programming Archives - Page 3 of 3

程序员必读书单 1.0

作者：Lucida

微博：@peng_gong
豆瓣：@figure9

原文链接：http://lucida.me/blog/developer-reading-list/

本文把程序员所需掌握的关键知识总结为三大类19个关键概念，然后给出了掌握每个关键概念所需的入门书籍，必读书籍，以及延伸阅读。旨在成为最好最全面的程序员必读书单。

前言

Reading makes a full man; conference a ready man; and writing an exact man.

Francis Bacon

优秀的程序员应该具备两方面能力：

良好的程序设计能力：
- 掌握常用的数据结构和算法（例如链表，栈，堆，队列，排序和散列）；
- 理解计算机科学的核心概念（例如计算机系统结构、操作系统、编译原理和计算机网络）；
- 熟悉至少两门以上编程语言（例如C++，Java，C#，和Python）；
专业的软件开发素养：
- 具备良好的编程实践，能够编写可测试（Testable），可扩展（Extensible），可维护（Maintainable）的代码；
- 把握客户需求，按时交付客户所需要的软件产品；
- 理解现代软件开发过程中的核心概念（例如面向对象程序设计，测试驱动开发，持续集成，和持续交付等等）。

和其它能力一样，程序设计能力和软件开发素养源自项目经验和书本知识。项目经验因人而异（来自不同领域的程序员，项目差异会很大）；但书本知识是相通的——尤其是经典图书，它们都能够拓宽程序员的视野，提高程序员的成长速度。

在过去几年的学习和工作中，我阅读了大量的程序设计/软件开发书籍。随着阅读量的增长，我意识到：

经典书籍需要不断被重读——每一次重读都会有新的体会；
书籍并非读的越多越好——大多数书籍只是经典书籍中的概念延伸（有时甚至是照搬）；

意识到这两点之后，我开始思考一个很功利的问题：如何从尽可能少的书中，获取尽可能多的关键知识？换句话说：

优秀的程序员应该掌握哪些关键概念？
哪些书籍来可以帮助程序员掌握这些关键概念？

这即是这篇文章的出发点——我试图通过程序员必读书单这篇文章来回答上面两个问题。

标准

进入必读书单之前，我先介绍下书单里的书籍选择标准和领域选择标准。当然你也点击这里直接跳转到书单开始阅读。

书籍选择标准

必读：什么是必读书籍呢？如果学习某项技术有一本书无论如何都不能错过，那么这本书就是必读书籍——例如Effective Java于Java，CLR via C#于C#；
- 注意我没有使用“经典”这个词，因为经典计算机书籍往往和计算机科学联系在一起，而且经典往往需要10年甚至更长的时间进行考验；
注重实践，而非理论：所以这个书单不会包含过于原理性的书籍；
入门—必读—延伸：必读书籍的问题在于：1. 大多不适合入门；2. 不够全面。考虑到没有入门阅读和延伸阅读的阅读列表是不完整的——所以书单中每个关键概念都会由一本入门书籍，一本必读书籍（有时入门书籍和必读书籍是同一本），和若干延伸阅读书籍所构成。

概念选择标准

全面：全面覆盖软件开发中重要的概念；
通用：适用于每一个程序员，和领域特定方向无关；
注重基础，但不过于深入：优秀的程序员需要良好的计算机科学基础，但程序员并没必要掌握过于深入的计算机科学知识。以算法为例，每个程序员都应该掌握排序、链表、栈以及队列这些基本数据结构和算法，但计算几何、线性规划和网络流这些算法可能就不是每个程序员都需要掌握的了；

通过这几个标准，我把程序员应掌握的关键概念分为程序设计，软件开发，以及个人成长三大类，每一大类均由若干关键概念组成。

快速通道

自从开博以来，经常会有朋友在论坛，微博，和QQ上提问学习X技术读什么书合适（例如：学习Java读什么书合适？如何学习程序设计？）所以我在这里列出了一个“快速通道”——把常见的问题集中在一起，点击问题，即可直接进入答案。（当然，如果你把本文从头读到尾帮助会更大 :–)）

程序员必读书单

入门书籍

程序设计：

软件开发：

个人成长：

必读书籍

程序设计：

软件开发：

个人成长：

这个阅读列表覆盖了软件开发各个关键领域的入门书籍和必读书籍，我相信它可以满足绝大多数程序员的需求，无论你是初学者，还是进阶者，都可以从中获益：

基础理论包括了程序员应该掌握的计算机基础知识；
编程语言对软件开发至关重要，我选择了C，C++，Java，C#，Python，和JavaScript这六门主流编程语言进行介绍，如果想进一步理解编程语言，可以阅读编程语言理论里的书目；
在理解编程语言的基础上，优秀的程序员还应该了解各种程序设计技巧，熟悉基本的算法数据结构，并且能够高效的进行程序调试。
良好的程序设计能力是成为优秀程序员的前提，但软件开发知识也是必不可少的：优秀的程序员应具备良好的编程实践，知道如何利用面向对象，重构，和软件测试编写可复用，可扩展，可维护的代码，并具备软件项目管理知识和专业开发素养；
就像我们可以从名人传记里学习名人的成功经验，程序员也可以通过追随优秀程序员的足迹使自己少走弯路。大师之言包含一系列对大师程序员/计算机科学家的访谈，任何程序员都可以从中获益良多；
为了打造用户满意的软件产品，程序员应当掌握一定的界面设计知识和交互设计知识（是的，这些工作应该交给UI和UX，但如果你想独自打造一个产品呢？）；
专业程序员应当对自己进行职业规划，并熟悉程序员求职面试的流程，以便在职业道路上越走越远；
软件开发是一项需要不断学习的技能，学习思维方式可以有效的提升学习能力和学习效率；
软件开发是一项国际化的工作，为了让更多的人了解你的代码（工作），良好的英语写作能力必不可少。

尽管我尽可能的去完善这个书单，但受限于我的个人经历，这个书单难免会有所偏颇。所以如果你有不同的意见，或者认为这个书单漏掉了某些重要书籍，请在评论中指出，我会及时更新。:–)

程序设计

1. 基础理论

编码：隐匿在计算机软硬件背后的语言这本书其实不应该叫编码——它更应该叫“Petzold教你造计算机”——作者Charles Petzold创造性的以编码为主题，从电报机和手电筒讲到数字电路，然后利用数字电路中的逻辑门构造出加法器和触发器，最后构造出一个完整的存储程序计算机。不要被这些电路概念吓到——编码使用大量形象贴切的类比简化了这些概念，使其成为最精彩最通俗易懂的计算机入门读物。

深入理解计算机系统（第2版）这本书的全名是：Computer Systems：A Programmer’s Perspective（所以它又被称为CSAPP），我个人习惯把它翻译为程序员所需了解的计算机系统知识，尽管土了些，但更名副其实。

深入理解计算机系统是我读过的最优秀的计算机系统导论型作品，它创造性的把操作系统，计算机组成结构，数字电路，以及编译原理这些计算机基础学科中的核心概念汇集在一起，从而覆盖了指令集体系架构，汇编语言，代码优化，计算机存储体系架构，链接，装载，进程，以及虚拟内存这些程序员所需了解的关键计算机系统知识。如果想打下扎实的计算机基础又不想把操作系统计算机结构编译原理这些书统统读一遍，阅读深入理解计算机系统是最有效率的方式。

延伸阅读：

世界是数字的：K&R中的K（Brian Kernighan）的近作，这本书源自Brian在普林斯顿大学所教授的计算机基础课程，以通俗易懂的方式讲述了现代人所应了解的计算机知识和网络知识；
图灵的秘密：他的生平、思想及论文解读：Charles Petzold的另一部作品，这本书以图灵的论文论可计算数及其在判定问题上的应用（On Computable Numbers, with an Application to the Entscheidungsproblem）为主题，阐述了图灵机（现代计算机的始祖）的构造，原理，以及应用。
计算机系统概论（第2版）：另一部优秀的计算机系统导论型作品，和深入理解计算机系统不同，这本书采用自下而上的方式，从二进制，和数字逻辑这些底层知识一步步过渡到高级编程语言（C），从而以另一种方式理解计算机系统。

2. 编程语言

编程语言是程序员必不可少的日常工具。工欲善其事，必先利其器。我在这里给出了C，C++，Java，C#，JavaScript，和Python这六种常用编程语言的书单（我个人不熟悉Objective-C和PHP，因此它们不在其中）。

需要注意的是：我在这里给出的是编程语言（Programming Language）书籍，而非编程平台（Programming Platform）书籍。以Java为例，Effective Java属于编程语言书籍，而Android编程权威指南就属于编程平台书籍。

C

忘记谭浩强那本糟糕不堪的C程序设计，C和指针才是C语言的最佳入门书籍。它详细但又不失简练的介绍了C语言以及C标准库的方方面面。

对于C语言初学者，最难的概念不仅仅是指针和数组，还有指向数组的指针和指向指针的指针。C和指针花了大量的篇幅和图示来把这些难懂但重要的概念讲的清清楚楚，这也是我推荐它作为C语言入门读物的原因。

尽管C程序设计语言是二十多年前的书籍，但它仍然是C语言——以及计算机科学中最重要的书籍之一，它的重要性不仅仅在于它用清晰的语言和简练的代码描述了C语言全貌，而且在于它为之后的计算机书籍——尤其是编程语言书籍树立了新的标杆。以至于在很多计算机书籍的扉页，都会有“感谢Kernighan教会我写作”这样的字样。

延伸阅读：

C专家编程：不要被标题中的“专家”吓到，这实际是一本很轻松的书籍，它既包含了大量C语言技术细节和编程技巧，也包含了很多有趣的编程轶事；
C陷阱与缺陷：书如其名，这本书介绍了C语言中常见的坑和一些稀奇古怪的编程“技巧”，不少刁钻的C语言面试题都源自这本小册子；
C语言参考手册：全面且权威的C语言参考手册，而且覆盖C99，如果你打算成为C语言专家，那么这本书不可错过；
C标准库：给出了15个C标准库的设计思路，实现代码，以及测试代码，配合C程序设计语言阅读效果更佳；
C语言接口与实现：这本书展示了如何使用C语言实现可复用的数据结构，其中包含大量C语言高级技巧，以至于Amazon上排行第一的评论是“Probably the best advanced C book in existance”，而排行第二的评论则是“By far the most advanced C book I read”。

C++

作为C++的发明者，没有人能比Bjarne Stroustrup更理解C++。Bjarne在Texas A&M大学任教时使用C++为大学新生讲授编程，从而就有了C++程序设计原理与实践这本书——它面向编程初学者，既包含C++教程，也包含大量程序设计原则。它不但是我读过最好的C++入门书，也是我读过最好的编程入门书。

比较有趣的是，C++程序设计原理与实践直到全书过半都没有出现指针，我想这可能是Bjarne为了证明不学C也可以学好C++吧。

同样是Bjarne Stroustrup的作品，C++程序设计语言是C++最权威且最全面的书籍。第4版相对于之前的版本进行了全面的更新，覆盖了第二新的C++ 11标准，并砍掉了部分过时的内容。

延伸阅读：

A Tour of C++：如果你觉得C++程序设计语言过于庞大，但你又想快速的浏览一遍新版C++的语言特色，那么可以试试这本小红书；
C++语言的设计与演化：C++的“历史书”，讲述了C++是如何一步一步从C with Classes走到如今这一步，以及C++语言特性背后的故事；
C++标准库（第2版）：相对于其它语言的标准库，C++标准库虽然强大，但学习曲线十分陡峭，这本书是学习C++标准库有力的补充；
深度探索C++对象模型：这本书系统的讲解了C++是如何以最小的性能代价实现对象模型，很多C++面试题（包括被问烂的虚函数指针）都可以在这本书里找到答案；
Effective C++和More Effective C++：由于C++的特性实在繁杂，因此很容易就掉到坑里。Effective系列既讲述了C++的良好编程实践，也包含C++的使用误区，从而帮你绕过这些坑。

Java

平心而论Java核心技术（即Core Java）并不算是一本特别出色的书籍：示例代码不够严谨，充斥着很多与C/C++的比较，语言也不够简洁——问题在于Java并没有一本很出色的入门书籍，与同类型的Java编程思想相比，Java核心技术至少做到了废话不多，与时俱进（Java编程思想还停留在Java 6之前），矮子里面选将军，Java核心技术算不错了。

尽管Java没有什么出色的入门书籍，但这不代表Java没有出色的必读书籍。Effective Java是我读过的最好的编程书籍之一，它包含大量的优秀Java编程实践，并对泛型和并发这两个充满陷阱的Java特性给出了充满洞察力的建议，以至于Java之父James Gosling为这本书作序：“我很希望10年前就拥有这本书。可能有人认为我不需要任何Java方面的书籍，但是我需要这本书。”

延伸阅读：

深入理解Java虚拟机（第2版）：非常优秀且难得的国产佳作，系统的介绍了Java虚拟机和相关工具，并给出了一些调优建议；
Java程序员修炼之道：在这本书之前，并没有一本Java书籍系统详细的介绍Java 7的新特性（例如新的垃圾收集器，try using结构和invokedynamic指令），这本书填补了这个空白；
Java并发编程实践：系统全面的介绍了Java的并发，如何设计支持并发的数据结构，以及如何编写正确的并发程序；
Java Puzzlers：包含了大量的Java陷阱——以至于读这本书时我说的最多的一个词就是WTF，这本书的意义在于它是一个反模式大全，Effective Java告诉你如何写好的Java程序，而Java Puzzlers则告诉你糟糕的Java程序是什么样子。更有意思的是，这两本书的作者都是Joshua Bloch。

视频教程：

Java语言学习极速之旅：系统全面的Java语言教程，6个阶段Java基础入门，循序渐进掌握Java面向对象精髓。3个Java进阶方向，Java SE、Java EE、Android开发，每一个都包含相应的知识点精讲和项目开发实例，快速上手。
Android 0基础极速养成计划：Android开发快速入门视频教程，通过对Android基础知识讲解，详细介绍Android开发环境搭建，同时包含Android实战案例解析，通过全新实战的Android课程，系统学习Android开发。

C#

可能你会疑问我为什么会推荐这本接近1200页的“巨著”用作C#入门，这是我的答案：

C#的语言特性非常丰富，很难用简短的篇幅概括这些特性；
精通C#之所以有近1200页的篇幅，是因为它不但全面介绍了C#语言，而且还覆盖了ADO.NET，WCF，WF，WPF，以及ASP.NET这些.Net框架。你可以把这本书视为两本书——一本500多页的C#语言教程和一本600多页的.Net平台框架快速上手手册。
尽管标题带有“精通”两字，精通C#实际上是一本面向初学者的C#书籍，你甚至不需要太多编程知识，就可以读懂它。

CLR via C#是C#/.Net最重要的书籍，没有之一。它全面介绍了.Net的基石——CLR的运行原理，以及构建于CLR之上的C#类型系统，运行时关系，泛型，以及线程/并行等高级内容。任何一个以C#为工作内容的程序员都应该阅读此书。

延伸阅读：

深入理解C#（第3版）：C#进阶必读，这本书偏重于C#的语言特性，它系统的介绍了C#从1.0到C# 4.0的语言特性演化，并展示了如何利用C#的语言特性编写优雅的程序;
.NET设计规范（第2版）：C#专业程序员必读，从变量命名规范讲到类型系统设计原则，这本书提供了一套完整的.Net编程规范，使得程序员可以编写出一致，严谨的代码，
C# 5.0权威指南：来自O’Reilly的C#参考手册，严谨的介绍了C#语法，使用，以及核心类库，C#程序员案头必备；
LINQ to Objects Using C# 4.0和Async in C# 5.0：LINQ和async分别是.Net 3.5和.Net 4.5中所引入的最重要的语言特性，所以我认为有必要在它们上面花点功夫——这两本书是介绍LINQ和async编程的最佳读物。

JavaScript

尽管JavaScript现在可以做到客户端服务器端通吃，尽管JQuery之类的前端框架使得一些人可以不懂JavaScript也可以编程，但我还是认为学习JavaScript从HTML DOM开始最为适合，因为这是JavaScript设计的初衷。JavaScript DOM编程艺术系统的介绍了如何使用JavaScript，HTML，以及CSS创建可用的Web页面，是一本前端入门佳作。

JavaScript语言包含大量的陷阱和误区，但它却又有一些相当不错的特性，这也是为什么Douglas Crockford称JavaScript为世界上最被误解的语言，并编写了JavaScript语言精粹一书来帮助前端开发者绕开JavaScript中的陷阱。和同类书籍不同，JavaScript语言精粹用精炼的语言讲解了JavaScript语言中好的那部分（例如闭包，函数是头等对象，以及对象字面量），并建议读者不要使用其它不好的部分（例如混乱的类型转换，默认全局命名空间，以及奇葩的相等判断符），毕竟，用糟糕的特性编写出来的程序往往也是糟糕的。

延伸阅读：

JavaScript高级程序设计（第3版）：详尽且深入的介绍了Javascript语言，DOM，以及Ajax，并针对HTML5做了对应更新；
JavaScript权威指南（第6版）：这本书的第5版曾被前端专家Douglas Crockford称之为“唯一靠谱的JavaScript书”。相对于JavaScript高级程序设计，JavaScript权威指南更像是一本案头参考书，当然如果你感兴趣也可以从头读到尾；
编写可维护的JavaScript：书如其名，这本书给出了大量的优秀JavaScript编程实践，使得程序员编写出健壮且易于维护的JavaScript代码；
JavaScript异步编程：和常见的支持并发的编程语言（例如Java和C#）不同，JavaScript本身是单线程的，因此不能把其它语言处理并发的方式照搬到JavaScript。JavaScript异步编程系统的介绍了JavaScript中的并发原理，并阐述了如何使用Promise、Deferred以及Async.js编写出简洁高效的异步程序。

Python

Python的入门书籍很多，而且据说质量大多不错，我推荐Python基础教程的原因是因为它是我的Python入门读物——简洁，全面，代码质量很不错，而且有几个很有趣的课后作业，使得我可以快速上手。

这里顺便多说一句，不要用Python学习手册作为Python入门——它的废话实在太多，你能想象它用了15页的篇幅去讲解if语句吗？尽管O’Reilly出了很多经典编程书，但这本Python学习手册绝对不在其中。

权威且实用的Python书籍，覆盖Python 2和Python 3。尽管它名为参考手册，但Python参考手册在Python语法和标准库基础之上对其实现机制也给出了深入的讲解，不容错过。

延伸阅读：

Python袖珍指南（第5版）：实用且便携的Python参考手册，我会说我在飞机上写程序时用的就是它么 –_–#；
Python Cookbook（第3版）：非常好的Python进阶读物，包含各种常用场景下的Python代码，使得读者可以写出更加Pythonic的代码；
Python编程实战：运用设计模式、并发和程序库创建高质量程序：Python高级读物，针对Python 3，2014年的Jolt大奖图书，不可错过；
Python源码剖析：少见的国产精品，这本书以Python 2.5为例，从源代码出发，一步步分析了CPython是如何实现类型，控制流，函数/方法的声明与调用，类型以及装饰器等Python核心概念，读过之后会大大加深对Python的理解。尽管这本书有些过时，但我们仍然可以按照它分析源代码的方式来分析新版Python。

3. 编程语言理论

大多数程序员并不需要从头编写一个编译器或解释器，因此龙书（编译原理）就显得过于重量级；然而多数程序员还是需要解析文本，处理配置文件，或者写一个小语言，编程语言实现模式很好的满足了这个需求。它把常用的文本解析/代码生成方法组织成一个个模式，并为每个模式给出了实例和应用场景。这本书既会提高你的动手能力，也会加深你对编程语言的理解。Python发明者Guido van Rossum甚至为这本书给出了“Throw away your compiler theory book!”这样的超高评价。

程序员每天都要和编程语言打交道，但是思考编程语言为什么会被设计成这个样子的程序员并不多，程序设计语言——实践之路完美的回答了这个问题。这本书从编程语言的解析和运行开始讲起，系统了介绍了命名空间，作用域，控制流，数据类型以及方法（控制抽象）这些程序设计语言的核心概念，然后展示了这些概念是如何被应用到过程式语言，面向对象语言，函数式语言，脚本式，逻辑编程语言以及并发编程语言这些具有不同编程范式的编程语言之上。这本书或极大的拓宽你的视野——无论你使用什么编程语言，都会从这本书中获益良多。理解这一本书，胜过学习十门新的编程语言。

延伸阅读：

七周七语言：理解多种编程范型：尽管我们在日常工作中可能只使用两三门编程语言，但是了解其它编程语言范式是很重要的。七周七语言一书用精简的篇幅介绍了Ruby，Io，Prolog，Scala，Erlang，Clojure，和Haskell这七种具有不同编程范式的语言——是的，你没法通过这本书变成这七种语言的专家，但你的视野会得到极大的拓宽；
自制编程语言：另一本优秀的编译原理作品，自制编程语言通过从零开始制作一门无类型语言Crowbar和一门静态类型语言Diksam，把类型系统，垃圾回收，和代码生成等编程语言的关键概念讲的清清楚楚；
计算的本质：深入剖析程序和计算机：披着Ruby外衣的计算理论入门书籍，使你对编程语言的理解更上一层楼。

4. 程序设计

现代编程语言的语法大多很繁杂，初学者使用这些语言学习编程会导致花大量的时间在编程语言语法（诸如指针，引用和类型定义）而不是程序设计方法（诸如数据抽象和过程抽象）之上。程序设计方法解决了这个问题——它专注于程序设计方法，使得读者无需把大量时间花在编程语言上。这本书还有一个与之配套的教学开发环境DrScheme，这个环境会根据读者的程度变换编程语言的深度，使得读者可以始终把注意力集中在程序设计方法上。

我个人很奇怪程序设计方法这样的佳作为什么会绝版，而谭浩强C语言这样的垃圾却大行其道——好在是程序设计方法第二版已经被免费发布在网上。

计算机程序的构造与解释是另一本被国内大学忽视（至少在我本科时很少有人知道这本书）的教材，这本书和程序设计方法有很多共同点——都使用Scheme)作为教学语言；都专注于程序设计方法而非编程语言本身；都拥有相当出色的课后题。相对于程序设计方法，计算机程序的构造与解释要更加深入程序设计的本质（过程抽象，数据抽象，以及元语言抽象），以至于Google技术总监Peter Norvig给了这本书超高的评价。

延伸阅读：

编程原本：STL作者的关于程序设计方法佳作——他把关系代数和群论引入编程之中，试图为程序设计提供一个坚实的理论基础，从而构建出更加稳固的软件。这本书是程序设计方法和计算机程序的构造与解释的绝好补充——前者使用函数式语言（Scheme）讲授程序设计，而编程原本则使用命令式语言（C++）;
元素模式：设计模式总结了面向对象程序设计中的模式，而元素模式这本书分析了程序设计中的常见模式的本质，阅读这本书会让你对程序设计有更深的理解；
The Science of Programming：会编程的人很多，但能够编写正确程序的人就少多了。The Science of Programming通过前条件——不变式——后条件以及逻辑谓词演算，为编写正确程序提供了强有力的理论基础，然后这本书通过实例阐述了如何应用这些理论到具体程序上。任何一个想大幅提高开发效率的程序员都应阅读此书。

5. 算法与数据结构

我在算法学习之路一文中提到我的算法入门教材是数据结构与算法分析：C语言描述，我曾经认为它是最好的算法入门教材，但自从我读到Sedgewick的算法之后我就改变了观点——这本算法才是最好的算法入门教材：

使用更为容易的Java语言作为教学语言；
覆盖所有常用的数据结构和算法，并均给出其完整实现；
包含大量的图示用于可视化算法——事实上这是我读过的图示最为丰富形象的书籍，这也是我称其为最好的算法入门书籍的原因。

编程珠玑（第2版）是一本少见的实践型算法书籍——它并非一一介绍数据结构/算法的教材，而是实践性极强的算法应用手册。作者（Jon Bentley）从他多年的实际经验精选出一些有趣而又实用的问题，然后展示了他解决这些问题的过程（分析问题，选择合适的算法，解决问题，以及验证答案）。任何程序员都可以从中获益。

延伸阅读：

编程珠玑（续）：严格来说这本书并非编程珠玑的续作，而是一本类似于番外篇的编程技巧/实践手册；它不像编程珠玑那般重视算法的应用，而是全面覆盖了程序员所需的能力；
算法导论（第3版）：尽管我在这边文章开头提到会尽量避免理论性的书籍，但没有算法导论的算法阅读列表是不完整的，我想这本书就不需要我多介绍了； :–)
算法设计与分析基础（第3版）：侧重于算法设计，这本书创新的把常见算法分为分治，减治，变治三大类，并覆盖了动态规划，回溯，以及分支定界等高级算法设计方法，属于算法设计的入门佳作；

6. 程序调试

一个让非编程从业人员惊讶的事实是程序员的绝大多时间都花在调试上，而不是写程序上，以至于Bob大叔把调试时间占工作时间的比例作为衡量程序员开发能力的标准。调试九法——软硬件错误的排查之道既是调试领域的入门作品，也是必读经典之作。调试九法的作者是一个具有丰富实战经验的硬件工程师，他把他多年的调试经验总结成九条调试法则，并对每一条法则都给对应的实际案例。任何程序员都应通过阅读这本书改善调试效率，即便是非程序员，也可以从这本书中学到系统解决问题的方法。

延伸阅读：

Writing Solid Code：最好的调试是不调试——Writing Solid Code介绍了断言，设计清晰的API，以及单步代码等技巧，用于编写健壮的代码，减少调试的时间；
软件调试的艺术：调试工具书——这本书详细的介绍了常见的调试器工具，并通过具体案例展示了它们的使用技巧；

软件开发

1. 编程实践

Brian Kernighan是这个星球上最好的计算机书籍作者：从上古时期的Software Tools，到早期的Unix编程环境和C程序设计语言，再到这本程序设计实践，每本书都是必读之作。

尽管程序设计实践只有短短200余页，但它使用精炼的代码和简要的原则覆盖了程序设计的所有关键概念（包括编程风格，算法与数据结构，API设计，调试，测试，优化，移植，以及领域特定语言等概念）。如果你想快速掌握良好的编程实践，或者你觉着900多页的代码大全过于沉重，那么程序设计实践是你的不二之选。我第一次读这本书就被它简洁的语言和优雅的代码所吸引，以至于读研时我买了三本程序设计实践——一本放在学校实验室，一本放在宿舍，一本随身携带阅读。我想我至少把它读了十遍以上——每一次都有新的收获。

无论在哪个版本的程序员必读书单，代码大全都会高居首位。和其它程序设计书籍不同，代码大全用通俗清晰的语言覆盖了软件构建（Software Construction）中各个层次上所有的重要概念——从变量命名到类型设计，从控制循环到代码结构，从测试和调试到构建和集成，代码大全可谓无所不包，你可以把这本书看作为程序员的一站式（Once and for all）阅读手册。更珍贵的是，代码大全在每一章末尾都给出了价值很高的参考书目（参考我之前的如何阅读书籍一文），如果你是一个初出茅庐的程序员，代码大全是绝好的阅读起点。

延伸阅读：

编写可读代码的艺术：专注于代码可读性（Code Readability），这本书来自Google的两位工程师对Google Code Readability的总结。它给出了大量命名，注释，代码结构，以及API设计等日常编码的最佳实践，并包含了很多看似细微但却可以显著提升代码可读性的编程技巧。这本书的翻译还不错，但如果你想体会书中的英语幽默（例如Tyrannosaurus——Stegosaurus——Thesaurus），建议阅读它的英文影印版；
卓有成效的程序员：专注于生产效率（Productivity），它既包含源自作者多年经验的高生产率原则，也包含大量的提高生产率的小工具，每个追求高生产率的程序员都应该阅读这本书；
UNIX编程艺术：专注于程序设计哲学，这本书首先总结出包括模块化，清晰化，可组合，可分离等17个Unix程序设计哲学，接下来通过Unix历史以及各种Unix编程工具展示了这些原则的应用。尽管个人觉的这本书有些过度拔高Unix且过度贬低Windows和M$，但书中的Unix设计哲学非常值得借鉴。

2. 面向对象程序设计

无论是在Amazon还是在Google上搜索设计模式相关书籍，Head First设计模式都会排在首位——它使用风趣的语言和诙谐的图示讲述了观察者，装饰者，抽象工厂，和单例等关键设计模式，使得初学者可以迅速的理解并掌握设计模式。Head First设计模式在Amazon上好评如潮，就连设计模式原书作者Erich Gamma都对它给出了很高的评价。

需要注意，Head First设计模式是非常好的设计模式入门书，但千万不要把这本书作为学习设计模式的唯一的书——是的，Head First设计模式拥有风趣的语言和诙谐的例子，但它既缺乏实际的工程范例，也没有给出设计模式的应用/适用场景。我个人建议是在读过这本书之后立即阅读“四人帮”)的设计模式或Bob大叔的敏捷软件开发，以便理解设计模式在实际中的应用。

设计模式作为设计模式领域的开山之作，Erich Gamma，Richard Helm，Ralph Johnson等四位作者将各个领域面向对象程序开发的经验总结成三大类23种模式，并给出了每个模式的使用场景，变体，不足，以及如何克服这些不足。这本书行文严谨紧凑（四位作者都是PhD），并且代码源自实际项目，属于设计模式领域的必读之作。

需要注意：设计模式不适合初学者阅读——它更像是一篇博士论文而非技术书籍，加上它的范例都具有很强的领域背景（诸如GUI窗口系统和富文本编辑器），缺乏实际经验的程序员很难理解这本书。

延伸阅读：

敏捷软件开发（原则模式与实践）：尽管标题带有“敏捷”，但这本书实际是一本面向对象程序设计读物——Bob大叔通过丰富的例子讲解设计模式的应用和SOLID面向对象设计原则)，如果你觉着设计模式过于晦涩，那么你完全可以从这本书开始学习。这本书使用Java作为讲解语言，它也有对应的C#版本；
代码整洁之道：同样是Bob大叔的作品，这本书教导读者使用面向对象+敏捷开发原则编写清晰可维护的代码；
企业应用架构模式：这本书专注于架构，作者Martin Fowler针对企业应用的特点（诸如持久化数据，多人访问，操作数据的界面以及复杂的业务逻辑），总结出若干企业架构模式，以便程序员构建强大且可扩展的企业应用。

3. 重构

任何产品代码都不是一蹴而就，而是在反复不断的修改中进化而来。重构正是这样一本介绍如何改进代码的书籍——如何在保持代码行为的基础上，提升代码的质量（这也是重构的定义）。

我见过很多程序员，他们经常声称自己在重构代码，但他们实际只做了第二步（提升代码的质量），却没有保证第一步（保持代码行为），因此他们所谓的重构往往会适得其反——破坏现有代码或是引入新bug。这也是我推荐重构这本书的原因——它既介绍糟糕代码的特征（Bad smell）和改进代码的方法，也给出了重构的完整流程——1. 编写单元测试保持（Preserve）程序行为；2. 重构代码；3. 保证单元测试通过。重构还引入了一套重构术语（诸如封装字段，内联方法，和字段上移），以便程序员之间交流。只有理解了这三个方面，才能算是理解重构。

这里再重复一遍重构的定义——在保持代码行为的基础上，提升代码的质量。重构专注于第二步，即如何提升代码的质量，而修改代码的艺术专注于第一步，即如何保持代码的行为。

提升代码质量并不困难，但保持代码行为就难多了，尤其是对没有测试的遗留代码（Legacy Code）而言——你需要首先引入测试，但遗留代码往往可测试性（Testability）很差，这时你就需要把代码变的可测试。修改代码的艺术包含大量的实用建议，用来把代码变的可测试（Testable），从而使重构变为可能，使提高代码质量变为可能。

延伸阅读：

重构与模式：这本书的中文书名存在误导，它的原书书名是Refactoring to Patterns——通过重构，把模式引入代码。这本书阐述了重构和设计模式之间的关系，使得程序员可以在更高的层次上思考重构，进行重构。

4. 软件测试

关于软件测试的书籍很多，但很少有一本测试书籍能像How to Break Software这般既有趣又实用。不同于传统的软件测试书籍（往往空话连篇，无法直接应用），How to Break Software非常实际——它从程序员的心理出发，分析软件错误/Bug最可能产生的路径，然后针对这些路径进行残酷的测试，以保证软件质量。

我在第一次阅读这本书时大呼作者太过“残忍”——连这些刁钻诡异的测试招数都能想出来。但这种毫不留情（Relentless）的测试风格正是每个专业程序员所应具备的心态。

注意：如果你是一个测试工程师，那么在阅读这本书前请三思——因为阅读它之后你会让你身边的程序员苦不堪言，甚至连掐死你的心都有 :-D。

How to Break Software注重黑盒测试，而这本xUnit Test Patterns则注重白盒测试。正如书名所示，xUnit Test Patterns覆盖了单元测试的每个方面：从如何编写良好的单元测试，到如何设计可测试（Testable）的软件，再到如何重构测试——可以把它看作为单元测试的百科全书。

延伸阅读：

Practical Unit Testing with JUnit and Mockito：尽管xUnit Test Patterns覆盖了单元测试的方方面面，但它的问题在于不够与时俱进（07年出版）。Practical Unit Testing弥补了这个缺陷——它详细介绍了如何通过测试框架JUnit和Mock框架Mockito编写良好的单元测试，并给出了大量优秀单元测试的原则；
单元测试的艺术（第2版）：可以把这本书看作为前一本书的.Net版，适合.Net程序员；
Google软件测试之道：这本书详细介绍了Google如何测试软件——包括Google的软件测试流程以及Google软件测试工程师的日常工作/职业发展。需要注意的是：这本书中的测试流程在国内很可能行不通（国内企业缺乏像Google那般强大的基础设施（Infrastructure）），但它至少可以让国内企业有一个可以效仿的目标；
探索式软件测试：James Whittaker的另一本测试著作，不同于传统的黑盒/白盒测试，这本书创造性的把测试比喻为“探索”（Exploration），然后把不同的探索方式对应到不同的测试方式上，以便尽早发现更多的软件错误/Bug。

5. 项目管理

很多程序员都向往成为横扫千军（One-man Army）式的“编程英雄”，但卓越的软件并非一人之力，而是由团队合力而成。极客与团队就是这样一本写给程序员的如何在团队中工作的绝好书籍，它围绕着HRT三大原则（Humility谦逊，Respect尊重，和Trust信任），系统的介绍了如何融入团队，如何打造优秀的团队，如何领导团队，以及如何应对团队中的害群之马（Poisonous People）。这本书实用性极强，以至于Python之父Guido van Rossum都盛赞这本书“说出了我一直在做但总结不出来的东西”。

尽管人月神话成书于40年前，但它仍是软件项目管理最重要的书籍。人月神话源自作者Fred Brooks领导并完成System/360和OS/360这两个即是放到现在也是巨型软件项目的里程碑项目的经验总结。它覆盖了软件项目各个方面的关键概念：从工期管理（Brooks定律）到团队建设（外科团队），从程序设计（编程的本质是使用正确的数据结构）到架构设计（概念完整性），从原型设计（Plan to Throw one away）到团队交流（形式化文档+会议）。令人惊讶的是，即便40年之后，人月神话中的关键概念（包括焦油坑，Brooks定律，概念完整性，外科团队，第二版效应等等）依然适用，而软件开发的核心复杂度仍然没有得到解决（没有银弹）。

延伸阅读：

人件（原书第3版）：从人的角度分析软件项目。人件从雇佣正确的人，创建健康的工作环境，以及打造高效的开发团队等角度阐述了如何改善人，从而改善软件项目；
门后的秘密：卓越管理的故事：这本书生动的再现了软件项目管理工作的场景，并给出了各种实用管理技巧，如果你有意转向管理岗位，这本书不容错过；
大教堂与集市：这本书从黑客的历史说起，系统而又风趣的讲述了开源运动的理论和实践，以及开源软件项目是如何运作并发展的。了解开源，从这本书开始。

6. 专业开发

不要被庸俗的译名迷惑，程序员修炼之道是一本价值极高的程序员成长手册。这本书并不局限于特定的编程语言或框架，而是提出了一套切实可行的实效（Pragmatic）开发哲学，并通过程序设计，测试，编程工具，以及项目管理等方面的实例展示了如何应用这套开发哲学，从而使得程序员更加高效专业。有人把这本书称之为迷你版代码大全——代码大全给出了大量的优秀程序设计实践，偏向术；而程序员修炼之道给出了程序设计实践背后的思想，注重道。

程序员修炼之道指出了如何成为专业程序员，这本程序员职业素养则指出了专业程序员应该是什么样子——承担责任；知道自己在做什么；知道何时说不/何时说是；在正确的时间编写正确的代码；懂得自我时间管理和工期预估；知道如何应对压力。如果你想成为专业程序员（Professional Developer）（而不是码农（Code Monkey）），这本书会为你指明前进的方向。

延伸阅读：

高效程序员的45个习惯：“敏捷”版的程序员修炼之道，可以把这本书作为程序员修炼之道的补充；
精益创业：尽管这是一本讲如何创业的书，但其中的精益生产，最小价值产品，以及构建-度量-学习循环都值得程序员借鉴。

7. 大师之言

奇思妙想：15位计算机天才及其重大发现是一本极具眼光的技术访谈书籍——在这本书访谈的15位计算机科学家中，竟出现了12位图灵奖获得者——要知道图灵奖从1966年设奖到现在也只有六十几位获奖者而已。

奇思妙想把计算机科学分为四大领域：编程语言；算法；架构；人工智能。并选取了每个领域下最具代表性的计算机科学家进行访谈。因为这些计算机科学家都是其所在领域的开拓者，因此他们能给出常人无法给出的深刻见解。通过这本书，你可以了解前三十年的计算机科学的发展历程——计算机科学家做了什么，而计算机又能做到/做不到什么。从而避免把时间浪费在前人已经解决的问题（或者根本无法解决的问题）上面。

同样是访谈录，同样访谈15个人，编程人生把重点放在程序员（Coders at work）上。它从各个领域选取了15位顶尖的程序员，这些程序员既包括Ken Thompson和Jamie Zawinski这些老牌Unix黑客，也包括Brad Fitzpatrick这样的80后新生代，还包括Frances Allen和Donald Knuth这样的计算机科学家。这种多样性（Diversity）使得编程人生兼具严谨性和趣味性，无论你是什么类型的程序员，都能从中受益良多。

延伸阅读：

图灵和ACM图灵奖（1966-2011）：通过图灵奖介绍整个计算机科学发展史，非常难得的国产精品图书；
编程大师访谈录：可以把这本书看作为二十年前的编程人生，被访谈者都是当时叱咤风云的人物（例如微软的创造者Bill Gates，Macintosh的发明者Jeff Raskin，以及Adobe的创始人John Warnock等等）。有趣的是这本书中大量的经验和建议到如今依然适用；
编程大师智慧：类似于编程人生，不同的是被访谈者都是编程语言的设计者——这本书覆盖了除C语言以外的几乎所有主流编程语言。通过这本书，你可以从中学到编程语言背后的设计思想——编程语言为什么要被设计成这样，是什么促使设计者要在语言中加入这个特性（或拒绝那个特性）。从而提升对编程语言的理解。

8. 界面设计

书如其名，写给大家看的设计书是一本面向初学者的快速设计入门。它覆盖了版式，色彩，和字体这三个设计中的关键元素，并创造性的为版式设计总结出CRAP四大原则（Contrast对比，Repetition重复，Alignment对齐，Proximity亲密）。全书使用丰富生动的范例告诉读者什么是好的设计，什么是不好的设计，使得即便是对设计一无所知的人，也可以从这本书快速入门。

写给大家看的设计书强调实践，即如何做出好的设计；认知与设计：理解UI设计准则强调理论，即为什么我们会接受这样的设计而反感那样的设计。如果你想要搞清楚设计背后的心理学知识，但又不想阅读大部头的心理学著作，那么认知与设计是你的首选。

延伸阅读：

GUI设计禁忌 2.0：这本书指出了GUI设计的原则和常见误区，然后通过具体范例指出了如何避免这些误区。如果你的工作涉及到用户界面，那么这本书会为你减少很多麻烦；
界面设计模式（第2版）：这本书将用户界面中的常见元素/行为组织成彼此关联的模式，以便读者理解并举一反三，从而将其运用到自己的应用中；
移动应用UI设计模式：类似于界面设计模式，但面向移动平台。它给出了iOS，Android，以及Windows Phones上常用的90余种界面设计模式，从而使得你不必把这些平台的应用挨个玩一遍也可以掌握各个平台的设计精髓。如果你主攻Android平台，那么Android应用UI设计模式会是更好的选择；
配色设计原理和版式设计原理：如果你读过写给大家看的设计书之后想继续深入学习设计，这两本书是不错的起点。

9. 交互设计

书如其名，通用设计法则给出了重要的125个设计原则，并用简练的语言和范例展示了这些原则的实际应用。每个原则都有对应的参考文献，以便读者进一步学习。我之所以推荐这本书，是因为：1. 程序员需要对设计有全面的认识；2. 程序员并不需要知道这些设计原则是怎么来的，知道怎么用即可。这本书很好的满足了这两个要求。

交互设计精髓是交互设计领域的圣经级著作。交互设计专家（以及VB之父）Alan Cooper在这本书中详细介绍了交互设计的原则，流程，以及方法，然后通过各种范例（主要来自桌面系统）展示了如何应用这些原则。

需要注意的是这本书的第4版已经出版，它在第三版的基础上增加了移动设计以及Web设计等内容。

延伸阅读：

The Design of Everyday Things：交互设计领域的另一本经典之作，它通过解读人类行动背后的心理活动，展示了设计问题的根源，并给出了一系列方法用以解决设计问题（需要注意，尽管这本书有中译版，但中译版对应的是02年的旧版，而非13年的新版）；
The Inmates Are Running the Asylum：Alan Cooper的另一本经典，这本书非常辛辣的指出让不具备人机交互知识的程序员直接编写面向用户的软件就像让精神病人管理疯人院（The Inmates Are Running the Asylum），然后给出了一套交互设计流程以挽救这个局面；
简约至上：交互式设计四策略：专注于把产品变的更加简单易用。作者通过删除，组织，隐藏，和转移这四个策略，展示了如何创造出简约优质的用户体验。

个人成长

1. 职业规划

软件开发者路线图是一本优秀且实用的程序员职业规划手册。这本书由若干个模式组成，每个模式都对应于程序员职业生涯中的特定阶段。通过这本书，读者可以很方便的找到自己目前所处的模式（阶段），应该做什么，目标是什么，以及下一个模式（阶段）会是什么。如果你时常感到迷茫，那么请阅读这本路线图，找到自己的位置，确定接下来的方向。

延伸阅读：

卡耐基全集：非常著名的为人处世书籍。很多人把这本书归类到成功学，但我并不这么认为——在我看来，这本书教的更多的是如何成为一个让大家喜欢的人。作为天天和机器打交道的程序员，这套书会帮助我们与人打交道；
沃顿商学院最受欢迎的谈判课：这本书不是教你去谈判，而是教你通过谈判（Negotiation）去得到更多（Getting more，这也是这本书的原书书名）。小到买菜砍价，大到争取项目，这本书中的谈判原则会让你收益良多；
程序员健康指南：作为长期与计算机打交道的职业，程序员往往会受到各式各样疾病的困扰，这本书正是为了解决这个问题而出现：它从改善工作环境，调整饮食结构，预防头痛眼痛，以及进行室内/室外锻炼等方面出发，给出了一套全面且可行的程序员健康改善计划，以帮助程序员打造健康的身体。

2. 思维方式

作为程序员，我们需要不断地学习——既要学习新技术，也要学习如何解决各种领域的问题。为了提升学习效率，我们需要学习如何学习。程序员的思维修炼正是这样一本讲如何学习的书，它集合了认知科学，神经学，以及行为理论的最新研究成果，并系统的介绍了大脑的工作机制。通过这本书，你将学会如何高效的使用自己的大脑，从而提高思考能力，改善学习效率。

Mastery is not about perfection. It’s about a process, a journey. The master is the one who stays on the path day after day, year after year. The master is the one who is willing to try, and fail, and try again, for as long as he or she lives.

为什么同样资质的人，大多数人会碌碌无为，而只有极少数能做到登峰造极？如何在领域内做到顶尖？如何克服通往顶尖之路上的重重险阻？如何把事情做到最好回答了这些问题，并极具哲理的指出登峰造极并不是结果，而是一段永不停止的旅程。阅读这本书不会让你立刻脱胎换骨，但它会指引你走向正确的道路——通往登峰造极之路。

延伸阅读：

怎样解题：数学思维的新方法：不要被标题中的“数学思维”吓到，它并不仅仅只是一本数学解题书，它所提出的四步解题法（理解题目->拟定方案->执行计划->总结反思）适用于任何领域；
暗时间：刘未鹏所写的关于学习思维方法的文章集，既包含了他对学习方法的思考，也包含了大量进一步阅读的资源；
批判性思维：带你走出思维的误区：这本书系统的分析了人类思维的常见误区，并针对各个误区给出了解决方案，从而帮助程序员养成严谨正确的思考方式；
Conceptual Blockbusting: A Guide to Better Ideas：与批判性思维相反，这本书专注于创造性思维（Creative Thinking），它分析了阻碍创造性思维的常见思维障碍（Blockbuster）以及这些思维障碍背后的成因，并给出了各种方法以破除这些障碍。

3. 求职面试

知己知彼，百战不殆。金领简历：敲开苹果微软谷歌的大门是程序员求职的必读书籍，它覆盖了程序员求职的方方面面：从开始准备到编写简历，从技术面试到薪酬谈判。由于该书作者曾在Google，微软，和苹果任职并进行过技术招聘，因此这本书的内容非常实用。

顺便吐个槽：这本书翻译的还不错，但我实在无法理解封面上的“进入顶级科技公司的葵花宝典”这段文字——找个工作而已，用不着切JJ这么凶残吧。-_–#

同样是来自金领简历作者的作品，程序员面试金典（第5版）专注于技术面试题，它既包含了IT企业（诸如微软，Google，和苹果）的面试流程以及如何准备技术面试，也包含了大量（超过200道）常见技术面试题题目以及解题思路。无论你打算进入国内企业还是外企，你都应该把这本书的题目练一遍，以找到技术面试的感觉（我在求职时就曾经专门搞了一块白板，然后每二十分钟一道题的练习，效果很不错）。

延伸阅读：

编程之美：微软技术面试心得：恐怕是国内技术面试第一书，这本书里面的多数题目都曾经是国内IT企业面试的必问题目。这本书的缺点是它太旧而且被用滥了（以至于一些企业开始避免使用这本书上的题目）——但你可以把它当成一本算法趣题来读；
剑指Offer：名企面试官精讲典型编程题：相对于东拼西凑的XX面试宝典，剑指Offer是一本少见的国产精品技术面试书籍，尽管这本书的技术面试题目不多（60余道），但作者为大多数题目都给出了不同方式的解法，并分析了这些解法之间的优劣，此外作者还以面试官的视角分析了技术面试的各个环节，从而帮助读者把握技术面试；
人人都有好工作：IT行业求职面试必读：可以把它看做金领简历的补充阅读——这本书的特点在于它给出了非常详细的简历/求职信/电子邮件编写技巧，而这正是不少国内程序员所缺乏的。

4. 英语写作

词汇量决定阅读能力，语法决定写作能力。计算机专业词汇并不多，但精确性非常重要，因此每个程序员都应具备良好的英语语法，但程序员并不需要过于专业的英语语法——掌握常用语法并把它用对就可以。The Only Grammar Book You’ll Ever Need正好可以满足这个需求，尽管它篇幅不大（不足200页），却覆盖了英语中的关键语法以及常见错误。把这本书读两遍，它会大幅度提高你的英语写作能力。

既是最畅销的英语写作书籍，也是计算机书籍中引用最多的非计算机书籍。风格的要素用极其简练的语言讲述了如何进行严肃，精确，清楚的英语写作。从这本书中，你不仅可以学到英语写作，更可以学到一种严谨至简的处事态度，而这正是专业开发所必需的。

延伸阅读：

牛津英语用法指南（第3版）：全面且权威的英语用法指南，它覆盖语法，词汇，发音，以及修辞等方面，并兼顾口语和书面语，以帮助读者掌握合理的英语用法（Proper English Usage）。不要被这本书的篇幅（1000多页）吓到——原书并没有这么厚，因为这本书被翻译成中文但又得保留原有的英文内容，所以它的篇幅几乎翻了一倍。考虑到这本书使用的词汇都很基础，所以我认为具有英语基础的读者直接阅读原版（Practical English Usage）会更合适；
写作法宝：非虚构写作指南（30周年纪念版）：详尽的非虚构（Non-Fiction）写作指南，无论你要写地方，技术，商务，运动，艺术，还是自传，你都可以从这本书中找到珍贵的建议；
中式英语之鉴：中国人使用英语最大的问题就是会把中式思维掺杂其中，从而形成啰里啰嗦不伦不类的中式英语（Chinglish）。中式英语之鉴系统的探讨了中式英语以及其成因，然后根据成因对中式英语进行归类，并对每个类别给出了大量的实际案例以及修改建议。如果你想摆脱中式英语，那么这本书是绝好的起点。

如何使用这个书单

学而不思则罔，思而不学则殆。

不愤不启，不悱不发。举一隅不以三隅反，则不复也。

不闻不若闻之，闻之不若见之，见之不若知之，知之不若行之，学至于行之而止矣。

来自他人的书单

它山之石，可以攻玉。我在本文最后给出其他中外优秀程序员的书单，以便参考&补充。

刘未鹏（暗时间作者）

以下同一条目下用“/”隔开的表示任选，当然也可以都读。

云风（中国游戏编程先行者，前网易游戏部门资深程序员，简悦创始人）

洪强宁（豆瓣技术总监）

陈皓（CoolShell博主）

张峥（微软亚洲研究院副院长）

Jeff Atwood（Stackoverflow联合创始人）

Joel Spolsky（Stackoverflow联合创始人）

软件项目管理

编程技艺

编程哲学

界面设计

资本运作

漫步华尔街

图形设计

写给大家看的设计书

思维方式

编程入门

DHH（Ruby on Rails创始人）

参考

作者：Lucida

微博：@peng_gong
豆瓣：@figure9

原文链接：http://lucida.me/blog/developer-reading-list/

CMU大师对软件工程师的系统建议

2016-04-16 新智元 新智元

新智元翻译1

来源：Quora

【新智元导读】软件工程师想学机器学习，有什么好建议？机器学习专家、卡耐基梅隆大学教授、1-Page公司首席科学家 Alex Smola 在 Quora 上给出了系统、具体的回答，还列出了推荐图书和论文。当然，如果你认为还有其他值得推荐的内容，留下评论，欢迎补充！

问题：你对想要学习机器学习的软件工程师有哪些建议？（What would be your advice to a software engineer who wants to learn machine learning?）

Alex Smola: 这很大程度上取决于软件工程师的背景及其具体想掌握机器学习的哪部分知识。简而言之，我们以一名拥有四年本科学位和一到两年行业经验的初级程序员为例，并假设这位程序员希望学习计算广告学、自然语言处理、图像分析、社交网络以及搜索和排序。那么，我们先说掌握机器学习有哪些基本要求（致学术界同仁的免责声明：下列内容并不完整，如果未列入你的论著，在此提前致歉）。

线性代数

机器学习以及数据统计和优化都需要这方面知识。这也是为什么GPU（图形处理器）远比CPU（中央处理器）适合进行机器学习。作为程序员，至少需要基本掌握以下内容：

标量、向量、矩阵、张量
把它们看作你可以组建并相互转换的零维、一维、二维、三维和更高维物体，有点像乐高玩具，它们使得基本的数据转换成为可能。

特征向量、范数、矩阵近似、分解
这些概念本质上是让你习惯线性代数的用法。如果你希望分析一个矩阵的情况（比如，检查为何循环神经网络中出现梯度消失，为何增强学习算法中控制器出现分歧(diverge)），你就必须要理解在应用矩阵和向量时可能出现的增长和减小范围是多少。如果你希望代码表现出色和稳定，那么低秩等矩阵近似算法或乔列斯基分解就很有用。

数值线性代数
如果你需要做很多最优化计算，那么这部分知识就很有用。对核方法和深度学习来说如此，对图像模型和采样器而言则不那么重要。

书籍
Serge Lang, LinearAlgebra
线性代数的基本介绍，适合本科生。
Bela Bolobas,Linear Analysis
比上面这本难很多，但对想做很多数学和泛函分析的人来说更有用。如果你想攻读博士，这本书或许不错。
Lloyd Trefethen andDavid Bau, Numerical Linear Algebra

有很多类似的书，这里列出一本。Numerical Recipes是另一本，不过其中算法略微过时。另外还有Golub and van Loan所著的 Matrix Computations。

最优化（和基本演算）

在许多情况下，设置要问的问题是相当容易的，但得出答案却没没那么简单。举例来说，如果要对一些数据进行线性回归（即找到一条线），你可能希望尽量减少与观测值的距离平方的总和。同样，如果想获得一个好的点击率预测模型，你就得最大化对于人们点击广告概率预测的准确性。这意味着我们通常会有一些目标、一些参数和大量数据，而我们需要通过一种方式来解决问题。这一点很重要，尤其因为我们常常不会有一个闭合式解决方案。

凸优化

很多时候，在优化问题不存在许多局部解决方案的情况下是不错的。当问题为凸时就会发生这种情况。（若你能在一个集合内任意两点间画出一条直线且这条直线处于该集合内，则这一集合就是凸的。若你能在图上任意两点间画出一条直线且这条直线位于图形上方，则这一函数是凸的。）

也许这一领域的经典书籍是这本由Steven Boyd和Lieven Vandenberghe所撰写的 Convex Optimization 。本书免费且非常棒。（回复041501下载，共730页）此外，Boyd的课程里也有许多很不错的幻灯片集。Dimitri Bertsekas也已经编写了关于最优化、控制等的宝典。这些应该足以供任何人开始了解这个领域了。

随机梯度下降算法

这一算法早期在很大程度上只是凸优化的一种特殊情况（至少早期定理是这样的），但最近发展很大，并且绝非是由于数据的增多。原因是，想象一下你有一些数据要处理，而你的算法需要将所有的数据都浏览一遍后才能继续新的步骤。而如果我故意给你10份同样的数据，那么你就必须重复10次工作，却没有什么实质性用处。显然，现实情况不会如此糟糕，但如果你需要操作多次小的新步骤，而每个小步骤之后都需要观测，它就能帮上忙。这在机器学习领域带来了相当大的变革型影响。此外，许多关联算法都容易得多。

我们面临的挑战是如何将其并行化。也许这个方向的第一步之一就是我们2009年的 Slow Learners are Fast 论文（回复041502下载）。最新版本是无锁变异型，例如Niu等于2013年所著的Hogwild论文（回复041503下载）。简而言之，这些算法通过人工计算机计算局部梯度并以异步方式更新共识参数集来运作。

另一个挑战是如何应对控制过度拟合的各种方法，例如通过正则化来实现。对于凸罚函数来说，有一种所谓近端梯度算法。一种比较流行的选择是Amir Beck和Marc Teboulle的FISTA算法。部分代码参见Francis Bach的SPAM toolbox（http://spams-devel.gforge.inria.fr/）。

非凸方法

许多机器学习问题都是非凸问题。从本质上来说，任何与深度学习相关的问题都是。但聚类、主题模型和几乎任何潜变量方法和当前几乎所有在机器学习领域有意思的问题也都是。部分加速技术可以提供帮助。例如，我的学生 Sashank Reddy最近展示了在这种情况下如何获得收敛的良好比率。

有许多被称为谱方法的技术可以使用。 Anima Anandkumar在她最近的Quora session中已经非常详尽地回答了这一问题。请参阅她的回复，因为其回复无比详细（https://www.quora.com/profile/Anima-Anandkumar-1）。概括地说，凸问题并非唯一能够确切解决的问题。在某些情况下，可以得出一个难题的数学表达式以显示只有某一组特定的参数能找到所有的集群、主题、相关比例、神经元或所有数据中的任何东西。这仅在你有能力且愿意花很多数学的功夫时才有效。

在培训深层网络方面（Deep Networks），最近有许多新技巧。我会在后面的内容中提及这些，但在某些情况下，目标不仅仅是优化，而是制定出一套具体的解决方案（几乎像是那本题为The Journey is the goal《旅程即是目的》的书）。

系统

机器学习正在成为大部分有关于人、测量、传感器和数据的关键要素，这与过去十年标度算法（scaling algorithms）的突破密不可分。Jeff Dean去年出了六套机器学习教程，也并非偶然。如果有人过了十年与世隔绝的生活，在这里给补充一下，他就是MapReduce、谷歌文件系统、BigTable和其他十多项成就了谷歌的关键技术背后的男人。

说笑归说笑，关于系统的研究为解决分布、异步、容错、可扩展和简易问题提供了宝贵的工具。后者是机器学习研究人员常常忽视的一点。简易是一种特性，不是一个错误。一些基本的技巧将带给你很多：

分布式哈希表

这实质上是如分布式缓存（memcached）、dynamo、 pastry和orceph等方法

构建的基础。它们都解决同一个问题——如何在避免访问之前数据输往的中央储存库的情况下向多台机器发布数据。为了达到这一目的，你需要将地址以一种随机又确定的方式编码（也就是哈希）。此外，你需要解决如果任何一台机器出现故障时谁将负责处理。

这就是我们在参数服务器（Parameter Server）中使用的数据布局。我的学生李沐是这个项目背后的智囊。工具组合参见DMLC（http://dmlc.ml/）。

一致性和信息传送

所有这一切的教父是Leslie Lamport的PAXOS 协议。它解决了在不是所有机器任何时候都可用或有些机器出现故障时如何达成共识的问题（是的，我在这儿就一句带过了）。如果你曾经使用过版本控制，你可能靠直觉知道它是如何工作的——大量机器（或开发者）产生更新（或代码段），而你希望将这些都结合成有意义的信息（例如，你不该两次运用微分），但又不需要所有机器与其他所有机器一直传递着信息。

在系统中，解决方案是使用向量时钟（参见例子：谷歌的Chubby）。我们在参数服务器中使用它的一种变体。关键的区别在于（均引自李沐）在参数范围内使用向量时钟。这可以确保不会因为时间标识耗尽内存，就像一个文件系统并不需要为每一个字节都记录一个时间标识。

容错、Scaling和云

最简单的自学方法就是在亚马逊AWS、谷歌GWC、微软Azure, 或你可以找到的各个其他平台上运行算法。当你第一次启动1000个服务器，意识到你正在向一个实际上的合法僵尸网络发送大量指令时，还是很令人激动的。我在谷歌工作时，我们控制了欧洲某处了5000个高端机器，用于主题模型中的推理。我们所调用的能源价值如果和一个核电站相比，也要占很大的比重了。我的经理当时把我叫到一旁，说这真是个昂贵的实验……

或许最容易起步的是学习docker。为了让scaling更容易，人们热火朝天地开发了不少工具。Docker Machine和Docker Cloud或许是近来最好的新工具，使你能像更换打印机驱动一样方便地连接不同的云端。

硬件

这似乎显而易见，但如果你了解自己算法所运行的硬件，的确会很有帮助。这会让你知道你写的代码是否已经接近峰值性能。初学者可以阅读Jeff Dean的Numbers every engineer should know一书。我在面试时最喜欢问的问题（曾经）是，应聘者的电脑有多快。知道算法的局限大有裨益：是缓存、内存带宽、延迟时间还是硬盘等等。Anandtech上有非常棒的介绍性文章，以及对微处理器架构等相关内容的测评。只要英特尔、ARM、AMD发布新硬件时，都可以去看一看。

统计学

我特意把这点留到最后。因为每个人都知道这是关键（的确如此），然后就忽略了其他所有东西。统计学确保你能问出好问题，同时帮助你理解自己在数据建模时用了多少估算。
从图像模型、核方法到深度学习等等，很多改进其实来自提出对的问题，也即定义了合理的优化目标，从而进行最优化。

Statistics Proper

Larry Wasserman的《统计学完全教程》（All of Statistics）是不错的入门教材。另外也可以看一下 David McKay 的 Machine Learning 一书。该书免费（篇幅很长、内容全面，回复041504下载）。其他还有不少好书，比如说 Kevin Murphy, Chris Bishop, Trevor Hastie, RobTibshirani 以及 Jerome Friedman 的著作The Elements of Statistical Learning:Data Mining, Inference, and Prediction。是的，Bernhard Scholkopf 和我也写了一本Learning with Kernels。

随机算法和概率统计

本质上就是用计算机科学解决一样的问题，关键区别在于他们是设计算法的一种工具，而非用来适配参数的一个问题。我特别喜欢 Michael Mitzenmacher 和Eli Upfal 写的书Probability and Computing: Randomized Algorithms and Probabilistic Analysis ，非常易读但同时谈到了许多深刻的问题。如果你想更深入地了解这些工具，还有 Rajeev Motwani 和 Prabhakar Raghavan 的书Randomized Algorithms，写得很好，不过如果你没有较好的统计学背景，可能较难读懂。

我的回答可能已经够长了，很少有人会一直读到这里。所以我接下来说得比较简短。网上有许多非常棒的视频资料。许多教授现在有自己YouTube频道，并上传自己的课程视频。如果你在学习比较复杂的工具，这些视频会有所帮助。我的视频在这里（https://www.youtube.com/user/smolix/playlists），Nando de Freitas的要好很多。

其他还有一些工具。DMLC是好的起点，其中有许多用于分布式可扩展推理的算法，包括基于MXNET的神经网络。

还有很多没谈到的：编程语言、数据源等等。但这个回答已经太长了，我会在其他问题中继续讨论。

附录，Alex Smola 著书：

G. Bakir, T. Hofmann, B. Schölkopf, A.J. Smola, B. Taskar, and S.V.N. Vishwanathan, editors. Predicting Structured Data. MIT Press, Cambridge, MA, 2006.
S. Mendelson and A. J. Smola, editors. Machine Learning, Proceedings of the Summer School 2002, Australian National University, volume 2600 of Lecture Notes in Computer Science. Springer, 2003.
B. Schölkopf and A. J. Smola. Learning with Kernels. MIT Press, 2002.
B. Schölkopf, C. J. C. Burges, and A. J. Smola, editors. Advances in Kernel Methods–Support Vector Learning. MIT Press, Cambridge, MA, 1999.
A. J. Smola, P. L. Bartlett, B. Schölkopf, and D. Schuurmans, editors. Advances in Large Margin Classifiers. MIT Press, Cambridge, MA, 2000.

Slow Learners are Fast 论文（回复041502下载）。最新版本是无锁变异型，例如Niu等于2013年所著的Hogwild论文（回复041503下载）

关于这一讨论，你认为还有其他值得推荐的内容？留下评论，欢迎补充！

购书可扫二维码或点击阅读原文获取促销链接

How Many Programming Technologies Can You Really Master?

Andrew Wulf , Aug 6, 2015

I keep seeing companies or their recruiters advertising they are looking for people “with significant experience developing iOS and Android applications from scratch and will have a mastery of modern mobile and web technologies, including Java, HTML5, CSS3, JavaScript, JSON and AJAX”.

There is no such person. You can master one and be mediocre in the others; you can master one and then move on to another and forget a lot of the prior; you can simply fool enough people into thinking you can do it and hope you can figure it out just in time.

Programming today in any major area is highly complex, constantly changing, and generally done with a lot of time pressure. None of these allow you to devote a lot of non-programming time to learn even the most recent changes, much less master everything from scratch. You can really only learn a new environment by doing real projects, and how many people can simultaneously write large native Android, native iOS and responsive web clients all at the same time?

During my 34 years being a programmer I’ve only rarely worked in more than one major area. My first job was on a supermini and then 6502 assembly on Apple and Pascal on a PC, my two startups were for Mac in C, I worked some more for other people (including Apple) for Mac in C, a little C++ then Objective-C/WebObjects transitioning to web in Java on both client and server though only rarely both, some JavaScript, then C++ game programming on Mac and Windows and finally Objective-C and iOS. For each transition it was a lot of learning on the fly followed by years of mastering all the new stuff.

If for some reason someone can actually do both Android and iOS—much less web—at a real master level, they should be making way more money than most companies are willing to pay. What companies want is to hire few people who are then able to do everything and at the lowest pay level they can get. Yet I cannot fathom anyone being able to be an expert on so many things simultaneously and how they can write multiple apps in multiple technologies and keep up. I’ve known people who were incredibly brilliant but I can’t remember anyone being so good they could actually juggle unrelated technologies at the same time and produce masterful applications.

Maybe there are exceptions. But I still think most people can’t do it. People can of course master one thing then move on to master another but in the process you inevitably forget things from the first. Last year during my months of not having anything to do waiting for my layoff (I was one of the last layoffs for no apparent reason as all of our technology was already replaced prior to the final sale of the brand) I spent a month working on C++, then node.js and finally Swift. Going back to each this year (since all I had done in my new job was Objective-C) I found I had forgotten much of what I learned. If you don’t use something regularly the memories seem to fall out the back of your head. In rewriting this blog engine in PHP I got all those languages mixed up in my head.

Now if you are writing in Objective-C and then Swift on iOS at least there is some overlap. But Android is not just a different language from iOS, everything is different from the tools to how you do layouts to supporting multiple major OS releases to the 24,000 or so different devices. Just keeping up with all the new changes in this years WWDC in June is taking a lot of effort; not helping is that sample code Apple released then is already uncompilable in the latest XCode beta. Even if you wrote no code and just watched videos and read documentation and sample code all day, how could you say you are an expert with a straight face?

Add to two different mobile OS environments all the complex mess that is modern web development, especially with Javascript frameworks that appear one day and then vanish the next. You’d need three heads to keep up with it. The Javascript programmers I worked with couldn’t do more than keep up with one (in this case AngularJS).

So finding a single person who can write iOS, Android and mobile/desktop web in Javascript, using modern APIs and yet supporting older OS versions, understanding the plusses and minuses of different approaches to design and UI and the subtleties of all the different browsers and Android devices especially, and deliver bug-free results in record time, is fantasy. Oh yeah and work for less than market rates.

When I started programming things were extremely primitive and I only had to know one language and one OS and no frameworks at all. Even during my two startups I only had to master C, Inside Macintosh and some occasional 68K assembly. Today is not then. Yet we still only have one brain and brains aren’t subject to Moore’s Law. They can’t be upgraded.

So if you (honestly) can do Android, iOS and mobile web simultaneously and deliver masterful results, I salute you! But I sure hope you are making 3X money too.

什么样的电子积木，让硬件创业变得如此简单？

原创 2016-04-28 硅谷密探 硅谷密探

今天，小探要介绍一款电子积木。

咋一看，像乐高玩具。但其实，学问大了。

这款电子积木套件叫mCookie，是一套可编程的芯片。mCookie的每一片电子积木都有自己的功能，譬如WiFi模块，蓝牙模块，声音模块，GPS模块，等等。

先来看看怎么耍

mCookie的边框有着磁性化材料设计，因而，你在拼接时，不再需要焊接电路，而是直接把一个个mCookie粘贴在一起。

拼接，折叠，翻转，是如此的轻巧自如。

然后，把mCookie的模块（控制，感应，机动等模块拼在一起）装载到乐高积木，或者四轴无人机模型上，

本身不会动的模型就可以飞起来了！

想想看，从前到后，就是把需要的几个功能模块拼起来，再套上模型，就可以完成一个无人机这么复杂的智能硬件了。真的很神奇啊！

没错，mCookie可以帮助你最轻量化地制作智能硬件的原型产品。

譬如，这个音乐盒，只需要7个mCookie积木就可以制作完成：

而这个小型气象站也就是四五块积木就拼接完成了：

因而，mCookie无论用于电子电路及编程的教育，还是硬件创客的实践上，都是非常轻量级高质量的工具。而其实，mCookie又只是 Microduino 旗下的最新系列产品。

那么，什么是Microduino？

Microduino是完全兼容Arduino的开发板，功能与Arduino无异。只不过，它们更小巧，有着许多功能模块。

Microduino有多牛？

清华大学专门开设了一门2个学分的课程，让学生学习使用Microduino。

Microduino还应用到了拯救秃鹫这一濒临灭绝的物种的挑战中，Discovery探索频道也报道了。

另外，雀巢咖啡也用了Microduino的产品做了一次很好的推广营销。

如今，Microduino的用户已经覆盖了六大洲，现在就差南极洲一个就能集齐七大洲了。（不知道会不会召唤出神龙呢？）

核心创始人也是大有来头

Tiki Wang，Bin Feng是复旦大学的同学，96年电子材料专业。后来Tiki去了清华读了电子设计的硕士；而Bin Feng则去了UCSD（加州大学圣地亚哥分校）念研究生，后来走上了市场和销售的道路。

两条完全不同的发展道路，却又最终有了交集。他们再次相聚，决心一起做翻事业，于是，拉上了朋友老潘，三个人培育了Microduino这个项目。

老潘也是个牛人，据说曾经有个团队做了3个月也没搞定的电路板，老潘一人一天就搞定了。神一般的技术达人！

How much math do I need to know to program?”

Source: http://inventwithpython.com/blog/2012/03/18/how-much-math-do-i-need-to-know-to-program-not-that-much-actually/

March 18, 2012 Al Sweigart Blog

Here are some posts I’ve seen on the r/learnprogramming subreddit forum:

Math and programming have a somewhat misunderstood relationship. Many people think that you have to be good at math or made good grades in math class before you can even begin to learn programming. But how much math does a person need to know in order to program?

Not that much actually. This article will go into detail about the kinds of math you should know for programming. You probably know it already.

For general programming, you should know the following:

Addition, subtraction, division, and multiplication – And really, the computer will be doing the adding, subtracting, dividing, and multiplying for you anyway. You just have to know when you need to do these operations.
Mod – The mod operation is the “remainder” and its sign is usually the % percent sign. So 23 divided by 7 is 3 with a remainder of 2. But 23 mod 7 is 2.
The even/odd mod test trick – If you want to know if a number is odd or even, mod it by 2. If the result is 0, the number is even. If the result is 1, the number is odd. 23 mod 2 is 1, so you know 23 is odd. 24 mod 2 is 0, so you know 24 is even. If x mod 2 is 0, you know that whatever number is stored in the variable x is even.
To get a percentage of a number, multiply that number by the percent number with the decimal point in front of it. So to get 54% of 279, multiple 0.54 * 279. This is why 1.0 often means 100% and 0.0 means 0%.
Know what negative numbers are. A negative number times a negative number is a positive. A negative times a positive is negative. That’s about it.
Know what a Cartesian coordinate system is. In programming, the (0, 0) origin is the top left corner of the screen or window, and the Y axis increases going down.
Know the Pythagorean theorem, and that it can be used to find the distance between two points on a Cartesian coordinate system. The Pythagorean theorem is a^2 + b^2 = c^2. What this usually means in programming is the distance between coordinate (x1, y1) and (x2, y2) will just be sqrt( (x1 – x2)^2 + (y1 – y2)^2 ).
Know what decimal, binary, and hexadecimal numbering systems are. Decimal numbers are the numbers we’re used to that have ten digits: 0 to 9. It’s commonly thought that humans develop this system because we have ten fingers and counted on our fingers.

Computers work with binary data, which is a number system with only two digits: 0 and 1. This is because we build computers out of electronics components where it’s cheaper to make them only recognize two different states (one state to represent 0 and the other to represent 1).

The numbers are still the exact same, but they are written out differently because there are a different number of digits in each system. Because hex has 6 more digits than the 0-9 numerals can provide, we use the letters A through F for the digits above 9. The easiest way to show these number systems is with an odometer. The following three odometers always show the same number, but they are written out differently in different number systems:

See the Odometer Number Systems page in a new window.You don’t even have to know the math of converting a number from one number system to another. Every programming language has functions that can do this for you.

(On a side note, hexadecimal is used because one hexadecimal digit can represent exactly four binary digits. So since 3 in hex represents 0011 in binary and A in hex represents 1010. This has the nice effect that the hex number 3A (which is 58 in decimal) is written in binary as 00111010. Hex is used in programming because it is a shorthand for binary. Nobody likes writing out all those ones and zeros.)

And that’s about it. Other than the number system stuff, you probably already knew all the math you needed to know to do programming. Despite the popular conception, math isn’t really used that much in programming. You would need to know math in order to write programs that do, say, earthquake simulators. But that’s more about needing to know math for earthquakes rather than needing to know math for programming an earthquake simulator.

Advanced Mathematics in Some Areas of Programming

There’s a few areas of programming where some additional math knowledge might be needed (but for 95% of the software you’ll write, you don’t need to know it.)

3D games and 3D graphics – 3D stuff will usually involve knowing trigonometry and linear algebra (that is, math dealing with matrices). Of course, there are many 3D graphics libraries that implement all this math programming for you, so you don’t need to know the math.

2D physics (like Angry Birds) and 3D physics (like many popular 3D games use) – To do programming that involves physics, you’ll need to learn some physics equations and formulas (specifically mechanics, which is the type of physics with springs, gravity, and balls rolling down inclined planes.) However, there are several physics engines and software libraries that implement this stuff for you, so you really don’t need to know the physics equations to make a game like Angry Birds.

Cryptography – And really, by cryptography, I just mean RSA. In which case, you’d have to learn some math about how prime numbers work and doing the Greatest Common Divisor (which is a dead simple algorithm, although plenty of programming languages have gcd() function that does this for you.) Other encryption ciphers are mostly moving data around in specific steps. For example, this Flash animation shows the steps in the AES “Rijndael” cipher. All the steps are basically substituting numbers for other numbers, shifting rows of numbers over, mixing up columns of numbers, and doing basic addition with numbers.

And that’s just if you want to write your own encryption ciphers (which you shouldn’t do, because there are already plenty of good ones and without expertise your cipher will probably suck and be easily cracked.) If you just want to write a program that encrypts data, there are software libraries that implement encryption and decryption functions already.

So even for the above situations, you don’t need to know the math to make programs with 3D graphics, physics, or encryption. Just learn to use the libraries.

What You Do Need to Learn to Do Programming

What you do need to learn is how to model data and devise algorithms. This basically means, how to take some real-world calculation or some data processing, and write out code that makes the computer do it. For example, in the game Dungeons and Dragons the characters and monsters have several different statistics for combat:

HP, or hit points, is the amount of damage a person can take before dying. More HP means you can take more damage before dying.
AC, or armor class, is a measure of the chance your armor has of blocking an attack. The lower the AC, the more protective the armor is.
THAC0 (pronounced “thay-co”), or “To Hit Armor Class 0”, is a measure of how skillful the person is at making a successful hit on an opponent. The lower the THAC0, the more accurate the person’s attack is.
The damage of the weapon is written out as something like 1d6+2. This means the damage is the amount from rolling 1 six-sided dice, and then adding 2 to it. A damage stat of 2d4 would be rolling 2 four-sided dice and adding them together. (Dungeons and Dragons uses 4, 6, 8, 10, 12, and 20-sided dice.)

To see if an attacker hits a defender, the attacker rolls a twenty-sided die. If this number is equal to or greater than the attacker’s THAC0 minus the defender’s AC, then the hit is successful and the defender takes damage. Otherwise, the defender has either dodged or blocked the attack and takes no damage.

Let’s take two Dungeon and Dragons characters, Alice and Bob, with the following stats:

Alice: HP 14, AC 5, THAC0 18, DAMAGE 1d6
Bob: HP 12, AC 7, THAC0 16, DAMAGE 2d4

So Alice has two more hit points than Bob and better armor (remember, lower AC is better). But Bob is more likely to make a successful hit (remember, lower THAC0 is better) and does more damage. We can tell Bob’s damage is better because 2d4 will result in 2 to 8 points of damage, while Alice’s 1d6 will result in 1 to 6 points of damage. (If you knew statistics math, you could calculate that Bob’s expected value of damage is 5, which is larger than Alice’s expected value of damage is 3.5.)

So would you bet on Alice or Bob to win in a fight? It’s hard to tell, they seem pretty evenly matched. Even if you knew a lot of statistics, doing all these calculations would be a pain. But you don’t need to know statistics in order to write a program that simulates Dungeons and Dragons combat (that is, models this process) and then run several hundred or thousand simulated fights and see who wins on average.

Here’s such a program written in Python: (Download source)

import random, copy

NUM_FIGHTS = 1
VERBOSE = True

# Lower thac0 and lower ac values are better. Higher damage & hp values are better.
aliceTemplate = {'name': 'Alice', 'hp': 14, 'ac': 5, 'thac0': 18, 'dmgnum': 1, 'dmgsize':6, 'dmgmod': 0}
bobTemplate   = {'name': 'Bob',   'hp': 12, 'ac': 7, 'thac0': 16, 'dmgnum': 2, 'dmgsize':4, 'dmgmod': 0}

def display(s):
    if VERBOSE:
        print(s)

def attack(attacker, defender):
    if random.randint(1, 20) >= attacker['thac0'] - defender['ac']:
        damage = 0
        for i in range(attacker['dmgnum']):
            damage += random.randint(1, attacker['dmgsize'])
        damage += attacker['dmgmod']
        display('%s (%s hp) hits %s (%s hp) for %s points of damage. %s is reduced to %s hp.' % (attacker['name'], attacker['hp'], defender['name'], defender['hp'], damage, defender['name'], defender['hp'] - damage))
        defender['hp'] -= damage
    else:
        display('%s misses %s.' % (attacker['name'], defender['name']))

aliceWins = 0
bobWins = 0
for i in range(NUM_FIGHTS):
    display('======================')
    display('Start of combat #%s' % (i+1))
    alice = copy.deepcopy(aliceTemplate)
    bob = copy.deepcopy(bobTemplate)
    while True:
        attack(alice, bob)
        if bob['hp'] <= 0:
            break

        attack(bob, alice)
        if alice['hp'] <= 0:
            break
    if alice['hp'] <= 0:
        display('Alice has died.')
        bobWins += 1
    if bob['hp'] <= 0:
        display('Bob has died.')
        aliceWins += 1

print()
print('Alice won %s (%s%%) fights. Bob won %s (%s%%) fights.' % (aliceWins, round(aliceWins / NUM_FIGHTS * 100, 2), bobWins, round(bobWins / NUM_FIGHTS * 100, 2)))

When you run this program, it produces output like this:

======================
Start of combat #1
Alice misses Bob.
Bob (12 hp) hits Alice (14 hp) for 6 points of damage. Alice is reduced to 8 hp.
Alice misses Bob.
Bob misses Alice.
Alice misses Bob.
Bob misses Alice.
Alice misses Bob.
Bob misses Alice.
Alice (8 hp) hits Bob (12 hp) for 5 points of damage. Bob is reduced to 7 hp.
Bob misses Alice.
Alice misses Bob.
Bob misses Alice.
Alice misses Bob.
Bob (7 hp) hits Alice (8 hp) for 2 points of damage. Alice is reduced to 6 hp.
Alice (6 hp) hits Bob (7 hp) for 6 points of damage. Bob is reduced to 1 hp.
Bob misses Alice.
Alice (6 hp) hits Bob (1 hp) for 1 points of damage. Bob is reduced to 0 hp.
Bob has died.

Alice won 1 (100.0%) fights. Bob won 0 (0.0%) fights.

But maybe Alice just got lucky in this one fight. Let’s reprogram this program to turn off the verbose output (displaying text on the screen takes a lot more time than running the simulation) and up the number of fights to 30,000 (this is just changing the NUM_FIGHTS variable to 30000 and the VERBOSE variable to False):

Alice won 12909 (43.03%) fights. Bob won 17091 (56.97%) fights.

So we can see that with the given stats, Bob is at a slight advantage. The computer just ran 30,000 simulated fights. If we were to play 30,000 fights of Dungeons and Dragons with pencil, paper, and physical dice, it would take months to calculate this. But my laptop had the results in less than 8 seconds.

But what if we increased Alice’s hit points from 14 to 20. Who would win then?

Alice won 19438 (64.79%) fights. Bob won 10562 (35.21%) fights.

We see that those 6 extra hit points turns the tables and gives Alice the advantage. How about if her hit points were only increased to 16 instead of 20?

Alice won 15176 (50.59%) fights. Bob won 14824 (49.41%) fights.

We see that just tweaking the stats by 2 hit points is just enough to even out the advantages that Bob gets from his higher level of damage.

And when you look at this program, the only math it uses is addition, subtraction, and multiplication and division to find a percentage. Even if we made the simulation more sophisticated to account for the effects of magic spells, healing potions, multiple attackers, and switching to different weapons in mid-combat, we wouldn’t need to know more math or have made good math grades to do the programming for it.

Sure, go ahead and learn more math. It can only help you become a better programmer. But how much math do you need to know to program? Very little, actually.

UPDATE: I guess I’d add basic algebra to the required knowledge, but only insofar as that if X * 3 = 12 knowing why X is 4.

(Here’s a list of other discussions on Reddit about this topic.)