给机器学习初学者的建议

文章目录

本文译自康奈尔大学信息科学系助理教授David Mimno写的《Advice for students of machine learning》，Mimno先生总结了一些对于机器学习学生/初学者的建议，强调理论与实践相结合，要有耐心和毅力，并提出了深入研究一篇论文的方法。希望对读者有所帮助。
原文地址：http://www.mimno.org/articles/ml-learn/
Mimno先生主页：http://mimno.infosci.cornell.edu/
下面是译文正文：

=============================================================
题名：给机器学习初学者的建议
作者：David Mimno
译者：whatbeg

最近我的一个学生问我学习机器学习的建议，于是我写下了这篇文章，此文偏向于我个人的经验，但我还是要概括一下。

我现在最乐意推荐的入门书籍是Kevin Murphy的书《机器学习》(Machine Learning)
你可能也想读

Chris Bishop的《模式识别和机器学习》(译者注：Pattern Recognition and Machine Learning, PRML，经典书籍，豆瓣评分9.6)
Daphne Koller的《概率图模型》(Probabilistic Graphical Models : Principles and Techniques)
以及David Mackay的《信息理论：推理与学习算法》(Information Theory, Inference and Learning Algorithms)

任何你学习的关于线性代数和概率论/统计学的知识都会有所帮助。

Strang的《线性代数概论》(Introduction To Linear Algebra)
Gelman,Carlin,Stern和Rubin的《贝叶斯数据分析》(Bayesian Data Analysis, Second Edition)
Gelman和Hill的《用回归和多级/分层模型进行数据分析》(Data Analysis Using Regression and Multilevel/Hierarchical Models)
等，这些都是我喜欢的书籍。

不要想着一开始就获得某个知识的所有方面，尽量从多个不同的资源去阅读对同一个知识的描述。

没有什么比你自己亲自尝试更重要。选择一个模型，然后实现它，将它与其它开源实现进行比较，想一想，是不是有什么使程序工作的计算或者数学上的技巧呢？

读一些论文。我在读研究生的时候，早上和晚上都有20分钟在公交车上，我包里总是带着一篇有趣的论文，公交不是重点–真正起作用的是我每天能花大约半小时在阅读（这些论文）上。

选择一篇你喜欢的论文，然后花一个星期深入研究它，无时无刻不想着它，回忆每个公式的形式，花点时间散步并琢磨每个变量是如何影响结果的，不同的变量是怎样相互影响的。想一想公式6是如何得到公式7的--作者常常省略中间步骤和代数细节，你可以将步骤补充完整。

要有耐心和毅力。
记住冯·诺伊曼所说的，“Young man, in mathematics you don’t understand things. You just get used to them.”。（大意是，年轻人，在数学上你什么都没理解，你只是习惯了它们）

Whatbeg's blog

当你的才华撑不起你的野心时，就应该静下心来好好学习。

给机器学习初学者的建议