给机器学习初学者的建议
总阅读次
本文译自康奈尔大学信息科学系助理教授David Mimno写的《Advice for students of machine learning》,Mimno先生总结了一些对于机器学习学生/初学者的建议,强调理论与实践相结合,要有耐心和毅力,并提出了深入研究一篇论文的方法。希望对读者有所帮助。
原文地址:http://www.mimno.org/articles/ml-learn/
Mimno先生主页:http://mimno.infosci.cornell.edu/
下面是译文正文:
=============================================================
题名:给机器学习初学者的建议
作者:David Mimno
译者:whatbeg
最近我的一个学生问我学习机器学习的建议,于是我写下了这篇文章,此文偏向于我个人的经验,但我还是要概括一下。
我现在最乐意推荐的入门书籍是Kevin Murphy的书《机器学习》(Machine Learning)
你可能也想读
- Chris Bishop的《模式识别和机器学习》(译者注:Pattern Recognition and Machine Learning, PRML,经典书籍,豆瓣评分9.6)
- Daphne Koller的《概率图模型》(Probabilistic Graphical Models : Principles and Techniques)
- 以及David Mackay的《信息理论:推理与学习算法》(Information Theory, Inference and Learning Algorithms)
任何你学习的关于线性代数和概率论/统计学的知识都会有所帮助。
- Strang的《线性代数概论》(Introduction To Linear Algebra)
- Gelman,Carlin,Stern和Rubin的《贝叶斯数据分析》(Bayesian Data Analysis, Second Edition)
- Gelman和Hill的《用回归和多级/分层模型进行数据分析》(Data Analysis Using Regression and Multilevel/Hierarchical Models)
等,这些都是我喜欢的书籍。
不要想着一开始就获得某个知识的所有方面,尽量从多个不同的资源去阅读对同一个知识的描述。
没有什么比你自己亲自尝试更重要。选择一个模型,然后实现它,将它与其它开源实现进行比较,想一想,是不是有什么使程序工作的计算或者数学上的技巧呢?
读一些论文。我在读研究生的时候,早上和晚上都有20分钟在公交车上,我包里总是带着一篇有趣的论文,公交不是重点–真正起作用的是我每天能花大约半小时在阅读(这些论文)上。
选择一篇你喜欢的论文,然后花一个星期深入研究它,无时无刻不想着它,回忆每个公式的形式,花点时间散步并琢磨每个变量是如何影响结果的,不同的变量是怎样相互影响的。想一想公式6是如何得到公式7的--
作者常常省略中间步骤和代数细节,你可以将步骤补充完整。
要有耐心和毅力。
记住冯·诺伊曼所说的,“Young man, in mathematics you don’t understand things. You just get used to them.”。(大意是,年轻人,在数学上你什么都没理解,你只是习惯了它们)