如何轻松学会机器学习?
作为一名曾从事安卓开发并成功转行为算法工程师的程序员,我来分享一下我的学习经验。首先,要认识到机器学习确实有一定难度,因为需要掌握一些先验知识,并且没有及时的正反馈。整个学习过程可能会比较漫长,那么我们应该如何坚持下去呢?关键在于明确整个学习步骤,知道每个阶段的学习目标。标准是非常重要的,因为机器学习涉及的知识点众多,如果一开始就陷入细节中,很难看到学习的终点。接下来,我将详细介绍每个学习阶段的标准和原因。
I、初识机器学习
在刚接触机器学习时,你可能听到很多关于公式和概念的说法,但是我建议先对机器学习有一个整体的了解,看看自己是否对此感兴趣。有没有类似《Head First》这种快速简单入门的书呢?确实有,《集体编程智慧》就是一本非常经典的书。这本书虽然入门级别,但现在很少有人提起它了。一开始并不需要深入了解机器学习算法的知识,而是要知道机器学习能做什么,培养对机器学习的兴趣,这对你未来坚持下去至关重要。我在学生时代阅读这本书时,发现了机器学习的魅力,通过分析数据来获得集体智慧,这不就是编程的最高价值吗?
II、深入学习阶段
当你进入这个阶段时,说明你有充足的学习时间,希望能够系统地学习,而不是为了急于就业而走捷径。整个学习路径包括:机器学习理论、机器学习实战、深度学习理论、选择深度学习就业方向、实战方向。下面我将详细介绍每个阶段应该做什么以及如何做。
1. 机器学习理论
机器学习确实需要一定的数学基础,但要求并不是很高。只要你上过大学的《高等代数》和《概率论》课程,就能完全胜任。学习机器学习理论最扎实的方式就是上课。我曾经去上过计算机系的机器学习课程,一个学期的学习和考试,非常扎实。如果你无法去上课,或者老师水平有限,通过看书或者视频自学也是完全可行的。下面按时间顺序,介绍应该依次阅读哪些书。首先是《西瓜书》、李航的《统计学习方法》和《模式识别》三本书。你只需要看完其中一本,不必阅读全部章节,因为有些知识可能在你的整个算法生涯中都用不到。一开始我们只需要学习普适的知识,其他的可以在需要的时候补充学习。《西瓜书》只需要看到第九章的聚类部分,《统计学习方法》只需要看到第九章的EM算法部分,《模式识别》是清华大学研究生模式识别课程的教材,建议在看完《西瓜书》和《统计学习方法》后再翻阅一下。当你读完这些书后,会感觉自己对机器学习有所了解,但过一段时间可能会忘记一些内容。这时候可以看吴恩达的机器学习视频,在Coursera上就能找到。观看视频时一定要记笔记,因为以后你会经常翻阅,记录下来可以节省大量时间。此外,我还推荐知乎官方的「知乎知学堂」和「AGI课堂」联动推出的【程序员的AI大模型进阶之旅】公开课,共有两天的课程,完全免费。课程介绍了在LLM时代,程序员应该如何抓住这次机会,并且有名师讲解了模型原理以及开源工具LangChain等技术干货,对于理解LLM原理非常有帮助。通过这些学习,你已经全面了解了机器学习的基础知识,但你可能会怀疑自己是否能够实现这些算法,接下来就要进入实战阶段。
2. 机器学习实战
在此之前,你只见过伪代码,《机器学习实战》这本书则给出了各种算法的Python实现,而且都是原创的,没有使用现成的库。读完这本书后,你会有信心说,我不是调包侠,我能直接手写机器学习算法。在机器学习实战阶段,你需要学习使用pandas、numpy和sklearn这三个库,主要使用xgboost和lightgbm这两个模型。
当提到这个话题时,如果你想进一步了解,请访问葫芦娃AI
暂无评论内容