机器学习个人笔记完整版v5(原稿)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
斯坦福大学2014机器学习教程
个人笔记(V5.01)
摘要
本笔记是针对斯坦福大学2014年机器学习课程
视频做的个人笔记
黄海广
haiguang2000@
qq群:554839127
最后修改:2017-12-3
斯坦福大学2014机器学习教程中文笔记
课程概述
Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识。机器学习是当今非常普遍,你可能会使用这一天几十倍而不自知。很多研究者也认为这是最好的人工智能的取得方式。在本课中,您将学习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,你会不仅得到理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,你会学到一些硅谷利用机器学习和人工智能的最佳实践创新。
本课程提供了一个广泛的介绍机器学习、数据挖掘、统计模式识别的课程。主题包括:(一)监督学习(参数/非参数算法,支持向量机,核函数,神经网络)。(二)无监督学习(聚类,降维,推荐系统,深入学习推荐)。(三)在机器学习的最佳实践(偏差/方差理论;在机器学习和人工智能创新过程)。本课程还将使用大量的案例研究,您还将学习如何运用学习算法构建智能机器人(感知,控制),文本的理解(Web搜索,反垃圾邮件),计算机视觉,医疗信息,音频,数据挖掘,和其他领域。
本课程需要10周共18节课,相对以前的机器学习视频,这个视频更加清晰,而且每课都有ppt课件,推荐学习。
本人是中国海洋大学2014级博士生,2014年刚开始接触机器学习,我下载了这次课程的所有视频和课件给大家分享。中英文字幕来自于https:///course/ml,主要是教育无边界字幕组翻译,本人把中英文字幕进行合并,并翻译剩余字幕,对视频进行封装,归类,并翻译了课程目录,做好课程索引文件,希望对大家有所帮助。部分视频中文字幕由中国海洋大学的博士生翻译。视频已经翻译完毕,如果下载了视频,可以直接在文档中打开视频,内嵌中英文字幕,推荐使用potplayer。
这篇中文笔记,主要是根据视频内容和中文字幕以及ppt来制作,部分来源于网络,如“小小人_V”的笔记,并持续更新。
视频下载链接:/s/1pKLATJl 密码:xn4w
本人水平有限,如有公式、算法错误,请及时指出,发邮件给我,也可以加我qq。
今日发现这个笔记被下载超过3万次,应该说这个笔记有点用,我发现以前一些翻译小
错误,进行了修改,以免误导初学者。
黄海广
2017-6-7 夜笔记更新网址:https:///fengdu78/Coursera-ML-AndrewNg-Notes
知乎:https:///people/fengdu78/activities
文档修改历史
目录
第1周 (1)
一、引言(Introduction) (1)
1.1 欢迎 (1)
1.2 机器学习是什么? (4)
1.3 监督学习 (6)
1.4 无监督学习 (10)
二、单变量线性回归(Linear Regression with One Variable) (15)
2.1 模型表示 (15)
2.2 代价函数 (18)
2.3 代价函数的直观理解I (20)
2.4 代价函数的直观理解II (21)
2.5 梯度下降 (23)
2.6 梯度下降的直观理解 (26)
2.7 梯度下降的线性回归 (29)
2.8 接下来的内容 (31)
三、线性代数回顾(Linear Algebra Review) (32)
3.1 矩阵和向量 (32)
3.2 加法和标量乘法 (34)
3.3 矩阵向量乘法 (35)
3.4 矩阵乘法 (36)
3.5 矩阵乘法的性质 (37)
3.6 逆、转置 (38)
第2周 (39)
四、多变量线性回归(Linear Regression with Multiple Variables) (39)
4.1 多维特征 (39)
4.2 多变量梯度下降 (41)
4.3 梯度下降法实践1-特征缩放 (43)
4.4 梯度下降法实践2-学习率 (45)
4.5 特征和多项式回归 (46)
4.6 正规方程 (48)
4.7 正规方程及不可逆性(选修) (51)
五、Octave教程(Octave Tutorial) (54)
5.1 基本操作 (54)
5.2 移动数据 (61)
5.3 计算数据 (70)
5.4 绘图数据 (77)
5.5 控制语句:for,while,if语句 (83)
5.6 向量化 (89)
5.7 工作和提交的编程练习 (94)
第3周 (97)
六、逻辑回归(Logistic Regression) (97)
6.1 分类问题 (97)
6.3 判定边界 (101)
6.4 代价函数 (103)
6.5 简化的成本函数和梯度下降 (108)
6.6 高级优化 (112)
6.7 多类别分类:一对多 (117)
七、正则化(Regularization) (120)
7.1 过拟合的问题 (120)
7.2 代价函数 (122)
7.3 正则化线性回归 (124)
7.4 正则化的逻辑回归模型 (125)
第4周 (127)
第八、神经网络:表述(Neural Networks: Representation) (127)
8.1 非线性假设 (127)
8.2 神经元和大脑 (129)
8.3 模型表示1 (133)
8.4 模型表示2 (137)
8.5 样本和直观理解1 (139)
8.6 样本和直观理解II (141)
8.7 多类分类 (143)
第5周 (144)
九、神经网络的学习(Neural Networks: Learning) (144)
9.1 代价函数 (144)
9.2 反向传播算法 (146)
9.3 反向传播算法的直观理解 (149)
9.4 实现注意:展开参数 (152)
9.5 梯度检验 (153)
9.6 随机初始化 (155)
9.7 综合起来 (156)
9.8 自主驾驶 (157)
第6周 (160)
十、应用机器学习的建议(Advice for Applying Machine Learning) (160)
10.1 决定下一步做什么 (160)
10.2 评估一个假设 (163)
10.3 模型选择和交叉验证集 (165)
10.4 诊断偏差和方差 (167)
10.5 正则化和偏差/方差 (169)
10.6 学习曲线 (171)
10.7 决定下一步做什么 (173)
十一、机器学习系统的设计(Machine Learning System Design) (175)
11.1 首先要做什么 (175)
11.2 误差分析 (176)
11.3 类偏斜的误差度量 (179)
11.4 查准率和查全率之间的权衡 (180)