《机器学习》教学大纲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《机器学习》教学大纲
课程编号:
课程名称:机器学习
英文名称:Machine Learning
先修课程:高等数学(数学分析)、线性代数(高等代数)、概率论与数理统计、程序设计基础
总学时数:54学时
一、教学目的
本课程可作为计算机科学与技术、智能科学与技术相关本科专业的必修课,也可作为其它本科专业的选修课,或者其它专业低年级研究生的选修课。

本课程的教学目的是使学生理解机器学习的基本问题和基本算法,掌握它们的实践方法,为学生今后从事相关领域的研究工作或项目开发工作奠定坚实的基础。

具体来讲,要使学生理解聚类、回归、分类、标注相关算法并掌握它们的应用方法;理解概率类模型并掌握它们的应用方法;理解神经网络类模型并掌握它们的应用方法;理解深度学习模型并掌握它们的应用方法;理解距离度量、模型评价、过拟合、最优化等机器学习基础知识;掌握特征工程、降维与超参数调优等机器学习工程应用方法。

二、教学要求
总体上,本课程的教学应本着理论与实践相结合的原则,深入浅出,突出重点,在重视基础理论的同时,注意培养学生独立思考和动手能力。

在内容设计上,应以示例入手,逐步推进,详尽剖析算法思想与基本原理。

在实施方法上,应采取启发式教学方法,在简要介绍算法思想和流程的基础上,引导学生自行运行并分析实现代码。

在教学手段上,应结合板书、多媒体、网络资源等多种传授方法,提高学生兴趣。

在实验教学上,应促进学生对讲授知识的理解,开拓眼界,提升实践能力。

三、教学内容
本课程内容共分为八章。

(一)绪论(1学时)
【内容】机器学习的基本概念,机器学习算法及其分类,课程内容介绍,编程环境及工具包。

【重点】机器学习的基本概念,机器学习算法分类。

(二)聚类(11学时,含4学时实验课)
【内容】K均值聚类及其改进算法,聚类的任务,样本点常用距离度量,聚类算法评价指标,聚类算法分类,DBSCAN算法及其派生算法,AGNES算法。

【重点】距离度量,聚类算法评价指标,K均值算法,DBSCAN算法。

【难点】聚类算法评价指标,DBSCAN算法。

(三)回归(8学时)
【内容】回归任务与评价方法,线性回归模型,全局最优、凸优化等机器学习中的最优化理论,迭代法、梯度下降法、牛顿法等最优化方法,多项式回归,过拟合与泛化,向量相关性与岭回归,局部回归。

【重点】线性回归模型,梯度下降法,多项式回归,过拟合与泛化,向量相关性与岭回归。

【难点】最小二乘法求解线性回归模型,岭回归算法。

(四)分类(10学时,含2学时案例讨论课)
【内容】回归任务与评价方法,线性回归模型,全局最优、凸优化等机器学习中的最优化理论,迭代法、梯度下降法、牛顿法等最优化方法,多项式回归,过拟合与泛化,向量相关性与岭回归,局部回归。

【重点】线性回归模型,梯度下降法,多项式回归,过拟合与泛化,向量相关性与岭回归。

【难点】最小二乘法求解线性回归模型,岭回归算法。

(五)特征工程、降维与超参数调优(4学时)
【内容】特征工程,数据总体分析,数据可视化,数据预处理,奇异值分解降维方法,主成分分析降维方法,网格搜索超参数调优方法,随机搜索超参数调优方法。

【重点】数据预处理方法,主成分分析降维方法,网格搜索超参数调优方法。

【难点】数据预处理方法,主成分分析降维方法。

(六)概率模型与标注(8学时)
【内容】分类、聚类和标注任务的概率模型,生成模型和判别模型,概率模型的简化假定,逻辑回归模型的概率分析,朴素贝叶斯分类,EM 算法与高斯混合聚类,隐马尔可夫模型,条件随机场模型。

【重点】朴素贝叶斯分类,EM算法,隐马尔可夫模型。

【难点】EM算法,隐马尔可夫模型。

(七)神经网络(8学时)
【内容】神经元,神经网络,分类、聚类、回归、标注任务的神经网络模型,误差反向传播学习算法,多层神经网络常用损失函数,多层
神经网络常用优化算法,多层神经网络中过拟合的抑制,竞争学习,自组织特征映射网络的结构与学习。

【重点】神经元模型,神经网络的结构,误差反向传播学习算法,多层神经网络常用损失函数,多层神经网络常用优化算法,多层神经网络中过拟合的抑制。

【难点】误差反向传播学习算法,结合动量优化和步长优化的算法。

(八)深度学习(4学时)
【内容】卷积层,池化层,Flatten层,批标准化层,典型卷积神经网络,循环神经网络的基本结构、网络结构,长短时记忆网络,双向循环神经网络和深度循环神经网络。

【重点】卷积层,批标准化层,长短时记忆网络。

【难点】批标准化层,长短时记忆网络。

四、教科书
《机器学习》清华大学出版社王衡军编著。

相关文档
最新文档