2010-机器学习复习提纲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年上海交通大学机器学习课程复习提纲

一、分数分配

平时作业占30分;

期末考试成绩占70分;

二、期末考试题型:

1. 是非、概念及简答题

2. 计算求解题

三、题目举例

1. 是非及选择题举例

判断正误。

1)h 1,h 2为定义在实例空间X 上的两个布尔假设(hypothesis), 如果断言h 1 ≥g h 2 不成立,则h 1

2. 概念及简答题举例

试给出机器(计算机程序)学习的一般定义。一般设计一个机器学习系统需要几个典型步骤?

3. 计算求解题举例

找出以下定义在两维欧氏空间R 2上的三个布尔函数之间存在的more_general_than 关系。

⎩⎨⎧≤≤-≤≤=其他且0

11,201),(y x y x f , ⎩⎨⎧≤+-=其他01)1(1),(22y x y x g ⎩⎨

⎧≤+-=其他04)2(1),(22y x y x h

试分别讨论在已知g(x,y)与正例(训练样例)不一致,与反例不一致两种不同情况下,是否可以利用上述关系来减少搜索的工作量, 即排除一些不可能是目标函数的假设。

三、复习内容要点

1. 引言

1.1 理解什么是机器学习。一个完整定义的学习问题需要确定哪些要素;

1.2 解释机器学习系统设计过程的一般步骤;

2. 概念学习和一般到特殊序

2.1 什么是概念学习?

2.2 理解假设的一般到特殊序,即理解关系more_general_than (more_general_than_or_equal_to)等。

2.3 掌握Find-S算法。

2.4 掌握变型空间(version space)的概念。

2.5 掌握候选消除算法。

2.6 假设空间H中与数据D一致的一般边界、特殊边界的定义。

2.7 解释概念学习中的最优查询策略。

2.8 掌握不完全学习的概念(变型空间包含多个假设时)的使用方法。

2.9 理解归纳偏置,与无偏学习的无用性。

3.决策树学习

3.1 决策树的定义;

3.2 基本的决策树学习算法;

3.3 相对于c个状态的分类的熵的计算方法;

3.4 信息增益的计算方法;

3.5 理解决策树学习算法对假设空间进行搜索的特点;

3.6 理解过度拟合;

3.7 掌握避免过度拟合的方法;错误率降低修剪,规则后修剪。

3.8 掌握处理连续值属性的方法,

3.9 理解增益比率标准;

3.10 理解处理缺少属性值的情况,处理不同代价的属性的方法。

4.人工神经网络

4.1 理解人工神经网络的生物学动机;

4.2 理解人工神经网络的适用情况;

4.3 掌握感知器(perceptron)的计算方法;

4.4 理解感知器的表示能力;

4.5 掌握感知器的训练法则(training rule);

4.6 掌握梯度下降算法。掌握梯度下降法则、随机梯度下降法则(delta rule)的计算;

4.7 掌握可微阈值单元:sigmoid单元,掌握BP算法;

4.8 了解前馈网络(Feedforward networks)的表示能力;

4.9 理解BP算法训练中的过度拟合现象及其解决方案;

4.10 掌握实际问题中输入、输出的编码以及网络结构的设定;

4.11 了解网络结构的动态设定方法;

6贝叶斯学习

6.1 掌握最大后验(maximum a posteriori, MAP)假设、极大似然(maximum likelihood, ML)假设的计算方法。

6.2 理解采用最大后验假设的贝叶斯方法刻画其他机器学习算法(如Find-S)的条件。6.3 理解回归问题中采用误差平方最小化的合理性;

6.4 掌握贝叶斯最优分类器的计算;

6.5 掌握朴素贝叶斯(Naive Bayes)分类器的假定和计算方法;

6.6 理解朴素贝叶斯(Naive Bayes)分类器在文本分类中的用法;

6.7 理解贝叶斯信念网的动机、表示和简单推理;

8基于实例的学习

8.1 理解基于实例学习的一般思想。

8.2 掌握K-近邻算法思想。

8.3 掌握距离加权的最紧邻算法思想。

8.4 了解局部加权回归的基本思想。

8.5 了解径向基函数的计算思想。

8.6 了解基于案例的推理的适用情况与特点。

8.7 掌握积极学习与消极学习的区别。

9遗传算法

9.1 掌握遗传算法的基本思想和算法。

9.2 了解常用的遗传算子。

9.3 了解命题规则、规则集合的二进制位串表示方法。

9.4 了解适应度函数及其使用方法。

9.5 了解遗传编程的基本思想。

10学习规则集合

10.1 掌握序列覆盖(sequential covering)算法的基本思想。

10.2 掌握序列覆盖中learn-one-rule算法的思想。

10.3 了解序列覆盖算法的变型。

10.4 -10.5 学习一阶规则集合

10.6- 10.7 逆规约

13.增强学习

13.1 理解增强学习的应用背景, 理解状态(state)、行动(action)、回报(reward)之间的关系。

13.2 掌握增强学习中的累计折算回报V (s)的公式。

13.3 理解策略(policy) 的含义。掌握最优策略的含义。

13.4 在Q-学习中,Q(s,a)的含义是什么?

13.5 掌握Q-学习算法。能够用Q-学习算法,计算一个动态环境中的Q(s,a)的表项。能够使用在训练过程中学到的Q(s,a)表,来指导以后的agent行为。

相关文档
最新文档