最新(含答案)机器学习第一阶段练习题

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

机器学习第一阶段练习题

一、选择题

1. 以下三阶泰勒展开式错误的一项是（B ）

A. 3231211x !x !x e x +++=

B. 323

1211x x x )x ln(++=+ C. 331x !x x sin -= D. 321x x x x

-11+++= 分析：3231211x x -

x )x ln(+=+ 2. 以下不属于凸函数一项的是（D ）

A. y=-log x

B. y=x log x

C. y=||x||p

D. y=e ax

分析：a 应该限定取值范围：a ≥1或a ≤0

3. 以下说法错误的一项是（C ）

A. 负梯度方向是使函数值下降最快的方向

B. 当目标函数是凸函数时，梯度下降法的解是全局最优解

C. 梯度下降法比牛顿法收敛速度快

D. 拟牛顿法不需要计算Hesse 矩阵

分析：牛顿法需要二阶求导，梯度下降法只需一阶，因此牛顿法比梯度下降法更快收敛

4. 一般，k-NN 最近邻方法在（B ）的情况下效果较好

A. 样本较多但典型性不好

B. 样本较少但典型性好

C. 样本呈团状分布

D. 样本呈链状分布

分析：k 近邻算法对较多且典型不好的，团状，链状的样本不具有太大的优势

5. 机器学习中L1正则化和L2正则化的区别是？（A ）

A. 使用L1可以得到稀疏的权值，使用L2可以得到平滑的权值

B. 使用L1可以得到平滑的权值，使用L2可以得到平滑的权值

C 使用L1可以得到平滑的权值，使用L2可以得到稀疏的权值

D.使用L1可以得到稀疏的权值，使用L2可以得到稀疏的权值

分析：L1正则化偏向于稀疏，它会自动进行特征选择，去掉一些没用的特征，也就是将这些特征对应的权重置为0。L2主要功能是为了防止过拟合，当要求参数越小时，说明模型越简单，而模型越简单则，越趋向于平滑，从而防止过拟合。

二、公式推理题

1. 请写出通过条件概率公式和全概率公式推出贝叶斯公式的过程分析：条件概率：)

A (P )A

B (P )A |B (P )B (P )AB (P )B |A (P ==，全概率：∑=i

i

i )B (P )B |A (P )A (P 贝叶斯公式：∑=j

j j i i i )

B (P )B |A (P )B (P )B |A (P )A |B (P 2. 请写出正态分布的概率密度函数、期望、以及方差

分析：概率密度函数：02122

2>=--σ,e σπ)x (f σ)μx (；期望：μ)x (E =；方差：2σ)x (D =

三、

四、简答题

1.

2. 求函数R x ,x )x (f x

∈=的最小值

分析：令,x t x =两边取对数：,x ln x lnt =两边对t 求导：,x *

x x ln 't *t 11+= 令t ’=0：10-==+e x ,1 lnx 那么：，则e e t 1

-=即为f(x)最小值。

3. 欠拟合和过拟合的原因分别有哪些？如何避免？

分析：

欠拟合的原因：模型复杂度过低，不能很好的拟合所有的数据，训练误差大；

避免欠拟合：增加模型复杂度，如采用高阶模型（预测）或者引入更多特征（分类）等。过拟合的原因：模型复杂度过高，训练数据过少，训练误差小，测试误差大；

避免过拟合：降低模型复杂度，如加上正则惩罚项，如L1，L2，增加训练数据等。

4. 列举聚类算法有哪些相似性度量准则及公式（至少四个）

分析：曼哈顿距离：∑=-=n

i i i |y x |)y ,x (d 1；欧氏距离：p

n i p i i )|y x |()y ,x (d 11

∑=-=；

Jaccard 系数：|

B A ||B A |)B ,A (J ⋃⋂=；余弦相似度：|b ||a |b a θcos T ⋅=；皮尔森系数：Y X XY σσ)Y ,X (COV ρ⋅=

；相对熵（K-L 距离）：)x (q )x (p log E )q ||p (D )x (p = 5. 若要对以下图案进行聚类分析需要采用哪种聚类方法，简述理由和该方法步骤

分析：该图案为非凸状的，因此不能使用基于距离的聚类算法（k-means 、k-medoids 等），可选择密度聚类（DBSCAN 等）、网格聚类（STING ）等非距离的方法。

6.

7. 简述UserCF 和ItemCF 算法的相同点与不同点

分析：