机器学习 模拟题与参考答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机器学习模拟题与参考答案
一、单选题(共114题,每题1分,共114分)
1.机器学习这个术语是由( )定义的?
A、Arthur Samuel
B、Guido van Rossum
C、James Gosling
D、以上都不是
正确答案:A
2.在一个线性回归问题中,我们使用 R 平方(R-Squared)来判断拟合度。

此时,如果增加一个特征,模型不变,则下面说法正确的是?
A、如果 R-Squared 增加,则这个特征有意义
B、如果R-Squared 减小,则这个特征没有意义
C、仅看 R-Squared 单一变量,无法确定这个特征是否有意义。

D、以上说法都不对
正确答案:C
3.在SVM中, margin的含义是()
A、损失误差
B、间隔
C、幅度
D、差额
正确答案:B
4.下列哪种方法可以用来缓解过拟合的产生:( )。

A、正则化
B、增加更多的特征
C、以上都是
D、增加模型的复杂度
正确答案:A
5.当数据分布不平衡时,我们可采取的措施不包括( )。

A、对数据分布较少的类别过采样
B、对数据分布较多的类别欠采样
C、对数据分布较少的类别赋予更大的权重
D、对数据分布较多的类别赋予更大的权重
正确答案:D
6.同质集成中的个体学习器亦称()
A、异质学习器
B、同质学习器
C、基学习器
D、组件学习器
正确答案:C
7.以下哪些是无序属性()
A、{小,中,大}
B、闵可夫斯基距离
C、{飞机,火车、轮船}
D、{1,2,3}
正确答案:C
8.下列关于过拟合的说法错误的是
A、过拟合是指模型在训练集上表现很好,但是在交叉验证集和测试集上表现一般
B、解决过拟合可以采用Dropout方法
C、解决过拟合可以采用参数正则化方法
D、数据集扩增不能用来解决过拟合问题
正确答案:D
9.神经网络算法有时会出现过拟合的情况,那么采取以下哪些方法解决过拟合更为可行()。

A、减少训练数据集中数据的数量
B、增大学习的步长
C、为参数选取多组初始值,分别训练,再选取一组作为最优值
D、设置一个正则项减小模型的复杂度
正确答案:D
10.下列是机器学习中降维任务的准确描述的为
A、依据某个准则对项目进行排序
B、将其映射到低维空间来简化输入
C、预测每个项目的实际值
D、对数据对象进行分组
正确答案:B
11.对于在原空间中线性不可分问题,支持向量机()。

A、将数据映射到核空间中
B、在原空间中寻找线性函数划分数据
C、在原空间中寻找非线性函数的划分数据
D、无法处理
正确答案:A
12.下面关于SVM算法叙述不正确的是()
A、SVM是一种基于经验风险最小化准则的算法
B、SVM在解决小样本、非线性及高维模式识别问题中具有优势
C、SVM最终分类结果只与少数支持向量有关
D、SVM求得的解为全局唯一最优解
正确答案:A
13.“学习向量量化”与一般聚类算法不同的是()
A、数据样本带有类别标记
B、向量程度不同
C、簇的种类不同
D、结构不同
正确答案:A
14.以下关于Sigmoid的特点说法错误的是 ( )。

A、Sigmoid函数计算量小
B、趋向无穷的地方,函数变化很小,容易出现梯度消失的现象
C、可以将函数值的范围压缩到[0,1]
D、函数处处连续
正确答案:A
15.下列关于主成分分析的表述错误的是
A、主成分分析是数据增维的方法
B、通过主成分分析,可以用较少的新的指标来代替原来较多的指标反映的信息,并且新的指标之间是相互独立的
C、主成分分析方法一种数据降维的方法
D、通过主成分分析,可以将多个变量缩减为少数几个新的变量,而信息并没有损失,或者说信息损失很少
正确答案:A
16.不属于KNN算法要素的是:
A、训练样本的个数
B、k值的选择
C、分类决策的规则
D、距离度量
正确答案:A
17.关于随机森林,说法错误的是:
A、相对于Boosting系列的Adaboost和GBDT, RF实现比较简单。

B、在训练后,可以给出各个特征对于输出的重要性
C、训练高度串行化
D、随机采样,训练出的模型的方差小,泛化能力强
正确答案:C
18.如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?
A、测试样本误差始终为零
B、测试样本误差不可能为零
C、以上答案都不对
正确答案:C
19.以下关于神经网络的说法中,正确的是()?
A、增加网络层数,一定增加测试集错误率
B、减小网络层数,一定能减小测试集错误率
C、增加网络层数,可能增加测试集错误率
D、增加网络层数,一定能减小训练集错误率
正确答案:C
20.下列两个变量之间的关系中,那一个是线性关系
A、正方形的边长与周长
B、学生的性别与他(她)的数学成绩
C、儿子的身高与父亲的身高
D、人的工作环境与他的身体健康状况
正确答案:A
21.一般来说,下列哪种方法常用来预测连续独立变量?
A、线性回归
B、逻辑回顾
C、线性回归和逻辑回归都行
D、以上说法都不对
正确答案:A
22.对于非概率模型而言,可按照判别函数线性与否分成线性模型与非线性模型。

下面哪个模型不属于线性模型?
A、感知机
B、AdaBoost
C、K-means
D、k近邻
正确答案:B
23.关于logistic回归和SVM不正确的是()
A、SVM可以有效避免模型过拟合
B、SVM目标是结构风险最小化
C、Logistic回归可以用于预测事件发生概率的大小
D、Logistic 回归目标函数是最小化后验概率
正确答案:D
24.关于维数灾难说法错误的是?
A、高维度数据可使得算法泛华能力变得越来越弱
B、高维度数据增加了运算难度
C、降低高维度数据会对数据有所损伤
D、高维度数据难以可视化
正确答案:A
25.关于BP算法特点描述错误的是 ( )
A、输入信号顺着输入层、隐层、输出层依次传播
B、计算之前不需要对训练数据进行归一化
C、预测误差需逆向传播,顺序是输出层、隐层、输入层
D、各个神经元根据预测误差对权值进行调整
正确答案:B
26.关于决策树,以下哪种说法是正确的
A、是无监督学习
B、可读性强
C、只用于分类问题
D、只用于回归问题
正确答案:B
27.()是并行式集成学习方法最著名的代表
A、随机森林
B、Boosting
C、Bagging
D、AdaBoost
正确答案:C
28.关于SVM泛化误差描述正确的是
A、超平面与支持向量之间距离
B、超平面与支持向量之间距离
C、SVM的误差阈值
正确答案:A
29.哪一个是机器学习的合理定义?
A、机器学习从标记的数据中学习
B、机器学习是允许机器人智能行动的领域
C、机器学习是计算机编程的科学
D、机器学习能使计算机能够在没有明确编程的情况下学习
正确答案:D
30.四个点坐标为(1,1),(1,0),(-1,-1),(-1,0),用 SVM 分类的决策边界是
A、y = -x
B、x = 0
C、y = x
D、y = 0
正确答案:B
31.下列关于线性回归分析中的残差(Residuals)说法正确的是?
A、残差均值总是为零
B、残差均值总是小于零
C、残差均值总是大于零
D、以上说法都不对
正确答案:A
32.关于数据规范化,下列说法中错误的是( )。

A、标准化实际上是将数据在样本的标准差上做了等比例的缩放操作
B、包含标准化和归一化
C、归一化利用了样本中的最大值和最小值
D、标准化在任何场景下受异常值的影响都很小
正确答案:D
33.以下有关随机森林算法的说法错误的是:
A、随机森林算法的分类精度不会随着决策树数量的增加而提高
B、决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型分类效果越好
C、随机森林算法不需要考虑过拟合问题
D、随机森林算法对异常值和缺失值不敏感
正确答案:C
34.BP算法总结错误的是()。

A、当前层的连接权值梯度,取决于当前层神经元阈值梯度和上一层神经元输出
B、算法只要知道上一层神经元的阈值梯度,就能计算当前层神经元的阈值梯度和连接权值梯度
C、隐层的阈值梯度只跟本层的神经元输出值有关
D、隐层阈值梯度取决于隐层神经元输出、输出层阈值梯度和隐层与输出层的连接权值
正确答案:C
35.KNN算法属于一种典型的()算法
A、半监督学习
B、无监督学习
C、监督学习
D、弱监督学习
正确答案:C
36.下列哪种归纳学习采用符号表示方式?
A、经验归纳学习
B、遗传算法
C、联接学习
D、强化学习
正确答案:A
37.下列中为判别模型的是()
A、高斯混合模型
B、隐含马尔科夫模型
C、GAN模型
D、逻辑回归模型
正确答案:D
38.SVM中的代价参数C表示什么?
A、交叉验证的次数
B、以上都不对
C、用到的核函数
D、在分类准确性和模型复杂度之间的权衡
正确答案:D
39.以下关于训练集、验证集和测试集说法不正确的是( )。

A、验证集用于调整模型参数
B、测试集是纯粹是用于测试模型泛化能力
C、以上说法都不对
D、训练集是用来训练以及评估模型性能
正确答案:D
40.以下哪个是PCA算法的主要应用?
A、聚类
B、分类
C、距离度量
D、数据压缩
正确答案:D
41.点击率的预测是一个数据比例不平衡问题(比如训练集中样本呈阴性的比例为99%,阳性的比例是1%),如果我们用这种数据建立模型并使得训练集的准确率高达99%。

我们可以得出结论是:
A、模型的准确率非常高,我们不需要进一步探索
B、模型不好,我们应建一个更好的模型
C、无法评价模型
D、以上都不正确
正确答案:B
42.下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个
A、ReLU
B、Tanh
C、Logistic
D、Sigmoid
正确答案:B
43.KNN算法是基于()
A、概率空间
B、距离空间
C、线性空间
D、颜色空间
正确答案:B
44.1下列关于线性回归说法错误的是()
A、线性回归的前提假设之一是残差必须服从独立正态分布
B、自变量和残差不一定保持相互独立
C、残差的方差无偏估计是SSE/(n-p)
D、在现有模型上,加入新的变量,所得到的R^2的值总会增加正确答案:B
45.在大数据集上训练决策树,为了使用较少时间,我们可以()
A、增加学习率
B、增加树的深度
C、减少树的数量
D、减少树的深度
正确答案:D
46.下列关于Boosting和Bagging的描述正确的是:
A、Boosting主要关注降低方差
B、Boosting的代表算法有随机森林
C、Bagging基于自助采样法
D、Bagging主要关注降低偏差
正确答案:C
47.下面不属于过拟合原因的是
A、训练数据过多
B、特征维度过多
C、模型假设过于复杂
D、噪声过多
正确答案:A
48.假设现在只有两个类,这种情况下SVM需要训练几次?
A、4
B、1
C、3
D、2
正确答案:B
49.一对一法分类器,k个类别需要多少个SVM:
A、k!
B、k
C、k(k-1)/2
D、k(k-1)
正确答案:C
50.以下关于感知器说法错误的是: ( )
A、感知器中的偏置只改变决策边界的位置
B、可为感知器的输出值设置阈值使其用于处理分类问题
C、单层感知器可以用于处理非线性学习问题
D、感知器是最简单的前馈式人工神经网络
正确答案:C
51.以下关于学习率说法错误的是()。

A、学习率的选择不能太大也不能太小
B、学习率太大会导致无法收敛
C、学习率必须是固定不变的
D、学习率太小会使得算法陷入局部极小点
正确答案:C
52.决策树模型中应如何妥善处理连续型属性
A、利用固定阈值进行离散化
B、根据信息增益选择阈值进行离散化
C、直接忽略
D、随机选择数据标签发生变化的位置进行离散化
正确答案:B
53.下列有关支持向量机说法不正确的是:
A、是凸二次优化问题
B、采用结构风险最小化原理
C、得到的是局部最优解
D、具有很好的推广能力
正确答案:C
54.假如我们使用 Lasso 回归来拟合数据集,该数据集输入特征有 100 个(X1,X2,…,X100)。

现在,我们把其中一个特征值扩大 10 倍(例如是特征 X1),然后用相同的正则化参数对 Lasso 回归进行修正。

那么,下列说法正确的是?
A、特征 X1 很可能被排除在模型之外
B、特征 X1 很可能还包含在模型之中
C、无法确定特征 X1 是否被舍弃
D、以上说法都不对
正确答案:B
55.极大似然估计是()
A、通过总体分布才能求出来的统计量
B、与总体分布无关的统计量
C、对数似然方程的解
D、似然方程的解
正确答案:A
56.关于K-均值算法,以下说法不正确的是
A、K-均值算法是一种划分方法。

B、K-均值算法能发现任意形状的簇。

C、C. K-均值算法不一定收敛于全局最优解。

D、比起DBSCAN算法来,K更好
正确答案:B
57.下列有关SVM和LR说法不正确的是()
A、LR判别式模型
B、SVM是判别式模型
C、SVM和LR都是分类模型
D、SVM是分类模型,LR是回归模型
正确答案:D
58.混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是
A、七分之四
B、三分之二
C、二分之一
D、四分之一
正确答案:C
59.在机器学习中,学得的模型适用于新样本的能力称为()
A、训练能力
B、分析能力
C、验证能力
D、泛化能力
正确答案:D
60.朴素贝叶斯是一种典型的基于概率的机器学习方法,它利用了
A、先验概率
B、后验概率
C、以上都是
D、以上都不是
正确答案:C
61.对决策树进行剪枝处理的主要目的是什么
A、避免过拟合,提升泛化能力
B、提高对训练集的学习能力
C、避免欠拟合
D、避免过拟合,降低泛化能力
正确答案:A
62.当训练集很多时,一种更为强大的结合策略是使用(),即通过另一个学习器来进行结合。

A、学习法
B、平均法
C、投票法
D、加权投票法
正确答案:A
63.以下关于机器学习描述错误的是?
A、研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能
B、是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科
C、基于数据的机器学习是现代智能技术中的重要方法之一
D、器学习强调三个关键词:算法、模型、训练
正确答案:D
64.下列不属于集成学习方法是
A、boosting
B、bagging
C、stacking
D、connecting
正确答案:D
65.关于BP算法优缺点的说法错误的是 ( )。

A、BP算法不能用于处理非线性分类问题
B、BP算法容易陷入局部最小值
C、BP算法训练时间较长
D、BP算法训练时候可能由于权值调整过大使得激活函数达到饱和
正确答案:A
66.下列不是SVM核函数的是:
A、logistic核函数
B、径向基核函数
C、多项式核函数
D、Sigmoid核函数
正确答案:A
67.StandardScaler预处理方法可以表示为?=(?-?)/?,其中?表示特征所在列的
A、最大值
B、分解阈值
C、均值
D、方差
正确答案:D
68.关于BP算法反向传播的说法正确的是()。

A、BP算法反向传播进行更新时一般用到微积分的链式传播法则
B、BP算法更新量与步长关系不大
C、BP算法反向传播的预测误差值一般由真实标签值和预测标签值的差计算得来
D、BP算法反向传播的目的是只对权值进行更新
正确答案:A
69.一个包含n类的多分类问题,若采用一对剩余的方法,需要拆分成多少次?
A、n+1
B、n
C、1
D、n-1
正确答案:D
70.如果一个 SVM 模型出现欠拟合,那么下列哪种方法能解决这一问题?
A、增大惩罚参数 C 的值
B、减小惩罚参数 C 的值
C、减小核系数(gamma参数)
D、都不正确
正确答案:A
71.线性回归能完成的任务是
A、预测离散值
B、聚类
C、预测连续值
D、分类
正确答案:C
72.EM算法是()学习算法
A、都不是
B、无监督
C、半监督
D、有监督
正确答案:B
73.模型评估的常用方法有哪些
A、留出法
B、交叉验证法
C、自助法
D、以上都是
正确答案:D
74.下面关于贝叶斯分类器描述错误的是
A、是基于后验概率
B、以贝叶斯定理为基础
C、可以用极大似然估计法解贝叶斯分类器
D、可以解决有监督学习的问题
正确答案:A
75.AGNES是一种()聚合策略的层次聚类算法
A、A自顶向下
B、自底向上
C、由最近样本决定
D、D最远样本决定
正确答案:B
76.JC系数的度量公式()
A、a/b+c
B、B.a/a+b
C、b/b+c
D、a/a+b+c
正确答案:D
77.K均值算法的K指的是什么?
A、K是均值的数值
B、K是均值的最大限值
C、K是分类的数量
D、K是分类的迭代次数
正确答案:B
78.以下哪项不是降维的优点
A、丢失部分信息
B、节省空间
C、加速后续的训练算法
D、将数据可视化,从中获得洞察,了解最重要的特征正确答案:A
79.SVM算法的性能取决于:
A、以上所有
B、软间隔参数
C、核函数的参数
D、核函数的选择
正确答案:A
80.以下关于降维说法不正确的是?
A、降维是将训练样本从高维空间转换到低维空间
B、降维不会对数据产生损伤
C、通过降维可以更有效地发掘有意义的数据结构
D、降维有助于数据可视化
正确答案:B
81.决策树学习的关键是
A、剪枝
B、初始结点选择
C、选择最优划分属性
D、分枝
正确答案:C
82.决策树中不包含以下哪种结点
A、内部结点
B、根节点
C、叶节点
D、外部结点
正确答案:D
83.哪些机器学习模型经过训练,能够根据其行为获得的奖励和反馈做出一系列决策?
A、无监督学习
B、监督学习
C、强化学习
D、以上全部
正确答案:C
84.以下哪个不是常见的决策树算法
A、ID3
B、C4.5
C、CART
D、DBSCAN
正确答案:D
85.下列贝叶斯网结构中不属于三种典型的依赖关系
A、同父结构
B、顺序结构
C、V型结构
D、选择结构
正确答案:D
86.关于决策树结点划分指标描述正确的是
A、信息增益越大越好
B、基尼指数越大越好
C、类别非纯度越大越好
D、信息增益率越小越好
正确答案:A
87.朴素贝叶斯分类器的特征不包括
A、数据的缺失值影响不大
B、要求数据的属性是相互独立的
C、孤立的噪声对该分类器的影响不大
D、条件独立的假设可能不成立
88.以下哪项是非线性降维方法
A、PCA(主成分分析)
B、LDA(线性判别)
C、ICA(独立成分分析)
D、KPCA(核化线性降维)
正确答案:D
89.做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。

然后,用阈值n(n>0.5)重新划分样本到正例类和反例类,下面哪一种说法正确是()1.增加阈值不会提高召回率 2..增加阈值会提高召回率 3..增加阈值不会降低查准率 4.增加阈值会降低查准率
A、1、3
B、2、4
C、1
D、2
正确答案:A
90.下列方法中,属于无监督学习的为()
A、线性回归
B、K均值
C、神经网络
D、决策树
正确答案:B
91.若svm出现欠拟合,以下合适的做法是
A、使用更powful的kernel
B、使用L2 正规化
C、做数据增强
D、增加训练样本
正确答案:A
92.对主成分分析PCA方法描述正确的是:
A、投影矩阵是正交矩阵
B、进行非正交投影
C、PCA不需要进行样本去均值
D、投影到特征值最小的方向
93.EM算法的停止条件()
A、训练器异常
B、数据样本异常
C、似然函数减小
D、已达到最大迭代轮数
正确答案:D
94.基于层次的聚类算法包括( )。

A、基于网络的聚类算法
B、基于密度的聚类算法
C、合并的层次聚类
D、基于划分的算法
正确答案:C
95.关于EM算法正确的是
A、EM算法包括两步:E算法和M算法
B、EM算法一定能收敛到全局最大值点
C、英文全称是Expectation-Minimization
D、以上都不正确
正确答案:A
96.构建一个最简单的线性回归模型需要几个系数(只有一个特征)?
A、2 个
B、3 个
C、1 个
D、4 个
正确答案:A
97.以下哪个不是原型聚类算法()
A、K均值算法
B、学习向量量化LVQ
C、高斯混合聚类
D、PCA算法
正确答案:D
98.下列误差和错误中,哪一项是由于训练样本的错误而导致?
A、偏差
B、泛化误差
C、噪声
D、方差
正确答案:C
99.将数据集D进行适当处理,产生出训练集S和测试集T,有哪些常见的做法:
A、留出法
B、交叉验证法
C、自助法
D、以上都是
正确答案:D
100.谷歌新闻每天收集非常多的新闻,并运用( )方法再将这些新闻分组,组成若干类有关联的新闻。

于是,搜索时同一组新闻事件往往隶属同一主题的,所以显示到一起。

A、关联规则
B、聚类
C、回归
D、分类
正确答案:B
101.朴素贝叶斯分类器的三种实现不包括
A、基于伯努利模型实现
B、属性条件独立性假设实现
C、基于高斯模型实现
D、基于多项式模型实现
正确答案:B
102.给定一定数量的红细胞、白细胞图像,但是并不知道图像与标签的对应关系,设计一个红白细胞分类器,这属于()问题
A、半监督学习
B、无监督学习
C、监督学习
D、以上都可以
正确答案:B
103.极大似然估计中参数是()
A、未知的随机变量
B、确定且已知的量
C、已知的随机变量
D、确定且未知的量
正确答案:D
104.按照求解方法进行分类算法的划分,下列中为生成模型的是()
A、贝叶斯分类器
B、K近邻
C、决策树
D、支持向量机SVM
正确答案:A
105.下列有关核函数不正确的是:
A、函数与非线性映射并不是一一对应的关系
B、可以采用cross-va1idalion方法选择最佳核函数
C、满足Mercer条件的函数不一定能作为支持向量机的核函数
D、极大地提高了学习机器的非线性处理能力
正确答案:C
106.假设你有以下数据:(0,2)(2,2)(3,1)输入和输出都只有一个变量。

使用线性回归模型(y=wx+b)来拟合数据。

那么使用留一法(Leave-One Out)交叉验证得到的均方误差是多少?
A、49/27
B、10/32
C、39/27
D、55/27
正确答案:A
107.混淆矩阵的真负率公式是为
A、TN/(TN+FP)
B、FN/(TP+FN)
C、FP/(FP+TN)
D、TP/(TP+FN)
正确答案:A
108.假设我们使用原始的非线性可分版本的 Soft-SVM 优化目标函数。

我们需要做什么来保证得到的模型是线性可分离的?
A、C = 0
B、C = 1
C、C 正无穷大
D、C 负无穷大
正确答案:C
109.若某学习器预测的是离散值,则此类学习任务称为()
A、强化学习
B、回归
C、分类
D、聚类
正确答案:C
110.在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?
A、使用常数项
B、更新权重 w 时,使用的是矩阵求逆还是梯度下降
C、多项式阶数
正确答案:C
111.关于BP算法信号前向传播的说法正确的是()。

A、BP算法在计算正向传播输出值时需要考虑激活函数
B、BP算法信号前向传播的计算量跟输入层神经元数目无关
C、BP算法只有在隐层才有激活函数
D、BP算法信号传播的顺序是输出层、隐层、输入层。

正确答案:A
112.对Boosting模型的描述错误的是
A、采用串行训练模式
B、增加被错误分类样本的权值
C、通过改变训练集进行有针对性的学习
D、基础分类器采用少数服从多数原则进行集成
正确答案:D
113.对函数dist(.,.)若它是一个距离度量则需要满足的基本特性中以下哪个不是正确答案
A、递增性
B、同一性
C、对称性
D、非负性
正确答案:A
114.“没有免费的午餐定理”告诉我们
A、没有可以适应一切问题的算法
B、我们不能对问题有先验假设
C、设计好的算法是徒劳的
D、对于一个特定的问题,任何算法都是一样好的正确答案:A。

相关文档
最新文档