机器学习期末测试练习题3

合集下载

机器学习基础期末考试试题

机器学习基础期末考试试题

机器学习基础期末考试试题一、选择题(每题2分,共20分)1. 在机器学习中,下列哪个算法属于监督学习算法?A. 决策树B. K-meansC. 遗传算法D. 随机森林2. 以下哪个是线性回归的假设条件?A. 特征之间相互独立B. 特征与目标变量之间存在非线性关系C. 目标变量的误差项服从正态分布D. 所有特征都是类别型变量3. 支持向量机(SVM)的主要目标是什么?A. 找到数据点之间的最大间隔B. 减少模型的复杂度C. 增加模型的泛化能力D. 所有选项都正确4. 在深度学习中,卷积神经网络(CNN)通常用于处理哪种类型的数据?A. 音频数据B. 图像数据C. 文本数据D. 时间序列数据5. 交叉验证的主要目的是:A. 减少模型的过拟合B. 增加模型的复杂度C. 减少训练集的大小D. 增加模型的运行时间二、简答题(每题10分,共30分)6. 解释什么是过拟合,并给出一个避免过拟合的策略。

7. 描述随机森林算法的基本原理,并简述其相对于决策树的优势。

8. 解释梯度下降算法的工作原理,并说明为什么它在优化问题中如此重要。

三、计算题(每题25分,共50分)9. 假设你有一个线性回归模型,其目标函数为 \( J(\theta) =\frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2 \),其中 \( h_\theta(x) = \theta_0 + \theta_1 x_1 + \theta_2x_2 \)。

给定以下数据点:\[\begin{align*}x_1 & : [1, 2, 3] \\x_2 & : [1, 3, 4] \\y & : [2, 4, 5]\end{align*}\]请计算该模型的损失函数 \( J(\theta) \)。

10. 给定一个二分类问题的数据集,使用逻辑回归模型进行分类。

如果模型的决策边界是 \( w_1 x_1 + w_2 x_2 - \theta = 0 \),其中\( w_1 = 0.5 \),\( w_2 = -1 \),\( \theta = 0.5 \)。

最新模式识别与机器学习期末考查试题及参考答案

最新模式识别与机器学习期末考查试题及参考答案

模式识别与机器学习期末考查试卷研究生姓名:入学年份:导师姓名:试题1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。

答:(1)模式识别是研究用计算机来实现人类的模式识别能力的一门学科,是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。

主要集中在两方面,一是研究生物体(包括人)是如何感知客观事物的,二是在给定的任务下,如何用计算机实现识别的理论和方法。

机器学习则是一门研究怎样用计算机来模拟或实现人类学习活动的学科,是研究如何使机器通过识别和利用现有知识来获取新知识和新技能。

主要体现以下三方面:一是人类学习过程的认知模型;二是通用学习算法;三是构造面向任务的专用学习系统的方法。

两者关心的很多共同问题,如:分类、聚类、特征选择、信息融合等,这两个领域的界限越来越模糊。

机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题,其中包括图像/视频分析(文本、语音、印刷、手写)文档分析、信息检索和网络搜索等。

(2)机器学习和模式识别是分别从计算机科学和工程的角度发展起来的,各自的研究侧重点也不同。

模式识别的目标就是分类,为了提高分类器的性能,可能会用到机器学习算法。

而机器学习的目标是通过学习提高系统性能,分类只是其最简单的要求,其研究更侧重于理论,包括泛化效果、收敛性等。

模式识别技术相对比较成熟了,而机器学习中一些方法还没有理论基础,只是实验效果比较好。

许多算法他们都在研究,但是研究的目标却不同。

如SVM 在模式识别中研究所关心的就是其对人类效果的提高,偏工程。

而在机器学习中则更侧重于其性能上的理论证明。

试题2:列出在模式识别与机器学习中的常用算法及其优缺点。

答:(1) K近邻法KNN算法作为一种非参数的分类算法,它已经广泛应用于分类、回归和模式识别等。

在应用KNN算法解决问题的时候,要注意的两个方面是样本权重和特征权重。

优缺点:非常有效,实现简单,分类效果好。

机器学习期末试题及答案

机器学习期末试题及答案

机器学习期末试题及答案一、选择题1. 机器学习是一种:A. 人工智能子领域B. 数据分析工具C. 算法库D. 编程语言答案:A. 人工智能子领域2. 以下哪种算法是无监督学习算法?A. 决策树B. 支持向量机C. K均值聚类D. 朴素贝叶斯答案:C. K均值聚类3. 在机器学习中,过拟合是指:A. 模型无法适应新数据B. 模型过于简单C. 模型过于复杂D. 模型的精度较低答案:C. 模型过于复杂4. 机器学习任务中的训练集通常包括:A. 特征和标签B. 标签和模型参数C. 特征和模型参数D. 特征、标签和模型参数答案:A. 特征和标签5. 在机器学习中,用于评估模型性能的常见指标是:A. 准确率B. 回归系数C. 损失函数D. 梯度下降答案:A. 准确率二、填空题1. 监督学习中,分类问题的输出是离散值,而回归问题的输出是________________。

答案:连续值/实数值2. 机器学习中的特征工程是指对原始数据进行________________。

答案:预处理3. ________________是一种常见的集成学习算法,通过构建多个弱分类器来提高整体模型的性能。

答案:随机森林4. K折交叉验证是一种常用的评估模型性能和调参的方法,其中K 代表______________。

答案:折数/交叉验证的次数5. 在机器学习中,优化算法的目标是最小化或最大化一个称为______________的函数。

答案:目标函数/损失函数三、简答题1. 请简要解释什么是过拟合,并提出至少三种防止过拟合的方法。

答:过拟合是指在训练数据上表现很好,但在新数据上表现较差的现象。

防止过拟合的方法包括:- 数据集扩充:增加更多的训练样本,从而减少模型对特定数据的过度拟合。

- 正则化:通过在损失函数中引入正则化项,约束模型的复杂度,防止模型过分拟合训练数据。

- 交叉验证:使用交叉验证方法对模型进行评估,通过评估模型在不同数据集上的性能,选择性能较好的模型。

安徽农业大学机器学习期末考试试卷

安徽农业大学机器学习期末考试试卷

安徽农业大学机器学习期末考试试卷一、填空题1、工作过程中集中精力工作。

,不要喝酒,不要吃东西,。

如果你必须转移注意力到别的地方,必须停止设备。

2、各类铲刮作业都应低速行驶,角铲土和使用齿耙时必须用。

3、必须高度重视自己在工作中的安全责任。

以的安全意识投入4、如果将平地机放置在露天或不平整的场地上,最好用垫木将平地机架起,以使轮胎减载,然后将轮胎气压降低,并将轮胎遮挡起来,避免阳光直接照射。

5、一旦刮平操作开始后,可使用来改变"坡度跟踪控制器"的提升,这样可以使泥土被带出刮刀外。

6、转向时,或使用轴驱动轮转向时,不得,可使前轮倾斜以减少平地机转向半径,但在高速行驶时不得使用,以防出现急剧的反作用力。

7、做路拱时,先将路料堆放在路中央,使平地机刮刀前倾成角,稍提刀尾,平地机沿堆料中央匀速行驶,使路料沿刮刀向两侧移动。

8、如果用铰接式平地机左(右)倾平地时,使机架向右(左)饺接。

如果驱动轮打滑,则铰接角度,可以切土角度及侧推力。

9、发动机启动后,各仪表读数均应在规定值的范围内。

发动机运转时,不得操作,否则会造成发动机严重损坏。

10、使用平地机清除积雪时,应在轮,并应逐段探明路面的深坑、沟槽情况。

二、判断题1、一旦刮平操作开始后,可使用增减开关来改变"坡度跟踪控制器"的提升,这样可以使泥土被带出刮刀外。

( )2、在陡坡上作业时,不得使用饺接机架,以防止翻车造成严重的人机损伤。

在陡坡上来回进行作业时,刮刀伸出的方向应始终朝向上坡方向。

( )3、开始工作前,仔细检查设备的磨损标记和全部功能。

在接替前一个班时,询问工作条件和设备的功能。

( )4、使用平地机清除积雪时,应在轮胎上安装防滑链,并应逐段探明路面的深坑、沟槽情况。

( )5、严格按照手册规定的螺丝拧紧顺序与拧紧力矩对螺栓和螺母进行拧紧,可以稍微超过给定值。

( )6、在拆卸管路之前释放系统中的压力。

释放蓄能器中的压力。

机器学习考试试题

机器学习考试试题

机器学习考试试题一、选择题(每题 3 分,共 30 分)1、以下哪种情况不属于机器学习的应用场景?()A 图像识别B 自然语言处理C 传统的数值计算D 预测股票价格2、在监督学习中,如果预测值与真实值之间的差异较大,通常使用以下哪种方法来衡量模型的性能?()A 准确率B 召回率C 均方误差D F1 值3、下列哪种算法不是聚类算法?()A KMeansB 决策树C 层次聚类D 密度聚类4、对于一个过拟合的模型,以下哪种方法可以缓解?()A 增加训练数据量B 减少模型的复杂度C 增加正则化项D 以上都是5、以下关于特征工程的描述,错误的是?()A 特征工程是将原始数据转换为更有意义和有用的特征的过程B 特征选择是特征工程的一部分C 特征工程对于机器学习模型的性能影响不大D 特征缩放可以提高模型的训练效率6、在深度学习中,以下哪个不是常见的激活函数?()A Sigmoid 函数B ReLU 函数C Tanh 函数D Logistic 函数7、支持向量机(SVM)主要用于解决什么问题?()A 回归问题B 分类问题C 聚类问题D 降维问题8、以下哪种优化算法常用于神经网络的训练?()A 随机梯度下降(SGD)B 牛顿法C 共轭梯度法D 以上都是9、下面关于集成学习的说法,错误的是?()A 随机森林是一种集成学习算法B 集成学习可以提高模型的稳定性和泛化能力C 集成学习中的个体学习器必须是同一种类型的模型D 集成学习通过组合多个弱学习器来构建一个强学习器10、对于一个二分类问题,若混淆矩阵如下:||预测正例|预测反例||||||实际正例| 80 | 20 ||实际反例| 10 | 90 |则该模型的准确率是多少?()A 80%B 90%C 70%D 85%二、填空题(每题 3 分,共 30 分)1、机器学习中的有监督学习包括________、________和________等任务。

2、常见的无监督学习算法有________、________和________。

《机器学习》期末考试试卷附答案

《机器学习》期末考试试卷附答案

《机器学习》期末考试试卷附答案一、选择题(每题5分,共25分)1. 机器学习的主要目的是让计算机从数据中____,以实现某些任务或预测未知数据。

A. 抽取特征B. 生成模型C. 进行推理D. 分类标签答案:B. 生成模型2. K-近邻算法(K-NN)是一种____算法。

A. 监督学习B. 无监督学习C. 半监督学习D. 强化学习答案:A. 监督学习3. 在决策树算法中,节点的分裂是基于____进行的。

A. 信息增益B. 基尼不纯度C. 均方误差D. 交叉验证答案:A. 信息增益4. 支持向量机(SVM)的主要目的是找到一个超平面,将不同类别的数据点____。

A. 完全分开B. 尽量分开C. 部分分开D. 不分开答案:B. 尽量分开5. 哪种优化算法通常用于训练深度学习模型?A. 梯度下降B. 牛顿法C. 拟牛顿法D. 以上都对答案:D. 以上都对二、填空题(每题5分,共25分)1. 机器学习可以分为监督学习、无监督学习和____学习。

A. 半监督B. 强化C. 主动学习D. 深度答案:A. 半监督2. 线性回归模型是一种____模型。

A. 线性B. 非线性C. 混合型D. 不确定型答案:A. 线性3. 在进行特征选择时,常用的评估指标有____、____和____。

A. 准确率B. 召回率C. F1 分数D. AUC 值答案:B. 召回率C. F1 分数D. AUC 值4. 神经网络中的激活函数通常用于引入____。

A. 非线性B. 线性C. 噪声D. 约束答案:A. 非线性5. 当我们说一个模型具有很好的泛化能力时,意味着该模型在____上表现良好。

A. 训练集B. 验证集C. 测试集D. 所有集答案:C. 测试集三、简答题(每题10分,共30分)1. 请简要解释什么是过拟合和欠拟合,并给出解决方法。

2. 请解释什么是交叉验证,并说明它的作用。

答案:交叉验证是一种评估模型泛化能力的方法,通过将数据集分成若干个互斥的子集,轮流用其中若干个子集作为训练集,其余子集作为验证集,对模型进行评估。

机器学习算法导论期末考试题

机器学习算法导论期末考试题

机器学习算法导论期末考试题
1、给人脸打上标签再让模型进行学习训练的方法,属于( )
A.强化学习
B.半监督学习
C.监督学习
D.无监督学习
正确答案: C
2.机器学习进行的第一步是( )
A.数据收集
B.特征提取
C.交叉验证
D.模型训练
正确答案: B
3、一般来说,在机器学习中,用计算机处理一幅的图像,维度是( )
A.上万维
B.二维
C.三维
D.一维
正确答案: A
4、在讲解“没有免费午餐定理”的时候,我们假设以上每一种情况出现的概率相同,请问这样的假设是基于如”下哪种经验?( )
A.实践经验
B.无经验
C.常识经验
D.学习经验
正确答案: B
二、多选题
1、在本课程中,我们把机器学习分成了哪几类?( )
A.自监督学习
B.传统监督学习
C.无监督学习
D.半监督学习
正确答案:B、C、D
2、以下哪些算法是非显著式编程?( )
A.编程实现扫地机器人的路径规划
B.编程判断医疗CT片中的病变区域
C.编程统计一个地区的GDP
D.编程求解棋盘上的八皇后问题
正确答案:A. B
3、下面哪几种机器学习的分类,完全不需要人工标注数据?( )
A.半监督学习
B.强化学习
C.无监督学习
D.监督学习
正确答案:B. C。

机器学习期末试题

机器学习期末试题

中国科学院大学课程编号:712008Z 试 题 专 用 纸 课程名称:机器学习任课教师:卿来云———-—-————-————-—————---———-—--————-——————--—-—姓名学号 成绩一、基础题(共36分)1、请描述极大似然估计MLE 和最大后验估计MAP 之间的区别。

请解释为什么MLE 比MAP 更容易过拟合。

(10分)2、在年度百花奖评奖揭晓之前,一位教授问80个电影系的学生,谁将分别获得8个奖项(如最佳导演、最佳男女主角等)。

评奖结果揭晓后,该教授计算每个学生的猜中率,同时也计算了所有80个学生投票的结果。

他发现所有人投票结果几乎比任何一个学生的结果正确率都高。

这种提高是偶然的吗?请解释原因。

(10分)3、假设给定如右数据集,其中A 、B 、C 为二值随机变量,y 为待预测的二值变量。

(a) 对一个新的输入A =0, B =0, C =1,朴素贝叶斯分类器将会怎样预测y ?(10分)(b) 假设你知道在给定类别的情况下A 、B 、C 是独立的随机变量,那么其他分类器(如Logstic回归、SVM 分类器等)会比朴素贝叶斯分类器表现更好吗?为什么?(注意:与上面给的数据集没有关系。

)(6分) 二、回归问题。

(共24分) 现有N 个训练样本的数据集(){}1,Ni i i x y ==,其中,i i x y 为实数.1. 我们首先用线性回归拟合数据。

为了测试我们的线性回归模型,我们随机选择一些样本作为训练样本,剩余样本作为测试样本。

现在我们慢慢增加训练样本的数目,那么随着训练样本数目的增加,平均训练误差和平均测试误差将会如何变化?为什么?(6分) 平均训练误差:A 、增加 B 、减小 平均测试误差:A 、增加 B 、减小2. 给定如下图(a)所示数据。

粗略看来这些数据不适合用线性回归模型表示。

因此我们采用如下模型:()exp i i i y wx ε=+,其中()~0,1i N ε。

机器学习期末复习题及答案

机器学习期末复习题及答案

一、单选题1、在条件随机场(CRF)中,参数的学习通常使用哪种优化算法?()A.K-Means聚类B.梯度提升机(GBM)C.支持向量机(SVM)D.随机梯度下降(SGD)正确答案:D2、在概率无向图模型中,什么是团分解(Cluster Decomposition)?()A.一种通过节点之间的边传播信息,以更新节点的边缘概率的方法B.一种用于计算图的分割的算法C.一种将联合概率分布分解为多个局部概率分布的方法D.一种用于表示联合概率分布的无向树正确答案:C3、在数据不完备时,下列哪一种方法不是贝叶斯网络的参数学习方法()A.拉普拉斯近似B.最大似然估计方法C.蒙特卡洛方法D.高斯逼近正确答案:B4、在有向图模型中,什么是条件独立性?()A.给定父节点的条件下,子节点之间独立B.所有节点之间都独立C.所有节点的状态相互独立D.任意两个节点都是独立的正确答案:A5、在概率有向图模型中,节点表示什么?()A.变量B.参数C.条件概率D.边正确答案:A6、下列哪一项表示簇中样本点的紧密程度?()A.簇个数B.簇大小C.簇描述D.簇密度正确答案:D7、闵可夫斯基距离表示为曼哈顿距离时p为:()A.1B.2C.3D.4正确答案:A8、谱聚类与K均值聚类相比,对于什么样的数据表现更好?()A.低维数据B.高维数据C.线性可分数据D.高密度数据正确答案:B9、SVM适用于什么类型的问题?()A.既可用于线性问题也可用于非线性问题B.仅适用于回归问题C.仅适用于非线性问题D.仅适用于线性问题正确答案:A10、对于在原空间中线性不可分的问题,支持向量机()A.在原空间中寻找非线性函数划分数据B.无法处理C.利用核函数把数据映射到高维空间D.在原空间中寻找线性函数划分数据正确答案:C11、LDA主题模型中的alpha参数控制着什么?()A.单词分布的稀疏性B.文档-主题分布的稀疏性C.模型大小D.模型收敛速度正确答案:B12、LDA的全称是什么?()tent Dirichlet AllocationB.Linear Discriminant Analysistent Data AnalysisD.Lin Latent Dirichlet Allocation ear Data Algorithm正确答案:A13、以下对于梯度下降法中学习率lr的阐述,正确的是()A.lr小,收敛速度较快B.lr大,收敛速度较慢C.lr小,收敛速度较慢且较不易收敛D.lr大,收敛速度较快但可能导致不收敛正确答案:D14、在EM算法中,E代表期望,M代表()A.均值B.最大化C.最小化D.均方误差正确答案:B15、梯度下降中如何有效地捕捉到目标函数的全局最优?()A.调整学习速率B.增加模型复杂度C.使用梯度下降的变种算法D.增加训练样本量正确答案:C二、多选题1、下列机器学习常用算法中哪个属于分类算法?()A.K-meansB.最小距离分类器C.KNN(K近邻)D.逻辑回归正确答案:B、C、D2、下列关于决策树的说法正确的是?()A.CART使用的是二叉树B.其可作为分类算法,也可用于回归模型C.不能处理连续型特征D.它易于理解、可解释性强正确答案:A、B、D3、下列属于k近邻算法中常用的距离度量方法的是?()A.余弦相似度B.欧式距离C.曼哈顿距离D.闵可夫斯基距离正确答案:A、B、C、D4、下列属于深度模型的是?()A.DNNB.LightgbmC.LSTMD.Seq2Seq正确答案:A、C、D5、sklearn中RFECV方法分成哪两个部分?()A.RFEB.CVC.NLPD.MM正确答案:A、B6、以下关于蒙特卡洛方法描述正确的是()A.蒙特卡洛方法计算值函数可以采用First-visit方法B.蒙特卡洛方法方差很大C.蒙特卡洛方法计算值函数可以采用Every-visit方法D.蒙特卡洛方法偏差很大正确答案:A、B、C7、为什么循环神经网络可以用来实现自动问答,比如对一句自然语言问句给出自然语言回答()A.因为自动问答可以看成是一种序列到序列的转换B.因为循环神经网络能够处理变长输入C.因为循环神经网要比卷积神经网更强大D.因为卷积神经网络不能处理字符输入正确答案:A、B8、通常有哪几种训练神经网络的优化方法()A.梯度下降法B.随机梯度下降法C.小批量随机梯度下降法D.集成法正确答案:A、B、C9、隐马尔可夫模型的三个基本问题是()A.估值问题B.寻找状态序列C.学习模型参数D.状态更新正确答案:A、B、C10、在数据不完备时,贝叶斯网络的参数学习方法有()A.高斯逼近B.蒙特卡洛方法C.拉普拉斯近似D.最大似然估计方法正确答案:A、B、C11、基于约束的方法通过统计独立性测试来学习结点间的()A.独立性B.相关性C.依赖性D.完备性正确答案:A、B12、基于搜索评分的方法,关键点在于()A.确定合适的搜索策略B.确定评分函数C.确定搜索优先级D.确定选择策略正确答案:A、B13、条件随机场需要解决的关键问题有()A.特征函数的选择B.参数估计C.模型推断D.约束条件正确答案:A、B、C14、以下关于逻辑斯蒂回归模型的描述正确的是()A.针对分类的可能性进行建模,不仅能预测出类别,还可以得到属于该类别的概率B.直接对分类的可能性进行建模,无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题C.模型本质仍然是一个线性模型,实现相对简单D.逻辑斯蒂回归模型是线性回归模型正确答案:A、B、C、D15、LDA模型在做参数估计时,最常用的方法是()A.Gibbs采样方法B.变分推断C.梯度下降D.Beam search正确答案:A、B三、判断题1、关于EM算法的收敛性,EM算法理论上不能够保证收敛()正确答案:×2、多次运行,随机化初始点是对存在局部最优点的函数求解的一种方案()正确答案:√3、训练算法的目的就是要让模型拟合训练数据()正确答案:×4、循环神经网络按时间展开后就可以通过反向传播算法训练了()正确答案:√5、GIS算法的收敛速度由计算更新值的步长确定。

机器学习期末测试练习题3

机器学习期末测试练习题3

一、单选题1、以下关于感知器算法与支持向量机算法说法有误的是A. 由于支持向量机是基于所有训练数据寻找最大化间隔的超平面,而感知器算法却是相对随意的找一个分开两类的超平面,因此大多数时候,支持向量机画出的分类面往往比感知器算法好一些。

B.支持向量机是把所有训练数据都输入进计算机,让计算机解全局优化问题C.感知器算法相比于支持向量机算法消耗的计算资源和内存资源更少 ,但是耗费的计算资源更多D. 以上选项都正确正确答案:C2、假设你在训练一个线性回归模型,有下面两句话:如果数据量较少,容易发生过拟合。

如果假设空间较小,容易发生过拟合。

关于这两句话,下列说法正确的是?A.1正确,2错误B.1和2都错误C.1和2都正确D.1错误,2正确正确答案:A3、下面哪一项不是比较好的学习率衰减方法?t 表示为epoch 数。

A.α=11+2∗tᵯ0 B. α=1√ᵆᵯ0C. α=0.95ᵆᵯ0D.α=e ᵆᵯ0正确答案:D4、你正在构建一个识别足球(y = 1)与篮球(y = 0)的二元分类器。

你会使用哪一种激活函数用于输出层?A.ReLUB. tanhC.sigmoidD. Leaky ReLU正确答案:C5、假设你建立一个神经网络。

你决定将权重和偏差初始化为零。

以下哪项陈述是正确的?A.第一个隐藏层中的每个神经元将在第一次迭代中执行相同的计算。

但经过一次梯度下降迭代后,他们将会计算出不同的结果。

B.第一个隐藏层中的每个神经元节点将执行相同的计算。

所以即使经过多次梯度下降迭代后,层中的每个神经元节点都会计算出与其他神经元节点相同的结果。

C.第一个隐藏层中的每一个神经元都会计算出相同的结果,但是不同层的神经元会计算不同的结果。

D.即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算, 他们的参数将以各自方式进行更新。

正确答案:B6、某个神经网络中所有隐藏层神经元使用tanh激活函数。

那么如果使用np.random.randn(…,…)* 1000将权重初始化为相对较大的值。

机器学习(传统机器学习)期末测试练习题

机器学习(传统机器学习)期末测试练习题

机器学习(传统机器学习)期末测试练习题1、使用K-means算法得到了三个聚类中心,分别是[1,2],[-3,0],[4,2],现输入数据X=[3,1],则X属于第几类A.1B.3C。

2D.不能确定正确答案:B2、对一组无标签的数据X,使用不同的初始化值运行K-means算法50次,如何评测这50次聚类的结果哪个最优A.优化目标函数值最小的一组最优B.需要获取到数据的标签才能评测C.暂无方法D.最后一次运行结果最优正确答案:A3、下图是某个二维高斯混合模型的聚类结果,该GMM 的输出矩阵的形式为A.对角阵且非单位矩阵B.普通方阵C.单位矩阵D.不能确定正确答案:A二、多选题1、以下关于PCA算法的描述正确的有哪些A.即使输入数据X各个维度上的数值相似度较高,依旧需要对其去均值B.使用PCA算法时,数据压缩后的维度M可以设置的偏小一点C.在使用PCA算法时,有可能陷入局部最小值,所以需要使用不同的初始化数值多次计算以获得更好的结果D.已知使用PCA算法压缩后的数据Y以及压缩矩阵A,但是没法大致复原压缩前的数据X正确谜底:A、B2、有L个输入样本,每个样本的特征维度是N。

在设置压缩后的维度M时,以下哪些设置方式是合理的A.M = 0.1*NB.M= 0.1*LC.根据能量百分比准则,保留占据5%能量的M值D.根据能量百分比准则,保留占据95%能量的M值正确答案:A、D3、以下哪些是PCA算法可以解决的问题A.对维度较小的数据进行维度扩充B.对特征相关性较高的数据进行降维C.对维度大于3的数据进行可视化处理D.数据维度压缩正确答案:B、C、D。

山东财经大学《机器学习》2021 -2022学年第一学期期末试卷

山东财经大学《机器学习》2021 -2022学年第一学期期末试卷

山东财经大学《机器学习》2021 -2022学年第一学期期末试卷《机器学习》院/系——年纪——专业——姓名——学号—— 考试范围: 《机器学习》;满分:120 分;考试时间:120 分钟一、选择题(每题 2 分,共 20 分)1. 下列关于机器学习的描述,哪一项是正确的?A.机器学习是一种无需人工干预,机器就能自主产生智能的技术。

B.机器学习是让机器模拟人类的学习行为,以获取新的知识或技能。

C.机器学习仅适用于大规模数据集,不适用于小规模数据集。

D.机器学习是人工智能的一个子集,但两者没有本质区别。

2. 监督学习中的“标签”指的是什么?A.数据集中的特征值B.数据集中的目标变量C.数据集的分布规律D.数据集的噪声3. 下列哪种算法属于无监督学习?A.K-近邻算法B.决策树C.K-均值聚类D.逻辑回归4. 关于正则化技术,下列描述错误的是?A.正则化用于防止过拟合。

B.L1 正则化倾向于产生稀疏的权值。

C.L2 正则化倾向于产生平滑的权值。

D.正则化项越大,模型复杂度越高。

5. 在神经网络中,以下哪项不是常用的激活函数?A.SigmoidB.ReLUC.TanhD.Linear6.在机器学习中,哪项任务通常涉及通过训练数据来预测连续型的目标变量?A.分类B.回归C.聚类D.降维7.下列哪种算法属于集成学习方法?A.决策树B.随机森林C.K-均值聚类D.朴素贝叶斯8.在支持向量机(SVM)中,软间隔 SVM 通过什么方式处理数据中的噪声或异常值?A.增加样本数量B.引入松弛变量C.更改核函数D.调整学习率9.深度学习中,卷积神经网络(CNN)通常用于处理哪种类型的数据?A.文本数据B.图像数据C.序列数据D.表格数据10.当使用神经网络进行训练时,过拟合的一个可能表现是?A.训练集上的损失函数值持续增加B.训练集上的准确率持续增加,但测试集上的准确率停滞不前C.测试集上的损失函数值持续下降D.训练集和测试集上的准确率都持续增加二、填空题(每题 2 分,共 10 分)1.机器学习的三大要素包括______、______和______。

机器学习期末考试试题

机器学习期末考试试题

机器学习期末考试试题# 机器学习期末考试试题## 一、选择题(每题2分,共20分)1. 机器学习中的监督学习主要解决的问题类型是: - A. 回归问题- B. 分类问题- C. 聚类问题- D. 以上都是2. 下列哪个算法不是用于分类的:- A. 决策树- B. 支持向量机- C. K-means- D. 逻辑回归3. 在神经网络中,激活函数的作用是:- A. 增加计算复杂度- B. 引入非线性- C. 减少训练时间- D. 降低模型的泛化能力4. 交叉验证的主要目的是:- A. 加速模型训练- B. 减少模型过拟合- C. 增加数据量- D. 减少计算资源消耗5. 下列哪个不是深度学习模型:- A. 卷积神经网络(CNN)- B. 循环神经网络(RNN)- C. 随机森林- D. 长短期记忆网络(LSTM)## 二、简答题(每题10分,共30分)1. 请简述机器学习中的过拟合现象及其可能的解决方案。

2. 解释什么是特征工程,并说明其在机器学习中的重要性。

3. 描述一下什么是模型的泛化能力,并举例说明如何评估一个模型的泛化能力。

## 三、计算题(每题15分,共30分)1. 给定一个线性回归模型 \( y = \beta_0 + \beta_1 x_1 +\epsilon \),其中 \( \epsilon \) 服从均值为0的正态分布。

假设我们有以下数据点:- \( x_1 = [1, 2, 3, 4, 5] \)- \( y = [2, 4, 5, 4, 5] \)- 请计算最小二乘法估计的参数 \( \beta_0 \) 和 \( \beta_1 \)。

2. 假设有一个简单的二分类问题,我们使用逻辑回归模型进行分类。

给定以下数据点和对应的标签:- 特征:\( [x_1, x_2] = [[2, 1], [3, 0], [1, 1], [4, 1]] \) - 标签:\( y = [1, 0, 1, 0] \)- 请写出逻辑回归的假设函数 \( h(x) \),并计算使用梯度下降法更新参数的一次迭代过程。

机器学习试卷试题及答案

机器学习试卷试题及答案

机器学习试题(一共30题,标有下划线的,如3_1,3_2,只用选择其中一题)1. 在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?A. 多项式阶数B. 更新权重w 时,使用的是矩阵求逆还是梯度下降C. 使用常数项2. 假设你有以下数据:输入和输出都只有一个变量。

使用线性回归模型(y=wx+b)来拟合数据。

那么使用留一法(Leave-One Out)交叉验证得到的均方误差是多少?A. 10/27B. 39/27C. 49/27D. 55/273_1. 下列关于极大似然估计(Maximum Likelihood Estimate,MLE),说法正确的是(多选)?A. MLE 可能并不存在B. MLE 总是存在C. 如果MLE 存在,那么它的解可能不是唯一的D. 如果MLE 存在,那么它的解一定是唯一的3_2. 下列哪些假设是我们推导线性回归参数时遵循的(多选)?A. X 与Y 有线性关系(多项式关系)B. 模型误差在统计学上是独立的C. 误差一般服从0 均值和固定标准差的正态分布D. X 是非随机且测量没有误差的4_1. 为了观察测试Y 与X 之间的线性关系,X 是连续变量,使用下列哪种图形比较适合?A. 散点图B. 柱形图C. 直方图D. 以上都不对4_2. 一般来说,下列哪种方法常用来预测连续独立变量?A. 线性回归B. 逻辑回顾C. 线性回归和逻辑回归都行D. 以上说法都不对5. 个人健康和年龄的相关系数是-1.09。

根据这个你可以告诉医生哪个结论?A. 年龄是健康程度很好的预测器B. 年龄是健康程度很糟的预测器C. 以上说法都不对6. 下列哪一种偏移,是我们在最小二乘直线拟合的情况下使用的?图中横坐标是输入X,纵坐标是输出Y。

A. 垂直偏移(vertical offsets)B. 垂向偏移(perpendicular offsets)C. 两种偏移都可以D. 以上说法都不对7. 假如我们利用Y 是X 的 3 阶多项式产生一些数据(3 阶多项式能很好地拟合数据)。

机器学习(强化学习)期末测试练习题

机器学习(强化学习)期末测试练习题

1、Q-learning算法中,Q函数是
A.状态-动作值函数
B.状态函数
C.估值函数
D.奖励函数
正确答案:A
2、Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的
回报()
A.总和
B.最大值
C.最小值
D.期望值
正确答案:D
3、在强化学习过程中,学习率越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()
A.大,小
B.大,大
C.小,大
D.小,小
正确答案:A
4、在强化学习的过程中,()能够在稍微偏离目前最好策略的基础上,尝试更多策略,()能够运用目前最好的策略,获取更高的奖励
A.利用,探索
B.探索,利用
C.利用,输出
D.探索,输出
正确答案:B
5、在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用
当前Q函数最大动作的概率越()
A.小,小
B.大,小
C.大,大
D.小,大
正确答案:B
二、多选题
1、强化学习包含哪些元素
A.Reward
B.Agent
C.State
D.Action
正确答案:A、B、C、D
三、判断题
1、在DQN中,求解Q(s,a)时采用的策略是有限采样s,a,并通过采样值来估计Q值。

(√)
2、可以采用policy gradient算法来设计一款围棋游戏。

(√)
3、在Actor-Critic算法中,Q函数和V函数同时被优化。

(√)
4、TD算法使用完整的采样来计算长期奖励值。

(√)。

人工智能机器学习技术练习(习题卷3)

人工智能机器学习技术练习(习题卷3)

人工智能机器学习技术练习(习题卷3)说明:答案和解析在试卷最后第1部分:单项选择题,共155题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]对于神经网络的说法, 下面正确的是 :A)增加神经网络层数, 可能会增加测试数据集的分类错误率B)减少神经网络层数, 总是能减小测试数据集的分类错误率C)增加神经网络层数, 总是能减小训练数据集的分类错误率2.[单选题]支持向量机可以解决()A)分类问题B)回归问题C)分类问题和回归问题3.[单选题]关于SVM泛化误差描述正确的是A)超平面与支持向量之间距离B)超平面与支持向量之间距离C)SVM的误差阈值4.[单选题]下面哪个/些超参数的增加可能会造成随机森林数据过拟合?A)树的数量B)树的深度C)学习速率5.[单选题]下列哪个不是 RDD 的缓存方法 ()。

A)persist()B)Cache()C)Memory()6.[单选题]下列选项不属于专家系统底层核心部分的是()A)知识库B)推理机C)规则库D)决策树7.[单选题]在一个神经网络中,确定每个神经元的权重和偏差很重要。

用()方法可以确定神经元的权重和偏差,从而对函数进行拟合。

A)随机赋值,祈祷它们是正确的B)搜索所有权重和偏差的组合,直到得到最佳值C)赋予一个初始值,通过检杳与真值的误差,逐步迭代更新权重D)以上都不正确B)贝叶斯分类器C)神经网络D)线性模型9.[单选题](__)是一类用图来表达变量相关关系的概率模型。

A)神经元模型B)感知机模型C)概率图模型D)SVM10.[单选题]关于ZooKeeper临时节点的说法正确的是()A)创建临时节点的命令为:create-s/tmpmyvalueB)一旦会话结束,临时节点将被自动删除C)临时节点不能手动删除D)临时节点允许有子节点11.[单选题]情感分析技术可以应用于()A)股票市场分析B)互联网舆情分析与监控C)商品服务质量评估D)以上都是12.[单选题]以下集合是凸集的是A){(x,y) |y=x+1}B){(x,y) | x的平方 + y的平方 = 1}C){(x,y) | x的平方 + y的平方 > 1 }D){(x,y) |x=1 | y=1 }13.[单选题]线性SVM和一般线性分类器的区别主要是( )A)是否进行了空间映射B)是否确保间隔最大化C)是否能处理线性不可分问题D)训练误差通常较低14.[单选题]若1.数据加工、2.数据化、3.数据整齐化、4.数据分析,则在数据科学的基本流程顺序是(__)。

机器学习课程期末考试试题

机器学习课程期末考试试题

机器学习课程期末考试试题### 机器学习课程期末考试试题一、选择题(每题2分,共20分)1. 在机器学习中,通常所说的“过拟合”是指:- A. 模型在训练集上表现很好,但在测试集上表现较差 - B. 模型在训练集上表现较差- C. 模型在训练集和测试集上表现都很差- D. 模型在训练集上表现一般,但在测试集上表现很好2. 支持向量机(SVM)的核心思想是:- A. 找到最佳拟合线- B. 找到最佳拟合平面- C. 在特征空间中找到最优的决策边界- D. 在数据空间中找到最优的决策边界3. 以下哪个算法是用于聚类分析的?- A. 逻辑回归- B. 决策树- C. K-means- D. 随机森林4. 在神经网络中,激活函数的作用是:- A. 增加模型的复杂度- B. 引入非线性因素- C. 减少模型的复杂度- D. 使模型更容易训练5. 交叉验证的主要目的是什么?- A. 减少模型训练时间- B. 减少模型的过拟合风险- C. 提高模型的泛化能力- D. 增加模型的复杂度二、简答题(每题10分,共30分)1. 描述机器学习中的“训练集”和“测试集”的区别,并解释为什么在机器学习中需要将数据集分为训练集和测试集。

2. 解释什么是“决策树”,并简述如何使用决策树进行分类。

3. 什么是“梯度下降”算法?它在机器学习中如何应用?三、计算题(每题25分,共50分)1. 假设我们有一个简单的线性回归问题,模型的预测函数为 \( f(x) = wx + b \),其中 \( w \) 是权重,\( b \) 是偏置项。

给定数据集 \( \{(x_1, y_1), (x_2, y_2), ..., (x_n, y_n)\),其中\( y_i = wx_i + b + \epsilon_i \),\( \epsilon_i \) 是噪声项。

请推导最小二乘法的权重 \( w \) 和偏置 \( b \) 的更新公式。

人工智能机器学习技术练习(习题卷3)

人工智能机器学习技术练习(习题卷3)

人工智能机器学习技术练习(习题卷3)说明:答案和解析在试卷最后第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。

1.[单选题]如果我们说线性回归模型完美地拟合了训练样本(训练样本误差为零),则下面说法正确的是()。

A)测试样本误差始终为零B)测试样本误差不可能为零C)以上答案都不对2.[单选题]分类问题的label是一个( )值A)数B)类别C)类别或者数3.[单选题]()算法是通过智能体不断与环境进行交互,通过试错的方式来获得最佳策略A)有监督学习B)半监督学习C)无监督学习D)强化学习4.[单选题]下列方法中,属于无监督学习的为( )A)线性回归B)K均值C)神经网络D)决策树5.[单选题]在k近邻学习算法中,随着k的增加,上界将逐渐降低,当k区域无穷大时,上界和下界碰到一起,k近邻法就达到了()。

A)贝叶斯错误率B)渐进错误率C)最优值D)上界6.[单选题]F1参数(__),说明模型越稳定。

A)越小B)越大C)越趋近于某一特定值D)F1参数和模型稳定性没有关系7.[单选题]在训练集上每学到一条规则,就将该规则覆盖的训练样例去除,然后以剩下的训练样例组成训练集重复上述步骤。

这个过程称为(__)。

A)规则学习B)直推学习C)强化学习D)序贯覆盖8.[单选题]spark 是用以下哪种编程语言实现的A)cB)C++C)javaD)Scala9.[单选题]操作中,能够在神经网络中引入非线性的是(A)随机梯度下降B)ReLU函数C)卷积函数D)以上都不正确10.[单选题]根据_______,目前的集成学习方法大致可分为两大类,即个体学习器间存在强依赖关系、必须串行生成的序列化方法,以及个体学习器间不存在强依赖关系、可同时生成的并行化方法。

A)个体学习器的数量B)个体学习器的生成方式C)个体学习器的的类型D)个体学习器的的强弱11.[单选题]在支持向量机中,软间隔支持向量机的目标函数比硬间隔支持向量机多了一个()。

机器学习(强化学习)期末测试练习题

机器学习(强化学习)期末测试练习题

1、Q-learning算法中,Q函数是
A.状态-动作值函数
B.状态函数
C.估值函数
D.奖励函数
正确答案:A
2、Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的
回报()
A.总和
B.最大值
C.最小值
D.期望值
正确答案:D
3、在强化学习过程中,学习率越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()
A.大,小
B.大,大
C.小,大
D.小,小
正确答案:A
4、在强化学习的过程中,()能够在稍微偏离目前最好策略的基础上,尝试更多策略,()能够运用目前最好的策略,获取更高的奖励
A.利用,探索
B.探索,利用
C.利用,输出
D.探索,输出
正确答案:B
5、在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用
当前Q函数最大动作的概率越()
A.小,小
B.大,小
C.大,大
D.小,大
正确答案:B
二、多选题
1、强化学习包含哪些元素
A.Reward
B.Agent
C.State
D.Action
正确答案:A、B、C、D
三、判断题
1、在DQN中,求解Q(s,a)时采用的策略是有限采样s,a,并通过采样值来估计Q值。

(√)
2、可以采用policy gradient算法来设计一款围棋游戏。

(√)
3、在Actor-Critic算法中,Q函数和V函数同时被优化。

(√)
4、TD算法使用完整的采样来计算长期奖励值。

(√)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、单选题1、以下关于感知器算法与支持向量机算法说法有误的是A. 由于支持向量机是基于所有训练数据寻找最大化间隔的超平面,而感知器算法却是相对随意的找一个分开两类的超平面,因此大多数时候,支持向量机画出的分类面往往比感知器算法好一些。

B.支持向量机是把所有训练数据都输入进计算机,让计算机解全局优化问题C.感知器算法相比于支持向量机算法消耗的计算资源和内存资源更少,但是耗费的计算资源更多D. 以上选项都正确正确答案:C2、假设你在训练一个线性回归模型,有下面两句话:如果数据量较少,容易发生过拟合。

如果假设空间较小,容易发生过拟合。

关于这两句话,下列说法正确的是?A.1正确,2错误B.1和2都错误C.1和2都正确D.1错误,2正确正确答案:A3、下面哪一项不是比较好的学习率衰减方法?t表示为epoch数。

α0A.α=11+2∗tα0B. α=√tC. α=0.95tα0D.α=e tα0正确答案:D4、你正在构建一个识别足球(y = 1)与篮球(y = 0)的二元分类器。

你会使用哪一种激活函数用于输出层?A.ReLUB. tanhC.sigmoidD. Leaky ReLU正确答案:C5、假设你建立一个神经网络。

你决定将权重和偏差初始化为零。

以下哪项陈述是正确的?A.第一个隐藏层中的每个神经元将在第一次迭代中执行相同的计算。

但经过一次梯度下降迭代后,他们将会计算出不同的结果。

B.第一个隐藏层中的每个神经元节点将执行相同的计算。

所以即使经过多次梯度下降迭代后,层中的每个神经元节点都会计算出与其他神经元节点相同的结果。

C.第一个隐藏层中的每一个神经元都会计算出相同的结果,但是不同层的神经元会计算不同的结果。

D.即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算,他们的参数将以各自方式进行更新。

正确答案:B6、某个神经网络中所有隐藏层神经元使用tanh激活函数。

那么如果使用np.random.randn(…,…)* 1000将权重初始化为相对较大的值。

会发生什么?A.这不会对训练产生影响。

只要随机初始化权重,梯度下降不受权重大小的影响。

B.这会导致tanh的输入也非常大,从而使梯度也变大。

因此,你必须将学习率α设置得非常小以防止发散。

这会减慢网络参数学习速度。

C.这会导致tanh的输入也非常大,从而使梯度接近于零,优化算法将因此变得缓慢。

D.这会导致tanh的输入也非常大,导致神经元被“高度激活”,从而加快了学习速度。

正确答案:C7、以下关于权重衰减说法正确的是?A.权重衰减通过赋予神经元某个权值从而避免梯度消失B.当数据集中有噪声时,权重衰减可以在训练中逐渐修正神经网络的权重C.权重衰减是一种正则化技术,通过惩罚绝对值较大的模型参数为需要学习的模型增加了限制D.权重衰减是在训练过程中逐渐减少学习率正确答案:C8、当你增加正则化超参数λ时会发生什么?A. λ翻倍后会导致权重也翻倍B.使权重变得更小(趋近0)C.每次迭代的梯度下降走的步长更长D.使权重变得更大(远离0)正确答案:B9、对训练数据归一化的根本原因是?A.归一化也可以说是一种正则化处理,可以提升模型泛化能力B.让模型更快的收敛C.加快参数初始化过程D.更容易对数据进行可视化正确答案:B10、如果你训练的模型代价函数J随着迭代次数的增加,绘制出来的图如下,那么A.无论你在使用mini-batch还是批量梯度下降,看上去都是合理的B.如果你正在使用mini-batch梯度下降,那可能有问题;而如果你在使用批量梯度下降,那是合理的C.如果你正在使用mini-batch梯度下降,那看上去是合理的;而如果你在使用批量梯度下降,那可能有问题D.无论你在使用mini-batch还是批量梯度下降,都可能有问题正确答案:C11、下图中的曲线是由:梯度下降,动量梯度下降(β=0.5)和动量梯度下降(β=0.9)。

哪条曲线对应哪种算法?A.(1)是梯度下降;(2)是动量梯度下降(β=0.9);(3)是动量梯度下降(β=0.5)B.(1)是动量梯度下降(β=0.5);(2)是动量梯度下降(β=0.9);(3)是梯度下降C. (1)是动量梯度下降(β=0.5);(2) 是梯度下降; (3) 是动量梯度下降(β=0.9)D.都有可能正确答案:B12、关于Adam 算法,下列哪一个陈述是错误的?A.Adam 中的学习率超参数α通常需要调整B.Adam 优化算法常用于批量梯度下降法中,而不是用于随机(小批量)梯度下降法C.我们经常使用超参数的默认值 β1=0.9,β2=0.999,ϵ=10−8D.Adam 结合了Rmsprop 和动量的优点正确答案:B13、标准化公式z norm (i)=(i)√δ2+ϵ什么要使用ϵ?A.防止μ太小B.为了避免除零操作C.为了更准确地标准化D.为了加速收敛正确答案:B14、在训练了具有批标准化的神经网络之后,在用新样本评估神经网络性能时,应该A.跳过用μ和δ2值标准化的步骤,因为一个样本不需要标准化B.使用在训练期间,通过指数加权平均值得出的μ和δ2执行所需的标准化C.如果你在batch size为256的mini-batch上实现了批标准化,那么如果你要在一个测试样本上进行评估,你应该将这个例子重复256次,这样你就可以使用和训练时大小相同的mini-batch进行预测。

D.使用最后一个的mini-batch的μ和δ2值来执行所需的标准化正确答案:B15、以下关于ReLU函数说法错误的是:A.ReLU 函数的输出是非零中心化的,给后一层的神经网络引入偏置偏移,会影响梯度下降的效率B.ReLU 神经元在训练时比较容易“死亡”.在训练时,如果参数在一次不恰当的更新后,第一个隐藏层中的某个 ReLU 神经元在所有的训练数据上都不能被激活,那么这个神经元自身参数的梯度永远都会是0,在以后的训练过程中永远不能被激活.C. Leaky ReLU 在输入时,保持一个很小的梯度,这样当神经元非激活时也能有一个非零的梯度可以更新参数,这在一定程度上缓解了梯度消失问题D. 三个选项均正确正确答案:C二、多选题1、以下关于感知器算法说法正确的为A.只要是训练数据集线性可分,感知器算法就一定能收敛。

B.感知机学习算法存在许多的解,对同一个训练集来说,感知机初值的选择不同,最后得到的解就可能不同。

C.多层感知器是感知器的推广,克服了感知器不能对线性不可分数据进行识别的弱点。

D.当训练数据集线性不可分的情况下,袋式算法(Pocket Algorithm)使感知机也可以收敛于一个相对理想的解。

正确答案:A、B、C、D2、以下属于机器学习中用来防止过拟合的方法的是:A.权值衰减 Weight decayB.增加神经网络层数C.训练多个模型进行融合输出D.早停策略正确答案:A、C、D3、为什么最好的mini-batch的大小通常不是1也不是训练集总样本数m,而是介于两者之间?A.如果mini-batch的大小是1,那么你需要遍历整个训练集后才能更新一次参数B.如果mini-batch的大小是m,就是随机梯度下降,而这样做经常会比mini-batch慢C.如果mini-batch的大小是m,就是批量梯度下降。

你需要遍历整个训练集来更新参数D.如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处正确答案:C、D4、批标准化中关于γ和β的以下哪些陈述是正确的?A. γ和β的值确定了给定的批量归一化层的输出变量的均值和方差B.最佳值是γ=√δ2+ϵ,β=μC. γ和β是算法的超参数,我们通过随机采样进行调整D.它们的值可以通过Adam、AdaGrad或RMSprop优化算法来学习正确答案:A、D5、关于超参数优化的说法正确的有:A.超参数优化是一个组合优化问题,无法像一般参数那样通过梯度下降方法来优化B.评估一组超参数配置的时间代价非常高,从而导致一些优化方法(比如演化算法)在超参数优化中难以应用C.采用网格搜索会在不重要的超参数上进行不必要的尝试.一种在实践中比较有效的改进方法是对超参数进行随机组合,然后选取一个性能最好的配置D.神经架构搜索(NAS)也是神经网络超参数优化的一种方法。

它的原理是给定一个称为搜索空间的候选神经网络结构集合,用某种策略从中搜索出最优网络结构。

正确答案:A、B、C、D6、以下属于权重初始化方法的有?A.kaiming初始化B.均匀分布初始化(uniform)C.xavier 初始化D.高斯初始化(gaussian)正确答案:A、B、C、D7、神经网络中常见的超参数有?A.隐藏层数目B.正则化参数C.梯度下降法迭代的步数D.批大小正确答案:A、B、C、D8、现在我们增大批量梯度下降中的batch size超参数,与之前相比可能会发生什么变化?A.内存利用率提高了,大矩阵乘法的并行化效率提高。

B.跑完一次 epoch(全数据集)所需的迭代次数减少,对于相同数据量的处理速度进一步加快。

C.同样的模型要想达到相同的精度,其训练所花费的时间与增大前几乎相同。

D.一般来说 batch Size 越大,其确定的下降方向越准,引起训练loss震荡越小。

正确答案:A、B、D三、判断题1、sigmoid函数不是关于原点中心对称的,这会导致之后的网络层的输出也不是零中心的,进而影响梯度下降运作。

tanh激活函数解决了这个不足。

(√)2、Adagrad和RMSprop这两种自适应学习率的方式稍有差异,但主要思想都是基于历史的累计梯度去计算一个当前较优的学习率。

(√)3、在标准的随机梯度下降中,权重衰减正则化和ℓ2 正则化的效果相同.因此,权重衰减在一些深度学习框架中通过ℓ2 正则化来实现.但是,在较为复杂的优化方法(比如 Adam)中,权重衰减正则化和ℓ2 正则化并不等价。

(√)4、Xavier初始化是为了使得在经过多层网络后,信号不被过分放大或过分减弱,尽可能保持每个神经元的输入和输出的方差一致而提出的参数初始化方案。

(√)5、在线性模型的训练(比如感知器和Logistic回归)中,我们一般将参数全部初始化为 0.对于神经网络的训练也是如此。

(×) 6、Sigmoid激活函数会导致梯度消失现象;而Tanh激活函数不会。

(×)。

相关文档
最新文档