机器学习小测及答案
(含答案)机器学习第一阶段测试题
机器学习第一阶段测试题一、选择题1.以下带佩亚诺余项的泰勒展开式错误的一项是(D)A.)x (o x !x !x e x 33231211++++= B.)x (o x *x x arcsin 33321++=C.)x (o x !x !x x sin 5535131++-= D.)x (o x !x !x cos 44241211+-+=分析:)x (o x !x !x cos 44241211++-=2.以下关于凸优化的说法错误的一项是(C )A.集合C 任意两点间线段均在集合C 内,则C 为凸集B.集合C 的凸包是能够包含C 的最小凸集C.多面体不一定是凸集D.线性变换能保持原集合的凸性分析:多面体是指有限半空间和超平面的交集,多面体一定是凸集3.以下说法错误的一项是(C )A.当目标函数是凸函数时,梯度下降法的解是全局最优解B.进行PCA 降维时需要计算协方差矩阵C.沿负梯度下降的方向一定是最优的方向D.利用拉格朗日函数能解带约束的优化问题分析:沿负梯度方向是函数值下降最快的方向但不一定是最优方向4.K-means 无法聚以下哪种形状样本?()A.圆形分布B.螺旋分布C.带状分布D.凸多边形分布分析:基于距离的聚类算法不能聚非凸形状的样本,因此选B5.若X 1,X 2,...X n 独立同分布于(2σ,μ),以下说法错误的是(C )A.若前n 个随机变量的均值,对于任意整数ε,有:B.随机变量的收敛到标准正态分布C.随机变量收敛到正态分布D.样本方差其中样本均值分析:A:大数定理概念;B、C:中心极限定理概念;C 错,应该收敛到正态分布D:样本的统计量公式二、公式推理题1.请写出标准正态分布的概率密度函数、期望、以及方差分析:概率密度函数:2221x e π)x (f -=;期望:0=)x (E ;方差:1=)x (D 2.请根据表中的分类结果混淆矩阵给出查准率(准确率)P 和查全率(召回率)R 的计算公式真实情况预测结果正例反例正例TP(真正例)FN(假反例)反例FP(假正例)TN(真反例)分析:FP TP TP P +=,NF TP TP R +=三、简答题1.求函数y ln x )y ,x (f 32+=的梯度向量分析:)y)y ,x (f ,x )y ,x (f ()y ,x (f ∂∂∂∂=∇,所以答案为(2x,3/y)∑==n i i n X n Y 111=<-∞→}ε|μY {|P lim n n σn μn X Y n i i n -=∑=1∑==n i i n X Y 1)σ,μ(N 2∑=--=n i i )X X (n S 1211)σn ,μn (N 2∑==n i i X n X 112.列举你知道的无约束最优化方法(至少三个),并选一种方法进行详细介绍分析:梯度下降法,牛顿法,拟牛顿法,共轭梯度法...(介绍略)3.请简要叙述正则化项中的L1和L2方法分析:1正则化和L2正则化可以看做是损失函数的惩罚项。
人工智能机器学习技术练习(试卷编号141)
人工智能机器学习技术练习(试卷编号141)1.[单选题]分类模型在进行训练时需要()A)训练集B)训练集与测试集C)训练集、验证集、测试集答案:C解析:2.[单选题]基于划分的聚类,说法正确的是()A)对分区个数敏感B)无法区分互斥的簇C)有利于寻找非球形簇答案:A解析:3.[单选题]现在有一份数据,你随机的将数据分成了n份,然后同时训练n个子模型,再将模型最后相结合得到一个强学习器,这属于boosting方法吗A)是B)不是C)不确定答案:B解析:4.[单选题]如果SVM模型欠拟合, 以下方法哪些可以改进模型 :A)增大惩罚参数C的值B)减小惩罚参数C的值C)减小核系数(gamma参数)答案:A解析:5.[单选题]假设下图是K-means算法的聚类结果,那么K的值为()A)1B)2C)3D)4答案:C解析:6.[单选题]下列关于DataFrame说法正确的是( )。
A)DataFrame结构是由索引和数据组成B)DataFrame的行索引位于最右侧C)创建一个DataFrame对象时需要指定索引D)DataFrame每列的数据类型必须是相同的答案:C解析:7.[单选题]某单位运用随机森林算法思想建立抢修热点模型。
该模型主要预测下期台区工单数量,构建抢修热点。
模型构建步骤如下:①将历史数据进行随机自助法重抽样,生成N个训练样本集;②将N个训练样本集分别做决策树,生成N棵决策树;③将N棵决策树随机构成随机森林;④未来根据预测样本气候环境、设备属性、设备工况进行随机森林决策投票,得出针对该预测样本最优的决策树进行运算,并计算出最终结果。
模型算法构建步骤合理的顺序是()。
A)①②③④B)①③②④C)④①②③D)④②①③答案:A解析:8.[单选题]AGNES是一种采用(__)策略的层次聚类算法。
A)自顶向下B)自底向上C)自左至右D)自右至左答案:B解析:9.[单选题]下面关于 Random Forest 和 Gradient Boosting Trees 说法正确的是?A)Random Forest 的中间树不是相互独立的,而 Gradient Boosting Trees 的中间树是相互独立的B)两者都使用随机特征子集来创建中间树C)在 Gradient Boosting Trees 中可以生成并行树,因为它们是相互独立的D)无论任何数据,Gradient Boosting Trees 总是优于 Random Forest答案:B解析:本题考查的是随机森林和梯度提升树(GBDT)的基本概率和区别。
机器学习基础智慧树知到答案章节测试2023年太原理工大学
第一章测试1.样本是连续型数据且有标签,我们采用()进行机器学习。
A:嵌入算法B:聚类算法C:分类算法D:回归算法答案:D2.在机器学习中,样本常被分成()。
A:训练集B:其它选项都有C:测试集D:评估集答案:B3.机器学习算法需要显示编程,具备归纳、总结等自学习能力。
()A:错B:对答案:A4.机器学习和人工智能、深度学习是一个概念,都是指机器模仿人类推理、学习能力。
()A:错B:对答案:A5.特征工程非常重要,在采用机器学习算法前,首先需要利用特征工程确定样本属性。
()A:错B:对答案:B第二章测试1.K近邻算法认为距离越近的相似度越高。
()A:对B:错答案:A2.K近邻算法中数据可以不做归一化,因为是否归一化对结果影响不大。
()A:错B:对答案:A3.K近邻算法中采用不同的距离公式对于结果没有影响。
()A:错答案:A4.在上面图中,K=5,绿色样本的类别是()。
A:红色三角形B:蓝色正方形C:不能确定D:绿色圆形答案:B5.在K近邻算法中,K的选择是()?A:越大越好B:与样本有关C:其它都不正确D:越小越好答案:B第三章测试1.下列()中两个变量之间的关系是线性的。
A:猫的皮毛颜色和体重B:人的工作环境和健康状况C:重力和质量D:女儿的身高和父亲的体重答案:C2.下列说法不正确的是()。
A:线性回归模型也可以解决线性不可分的情况B:回归用于预测输入变量和输出变量之间的关系C:回归就是数据拟合D:回归分析就是研究两个事物的相关性答案:C3.从某大学随机选择8名女大学生,其身高x(cm)和体重y(kg)的回归方程是y=0.849x-85.712,则身高172cm的女大学生,预测体重为()。
A:60.316kgB:大于60.316kgC:小于60.316kgD:其它都不正确答案:Asso中采用的是L2正则化。
()A:错B:对答案:A5.线性回归中加入正则化可以降低过拟合。
()A:错答案:B第四章测试1.以下说法正确的是()。
机器学习考试题目及答案
机器学习考试题目答案1.简描述机器学习概念?TomMitCheI1:"对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习J 我们遇到的大部分事情一般包括分类问题与回归问题。
如房价的预测,股价的预测等属于分类问题。
一般的处理过程是:首先,1)获取数据;2)提取最能体现数据的特征;3)利用算法建模;4)将建立的模型用于预测。
如人脸识别系统,首先我们获取到一堆人脸照片,首先,对数据进行预处理,然后提取人脸特征,最后用算法如SVM或者NN等。
这样,我们就建立了一个人脸识别系统,当输入一张人脸,我们就知道这张面孔是否在系统中。
这就是机器学习的整个流程,其次还包括寻找最优参数等。
机器学习主要分为:监督学习:数据集是有标签的,大部分机器学习模型都属于这一类别,包括线性分类器、支持向量机等等;无监督学习:跟监督学习相反,数据集是完全没有标签的,主要的依据是相似的样本在数据空间中一般距离是相近的,这样就能通过距离的计算把样本分类,这样就完全不需要IabeI,比如著名的kmeans算法就是无监督学习应用最广泛的算法;半监督学习:半监督学习一般针对的问题是数据量超级大但是有标签数据很少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的而有一部分是没有的;强化学习:一直激励学习的方式,通过激励函数来让模型不断根据遇到的情况做出调整;2.循环神经网络的基本原理?RNNS的目的是用来处理序列数据。
在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。
但是这种普通的神经网络对于很多问题却无能无力。
例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。
RNNS之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。
具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。
机器学习知到章节答案智慧树2023年三亚学院
机器学习知到章节测试答案智慧树2023年最新三亚学院第一章测试1.下面哪句话是正确的()参考答案:增加模型的复杂度,总能减小训练样本误差2.评估模型之后,得出模型存在偏差,下列哪种方法可能解决这一问题()参考答案:向模型中增加更多的特征3.以垃圾微信识别为例,Tom Mitchell的机器学习的定义中,任务T是什么?()参考答案:T是识别4.如何在监督式学习中使用聚类算法()?参考答案:在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征;首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法5.想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()?参考答案:对训练集随机采样,在随机采样的数据上建立模型;使用PCA算法减少特征维度;尝试使用在线机器学习算法6.机器学习兴起于()。
参考答案:1990年;1980年7.监督学习包括是()。
参考答案:分类;回归8.机器学习可以对电子商务产品评价进行好评与差评分类。
()参考答案:对9.机器学习必备知识包括数学基础、心理学基础、算法设计基础、商业模式基础。
()参考答案:错10.机器学习是一门多学科交叉专业,涵盖____、____、近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
参考答案:null第二章测试1.关于k-NN算法,以下哪个选项是正确的?参考答案:可用于分类和回归2.k-NN算法在测试时间而不是训练时间上进行了更多的计算。
参考答案:对3.假设算法是k最近邻算法,在下面的图像中,____将是k的最佳值。
参考答案:104.一个kNN分类器,该分类器在训练数据上获得100%的准确性。
而在客户端上部署此模型时,发现该模型根本不准确。
以下哪项可能出错了?注意:模型已成功部署,除了模型性能外,在客户端没有发现任何技术问题参考答案:可能是模型过拟合5.以下是针对k-NN算法给出的两条陈述,其中哪一条是真的?1、我们可以借助交叉验证来选择k的最优值2、欧氏距离对每个特征一视同仁参考答案:1和26.你给出了以下2条语句,发现在k-NN情况下哪个选项是正确的?1、如果k的值非常大,我们可以将其他类别的点包括到邻域中。
机器学习(传统机器学习)期末测试练习题
1、使用K-means算法得到了三个聚类中心,分别是[1,2],[-3,0],[4,2],现输入数据X=[3,1],则X属于第几类A.1B.3C. 2D.不能确定正确答案:B2、对一组无标签的数据X,使用不同的初始化值运行K-means算法50次,如何评测这50次聚类的结果哪个最优A.优化目标函数值最小的一组最优B.需要获取到数据的标签才能评测C.暂无方法D.最后一次运行结果最优正确答案:A3、下图是某个二维高斯混合模型的聚类结果,该GMM的输出矩阵的形式为A.对角阵且非单位矩阵B.普通方阵C.单位矩阵D.不能确定正确答案:A二、多选题1、以下关于PCA算法的描述正确的有哪些A.即使输入数据X各个维度上的数值相似度较高,依旧需要对其去均值B.使用PCA算法时,数据压缩后的维度M可以设置的偏小一点C.在使用PCA算法时,有可能陷入局部最小值,所以需要使用不同的初始化数值多次计算以获得更好的结果D.已知使用PCA算法压缩后的数据Y以及压缩矩阵A,但是无法大致还原压缩前的数据X正确答案:A、B2、有L个输入样本,每个样本的特征维度是N。
在设置压缩后的维度M时,以下哪些设置方式是合理的A.M = 0.1*NB.M= 0.1*LC.根据能量百分比准则,保留占据5%能量的M值D.根据能量百分比准则,保留占据95%能量的M值正确答案:A、D3、以下哪些是PCA算法可以解决的问题A.对维度较小的数据进行维度扩充B.对特征相关性较高的数据进行降维C.对维度大于3的数据进行可视化处理D.数据维度压缩正确答案:B、C、D4、以下关于K-means的说法正确的有A.初始化聚类中心时,一定要将各个聚类中心的坐标设置为相同的值B.该算法会存在陷入局部极值的情况,可以使用不同的初始化值,多次实验来解决该问题C.K值的选取往往需要依靠经验或者数据集的情况来确定D.因为该算法是无监督学习算法,所以不存在过拟合问题,所以K设置的越大,效果越好正确答案:B、C5、以下哪些特征选取方式是无监督的A.使用协方差矩阵抽取协方差值较高的特征B.使用卷积层,pooling层处理输入图像,得到降维后的特征图C.使用线性神经网络抽取特征D.使用PCA进行特征抽取正确答案:A、D三、判断题1、特征向量对[1,1,1,1],[1,-1,-1,1]有可能来自转换矩阵A。
机器学习期末测试练习题3
一、单选题1、以下关于感知器算法与支持向量机算法说法有误的是A. 由于支持向量机是基于所有训练数据寻找最大化间隔的超平面,而感知器算法却是相对随意的找一个分开两类的超平面,因此大多数时候,支持向量机画出的分类面往往比感知器算法好一些。
B.支持向量机是把所有训练数据都输入进计算机,让计算机解全局优化问题C.感知器算法相比于支持向量机算法消耗的计算资源和内存资源更少,但是耗费的计算资源更多D. 以上选项都正确正确答案:C2、假设你在训练一个线性回归模型,有下面两句话:如果数据量较少,容易发生过拟合。
如果假设空间较小,容易发生过拟合。
关于这两句话,下列说法正确的是?A.1正确,2错误B.1和2都错误C.1和2都正确D.1错误,2正确正确答案:A3、下面哪一项不是比较好的学习率衰减方法?t表示为epoch数。
α0A.α=11+2∗tα0B. α=√tC. α=0.95tα0D.α=e tα0正确答案:D4、你正在构建一个识别足球(y = 1)与篮球(y = 0)的二元分类器。
你会使用哪一种激活函数用于输出层?A.ReLUB. tanhC.sigmoidD. Leaky ReLU正确答案:C5、假设你建立一个神经网络。
你决定将权重和偏差初始化为零。
以下哪项陈述是正确的?A.第一个隐藏层中的每个神经元将在第一次迭代中执行相同的计算。
但经过一次梯度下降迭代后,他们将会计算出不同的结果。
B.第一个隐藏层中的每个神经元节点将执行相同的计算。
所以即使经过多次梯度下降迭代后,层中的每个神经元节点都会计算出与其他神经元节点相同的结果。
C.第一个隐藏层中的每一个神经元都会计算出相同的结果,但是不同层的神经元会计算不同的结果。
D.即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算,他们的参数将以各自方式进行更新。
正确答案:B6、某个神经网络中所有隐藏层神经元使用tanh激活函数。
那么如果使用np.random.randn(…,…)* 1000将权重初始化为相对较大的值。
2022机器学习专项测试试题及答案
2022机器学习专项测试试题及答案1.机器学习的流程包括:分析案例、数据获取、________和模型验证这四个过程。
()A.数据清洗A、数据清洗B.数据分析C.模型训练(正确答案)D.模型搭建2.机器翻译属于下列哪个领域的应用?() *A.自然语言系统(正确答案)A. 自然语言系统(正确答案)B.机器学习C.专家系统D.人类感官模拟3.为了解决如何模拟人类的感性思维, 例如视觉理解、直觉思维、悟性等, 研究者找到一个重要的信息处理的机制是()。
*A.专家系统B.人工神经网络(正确答案)C.模式识别D.智能代理4.要想让机器具有智能, 必须让机器具有知识。
因此, 在人工智能中有一个研究领域, 主要研究计算机如何自动获取知识和技能, 实现自我完善, 这门研究分支学科叫()。
*A. 专家系统A.专家系统B. 机器学习(正确答案)C. 神经网络D. 模式识别5.如下属于机器学习应用的包括()。
*A.自动计算, 通过编程计算 456*457*458*459 的值(正确答案)A. 自动计算,通过编程计算 456*457*458*459 的值(正确答案)A.自动计算,通过编程计算 456*457*458*459 的值(正确答案)B.文字识别, 如通过 OCR 快速获得的图像中出汉字, 保存为文本C.语音输入, 通过话筒将讲话内容转成文本D.麦克风阵列, 如利用灵云该技术实现远场语音交互的电视6.对于神经网络模型, 当样本足够多时, 少量输入样本中带有较大的误差甚至个别错误对模型的输入-输出映射关系影响很小, 这属于()。
*A. 泛化能力A.泛化能力B. 容错能力(正确答案)C. 搜索能力D. 非线性映射能力7.下列选项不属于机器学习研究内容的是() *A. 学习机理A.学习机理B. 自动控制(正确答案)C. 学习方法D. 计算机存储系统8.机器学习的经典定义是: () *A.利用技术进步改善系统自身性能A. 利用技术进步改善系统自身性能B.利用技术进步改善人的能力C.利用经验改善系统自身的性能(正确答案)D.利用经验改善人的能力9.研究某超市销售记录数据后发现, 买啤酒的人很大概率也会购买尿布, 这种属于数据挖掘的那类问题()。
机器学习测试题_北京光环大数据培训
机器学习测试题_北京光环大数据培训人工智能一直助力着科技发展,新兴的机器学习正推动着各领域的进步。
如今,机器学习的方法已经无处不在—从手机上的语音助手到商业网站的推荐系统,机器学习正以不容忽视的速度闯入我们的生活。
以下测试题可以粗略的检测你对机器学习的了解和掌握程度。
有对机器学习有兴趣的小伙伴可自行测试。
1.以下哪一种方法最适合在n(n>1)维空间中做异常点检测。
A 正态分布图B 盒图C 马氏距离D 散点图答案:C马氏距离是是一种有效的计算两个未知样本集的相似度的多元计量方法,以卡方分布为基础,表示数据的协方差距离。
与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是关联的)。
因此马氏距离常用于多元异常值检测。
2. 逻辑回归与多元回归分析有哪些不同?A. 逻辑回归预测某事件发生的概率B. 逻辑回归有较高的拟合效果C. 逻辑回归回归系数的评估D. 以上全选答案:D逻辑回归是用于分类问题,我们能计算出一个事件/样本的概率;一般来说,逻辑回归对测试数据有着较好的拟合效果;建立逻辑回归模型后,我们可以观察回归系数类标签(正类和负类)与独立变量的的关系。
3 bootstrap 数据的含义是:A. 有放回的从整体M中抽样m个特征B. 无放回的从整体M中抽样m个特征C. 有放回的从整体N中抽样n个样本D. 无放回的从整体N中抽样n个样本答案:C如果我们没有足够的数据来训练我们的算法,我们应该通过重复随机采样增加训练集合的大小4.”过拟合是有监督学习的挑战,而不是无监督学习”以上说法是否正确:A. 正确B. 错误答案:B我们可以评估无监督学习方法通过无监督学习的指标,如:我们可以评估聚类模型通过调整兰德系数5.下列表述中,在k-fold交叉验证中关于选择K说法正确的是:A. 较大的K并不总是好的,选择较大的K可能需要较长的时间来评估你的结果B. 相对于期望误差来说,选择较大的K会导致低偏差(因为训练folds会变得与整个数据集相似)C. 在交叉验证中通过最小化方差法来选择K值D. 以上都正确答案:D较大的K意味着更小的偏差(因为训练folds的大小接近整个dataset)和更多的运行时间(极限情况是:留一交叉验证)。
中科院研究生院机器学习试卷 含答案
中国科学院研究生院课程编号:712008Z 试 题 专 用 纸 课程名称:机器学习任课教师:卿来云———————————————————————————————————————————————姓名学号 成绩1. 判断题(20分,每小题2分)(1)给定n 个数据点,如果其中一半用于训练,另一半用于测试,则训练误差和测试误差之间的差别会随着n 的增加而减小。
(T )(2)当训练数据较少时更容易发生过拟合。
(T ) (3)回归函数A 和B ,如果A 比B 更简单,则A 几乎一定会比B 在测试集上表现更好。
(F ) (4)在核回归中,最影响回归的过拟合性和欠拟合之间平衡的参数为核函数的宽度。
(T ) (5)在AdaBoost 算法中,所有被错分的样本的权重更新比例相同。
(T ) (6)Boosting 的一个优点是不会过拟合。
(F )(7)梯度下降有时会陷于局部极小值,但EM 算法不会。
(F ) (8)SVM 对噪声(如来自其他分布的噪声样本)鲁棒。
(F )(9)Boosting 和Bagging 都是组合多个分类器投票的方法,二者都是根据单个分类器的正确率决定其权重。
(F ) (10)在回归分析中,最佳子集选择可以做特征选择,当特征数目较多时计算量大;岭回归和Lasso 模型计算量小,且Lasso 也可以实现特征选择。
(T )2、logistic 回归模型。
(20分,每小题10分)我们对如图1(a)所示的数据采用简化的线性logistic 回归模型进行两类分类,即()()()121122112211|,,1exp Y w w g w x w x w x w x ==+=+−−x P 。
(为了简化,我们不采用偏差0w 。
) 训练数据可以被完全分开(训练误差为0,如图1(b)所示的L 1)。
共 3 页 第1页图1(a) 2维训练数据。
图1(b) 数据点可以被L 1(实线)。
L 2、L 3和L 4是另外几个可能的决策(1) 考虑一个正则化的方法,即最大化()21221log |,,2Ni i i C y w w w =−∑x P 。
(完整word版)机器学习练习题与答案
(完整word版)机器学习练习题与答案《机器学习》练习题与解答1.⼩刚去应聘某互联⽹公司的算法⼯程师,⾯试官问他“回归和分类有什么相同点和不同点”,他说了以下⾔论,请逐条判断是否准确。
1)回归和分类都是有监督学习问题[单选题] [必答题]○对○错参考答案:对。
解析:这道题只有⼀个同学做错。
本题考察有监督学习的概念。
有监督学习是从标签化训练数据集中推断出函数的机器学习任务。
有监督学习和⽆监督学习的区别是:机器学习算法的图谱如下:在回归问题中,标签是连续值;在分类问题中,标签是离散值。
具体差别请看周志华《机器学习》书中的例⼦,⼀看便懂:2.背景同上题。
请判断2)回归问题和分类问题都有可能发⽣过拟合 [单选题] [必答题]○对○错答案:对解析:这题有两个同学做错。
过拟合的英⽂名称是 Over-fitting(过拟合)。
为了说清楚“过”拟合,⾸先说⼀下“拟合”【拟合的⼏何意义】:从⼏何意义上讲,拟合是给定了空间中的⼀些点,找到⼀个已知形式未知参数的连续曲线或曲⾯来最⼤限度地逼近这些点。
⼀个直观的例⼦,是下⾯的电阻和温度的例⼦。
我们知道在物理学中,电阻和温度是线性的关系,也就是R=at+b。
现在我们有⼀系列关于“温度”和“电阻”的测量值。
⼀个最简单的思路,取两组测量值,解⼀个线性⽅程组,就可以求出系数a、b了!但是理想是丰满的,现实是残酷的!由于测量误差等的存在,我们每次测量得到的温度值和电阻值都是有误差的!因此,为了提⾼测量精度,我们会测量多次,得到多组的值,这样就相当于得到⼆维平⾯上的多个点,我们的⽬标是寻找⼀条直线,让这条直线尽可能地接近各个测量得到的点。
拟合的数学意义:在数学的意义上,所谓拟合(fit)是指已知某函数的若⼲离散函数值{f1,f2,…,fn}(未必都是准确值,有个别可能是近似甚⾄错误值),通过调整该函数中若⼲待定系数f(λ1, λ2,…,λn),使得该函数与已知点集的差别(最⼩⼆乘意义)最⼩。
机器学习(强化学习)期末测试练习题
1、Q-learning算法中,Q函数是
A.状态-动作值函数
B.状态函数
C.估值函数
D.奖励函数
正确答案:A
2、Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的
回报()
A.总和
B.最大值
C.最小值
D.期望值
正确答案:D
3、在强化学习过程中,学习率越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()
A.大,小
B.大,大
C.小,大
D.小,小
正确答案:A
4、在强化学习的过程中,()能够在稍微偏离目前最好策略的基础上,尝试更多策略,()能够运用目前最好的策略,获取更高的奖励
A.利用,探索
B.探索,利用
C.利用,输出
D.探索,输出
正确答案:B
5、在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用
当前Q函数最大动作的概率越()
A.小,小
B.大,小
C.大,大
D.小,大
正确答案:B
二、多选题
1、强化学习包含哪些元素
A.Reward
B.Agent
C.State
D.Action
正确答案:A、B、C、D
三、判断题
1、在DQN中,求解Q(s,a)时采用的策略是有限采样s,a,并通过采样值来估计Q值。
(√)
2、可以采用policy gradient算法来设计一款围棋游戏。
(√)
3、在Actor-Critic算法中,Q函数和V函数同时被优化。
(√)
4、TD算法使用完整的采样来计算长期奖励值。
(√)。
机器学习期末测试练习题3
、单选题1、以下关于感知器算法与支持向量机算法说法有误的是A.由于支持向量机是基于所有训练数据寻找最大化间隔的超平面,而感知器算法却是相对随意的找一个分开两类的超平面,因此大多数时候,支持向量机画出的分类面往往比感知器算法好一些。
B.支持向量机是把所有训练数据都输入进计算机,让计算机解全局优化问题C.感知器算法相比于支持向量机算法消耗的计算资源和内存资源更少,但是耗费的计算资源更多D.以上选项都正确正确答案:C2、假设你在训练一个线性回归模型,有下面两句话:如果数据量较少,容易发生过拟合。
如果假设空间较小,容易发生过拟合。
关于这两句话,下列说法正确的是?A.1正确,2错误B.1和2都错误C.1和2都正确D.1错误,2正确正确答案:A3、下面哪一项不是比较好的学习率衰减方法?t表示为epoch数。
A.a=1%12*t0C.a=0.95方。
0正确答案:D4、你正在构建一个识别足球(y二1)与篮球(y=0)的二元分类器。
你会使用哪一种激活函数用于输出层?A.ReLUB.tanhC.sigmoidD.LeakyReLU正确答案:C5、假设你建立一个神经网络。
你决定将权重和偏差初始化为零。
以下哪项陈述是正确的?A.第一个隐藏层中的每个神经元将在第一次迭代中执行相同的计算。
但经过一次梯度下降迭代后,他们将会计算出不同的结果。
B.第一个隐藏层中的每个神经元节点将执行相同的计算。
所以即使经过多次梯度下降迭代后,层中的每个神经元节点都会计算出与其他神经元节点相同的结果。
C.第一个隐藏层中的每一个神经元都会计算出相同的结果,但是不同层的神经元会计算不同的结果。
D.即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算,他们的参数将以各自方式进行更新。
正确答案:B6、某个神经网络中所有隐藏层神经元使用tanh激活函数。
那么如果使用np.random.randn(…,…)*1000将权重初始化为相对较大的值。
会发生什么?A.这不会对训练产生影响。
智慧树答案机器学习:模型与算法知到课后答案章节测试2022年
第一章1.sigmoid函数的值域为?()。
答案:(0,1)2.哪些属于监督学习重要元素?()。
答案:学习模型;标注数据;损失函数3.分析不同变量之间存在关系的研究叫回归分析。
()答案:对4.强可学习和弱可学习是等价的。
()答案:对5.下面的说法正确的是()。
答案:逻辑回归只能处理二分类问题第二章1.下面的说法正确的是()。
答案:K均值聚类算法实质上是最小化每个类簇的方差。
2.哪一项是皮尔逊相关系数的性质?()。
答案:X与Y协方差的绝对值小于等于13.下面的说法正确的有()。
答案:EM算法分为求取期望和期望最大化两个步骤。
;在K均值聚类算法中,欧式距离与方差量纲相同。
4.K均值聚类属于监督学习。
()答案:错5.特征人脸方法的本质是用称为“特征人脸”的特征向量按照线性组合形式表达每一张原始人脸图像。
()答案:对第三章1.下列哪一项不是运用半监督学习的原因()。
答案:为获得更高的机器学习性能2.在半监督学习中下列哪种说法是错误的()。
答案:“聚类假设的推广,对输出值没有限制”属于聚类假设的范畴。
3.半监督学习方法有:()。
答案:生成方法;基于图表的半监督学习;半监督SVM4.在有标记数据极少的情形下往往比其他方法性能更好是半监督学习生成式方法流程的优点。
()答案:对5.基于图表的半监督学习不用占有太大内存。
()答案:错第四章1.下列说法正确的是()。
答案:感知机网络只有输入层/输出层,无隐藏层。
2.一元变量所构成函数f在x处的梯度为()答案:;3.常用的池化操作有::()。
答案:最大池化;平均池化4.One-hot向量可以刻画词与词之间的相似性()答案:错5.前馈神经网络中存在反馈。
()答案:错第五章1.下列说法错误的是()。
答案:循环神经网络不能处理任意长度的序列2.下列说法正确的是()。
答案:如果一个完全连接的RNN有足够数量的sigmoid型隐藏神经元,它可以以任意的准确率去近似任何一个非线性动力系统个。
机器学习题集
机器学习题集一、选择题1.机器学习的主要目标是什么?A. 使机器具备人类的智能B. 使机器能够自动学习和改进C. 使机器能够模拟人类的思维过程D. 使机器能够按照给定的规则执行任务答案:B2.下列哪项不是机器学习算法的分类?A. 监督学习B. 无监督学习C. 半监督学习D. 完全手动学习答案:D3.在机器学习中,以下哪项是指学习算法在给定训练集上的表现能力?A. 泛化能力B. 训练误差C. 过拟合D. 欠拟合答案:B4.哪种机器学习算法通常用于处理回归问题?A. 支持向量机(SVM)B. K-近邻(K-NN)C. 线性回归D. 决策树答案:C5.深度学习是机器学习的哪个子领域?A. 弱学习B. 表示学习C. 概率学习D. 规则学习答案:B6.在监督学习中,算法尝试从训练数据中学习什么?A. 数据的分布B. 数据的模式C. 输入到输出的映射D. 数据的统计特性答案:C7.以下哪项是机器学习模型评估中常用的交叉验证方法?A. 留出法B. 梯度下降C. 决策树剪枝D. K-均值聚类答案:A8.在机器学习中,正则化通常用于解决什么问题?A. 数据不足B. 过拟合C. 欠拟合D. 维度灾难答案:B9.以下哪项是深度学习中常用的激活函数?A. 线性函数B. Sigmoid函数C. 逻辑回归D. 梯度提升答案:B10.在机器学习中,特征工程主要关注什么?A. 数据的收集B. 数据的清洗C. 从原始数据中提取有意义的特征D. 模型的部署答案:C11.下列哪个算法通常用于分类问题中的特征选择?A. 决策树B. PCA(主成分分析)C. K-均值聚类D. 线性回归答案:A12.集成学习通过结合多个学习器的预测结果来提高整体性能,这种方法属于哪种策略?A. 监督学习B. 弱学习C. 规则学习D. 模型融合答案:D13.在深度学习中,卷积神经网络(CNN)主要用于处理哪种类型的数据?A. 文本数据B. 图像数据C. 时间序列数据D. 语音数据答案:B14.以下哪个指标用于评估分类模型的性能时,考虑到了类别不平衡的问题?A. 准确率B. 精确率C. 召回率D. F1分数答案:D15.在强化学习中,智能体通过什么来优化其行为?A. 奖励函数B. 损失函数C. 梯度下降D. 决策树答案:A16.以下哪项是机器学习中的无监督学习任务?A. 图像分类B. 聚类分析C. 情感分析D. 回归分析答案:B17.在机器学习中,梯度下降算法主要用于什么?A. 数据的收集B. 模型的训练C. 数据的清洗D. 模型的评估答案:B18.以下哪项是机器学习中常用的正则化技术之一?A. L1正则化B. 决策边界C. 梯度提升D. 逻辑回归答案:A19.在机器学习中,过拟合通常发生在什么情况?A. 模型太复杂,训练数据太少B. 模型太简单,训练数据太多C. 数据集完全随机D. 使用了不合适的激活函数答案:A20.以下哪个算法是基于树的集成学习算法之一?A. 随机森林B. 线性回归C. K-近邻D. 神经网络答案:A21.在机器学习中,确保数据质量的关键步骤之一是:A. 初始化模型参数B. 提取新特征C. 数据清洗D. 损失函数最小化答案:C22.监督学习中,数据通常被分为哪两部分?A. 训练集和验证集B. 输入特征和输出标签C. 验证集和测试集D. 数据集和标签集答案:B23.数据标注在机器学习的哪个阶段尤为重要?A. 模型评估B. 特征工程C. 数据预处理D. 模型训练答案:C24.下列哪项不是数据清洗的常用方法?A. 处理缺失值B. 转换数据类型C. 去除异常值D. 初始化模型参数答案:D25.数据分割时,以下哪个集合通常用于评估模型的最终性能?A. 训练集B. 验证集C. 测试集D. 验证集和测试集答案:C26.在数据标注过程中,为每个样本分配的输出值被称为:A. 特征B. 权重C. 损失D. 标签答案:D27.数据代表性不足可能导致的问题是:A. 过拟合B. 欠拟合C. 收敛速度过慢D. 模型复杂度过高答案:B28.下列哪项不是数据收集时应考虑的因素?A. 数据源的可靠性B. 数据的隐私保护C. 模型的复杂度D. 数据的完整性答案:C29.数据清洗中,处理缺失值的一种常用方法是:A. 删除包含缺失值的行或列B. 使用均值、中位数或众数填充C. 将缺失值视为新特征D. 停止模型训练答案:A, B(多选,但此处只选一个最直接的答案)A30.数据的泛化能力主要取决于:A. 模型的复杂度B. 数据的多样性C. 算法的先进性D. 损失函数的选择答案:B31.监督学习中,输入特征与输出标签之间的关系是通过什么来学习的?A. 损失函数B. 决策树C. 神经网络D. 训练过程答案:D32.数据标注的准确性对模型的什么能力影响最大?A. 泛化能力B. 收敛速度C. 预测精度D. 特征提取答案:C33.在数据预处理阶段,处理噪声数据的主要目的是:A. 提高模型训练速度B. 降低模型的复杂度C. 提高模型的预测准确性D. 减少数据存储空间答案:C34.下列哪项不属于数据清洗的范畴?A. 缺失值处理B. 异常值检测C. 特征选择D. 噪声处理答案:C35.数据标注的自动化程度受什么因素影响最大?A. 数据集的大小B. 数据的复杂性C. 标注工具的效率D. 模型的训练时间答案:B36.在数据分割时,为什么需要设置验证集?A. 仅用于训练模型B. 评估模型在未见过的数据上的表现C. 替代测试集进行最终评估D. 加速模型训练过程答案:B37.数据的标签化在哪些类型的机器学习任务中尤为重要?A. 无监督学习B. 半监督学习C. 监督学习D. 强化学习答案:C38.数据质量对模型性能的影响主要体现在哪些方面?A. 模型的收敛速度B. 模型的复杂度C. 模型的预测精度D. 模型的泛化能力答案:C, D(多选,但此处只选一个最直接的答案)D39.下列哪项不是数据清洗和预处理阶段需要完成的任务?A. 数据标注B. 缺失值处理C. 噪声处理D. 模型评估答案:D40.数据多样性对防止哪种问题有重要作用?A. 欠拟合B. 过拟合C. 收敛速度过慢D. 损失函数波动答案:B41.机器学习的基本要素不包括以下哪一项?A. 模型B. 特征C. 规则D. 算法答案:C42.哪种机器学习算法常用于分类任务,并可以输出样本属于各类的概率?A. 线性回归B. 支持向量机C. 逻辑回归D. 决策树答案:C43.模型的假设空间是指什么?A. 模型能够表示的所有可能函数的集合B. 数据的特征向量集合C. 算法的复杂度D. 损失函数的种类答案:A44.下列哪个是评估模型好坏的常用准则?A. 准确率B. 损失函数C. 数据集大小D. 算法执行时间答案:B45.哪种算法特别适合于处理非线性关系和高维数据?A. 朴素贝叶斯B. 神经网络C. 决策树D. 线性回归答案:B46.在机器学习中,特征选择的主要目的是什么?A. 减少计算量B. 提高模型的可解释性C. 提高模型的泛化能力D. 以上都是答案:D47.结构风险最小化是通过什么方式实现的?A. 增加训练数据量B. 引入正则化项C. 减小模型复杂度D. 改进损失函数答案:B48.哪种算法常用于处理时间序列数据并预测未来值?A. 朴素贝叶斯B. 随机森林C. ARIMAD. 逻辑回归答案:C49.在决策树算法中,分割数据集的标准通常基于什么?A. 损失函数B. 信息增益C. 数据的分布D. 模型的复杂度答案:B50.哪种策略常用于处理类别不平衡的数据集?A. 采样B. 特征缩放C. 交叉验证D. 正则化答案:A51.监督学习的主要任务是什么?A. 从无标签数据中学习规律B. 预测新数据的标签C. 自动发现数据中的模式D. 生成新的数据样本答案:B52.下列哪个是监督学习算法?A. K-means聚类B. 线性回归C. PCA(主成分分析)D. Apriori算法(关联规则学习)答案:B53.在监督学习中,标签(label)通常指的是什么?A. 数据的索引B. 数据的特征C. 数据的类别或目标值D. 数据的分布答案:C54.监督学习中的损失函数主要用于什么?A. 评估模型的复杂度B. 衡量模型预测值与真实值之间的差异C. 生成新的数据样本D. 划分数据集为训练集和测试集答案:B55.下列哪种方法常用于处理分类问题中的多类分类?A. 二元逻辑回归B. 一对多(One-vs-All)策略C. 层次聚类D. PCA降维答案:B56.在监督学习中,过拟合通常指的是什么?A. 模型在训练集上表现很好,但在测试集上表现不佳B. 模型在训练集和测试集上表现都很好C. 模型在训练集上表现很差D. 模型无法学习到任何有用的信息答案:A57.下列哪个技术常用于防止过拟合?A. 增加数据集的大小B. 引入正则化项C. 减少模型的特征数量D. 以上都是答案:D58.交叉验证的主要目的是什么?A. 评估模型的性能B. 划分数据集C. 选择最优的模型参数D. 以上都是答案:D59.在监督学习中,准确率(Accuracy)的计算公式是什么?A. 正确预测的样本数 / 总样本数B. 误分类的样本数 / 总样本数C. 真正例(TP)的数量D. 真正例(TP)与假负例(FN)之和答案:A60.下列哪个指标在分类问题中考虑了类别的不平衡性?A. 准确率(Accuracy)B. 精确率(Precision)C. 召回率(Recall)D. F1分数(F1 Score)(注意:虽然F1分数不完全等同于解决类别不平衡,但在此选项中,它相比其他三个更全面地考虑了精确率和召回率)答案:D(但请注意,严格来说,没有一个指标是专为解决类别不平衡设计的,F1分数是精确率和召回率的调和平均,对两者都给予了重视)61.监督学习中的训练集包含什么?A. 无标签数据B. 有标签数据C. 噪声数据D. 无关数据答案:B62.下列哪个不是监督学习的步骤?A. 数据预处理B. 模型训练C. 模型评估D. 数据聚类答案:D63.逻辑回归适用于哪种类型的问题?A. 回归问题B. 分类问题C. 聚类问题D. 降维问题答案:B64.监督学习中的泛化能力指的是什么?A. 模型在训练集上的表现B. 模型在测试集上的表现C. 模型的复杂度D. 模型的训练时间答案:B65.梯度下降算法在监督学习中常用于什么?A. 特征选择B. 损失函数最小化C. 数据划分D. 类别预测答案:B66.在处理多标签分类问题时,每个样本可能属于多少个类别?A. 0个B. 1个C. 1个或多个D. 唯一确定的1个答案:C67.下列哪个不是监督学习常用的评估指标?A. 准确率B. 精确率C. 召回率D. 信息增益答案:D68.监督学习中的偏差(Bias)和方差(Variance)分别指的是什么?A. 模型的复杂度B. 模型在训练集上的表现C. 模型预测值的平均误差D. 模型预测值的变化程度答案:C(偏差),D(方差)69.ROC曲线和AUC值主要用于评估什么?A. 回归模型的性能B. 分类模型的性能C. 聚类模型的性能D. 降维模型的性能答案:B70.在处理不平衡数据集时,哪种策略可能不是首选?A. 重采样技术B. 引入代价敏感学习C. 使用集成学习方法D. 忽略不平衡性直接训练模型答案:D二、简答题1.问题:什么是无监督学习?答案:无监督学习是一种机器学习方法,它使用没有标签的数据集进行训练,目标是发现数据中的内在结构或模式,如聚类、降维等。
机器学习知到章节答案智慧树2023年同济大学
机器学习知到章节测试答案智慧树2023年最新同济大学第一章测试1.回归和分类都是有监督学习问题。
()参考答案:对2.输出变量为有限个离散变量的预测问题是回归问题;输出变量为连续变量的预测问题是分类问题。
()参考答案:错3.关于“回归(Regression)”和“相关(Correlation)”,下列说法正确的是?注意:x 是自变量,y 是因变量。
()参考答案:回归在 x 和 y 之间是非对称的,相关在 x 和 y 之间是互为对称的4.如果一个经过训练的机器学习模型在测试集上达到 100% 的准确率,这就意味着该模型将在另外一个新的测试集上也能得到 100% 的准确率。
()参考答案:错5.机器学习学得的模型适用于新样本的能力,称为"泛化"能力,这是针对分类和回归等监督学习任务而言的,与聚类这样的无监督学习任务无关。
()参考答案:错6.机器学习时,我们通常假设样本空间中的全体样本都服从某个未知"分布",并且我们获得的每个样本都是独立地从这个分布上采样获得的。
()参考答案:对7.从归纳偏好一般性原则的角度看,"奥卡姆剃刀" (Occam's razor)准则与“大道至简”说的是相同的道理。
()参考答案:对8.以下方法或系统属于"符号主义" (symbolism)学习技术的是()参考答案:"概念学习系统";"基于逻辑的归纳学习系统“;"结构学习系统"9.以下方法或技术属于统计学习范畴的是()参考答案:支持向量机;核方法10.归纳学习相当于"从样例中学习",即从训练样例中归纳出学习结果。
()参考答案:对第二章测试1.回归问题和分类问题都有可能发生过拟合。
()参考答案:对2.对于k折交叉验证, 以下对k的说法正确的是()参考答案:k越大, 不一定越好, 选择大的k会加大评估时间;选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集);在选择k时, 要最小化数据集之间的方差3.小明参加Kaggle某项大数据竞赛,他的成绩在大赛排行榜上原本居于前20,后来他保持特征不变,对原来的模型做了1天的调参,将自己的模型在自己本地测试集上的准确率提升了3%,然后他信心满满地将新模型的预测结果更新到了大赛官网上,结果懊恼地发现自己的新模型在大赛官方的测试集上准确率反而下降了。
机器学习试卷试题及答案
机器学习试题(一共30题,标有下划线的,如34,3_2,只用选择其中一题)1 .在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(C)Ver-fitting)中影响最大?A.多项式阶数B.更新权重W时,使用的是矩阵求逆还是梯度下降C,使用常数项2 .假设你有以下数据:输入和输出都只有一个变量。
使用线性回归模型(y=wx+b)来拟合数据。
那么使用留一法(1eave-OneOut)交叉验证得到的均方误差是多少?A. 10/27B. 39/27C. 49/27D. 55/273_1.下列关于极大似然估计(MaXimUm1ike1ihoodEstimate,M1E),说法正确的是(多选)?A. M1E可能并不存在B. M1E总是存在C.如果M1E存在,那么它的解可能不是唯一的D.如果M1E存在,那么它的解一定是唯一的3_2.下列哪些假设是我们推导线性回归参数时遵循的(多选)?AX与Y有线性关系(多项式关系)B.模型误差在统计学上是独立的C,误差一般服从O均值和固定标准差的正态分布D.X是非随机且测量没有误差的4_1.为了观察测试Y与X之间的线性关系,X是连续变量,使用下列哪种图形比较适合?A.散点图B.柱形图C.直方图D,以上都不对4_2,一般来说,下列哪种方法常用来预测连续独立变量?A.线性回归B.逻辑回顾C,线性回归和逻辑回归都行D.以上说法都不对5.个人健康和年龄的相关系数是-1.09o根据这个你可以告诉医生哪个结论?A.年龄是健康程度很好的预测器B.年龄是健康程度很糟的预测器C.以上说法都不对6.下列哪一种偏移,是我们在最小二乘直线拟合的情况下使用的?图中横坐标是输入X,纵坐标是输出Y overtica1offsetsperpendicu1aroffsetsA,垂直偏移(vertica1offsets)B.垂向偏移(perpendicu1aroffsets)C,两种偏移都可以D.以上说法都不对7 .假如我们利用Y是X的3阶多项式产生一些数据(3阶多项式能很好地拟合数据)。
机器学习技术及应用智慧树知到答案章节测试2023年
第一章测试1.下列属于机器学习中的监督学习算法有哪些()。
A:SVM B:ID3C:AdaBoost D:C4.5 答案:ABCD2.下列属于机器学习中的非监督学习算法有哪些()。
A:Sting B:K-meansC:Dbscan D:Birch 答案:ABCD3.下列属于机器学习中的半监督学习算法有哪些() A:基于距离的方法 B:基于流形学习的方法 C:基于差异的方法 D:基于类标签的方法答案:ABCD4.人工智能发展经历了哪几个发展阶段() A:推理期 B:知识期 C:表示期 D:学习期答案:ABD5.下列属于机器学习的应用领域有哪些() A:自然语言处理 B:人脸检测 C:计算机视觉 D:自动驾驶答案:ABCD第二章测试1.下列不属于机器学习开发语言是哪个?() A:R B:C++ C:汇编语言 D:Java 答案:C2.下列不属于机器学习的学习框架是哪个?() A:Keras B:Caffe C:RNND:TensorFlow 答案:C3.Numpy中创建全为0的矩阵使用() A:empty B:ones C:arange D:zeros 答案:D4.使用pandas时需要导入什么?() A:import matplotlib B:import numpy asnp C:import pandas as pd 答案:C5.下列说法正确的有() A:安装Scikit-learn库之前,不需要安装python、Numpy、Scipy和matplotlib等库。
B:Scikit-learn库是一个开源机器学习库,涵盖了几乎所有机器学习算法。
C:Scikit-learn内置了少量的数据集,其中数据集库datasets提供数据集。
D:Scikit-learn库不支持包括分类、回归、降维和聚类、模型选择及预处理等算法。
答案:B第三章测试1.在决策树中,用作分裂节点的信息增益说法不正确的是() A:较小不纯度的节点需要更多的信息来区分总体 B:信息增益可以使用熵得到 C:信息增益更加倾向于选择有较多取值的属性 D:ID3算法采用信息增益来选择特征答案:A2.下面明显属于回归问题的是() A:广告是否点击预测 B:西瓜好坏预测 C:房价估值预测 D:垃圾邮件识别答案:C3.梯度下降算法中学习率理解正确的是()A:学习率最好能设置可调的数值,先小后大 B:学习率最好设置很大的数值 C:学习率最好设置很小的数值 D:学习率最好能设置可调的数值,先大后小答案:D4.下列有关支持向量机(SVM)说法不正确的是() A:SVM的支持向量是少数的几个数据点向量 B:SVM对线性不可分的数据有较好的分类性能 C:SVM因为使用了核函数,因此它没有过拟合的风险 D:SVM使用核函数的过程实质是进行特征转换的过程答案:C5.K近邻算法的基本要素不包括() A:样本的大小 B:K值选择 C:距离度量 D:分类决策规则答案:A第四章测试1.下列属于机器学习中的非监督学习算法有哪些() A:Kmeans B:fisher判别C:PCA D:SVM 答案:AC2.从目的的角度来看,非监督学习的类别有哪些() A:降维 B:聚类 C:基于样本间相似性度量的方法 D:基于概率密度估计的方法答案:AB3.从实现方式的角度来看,非监督学习的类别有哪些() A:基于样本间相似性度量的方法 B:降维 C:基于概率密度估计的方法 D:聚类答案:AC4.下列哪些是非监督学习的应用场景() A:图像生成 B:用户细分 C:推荐系统D:异常发现答案:BCD5.对数据进行降维的原因有哪些() A:方便可视化处理 B:资源受限,不能处理高维数据 C:数据有冗余 D:能有效提升模型精度答案:ABC第五章测试1.卷积神经网络的缩写为() A:DNN B:ANN C:CNN D:BNN 答案:C2.人类历史上首次提出神经元模型是在哪一年() A:1946 B:1938 C:1949D:1943 答案:D3.深度学习概念是由下列哪位科学家提出的() A:威德罗 B:罗森勃拉特 C:霍夫 D:辛顿答案:D4.生物神经元不包含哪一部分() A:轴突 B:细胞体 C:树突 D:权重答案:D5.下列不属于常见反馈网络的是哪一个() A:感知机 B:BAM网络 C:Hopfield网络 D:Hamming网络答案:A第六章测试1.下列属于强化学习组成部分有哪些() A:行动 B:状态 C:智能体 D:环境答案:ABCD2.下列属于机器学习中的应改为强化学习算法有哪些() A:时间差分方法 B:值迭代算法 C:策略迭代算法 D:蒙特卡洛法答案:ABCD3.下列哪个是求解决策过程最优化的数学方法() A:动态规划方法 B:时间差分方法 C:策略迭代算法 D:蒙特卡洛法答案:AC4.采用时间差分法的强化学习可以分为哪几类() A:统计试验法 B:在线控制C:统计模拟法 D:离线控制答案:BD5.强化学习的主要特点有哪些() A:基于评估 B:交互性 C:单步 D:序列决策过程答案:ABD。
机器学习复习题及答案
一、单选题1、下列哪位是人工智能之父?()A.MarnivLeeMinskyB.HerbertA.SimonC.AllenNewellD.JohnCliffordShaw正确答案:A2、根据王珏的理解,下列不属于对问题空间W的统计描述是()A.-致性假设B•划分C■泛化能力D•学习能力正确答案:D3、下列描述无监督学习错误的是()。
A.无标签B•核心是聚类C•不需要降维D•具有很好的解释性正确答案:C4、下列描述有监督学习错误的是()。
A.有标签B•核心是分类C•所有数据都相互独立分布D•分类原因不透明正确答案:C5、下列哪种归纳学习采用符号表示方式?()A.经验归纳学习B■遗传算法C•联接学习D•强化学习正确答案:A6、混淆矩阵的假正是指()。
A.模型预测为正的正样本B•模型预测为正的负样本C•模型预测为负的正样本D•模型预测为负的负样本正确答案:B7、混淆矩阵的真负率公式是为()。
A.TP/(TP+FN)B.FP/(FP+TN)C.FN/(TP+FN)D.TN/(TN+FP)正确答案:D8、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是()。
A.1/4B.1/2C.4/7D.4/6正确答案:B9、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,精确率是()。
A.1/4B.1/2C.4/7D.2/3正确答案:C10、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,召回率是()。
A.1/4B.1/2C.4/7D.2/3正确答案:D11、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,F1-score是()。
A.4/13B.8/13C.4/7D.2/30.00/2.00正确答案:B12、EM算法的E和M指什么?()A.Expectation-MaximumB.Expect-MaximumC.Extra-MaximumD.Extra-Max正确答案:A13、EM算法的核心思想是?()A.通过不断地求取目标函数的下界的最优值,从而实现最优化的目标。
机器学习模拟试题含答案
机器学习模拟试题含答案一、单选题(共50题,每题1分,共50分)1、同质集成中的个体学习器亦称()A、组件学习器B、基学习器C、异质学习器D、同质学习器正确答案:B2、假设我们使用原始的非线性可分版本的 Soft-SVM 优化目标函数。
我们需要做什么来保证得到的模型是线性可分离的?A、C = 0B、C = 1C、C 正无穷大D、C 负无穷大正确答案:C3、关于logistic回归和SVM不正确的是()A、Logistic 回归目标函数是最小化后验概率B、Logistic回归可以用于预测事件发生概率的大小C、SVM可以有效避免模型过拟合D、SVM目标是结构风险最小化正确答案:A4、构建一个最简单的线性回归模型需要几个系数(只有一个特征)?A、1 个B、2 个C、4 个D、3 个正确答案:B5、假如我们使用 Lasso 回归来拟合数据集,该数据集输入特征有 100 个(X1,X2,…,X100)。
现在,我们把其中一个特征值扩大 10 倍(例如是特征 X1),然后用相同的正则化参数对 Lasso 回归进行修正。
那么,下列说法正确的是?A、特征 X1 很可能被排除在模型之外B、特征 X1 很可能还包含在模型之中C、无法确定特征 X1 是否被舍弃D、以上说法都不对正确答案:B6、下面关于SVM算法叙述不正确的是()A、SVM是一种基于经验风险最小化准则的算法B、SVM求得的解为全局唯一最优解C、SVM在解决小样本、非线性及高维模式识别问题中具有优势D、SVM最终分类结果只与少数支持向量有关正确答案:A7、KNN算法属于一种典型的()算法A、无监督学习B、半监督学习C、弱监督学习D、监督学习正确答案:D8、关于BP算法特点描述错误的是 ( )A、输入信号顺着输入层、隐层、输出层依次传播B、计算之前不需要对训练数据进行归一化C、预测误差需逆向传播,顺序是输出层、隐层、输入层D、各个神经元根据预测误差对权值进行调整正确答案:B9、关于维数灾难说法错误的是?A、高维度数据可使得算法泛华能力变得越来越弱B、高维度数据增加了运算难度C、降低高维度数据会对数据有所损伤D、高维度数据难以可视化正确答案:A10、做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、监督学习与无监督学习的主要区别是什么?分别列举应用两者的例子(或算法名称)。
2、在梯度下降算法中有时会出现梯度下降来回振荡,所需时间较长。
可以通过什么方法使
其收敛更快?
例如:原参数为:X1=size取值范围:0~200;X2=number取值范围:1~5
3、假设房价预测模型为:h(x)=Ѳ0+ Ѳ1X1+ Ѳ2X2,其中X1、X2分别为房间的开间、进深长度。
现在选择新的特征-房间面积X,得到新的学习算法。
已知训练集中面积与房价的关系如图所示:
请构造合适的多项式作为新的学习算法。
4、简述自己对欠拟合和过拟合的理解,必要时可画图辅助说明。
5、有如图曲线f(Ѳ)。
欲求f(Ѳ)=0时的Ѳ值,请用牛顿迭代法在图中画出两次迭代的
示意图。
Ѳ初始值取4.5。
6、请写出指数分布族的一般表达形式。
7、
用极大似然估计求算Ѳ使得最大。
简要写出推导步
8、简述对laplace平滑理解,可以举例说明;
9、按自己的理解简述参数学习算法和非参数学习算法的区别;
10、按自己的理解简述判别学习算法和生成算法的区别。
参考答案:并非标准答案,只要理解正确即可。
1、主要区别是监督学习中有属性的标签,而无监督学习则没有;
例子:监督学习——根据房价与房间面积对房价进行预测;
无监督学习——网页搜索将相关新闻聚在一起
算法:监督学习——支持向量机、线性回归决策树神经网络;
无监督学习——k-聚类等各种聚类方法、主成分分析
2、可利用特征缩放方法
例如:原参数为X1=size取值范围:0~200
X2=number取值范围:1~5
利用特征缩放方法后变为X1=size/200
X2=number/5
3、h(x)=Ѳ0+ Ѳ1 X+ Ѳ2 X2+ Ѳ3X3
4、首先欠拟合、过拟合没有明确的定义分界
明显的未充分利用数据,拟合结果不符合预期,甚至不能有效拟合训练集,我们可以认为欠拟合;考虑过多,超出自变量的一般含义维度,过多考虑噪声,会造成过拟合。
可以认为预测准确率、召回率都比理论上最佳拟合函数低很多,则为欠拟;训练集预测效果好,测试集预测效果差,则为过拟合。
或者简单的讲:对于特征集过小的情况,称之为欠拟合( under fitting );
对于特征集过大的情况,称之为过拟合( overfitting )
例如:给定一个数据集,根据x预测y.
最左边的函数为,并不能很好的拟合数据;
中间的加了一个额外的特性,函数为,稍微更好地
拟合了数据;
似乎我们增加越多的特性,拟合程度越好;但是增加太多的特性是很危险的,最右边的图是一个五阶的多项式,虽然很好的拟合了给定的数据集,但是这个并不是一个很好的预测函数。
欠拟合(underfitting):很明显有一些没有被模型捕获的结构,比如说最左边的图.
过拟合(overfitting):最右边的就是一个过拟合的例子.
因此说,特性的选择对于学习算法的性能来说是很重要的!!!
5、
两次迭代还得再往下画一步
6、若一类概率分布可以写成如下形式,那么它就属于指数分布族:
η - 自然参数,通常是一个实数
T(y) –充分统计量,通常,T(y)=y,实际上是一个概率分布的充分统计量(统计学知识)
对于给定的a,b,T三个函数,上式定义了一个以η为参数的概率分布集合,即改变η可以得到不同的概率分布
7、
令对Θ求导的值为零,求得Θ即可。
8、在统计上来说,在你有限的训练集中没有见过就认为概率是0是不科学的
为了上述问题,我们用laplace平滑来优化这个问题.
分子加1,分母加k(j的取值范围的大小)。
可以举适当的例子说明。
9、参数学习算法( parametric learning algorithm ):是一类有固定数目参数,以用来进行数据拟合的算法。
设该固定的参数集合为。
线性回归即使参数学习算法的一个例子
非参数学习算法(Non-parametric learning algorithm):参数数量会随 m (训练集大小)增长的算法。
通常定义为参数数量虽m线性增长。
换句话说,就是算法所需要的东西会随着训练集合线性增长,算法的维持是基于整个训练集合的,即使是在学习以后。
10、判别学习算法(discriminative learning algorithm):直接学习p(y|x)(比如说logistic回归)或者说是从输入直接映射到{0,1}.
生成学习算法(generative learning algorithm):对p(x|y)(和p(y))进行建模.
简单的来说,判别学习算法的模型是通过一条分隔线把两种类别区分开,而生成学习算法是对两种可能的结果分别进行建模,然后分别和输入进行比对,计算出相应的概率。