第八章 机器学习习题解答
机器学习 模拟题与参考答案
机器学习模拟题与参考答案一、单选题(共114题,每题1分,共114分)1.机器学习这个术语是由( )定义的?A、Arthur SamuelB、Guido van RossumC、James GoslingD、以上都不是正确答案:A2.在一个线性回归问题中,我们使用 R 平方(R-Squared)来判断拟合度。
此时,如果增加一个特征,模型不变,则下面说法正确的是?A、如果 R-Squared 增加,则这个特征有意义B、如果R-Squared 减小,则这个特征没有意义C、仅看 R-Squared 单一变量,无法确定这个特征是否有意义。
D、以上说法都不对正确答案:C3.在SVM中, margin的含义是()A、损失误差B、间隔C、幅度D、差额正确答案:B4.下列哪种方法可以用来缓解过拟合的产生:( )。
A、正则化B、增加更多的特征C、以上都是D、增加模型的复杂度正确答案:A5.当数据分布不平衡时,我们可采取的措施不包括( )。
A、对数据分布较少的类别过采样B、对数据分布较多的类别欠采样C、对数据分布较少的类别赋予更大的权重D、对数据分布较多的类别赋予更大的权重正确答案:D6.同质集成中的个体学习器亦称()A、异质学习器B、同质学习器C、基学习器D、组件学习器正确答案:C7.以下哪些是无序属性()A、{小,中,大}B、闵可夫斯基距离C、{飞机,火车、轮船}D、{1,2,3}正确答案:C8.下列关于过拟合的说法错误的是A、过拟合是指模型在训练集上表现很好,但是在交叉验证集和测试集上表现一般B、解决过拟合可以采用Dropout方法C、解决过拟合可以采用参数正则化方法D、数据集扩增不能用来解决过拟合问题正确答案:D9.神经网络算法有时会出现过拟合的情况,那么采取以下哪些方法解决过拟合更为可行()。
A、减少训练数据集中数据的数量B、增大学习的步长C、为参数选取多组初始值,分别训练,再选取一组作为最优值D、设置一个正则项减小模型的复杂度正确答案:D10.下列是机器学习中降维任务的准确描述的为A、依据某个准则对项目进行排序B、将其映射到低维空间来简化输入C、预测每个项目的实际值D、对数据对象进行分组正确答案:B11.对于在原空间中线性不可分问题,支持向量机()。
第八章 机器学习习题解答
第八章机器学习8.2答:(1)学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的学习中所用的推理越多,系统的能力越强(2)机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问“机器”——计算机(电子,以后还可能是中子计算机、光子计算机或神经计算机等)8.3答:机器学习系统的结构及基本功能当监督环节为示教人时,为示教式学习系统;当监督环节为监督器时,为自学式学习系统。
①知识库存储(记忆)、积累知识·长期记忆(LTM)先验知识背景如事物的基本概念和定义、定律和公理,博弈的基本规则等·中期记忆(MTM)环境事物的各种具体知识·短期记忆(STM)环境变化的信息和数据事实库或“黑板②学习元学习系统的核心环节·采集环境信息息选例环节或直接采集·接受监督指导监督环节的示教、指导信息或评价准则·进行学习推理获得有关问题的解答和结论·修改知识库将推理结果输入知识库,对知识增删改③执行元识别、论证、决策、判定模式分类器、专家咨询解释系统、智能控制机构、机械手/人等如执行元行动结果直接引起环境的变化 “在线”学习系统机器人规划、生产过程控制、机器博弈等④监督环节人:示教者;监督器:评价准则或检验标准·工作执行效果评价——接受来自执行元环节的反馈信息,对系统的工作执行效果进行评价和检验·制定评价标准——接受来自环境变化的信息,制定和修订评价标准和检验标准·监督学习环节——根据评价和检验的结果,对学习环节进行示教、训练或指导·控制选例环节——根据环境变化信息及工作执行效果的反馈,控制选例环节,选取其它事例或样本⑤选例环节作用是从环境中选取有典型意义的事例或样本,作为系统的训练集或学习对象。
如挑选典型病历,以便提高学习效率,加速学习过程。
选例环节可以由人或机器来实现⑥环境系统获取知识和信息的来源,执行的对象和人物等。
机器学习:模型与算法智慧树知到课后章节答案2023年下浙江大学
机器学习:模型与算法智慧树知到课后章节答案2023年下浙江大学浙江大学第一章测试1.sigmoid函数的值域为?()。
答案:(0,1)2.哪些属于监督学习重要元素?()。
答案:标注数据;学习模型;损失函数3.分析不同变量之间存在关系的研究叫回归分析。
()答案:对4.强可学习和弱可学习是等价的。
()答案:对5.下面的说法正确的是()。
答案:逻辑回归只能处理二分类问题第二章测试1.下面的说法正确的是()。
答案:K均值聚类算法实质上是最小化每个类簇的方差。
2.哪一项是皮尔逊相关系数的性质?()。
答案:X与Y协方差的绝对值小于等于13.下面的说法正确的有()。
答案:EM算法分为求取期望和期望最大化两个步骤。
;在K均值聚类算法中,欧式距离与方差量纲相同。
4.K均值聚类属于监督学习。
()答案:错5.特征人脸方法的本质是用称为“特征人脸”的特征向量按照线性组合形式表达每一张原始人脸图像。
()答案:对第三章测试1.下列哪一项不是运用半监督学习的原因()。
答案:为获得更高的机器学习性能2.在半监督学习中下列哪种说法是错误的()。
答案:“聚类假设的推广,对输出值没有限制”属于聚类假设的范畴。
3.半监督学习方法有:()。
答案:基于图表的半监督学习;半监督SVM;生成方法4.在有标记数据极少的情形下往往比其他方法性能更好是半监督学习生成式方法流程的优点。
()答案:对5.基于图表的半监督学习不用占有太大内存。
()答案:错第四章测试1.下列说法正确的是()。
答案:感知机网络只有输入层/输出层,无隐藏层。
2.一元变量所构成函数f在x处的梯度为()答案:3.常用的池化操作有::()。
答案:最大池化;平均池化4.One-hot向量可以刻画词与词之间的相似性()答案:错5.前馈神经网络中存在反馈。
()答案:错第五章测试1.下列说法错误的是()。
答案:循环神经网络不能处理任意长度的序列2.下列说法正确的是()。
答案:如果一个完全连接的RNN有足够数量的sigmoid型隐藏神经元,它可以以任意的准确率去近似任何一个非线性动力系统个。
机器学习考试题目及答案
机器学习考试题目答案1.简描述机器学习概念?TomMitCheI1:"对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习J 我们遇到的大部分事情一般包括分类问题与回归问题。
如房价的预测,股价的预测等属于分类问题。
一般的处理过程是:首先,1)获取数据;2)提取最能体现数据的特征;3)利用算法建模;4)将建立的模型用于预测。
如人脸识别系统,首先我们获取到一堆人脸照片,首先,对数据进行预处理,然后提取人脸特征,最后用算法如SVM或者NN等。
这样,我们就建立了一个人脸识别系统,当输入一张人脸,我们就知道这张面孔是否在系统中。
这就是机器学习的整个流程,其次还包括寻找最优参数等。
机器学习主要分为:监督学习:数据集是有标签的,大部分机器学习模型都属于这一类别,包括线性分类器、支持向量机等等;无监督学习:跟监督学习相反,数据集是完全没有标签的,主要的依据是相似的样本在数据空间中一般距离是相近的,这样就能通过距离的计算把样本分类,这样就完全不需要IabeI,比如著名的kmeans算法就是无监督学习应用最广泛的算法;半监督学习:半监督学习一般针对的问题是数据量超级大但是有标签数据很少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的而有一部分是没有的;强化学习:一直激励学习的方式,通过激励函数来让模型不断根据遇到的情况做出调整;2.循环神经网络的基本原理?RNNS的目的是用来处理序列数据。
在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。
但是这种普通的神经网络对于很多问题却无能无力。
例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。
RNNS之所以称为循环神经网路,即一个序列当前的输出与前面的输出也有关。
具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。
机器学习复习题及答案
一、单选题1、下列哪位是人工智能之父?()A.Marniv Lee MinskyB.HerbertA.SimonC.Allen NewellD.John Clifford Shaw正确答案:A2、根据王珏的理解,下列不属于对问题空间W的统计描述是()。
A.一致性假设B.划分C.泛化能力D.学习能力正确答案:D3、下列描述无监督学习错误的是()。
A.无标签B.核心是聚类C.不需要降维D.具有很好的解释性正确答案:C4、下列描述有监督学习错误的是()。
A.有标签B.核心是分类C.所有数据都相互独立分布D.分类原因不透明正确答案:C5、下列哪种归纳学习采用符号表示方式?()A. 经验归纳学习B.遗传算法C.联接学习D.强化学习正确答案:A6、混淆矩阵的假正是指()。
A.模型预测为正的正样本B.模型预测为正的负样本C.模型预测为负的正样本D.模型预测为负的负样本正确答案:B7、混淆矩阵的真负率公式是为()。
A.TP/(TP+FN)B.FP/(FP+TN)C.FN/(TP+FN)D.TN/(TN+FP)正确答案:D8、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是()。
A.1/4B.1/2C.4/7D.4/6正确答案:B9、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,精确率是()。
A.1/4B.1/2C.4/7D.2/3正确答案:C10、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,召回率是()。
A.1/4B.1/2C.4/7D.2/3正确答案:D11、混淆矩阵中的TP=16,FP=12,FN=8,TN=4,F1-score是()。
A.4/13B.8/13C.4/7D.2/30.00/2.00正确答案:B12、EM算法的E和M指什么?()A.Expectation-MaximumB.Expect-MaximumC.Extra-MaximumD.Extra-Max正确答案:A13、EM算法的核心思想是?()A.通过不断地求取目标函数的下界的最优值,从而实现最优化的目标。
机器学习(慕课版)习题答案全集
机器学习(慕课版)习题答案全集机器学习(慕课版)习题答案目录第一章机器学习概述 (2)第二章机器学习基本方法 (5)第三章决策树与分类算法 (9)第四章聚类分析 (13)第五章文本分析 (17)第六章神经网络 (22)第七章贝叶斯网络 (26)第八章支持向量机 (31)第九章进化计算 (32)第十章分布式机器学习 (34)第十一章深度学习 (35)第十二章高级深度学习 (37)第十三章推荐系统 (39)第一章机器学习概述1.机器学习的发展历史上有哪些主要事件?机器学习发展分为知识推理期、知识工程期、浅层知识期和深度学习几个阶段,可从几个阶段选择主要历史事件作答。
2.机器学习有哪些主要的流派?它们分别有什么贡献?符号主义:专家系统、知识工程贝叶斯派:情感分类、自动驾驶、垃圾邮件过滤联结主义:神经网络进化主义:遗传算法行为类推主义3.讨论机器学习与人工智能的关系机器学习是人工智能的一个分支,作为人工智能核心技术和实现手段,通过机器学习的方法解决人工智能面对的问题4.讨论机器学习与数据挖掘的关系数据挖掘是从大量的业务数据中挖掘隐藏、有用的、正确的知识促进决策的执行。
数据挖掘的很多算法都来自于机器学习,并在实际应用中进行优化。
机器学习最近几年也逐渐跳出实验室,解决从实际的数据中学习模式,解决实际问题。
数据挖掘和机器学习的交集越来越大,机器学习成为数据挖掘的重要支撑技术5.讨论机器学习与数据科学、大数据分析等概念的关系数据科学主要包括两个方面:用数据的方法研究科学和用科学的方法研究数据。
前者包括生物信息学、天体信息学、数字地球等领域;后者包括统计学、机器学习、数据挖掘、数据库等领域。
大数据分析即是后者的一个部分。
一般使用机器学习这个工具做大数据的分析工作,也就是说机器学习是我们做大数据分析的一个比较好用的工具,但是大数据分析的工具并不止机器学习,机器学习也并不只能做大数据分析。
北京交通大学机器学习(于剑)课后习题答案
第五章 1
L 0 x 0
推导过程:
T w j ij ,i j ,ij 1 ;i jij 0 由 W 是一组正交向量基,所以 ij ,w i
min Ds X (x k ,x )
x k
Ds X (x k ,x ) (x k x 0 )
xk x0 xk x0 xk x0 xk x0 xk x0
2 满足归类公理有 样本可分性公理: k ,i(x ~k i ) (1) 类可分性公理: i,k(x ~k i ) ~ 归类等价公理: X X (2) (3)
由 1 式有 k ,i(Sim X (x k ,X i ) j(j i ) Sim X (x k ,X j )), 即 k ,i,j((j i ) Sim X (x k ,X i ) Sim X (x k ,X j ))。 由 3 式归类等价公理有认知表示和外延表示归类能力等价, 即 Sim X (x k ,X i ) Sim X (x k ,X j ) uik u jk 所以有 k ,i,j((j i ) uik u jk )。
u
1
n
xk k
1
n
2
第四章
1
n
(x k k
1
n
u )2
1 如下数据集只有两个样本
X x 1 ,y 1 , x 2 ,y 2
其中
x 1 (1, 2),y 1 3 x 2 (3, 4),y 2 7
在该数据集上有多个回归函数达到目标函数的最小值,如 F1(x ) x 1 x 2 ,
10
第三章 1
K (x ) x xk
智慧树机器学习(山东联盟)章节测验答案
解忧书店 JieYouBookshop第一章单元测试1【单选题】 (5分)对西瓜的成熟度进行预测得到结果为0.51,这属于()学习任务。
A.其余选项都不是B.聚类C.回归D.分类2【单选题】 (5分)在学习过程中,X表示数据集,Y是所有标记的集合,也称为()。
A.样本集合B.属性集合C.输出空间D.函数3【单选题】 (5分)机器学习算法在学习过程中可能获得多个不同的模型,在解决“什么样的模型更好”这一问题时遵循“若有多个假设与观察一致,则选最简单的那个”,即()原则。
A.奥卡姆剃刀B.没有免费的午餐C.迪米特法则D.里氏替换4【单选题】 (5分)机器学习是整个人工智能的核心,机器学习算法的特征之一就是()。
A.类别B.模型C.特征D.数据5【单选题】 (5分)模型的泛化能力是指A.适用于训练集样本的能力B.适用于测试集样本的能力C.适用于新样本的能力D.适用于验证集样本的能力6【多选题】 (5分)下列关于学习算法的说法正确的是A.在某些问题上表现好的学习算法,在另一些问题上却可能不尽人意B.学习算法自身的归纳偏好与问题是否相配通常并不起决定性的作用C.学习算法必须有某种偏好,才能产出它认为“正确”的模型D.要谈论算法的相对优劣,必须要针对具体的学习问题7【多选题】 (5分)获得假设(模型)空间时,从特殊到一般的过程属于A.泛化B.归纳C.特化D.演绎8【多选题】 (5分)机器学习可以应用在下列哪些领域()A.搜索引擎B.天气预报C.商业营销D.自动驾驶汽车9【多选题】 (5分)根据训练数据是否拥有标记信息,学习任务可以分为()。
A.分类B.聚类C.无监督D.回归E.半监督F.监督10【判断题】 (5分)演绎是从一般到特殊的"特化"过程,即从基础原理推演出具体状况A.对B.错11【判断题】 (5分)分类预测的是离散值A.错B.对12【判断题】 (5分)分类和回归是无监督学习A.对B.错13【判断题】 (5分)奥卡姆剃刀原则:即“若有多个假设与观察一致,选最简单的一个”。
人工智能机器学习技术练习(习题卷8)
人工智能机器学习技术练习(习题卷8)第1部分:单项选择题,共62题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]基于二次准则函数的H-K算法较之于感知器算法的优点是()?A)计算量小B)可以判别问题是否线性可分C)其解完全适用于非线性可分的情况答案:B解析:2.[单选题]构建回归树的时间复杂度最重要的因素是()A)特征中类别的个数B)label列值域C)样本总量答案:A解析:3.[单选题]()是指为最小化总体风险,只需在每个样本上选择能使特定条件风险最小的类别标记。
A)支持向量机B)间隔最大化C)线性分类器D)贝叶斯判定准则答案:D解析:4.[单选题]下列选择 Logistic回归中的 One-Vs-All方法中,()是真实的。
A)我们需要在n类分类问题中适合n个模型B)我们需要适合n-1个模型来分类为n个类C)我们需要只适合1个模型来分类为n个类D)以上答案都不正确答案:A解析:如果存在n个类,那么n个单独的逻辑回归必须与之相适应,其中每个类的概率由剩余类的概率之和确定。
5.[单选题](__)不属于相关分析。
A)正相关B)负相关C)线性相关D)误差相关答案:D解析:6.[单选题]移动运营商对客户进行细分,设计套餐和营销活动可以使用下面哪种机器学习方法( )。
A)贝叶斯分类器B)关联方法C)聚类算法D)多层前馈网络7.[单选题]下面是三个散点图(A,B,C,从左到右)和和手绘的逻辑回归决策边界。
alt="" >上图中哪一个显示了决策边界过度拟合训练数据?A)AB)BC)CD)这些都没有答案:C解析:由于在图3中,决策边界不平滑,表明其过度拟合数据。
8.[单选题]半监督学习包括。
A)主动学习B)回归学习C)聚类学习D)直推学习答案:D解析:9.[单选题]在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然很低,下列哪种方法可以解决这一问题()A)一元切分B)一元文法C)数据平滑D)N元文法答案:C解析:10.[单选题]将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?A)频繁模式挖掘B)分类和预测C)数据预处理D)数据流挖掘答案:C11.[单选题]图像数据分析的常用方法不包括( )A)图像变换B)图像编码和压缩C)图像增强和复原D)图像数据采集答案:D解析:12.[单选题]下列关于数据的说法,不正确的是()A)数据的类别有多种多样B)数据库中的一列代表一个特征C)一组数据平均值不会受异常值影响D)数据点之间的距离满足d_ij+d_jk≥d_ik答案:C解析:13.[单选题]关于ZooKeeper的说法不正确是()A)采用层次化的数据结构B)采用类似于LINUX命令进行数据访问C)具备临时节点和永久节点D)永久节点会随客户端会话的结束而结束其生命周期答案:D解析:14.[单选题]下面数据结构能够支持随机的插入和删除操作、并具有较好的性能的是A)链表和哈希表B)数组和链表C)哈希表和队列D)堆栈和双向队列答案:A解析:15.[单选题]下面关于数据科学与统计学的关系描述不正确的有(__)。
(完整word版)机器学习练习题与答案
(完整word版)机器学习练习题与答案《机器学习》练习题与解答1.⼩刚去应聘某互联⽹公司的算法⼯程师,⾯试官问他“回归和分类有什么相同点和不同点”,他说了以下⾔论,请逐条判断是否准确。
1)回归和分类都是有监督学习问题[单选题] [必答题]○对○错参考答案:对。
解析:这道题只有⼀个同学做错。
本题考察有监督学习的概念。
有监督学习是从标签化训练数据集中推断出函数的机器学习任务。
有监督学习和⽆监督学习的区别是:机器学习算法的图谱如下:在回归问题中,标签是连续值;在分类问题中,标签是离散值。
具体差别请看周志华《机器学习》书中的例⼦,⼀看便懂:2.背景同上题。
请判断2)回归问题和分类问题都有可能发⽣过拟合 [单选题] [必答题]○对○错答案:对解析:这题有两个同学做错。
过拟合的英⽂名称是 Over-fitting(过拟合)。
为了说清楚“过”拟合,⾸先说⼀下“拟合”【拟合的⼏何意义】:从⼏何意义上讲,拟合是给定了空间中的⼀些点,找到⼀个已知形式未知参数的连续曲线或曲⾯来最⼤限度地逼近这些点。
⼀个直观的例⼦,是下⾯的电阻和温度的例⼦。
我们知道在物理学中,电阻和温度是线性的关系,也就是R=at+b。
现在我们有⼀系列关于“温度”和“电阻”的测量值。
⼀个最简单的思路,取两组测量值,解⼀个线性⽅程组,就可以求出系数a、b了!但是理想是丰满的,现实是残酷的!由于测量误差等的存在,我们每次测量得到的温度值和电阻值都是有误差的!因此,为了提⾼测量精度,我们会测量多次,得到多组的值,这样就相当于得到⼆维平⾯上的多个点,我们的⽬标是寻找⼀条直线,让这条直线尽可能地接近各个测量得到的点。
拟合的数学意义:在数学的意义上,所谓拟合(fit)是指已知某函数的若⼲离散函数值{f1,f2,…,fn}(未必都是准确值,有个别可能是近似甚⾄错误值),通过调整该函数中若⼲待定系数f(λ1, λ2,…,λn),使得该函数与已知点集的差别(最⼩⼆乘意义)最⼩。
机器学习智慧树知到课后章节答案2023年下同济大学
机器学习智慧树知到课后章节答案2023年下同济大学第一章测试1.回归和分类都是有监督学习问题。
()A:对 B:错答案:对2.输出变量为有限个离散变量的预测问题是回归问题;输出变量为连续变量的预测问题是分类问题。
()A:错 B:对答案:错3.关于“回归(Regression)”和“相关(Correlation)”,下列说法正确的是?注意:x 是自变量,y 是因变量。
()A:回归和相关在 x 和 y 之间都是互为对称的B:回归在 x 和 y 之间是对称的,相关在 x 和 y 之间是非对称的C:回归和相关在 x 和 y 之间都是非对称的D:回归在 x 和 y 之间是非对称的,相关在 x 和 y 之间是互为对称的答案:回归在 x 和 y 之间是非对称的,相关在 x 和 y 之间是互为对称的4.如果一个经过训练的机器学习模型在测试集上达到 100% 的准确率,这就意味着该模型将在另外一个新的测试集上也能得到 100% 的准确率。
()A:错 B:对答案:错5.机器学习学得的模型适用于新样本的能力,称为"泛化"能力,这是针对分类和回归等监督学习任务而言的,与聚类这样的无监督学习任务无关。
()A:错 B:对答案:错6.机器学习时,我们通常假设样本空间中的全体样本都服从某个未知"分布",并且我们获得的每个样本都是独立地从这个分布上采样获得的。
()A:对 B:错答案:对7.从归纳偏好一般性原则的角度看,"奥卡姆剃刀" (Occam's razor)准则与“大道至简”说的是相同的道理。
()A:错 B:对答案:对8.以下方法或系统属于"符号主义" (symbolism)学习技术的是()A:"概念学习系统"B:支持向量机C:"结构学习系统"D:"基于逻辑的归纳学习系统“答案:"概念学习系统";"结构学习系统";"基于逻辑的归纳学习系统“9.以下方法或技术属于统计学习范畴的是()A:核方法B:Hopfield神经网络C:支持向量机D:感知机答案:核方法;支持向量机10.归纳学习相当于"从样例中学习",即从训练样例中归纳出学习结果。
机器学习练习题与答案
单变量函数的梯度下降我们假设有一个单变量的函数函数的微分初始化,起点为学习率为根据梯度下降的计算公式我们开始进行梯度下降的迭代计算过程:如图,经过四次的运算,也就是走了四步,基本就抵达了函数的最低点,也就是山底多变量函数的梯度下降我们假设有一个目标函数:现在要通过梯度下降法计算这个函数的最小值。
我们通过观察就能发现最小值其实就是 (0,0)点。
但是接下来,我们会从梯度下降算法开始一步步计算到这个最小值!我们假设初始的起点为:初始的学习率为:函数的梯度为:进行多次迭代:我们发现,已经基本靠近函数的最小值点1.小刚去应聘某互联网公司的算法工程师,面试官问他“回归和分类有什么相同点和不同点”,他说了以下言论,请逐条判断是否准确。
1)回归和分类都是有监督学习问题[单选题] [必答题]○对○错参考答案:对。
解析:这道题只有一个同学做错。
本题考察有监督学习的概念。
有监督学习是从标签化训练数据集中推断出函数的机器学习任务。
有监督学习和无监督学习的区别是:机器学习算法的图谱如下:在回归问题中,标签是连续值;在分类问题中,标签是离散值。
具体差别请看周志华《机器学习》书中的例子,一看便懂:2.背景同上题。
请判断2)回归问题和分类问题都有可能发生过拟合 [单选题] [必答题]○对○错答案:对解析:这题有两个同学做错。
过拟合的英文名称是 Over-fitting(过拟合)。
为了说清楚“过”拟合,首先说一下“拟合”【拟合的几何意义】:从几何意义上讲,拟合是给定了空间中的一些点,找到一个已知形式未知参数的连续曲线或曲面来最大限度地逼近这些点。
一个直观的例子,是下面的电阻和温度的例子。
我们知道在物理学中,电阻和温度是线性的关系,也就是R=at+b。
现在我们有一系列关于“温度”和“电阻”的测量值。
一个最简单的思路,取两组测量值,解一个线性方程组,就可以求出系数a、b了!但是理想是丰满的,现实是残酷的!由于测量误差等的存在,我们每次测量得到的温度值和电阻值都是有误差的!因此,为了提高测量精度,我们会测量多次,得到多组的值,这样就相当于得到二维平面上的多个点,我们的目标是寻找一条直线,让这条直线尽可能地接近各个测量得到的点。
机器学习原理及应用练习题答案
机器学习原理及应用练习题答案第一章机器研究概述1.机器研究研究什么问题,构建一个完整的机器研究算法需要哪些要素?机器研究主要研究如何选择统计研究模型,从大量已有数据中研究特定经验。
构建一个完整的机器研究算法需要三个方面的要素,分别是数据,模型,性能度量准则。
2.可以生成新数据的模型是什么,请举出几个例子可以生成新数据的模型是生成模型,典型的生成模型有朴素贝叶斯分类器、高斯混合模型、隐马尔可夫模型、生成对抗网络等。
3.监督研究、半监督研究和无监督研究是什么,降维和聚类属于哪一种?监督研究是指样本集合中包含标签的机器研究,无监督研究是无标签的机器研究,而半监督研究介于二者之间。
降维和聚类是无监督研究。
4.过拟合和欠拟合会导致什么后果,应该怎样避免?过拟合导致模型泛化能力弱,发生明显的预测错误,往往是由于数据量太少或模型太复杂导致,通过增加训练数据量,对模型进行裁剪,正则化的方式来缓解。
而欠拟合则会导致模型不能对数据进行很好地拟合,通常是由于模型本身不能对训练集进行拟合或者训练迭代次数太少,解决方法是对模型进行改进,设计新的模型重新训练,增加训练过程的迭代次数。
5.什么是正则化,L1正则化与L2正则化有什么区别?正则化是一种抑制模型复杂度的方法。
L1正则化能够以较大概率获得稀疏解,起到特征选择的作用,并且可能得到不止一个最优解。
L2正则化相比前者获得稀疏解的概率小的多,但得到的解更加平滑。
第二章逻辑回归与最大熵模型1.逻辑回归模型解决(B)A.回归问题B.分类问题C.聚类问题D.推理问题2.逻辑回归属于(B)回归A.概率性线性B.概率性非线性C.非概率性线性D.非概率性非线性3.逻辑回归不能实现(D)A.二分类B.多分类C.分类展望D.非线性回归4.以下关于最大熵模型的表述毛病的是(B)A.最大熵模型是基于熵值越大模型越稳定的假设B.最大熵模型使用最大熵原理中一般意义上的熵建模以此缩小模型假设空间C.通过定义最大熵模型的参数可以实现与多分类逻辑回归相同的作用D.最大熵模型是一种分类算法5.下列关于模型评价指标的表述错误的是(C)A.正确率、精确率、召回率以及AUC均是建立在殽杂矩阵的基础上B.在样本不平衡的条件下正确率并不能作为很好的指标来权衡结果C.正确率表示所有被展望为正的样本中实际为正的样本的概率D.普通来说,置信度阈值越高,召回率越低,而精确率越高6.简述逻辑回归的道理。
机器学习题集
机器学习题集一、选择题1.机器学习的主要目标是什么?A. 使机器具备人类的智能B. 使机器能够自动学习和改进C. 使机器能够模拟人类的思维过程D. 使机器能够按照给定的规则执行任务答案:B2.下列哪项不是机器学习算法的分类?A. 监督学习B. 无监督学习C. 半监督学习D. 完全手动学习答案:D3.在机器学习中,以下哪项是指学习算法在给定训练集上的表现能力?A. 泛化能力B. 训练误差C. 过拟合D. 欠拟合答案:B4.哪种机器学习算法通常用于处理回归问题?A. 支持向量机(SVM)B. K-近邻(K-NN)C. 线性回归D. 决策树答案:C5.深度学习是机器学习的哪个子领域?A. 弱学习B. 表示学习C. 概率学习D. 规则学习答案:B6.在监督学习中,算法尝试从训练数据中学习什么?A. 数据的分布B. 数据的模式C. 输入到输出的映射D. 数据的统计特性答案:C7.以下哪项是机器学习模型评估中常用的交叉验证方法?A. 留出法B. 梯度下降C. 决策树剪枝D. K-均值聚类答案:A8.在机器学习中,正则化通常用于解决什么问题?A. 数据不足B. 过拟合C. 欠拟合D. 维度灾难答案:B9.以下哪项是深度学习中常用的激活函数?A. 线性函数B. Sigmoid函数C. 逻辑回归D. 梯度提升答案:B10.在机器学习中,特征工程主要关注什么?A. 数据的收集B. 数据的清洗C. 从原始数据中提取有意义的特征D. 模型的部署答案:C11.下列哪个算法通常用于分类问题中的特征选择?A. 决策树B. PCA(主成分分析)C. K-均值聚类D. 线性回归答案:A12.集成学习通过结合多个学习器的预测结果来提高整体性能,这种方法属于哪种策略?A. 监督学习B. 弱学习C. 规则学习D. 模型融合答案:D13.在深度学习中,卷积神经网络(CNN)主要用于处理哪种类型的数据?A. 文本数据B. 图像数据C. 时间序列数据D. 语音数据答案:B14.以下哪个指标用于评估分类模型的性能时,考虑到了类别不平衡的问题?A. 准确率B. 精确率C. 召回率D. F1分数答案:D15.在强化学习中,智能体通过什么来优化其行为?A. 奖励函数B. 损失函数C. 梯度下降D. 决策树答案:A16.以下哪项是机器学习中的无监督学习任务?A. 图像分类B. 聚类分析C. 情感分析D. 回归分析答案:B17.在机器学习中,梯度下降算法主要用于什么?A. 数据的收集B. 模型的训练C. 数据的清洗D. 模型的评估答案:B18.以下哪项是机器学习中常用的正则化技术之一?A. L1正则化B. 决策边界C. 梯度提升D. 逻辑回归答案:A19.在机器学习中,过拟合通常发生在什么情况?A. 模型太复杂,训练数据太少B. 模型太简单,训练数据太多C. 数据集完全随机D. 使用了不合适的激活函数答案:A20.以下哪个算法是基于树的集成学习算法之一?A. 随机森林B. 线性回归C. K-近邻D. 神经网络答案:A21.在机器学习中,确保数据质量的关键步骤之一是:A. 初始化模型参数B. 提取新特征C. 数据清洗D. 损失函数最小化答案:C22.监督学习中,数据通常被分为哪两部分?A. 训练集和验证集B. 输入特征和输出标签C. 验证集和测试集D. 数据集和标签集答案:B23.数据标注在机器学习的哪个阶段尤为重要?A. 模型评估B. 特征工程C. 数据预处理D. 模型训练答案:C24.下列哪项不是数据清洗的常用方法?A. 处理缺失值B. 转换数据类型C. 去除异常值D. 初始化模型参数答案:D25.数据分割时,以下哪个集合通常用于评估模型的最终性能?A. 训练集B. 验证集C. 测试集D. 验证集和测试集答案:C26.在数据标注过程中,为每个样本分配的输出值被称为:A. 特征B. 权重C. 损失D. 标签答案:D27.数据代表性不足可能导致的问题是:A. 过拟合B. 欠拟合C. 收敛速度过慢D. 模型复杂度过高答案:B28.下列哪项不是数据收集时应考虑的因素?A. 数据源的可靠性B. 数据的隐私保护C. 模型的复杂度D. 数据的完整性答案:C29.数据清洗中,处理缺失值的一种常用方法是:A. 删除包含缺失值的行或列B. 使用均值、中位数或众数填充C. 将缺失值视为新特征D. 停止模型训练答案:A, B(多选,但此处只选一个最直接的答案)A30.数据的泛化能力主要取决于:A. 模型的复杂度B. 数据的多样性C. 算法的先进性D. 损失函数的选择答案:B31.监督学习中,输入特征与输出标签之间的关系是通过什么来学习的?A. 损失函数B. 决策树C. 神经网络D. 训练过程答案:D32.数据标注的准确性对模型的什么能力影响最大?A. 泛化能力B. 收敛速度C. 预测精度D. 特征提取答案:C33.在数据预处理阶段,处理噪声数据的主要目的是:A. 提高模型训练速度B. 降低模型的复杂度C. 提高模型的预测准确性D. 减少数据存储空间答案:C34.下列哪项不属于数据清洗的范畴?A. 缺失值处理B. 异常值检测C. 特征选择D. 噪声处理答案:C35.数据标注的自动化程度受什么因素影响最大?A. 数据集的大小B. 数据的复杂性C. 标注工具的效率D. 模型的训练时间答案:B36.在数据分割时,为什么需要设置验证集?A. 仅用于训练模型B. 评估模型在未见过的数据上的表现C. 替代测试集进行最终评估D. 加速模型训练过程答案:B37.数据的标签化在哪些类型的机器学习任务中尤为重要?A. 无监督学习B. 半监督学习C. 监督学习D. 强化学习答案:C38.数据质量对模型性能的影响主要体现在哪些方面?A. 模型的收敛速度B. 模型的复杂度C. 模型的预测精度D. 模型的泛化能力答案:C, D(多选,但此处只选一个最直接的答案)D39.下列哪项不是数据清洗和预处理阶段需要完成的任务?A. 数据标注B. 缺失值处理C. 噪声处理D. 模型评估答案:D40.数据多样性对防止哪种问题有重要作用?A. 欠拟合B. 过拟合C. 收敛速度过慢D. 损失函数波动答案:B41.机器学习的基本要素不包括以下哪一项?A. 模型B. 特征C. 规则D. 算法答案:C42.哪种机器学习算法常用于分类任务,并可以输出样本属于各类的概率?A. 线性回归B. 支持向量机C. 逻辑回归D. 决策树答案:C43.模型的假设空间是指什么?A. 模型能够表示的所有可能函数的集合B. 数据的特征向量集合C. 算法的复杂度D. 损失函数的种类答案:A44.下列哪个是评估模型好坏的常用准则?A. 准确率B. 损失函数C. 数据集大小D. 算法执行时间答案:B45.哪种算法特别适合于处理非线性关系和高维数据?A. 朴素贝叶斯B. 神经网络C. 决策树D. 线性回归答案:B46.在机器学习中,特征选择的主要目的是什么?A. 减少计算量B. 提高模型的可解释性C. 提高模型的泛化能力D. 以上都是答案:D47.结构风险最小化是通过什么方式实现的?A. 增加训练数据量B. 引入正则化项C. 减小模型复杂度D. 改进损失函数答案:B48.哪种算法常用于处理时间序列数据并预测未来值?A. 朴素贝叶斯B. 随机森林C. ARIMAD. 逻辑回归答案:C49.在决策树算法中,分割数据集的标准通常基于什么?A. 损失函数B. 信息增益C. 数据的分布D. 模型的复杂度答案:B50.哪种策略常用于处理类别不平衡的数据集?A. 采样B. 特征缩放C. 交叉验证D. 正则化答案:A51.监督学习的主要任务是什么?A. 从无标签数据中学习规律B. 预测新数据的标签C. 自动发现数据中的模式D. 生成新的数据样本答案:B52.下列哪个是监督学习算法?A. K-means聚类B. 线性回归C. PCA(主成分分析)D. Apriori算法(关联规则学习)答案:B53.在监督学习中,标签(label)通常指的是什么?A. 数据的索引B. 数据的特征C. 数据的类别或目标值D. 数据的分布答案:C54.监督学习中的损失函数主要用于什么?A. 评估模型的复杂度B. 衡量模型预测值与真实值之间的差异C. 生成新的数据样本D. 划分数据集为训练集和测试集答案:B55.下列哪种方法常用于处理分类问题中的多类分类?A. 二元逻辑回归B. 一对多(One-vs-All)策略C. 层次聚类D. PCA降维答案:B56.在监督学习中,过拟合通常指的是什么?A. 模型在训练集上表现很好,但在测试集上表现不佳B. 模型在训练集和测试集上表现都很好C. 模型在训练集上表现很差D. 模型无法学习到任何有用的信息答案:A57.下列哪个技术常用于防止过拟合?A. 增加数据集的大小B. 引入正则化项C. 减少模型的特征数量D. 以上都是答案:D58.交叉验证的主要目的是什么?A. 评估模型的性能B. 划分数据集C. 选择最优的模型参数D. 以上都是答案:D59.在监督学习中,准确率(Accuracy)的计算公式是什么?A. 正确预测的样本数 / 总样本数B. 误分类的样本数 / 总样本数C. 真正例(TP)的数量D. 真正例(TP)与假负例(FN)之和答案:A60.下列哪个指标在分类问题中考虑了类别的不平衡性?A. 准确率(Accuracy)B. 精确率(Precision)C. 召回率(Recall)D. F1分数(F1 Score)(注意:虽然F1分数不完全等同于解决类别不平衡,但在此选项中,它相比其他三个更全面地考虑了精确率和召回率)答案:D(但请注意,严格来说,没有一个指标是专为解决类别不平衡设计的,F1分数是精确率和召回率的调和平均,对两者都给予了重视)61.监督学习中的训练集包含什么?A. 无标签数据B. 有标签数据C. 噪声数据D. 无关数据答案:B62.下列哪个不是监督学习的步骤?A. 数据预处理B. 模型训练C. 模型评估D. 数据聚类答案:D63.逻辑回归适用于哪种类型的问题?A. 回归问题B. 分类问题C. 聚类问题D. 降维问题答案:B64.监督学习中的泛化能力指的是什么?A. 模型在训练集上的表现B. 模型在测试集上的表现C. 模型的复杂度D. 模型的训练时间答案:B65.梯度下降算法在监督学习中常用于什么?A. 特征选择B. 损失函数最小化C. 数据划分D. 类别预测答案:B66.在处理多标签分类问题时,每个样本可能属于多少个类别?A. 0个B. 1个C. 1个或多个D. 唯一确定的1个答案:C67.下列哪个不是监督学习常用的评估指标?A. 准确率B. 精确率C. 召回率D. 信息增益答案:D68.监督学习中的偏差(Bias)和方差(Variance)分别指的是什么?A. 模型的复杂度B. 模型在训练集上的表现C. 模型预测值的平均误差D. 模型预测值的变化程度答案:C(偏差),D(方差)69.ROC曲线和AUC值主要用于评估什么?A. 回归模型的性能B. 分类模型的性能C. 聚类模型的性能D. 降维模型的性能答案:B70.在处理不平衡数据集时,哪种策略可能不是首选?A. 重采样技术B. 引入代价敏感学习C. 使用集成学习方法D. 忽略不平衡性直接训练模型答案:D二、简答题1.问题:什么是无监督学习?答案:无监督学习是一种机器学习方法,它使用没有标签的数据集进行训练,目标是发现数据中的内在结构或模式,如聚类、降维等。
人工智能第八章例题1
Bel({h2})=m({h2})=0.066 由似真函数求似真度 Pl({h1})=1-Bel({h1}′)=1-Bel({h2,h3}) =1-[m({h2}+m({h3}) =1-[0.066+0]=0.934 Pl({h2})=1-Bel({h2}′)=1-Bel({h1,h3}) =1-[m({h1})+m({h3})] =1-[0.87+0]=0.13 于是,最后得到: “ 感冒但非过敏性鼻炎 ” 为真的信任度为 0.87 ,非假的信任度为 0.934; “ 过敏性鼻炎但非感冒 ” 为真的信任度为 0.066 ,非假的信任度为 0.13。 所以,看来该患者是感冒了。 证据理论是被推崇的处理随机性不确定性的好方法,受到人工智能 特别是专家系统领域的广泛重视,并且已为许多专家系统所采用。 例 8.16 设U={0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}, 则 S1 = 0/0 + 0/1 + 0/2 + 0.1/3 + 0.2/4 + 0.3/5 + 0.5/6 + 0.7/7 + 0.9/8 + 1/9 + 1/10 S2=1/0+1/1+1/2+0.8/3+0.7/4+0.5/5+0.4/6+0.2/7 +0/8+0/9+0/10 就是论域 U 的两个模糊子集, 它们可分别表示 U 中“大数的集合”和“小数的 集合”。 可以看出, 上面“大数的集合”和“小数的集合”实际上是用外延法描述了 “大”和“小”两个软概念。这就是说, 模糊集可作为软概念的数学模型。 例 8.17 通常所说的“高个”、“矮个”、“中等个”就是三个关于身高的语言值。 我们用模糊集合为它们建模。 取人类的身高范围[1.0, 3.0]为论域 U, 在 U 上定义隶属函数μ矮(x)、 μ中等(x)、μ高(x)如下(函数图像如图 8-5 所示)。 这三个隶属函数就确定了 U 上的三个模糊集合,它们也就是相应三个语言值的数学模型。
机器学习实战课后习题答案
机器学习实战课后习题答案机器学习实战课后习题答案机器学习是一门应用广泛的学科,通过训练算法和模型来使计算机能够从数据中学习并做出预测和决策。
在机器学习实战这门课程中,学生们学习了各种机器学习算法和技术,并通过实践来巩固所学的知识。
在课后习题中,学生们需要运用所学的知识来解决一系列的问题。
下面是一些常见的机器学习实战课后习题及其答案。
1. 什么是监督学习和无监督学习?举例说明。
监督学习是一种通过给定输入和输出的训练数据来训练模型的学习方法。
在监督学习中,模型通过学习输入和输出之间的关系来进行预测和分类。
例如,给定一组房屋的特征(如面积、卧室数量等)和对应的价格,我们可以通过监督学习来训练一个模型,以预测给定房屋特征时的价格。
无监督学习是一种通过给定输入数据而没有对应输出的训练数据来训练模型的学习方法。
在无监督学习中,模型通过学习数据之间的内在结构和关系来进行聚类和降维等任务。
例如,给定一组顾客的购物记录,我们可以通过无监督学习来将顾客分成不同的群组,以便进行个性化的市场营销。
2. 什么是过拟合和欠拟合?如何解决这些问题?过拟合是指模型在训练数据上表现很好,但在测试数据上表现较差的现象。
过拟合通常发生在模型过于复杂或训练数据过少的情况下。
为了解决过拟合问题,可以采取以下方法:- 增加训练数据量:通过增加训练数据量,可以减少模型对训练数据的过度拟合。
- 简化模型:可以通过减少模型的复杂度来降低过拟合的风险。
例如,可以减少模型的参数数量或使用正则化方法来约束模型的复杂度。
- 使用交叉验证:通过使用交叉验证来评估模型在不同数据集上的性能,可以更好地了解模型的泛化能力。
欠拟合是指模型在训练数据和测试数据上都表现较差的现象。
欠拟合通常发生在模型过于简单或训练数据过多的情况下。
为了解决欠拟合问题,可以采取以下方法:- 增加模型复杂度:可以增加模型的复杂度,使其可以更好地拟合训练数据。
- 增加特征数量:通过增加特征数量,可以提供更多的信息给模型,从而改善模型的性能。
机器学习(慕课版)习题答案全集
机器学习(慕课版)习题答案目录第一章机器学习概述 (2)第二章机器学习基本方法 (5)第三章决策树与分类算法 (9)第四章聚类分析 (13)第五章文本分析 (17)第六章神经网络 (22)第七章贝叶斯网络 (26)第八章支持向量机 (31)第九章进化计算 (32)第十章分布式机器学习 (34)第十一章深度学习 (35)第十二章高级深度学习 (37)第十三章推荐系统 (39)第一章机器学习概述1.机器学习的发展历史上有哪些主要事件?机器学习发展分为知识推理期、知识工程期、浅层知识期和深度学习几个阶段,可从几个阶段选择主要历史事件作答。
2.机器学习有哪些主要的流派?它们分别有什么贡献?符号主义:专家系统、知识工程贝叶斯派:情感分类、自动驾驶、垃圾邮件过滤联结主义:神经网络进化主义:遗传算法行为类推主义3.讨论机器学习与人工智能的关系机器学习是人工智能的一个分支,作为人工智能核心技术和实现手段,通过机器学习的方法解决人工智能面对的问题4.讨论机器学习与数据挖掘的关系数据挖掘是从大量的业务数据中挖掘隐藏、有用的、正确的知识促进决策的执行。
数据挖掘的很多算法都来自于机器学习,并在实际应用中进行优化。
机器学习最近几年也逐渐跳出实验室,解决从实际的数据中学习模式,解决实际问题。
数据挖掘和机器学习的交集越来越大,机器学习成为数据挖掘的重要支撑技术5.讨论机器学习与数据科学、大数据分析等概念的关系数据科学主要包括两个方面:用数据的方法研究科学和用科学的方法研究数据。
前者包括生物信息学、天体信息学、数字地球等领域;后者包括统计学、机器学习、数据挖掘、数据库等领域。
大数据分析即是后者的一个部分。
一般使用机器学习这个工具做大数据的分析工作,也就是说机器学习是我们做大数据分析的一个比较好用的工具,但是大数据分析的工具并不止机器学习,机器学习也并不只能做大数据分析6.机器学习有哪些常用的应用领域?请举例说明其应用艺术创作、金融领域、医疗领域、自然语言处理、网络安全、工业领域、娱乐行业。
人工智能机器学习技术练习(习题卷8)
人工智能机器学习技术练习(习题卷8)第1部分:单项选择题,共155题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]如果一个 SVM 模型出现欠拟合,那么下列哪种方法能解决这一问题?A)增大惩罚参数 C 的值B)减小惩罚参数 C 的值C)减小核系数(gamma参数)答案:A解析:2.[单选题]以下哪项是解决NLP用例(如语义相似性、阅读理解和常识推理)的更好选择?A)ELMoB)Open AI’s GPTC)ULMFit答案:B解析:3.[单选题]如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?A)测试样本误差始终为零B)测试样本误差不可能为零C)以上答案都不对答案:C解析:根据训练样本误差为零,无法推断测试样本误差是否为零。
值得一提是,如果测试样本样本很大,则很可能发生过拟合,模型不具备很好的泛化能力!4.[单选题]特征归约主要是为了进行特征的()A)缺失值处理B)一致性处理C)异常值处理答案:B解析:5.[单选题]所谓几率,是指发生概率和不发生概率的比值。
所以,抛掷一枚正常硬币,正面朝上的几率(odds)为多少?A)0.5B)1C)都不是答案:B解析:几率(odds)是事件发生不发生概率的比率,正面朝上概率为1/2和反面朝上的概率都为1/2,所以几率为1。
6.[单选题](__)不属于机器学习理论基础。
A)数据科学B)哲学C)心理学D)人工智能7.[单选题]下面属于Boosting方法的特点是( )A)构造训练集时采用Bootstraping的方式B)每一轮训练时样本权重相同C)分类器可以并行训练D)预测结果时,分类器的比重不同答案:D解析:8.[单选题]能够直观显示出学习器在样本总体上的查全率、查准率的图是()。
A)ROC曲线B)误差曲线C)方差曲线D)P-R曲线答案:D解析:9.[单选题]训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM?A)大数据集B)小数据集C)中等大小数据集D)和数据集大小无关答案:A解析:有明确分类边界的数据集最适合SVM10.[单选题]在HSV色彩空间中的H表示色调,则其取值范围在()。
机器学习课后习题答案
机器学习课后习题答案一、回归问题1. 什么是回归问题?回归问题是指预测一个或多个连续值的问题。
在机器学习中,回归算法通过对已有的输入数据进行学习,建立一个数学模型,用于预测连续型输出变量的取值。
2. 回归问题有哪些常用的评价指标?常用的回归问题评价指标包括:•均方误差(Mean Squared Error,MSE):计算预测值与真实值之间的差异的均方值。
公式如下:MSE = (1/n) * Σ(y_pred - y_true)^2其中,y_pred是预测值,y_true是真实值,n是样本数量。
MSE越小,表示预测值与真实值的拟合程度越好。
•均方根误差(Root Mean Squared Error,RMSE):MSE的平方根。
公式如下:RMSE = √MSERMSE与MSE类似,用于评估预测值与真实值之间的差异,但RMSE更为直观。
•平均绝对误差(Mean Absolute Error,MAE):计算预测值与真实值之间的绝对差异的均值。
公式如下:MAE = (1/n) * Σ|y_pred - y_true|MAE越小,表示预测值与真实值的差异越小。
3. 请简要介绍线性回归算法的原理。
线性回归是一种基本的回归算法,它通过建立一个线性模型来描述自变量与因变量之间的关系。
线性回归的目标是找到最佳拟合直线来最小化预测值与真实值之间的误差。
线性回归算法的原理可以概括如下:1.假设自变量与因变量之间存在线性关系:y = β0 + β1*x1 + β2*x2 + ... + βn*xn + ε其中,y是因变量,x1, x2, …, xn是自变量,β0, β1, β2, …,βn是模型的参数,ε是误差项。
2.最小化误差:通过最小二乘法来确定最优的参数值,使预测值与真实值之间的误差最小化。
3.模型训练和预测:使用已知的训练数据集来训练模型,得到最优的参数值。
然后,可以使用该模型对新的输入数据进行预测。
4. 请简要介绍逻辑回归算法的原理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章机器学习
8.2答:
(1)学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的学习中所用的推理越多,系统的能力越强
(2)机器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问“机器”——计算机(电子,以后还可能是中子计算机、光子计算机或神经计算机等)
8.3答:机器学习系统的结构及基本功能
当监督环节为示教人时,为示教式学习系统;当监督环节为监督器时,为自学式学习系统。
①知识库存储(记忆)、积累知识
·长期记忆(LTM)先验知识背景如事物的基本概念和定义、定律和公理,博弈的基本规则等·中期记忆(MTM)环境事物的各种具体知识
·短期记忆(STM)环境变化的信息和数据事实库或“黑板
②学习元学习系统的核心环节
·采集环境信息息选例环节或直接采集
·接受监督指导监督环节的示教、指导信息或评价准则
·进行学习推理获得有关问题的解答和结论
·修改知识库将推理结果输入知识库,对知识增删改
③执行元识别、论证、决策、判定
模式分类器、专家咨询解释系统、智能控制机构、机械手/人等
如执行元行动结果直接引起环境的变化 “在线”学习系统
机器人规划、生产过程控制、机器博弈等
④监督环节人:示教者;监督器:评价准则或检验标准
·工作执行效果评价——接受来自执行元环节的反馈信息,对系统的工作执行效果进行评价和检验
·制定评价标准——接受来自环境变化的信息,制定和修订评价标准和检验标准
·监督学习环节——根据评价和检验的结果,对学习环节进行示教、训练或指导
·控制选例环节——根据环境变化信息及工作执行效果的反馈,控制选例环节,选取其它事例或样本
⑤选例环节
作用是从环境中选取有典型意义的事例或样本,作为系统的训练集或学习对象。
如挑选典型病历,以便提高学习效率,加速学习过程。
选例环节可以由人或机器来实现
⑥环境
系统获取知识和信息的来源,执行的对象和人物等。
如,医疗专家系统的病员、病历档案、医生、诊断书等;模式识别系统的文字、图象、物景;博弈系统的对手、棋局;智能控制系统的被控对象和生产过
程等。
8.4答:
(1).机械学习模型
机械学习——一种最简单的机器学习方法
机械学习是最基本的学习过程,任何学习系统都必须记住它们获取的知识
机械学习系统:知识的获取是以较为稳定和直接的方式进行的,不需要系统进行过多的加工
机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理
归纳过程可以简化成推导过程
直接使用求根公式计算一个一元二次方程的根自学
(2).机械学习的主要问题
①存储组织信息
②环境的稳定性与存储信息的适用性问题。
密切监视外界环境的变化,不断地更换所保存
的信息;核对。
③存储与计算之间的权衡。
预估算;“选择忘却”技术
8.5答:
(1)示例学习:
病态细胞的分类识别例如图,
•正例——三个病细胞(P1, P2, P3),
•反例——二个正常细胞(N1, N2);
•每个细胞由二个细胞体组成
* 细胞体表示为三元组:(核数、尾数、染色状),
* P1:{(2, 2, 深) (1, 1, 浅)}。
•学习任务——从例子集中归纳出有病状X的细胞
A. 概念描述的搜索和获取
概念描述
•假设不必给每个特性(属性)都指明应取值:
* 没有给出值的特性(以?指示)——对于该概念的描述无关紧要;
* 病细胞假设(a):{(2, ?, ?) (?, 1, 深)},一个细胞体有二个胞核;另一个有一个尾巴,且染色是深的。
•病细胞假设空间的半序图(图6.5)
•假设之间的关系弧指示泛化/特化关系,
•假设空间上的一个泛化/特化关系(图6.4),
* 假设(b)不考虑细胞体是否有尾巴,比假设(a)复盖更多的例子;
* 假设(b)比假设(a)泛化;
* 假设(a)比假设(b)特化。
•底层假设——最特化(具体)的概念描述:
* 所有特性都给定特别值,对应于例子空间中的一个例子。
•顶层假设——最泛化的概念描述:
* 不指定任何具体的特性值,
* 表示为{(? ? ?),(? ? ?)}。
•假设空间中的搜索方式
•特化搜索——从最泛化的假设(概念描述)出发,每次取用一个新的例子,就产生一些特化的描述,直到将初始最泛化的假设特化为解描述。
•泛化搜索——从最特化的假设(相应于例子空间中的一个例子)开始,每次取用一个新的例子时,就产生一些泛化的描述,直到产生出足够泛化的解描述。
•大多数示例学习方法都采用这二种方法或这二个方法的结合。
B.逐步泛化的学习策略
•采用宽度优先、自底向上的搜索方式:
•将第一个正例(P1)作为初始假设(H1)——极端特化的假设;
•正例(P2)用于指导系统生成泛化的假设(H2和H3):
* 多个泛化的假设——不同的映射会导致不同的假设,- 假设H1中包含了二个对象(细胞体);
* 采用保守原则——最低限度的泛化,:- 新的假设刚好覆盖现有的假设/例子。
•反例(N1)用来剪裁过于泛化的假设:
H3是过于泛化的假设,因为其蕴涵了反例N1。
基本策略:
•遇见正例就泛化某些假设以保证假设的完全描述性,
•遇见反例则删去某些假设以保证假设的一致描述性,
•直至得到一个既完全又一致的解描述(假设)为止。
•这个解描述作为满足给定例子集的概念定义——学习系统获得的新知识。
3 / 5。