2020年中山大学《机器学习》期末练习题1.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下列各题每个大题10分,共8道大题,卷面总分80分
注意:在给出算法时,非标准(自己设计的)部分应给出说明。
特别是自己设置的参数与变量的意义要说明。
1.下面是一个例子集。
其中,三个正例,一个反例。
“P”为正例、“N”为反例。
这些例子是关于汽车的。
例子有4个属性, 分别是“产地”、“生产商”、“颜色”、“年代”。
其中:“产地”的值域为0、“生产商”的值域为(,)、“颜色”的值域为0、“年代”的值域为(1980,1990)o这里规定“假设”的形式为4个属性值约束:的合取:每个约束可以为:一个特定值(比如、等)、?(表示接受任意值)和(表示拒绝所有值)。
例如,下面假设:
表示日本生产的、红色的汽车。
1)根据上述提供的训练样例和假设表示,手动执行候选消除算法。
特别是要写出处理了每一个训练样例后变型空间的
特殊和一般边界;
2)列出最后形成的变型空间中的所有假设O
2.写出3算法。
(要求:除标准3算法外,要加入“未知属性值” 和“过适合”两种情况的处理)。
3.给出•个求最小属性了∙集的算法。
4.给定训练例子集如下表。
依据给定的训练例子,使用朴素贝叶斯分类器进行分类。
给定类别未知例子〈高度=矮,头发=红,眼睛=兰>,计算这个例子的类别。
(计算类别时要先列出式子,然后再代入具体的数)o
5.给定线性函数7w = W% + W r t1 + ... + H;I X(I与误差定义E = ' χσω -.7i∙v))2
其中,X,是例子X的第i个属性值,f(x)是目标函数,D是训练例子集合。
请给出一个算法,这个算法能求出一组值,使得线性函数/U)逼近目标函数f(x)(本题要求写出算法的步骤,第.法步骤的详细程度要符合书中算法的标准)。
6.给定例子集(如下表),要求:1)用平面图直观画出例子的分布:2)给出一种规则好坏的评判标准:3)写出概念聚类算法。
7.简述题
D简述“机器发现”的三个定律:
2)、、是分析学习和归纳学习结合的三个算法。
简述这三个算法与单
纯的归纳学习方法相比,分别有什么区别或优点。
8.关于模式定理
D分析“选择步”对群体遗传的影响:令m()是群体中模式s在时间t (或第t代)的实例数量,f(h)是个体h的适应度,一刖是时间t (或第t代)群体中所有个体的平均适应度,n为群体中个体的总数量,於M是时间t (或第t代)群体中模式写的实例的平均适应度。
在“选择步”中,每个个体被选中的概率为(h) ((h)的计算见公式(1)),如果共进行了n次独立选择,请给出在第(1)代(即下•代)的群体中,模式S的实例存在的期望数量EDn(1)](要求给出分析过程)。
Pr(Λ) = —―(1)
Σ1√(Λ.>
2)分析“变异步”对群体遗传的影响:令m()是群体中模式S在时间t
(或第t代)的实例数量。
设在模式S中有R(S)个确定位,变异操作以概率选择•位并改变这位上的值。
如果只考虑变异步对群体遗传的影响,请给出在第(1)代(即下一代) 的群体中,模式S的实例存在的期望数量E[m(D](要求给出分析过程)O。