最新机器学习试题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010年春硕士研究生机器学习试题
下列各题每个大题10分,共8道大题,卷面总分80分
注意:在给出算法时,非标准(自己设计的)部分应给出说明。特别是自己设置的参数及变量的意义要说明。
1.下面是一个例子集。其中,三个正例,一个反例。“P”为正例、“N”为反例。这些例子
。
其中:“产地”的值域为(Japan,USA)、“生产商”的值域为(Honda, Chrysler
)、“颜色”的值域为(Blue
,Red
)、“年代”的值域为(1980,1990
)。这里规定“假设”的形式为4个属性值约束的合取;每个约束可以为:一个特定值(比如J a p a n、Blue等)、?(表示接受任意值)和 (表示拒绝所有值)。例如,下面假设:
(J a p a n,?,R e d,?)
表示日本生产的、红色的汽车。
1)根据上述提供的训练样例和假设表示,手动执行候选消除算法。特别是要写出处理了每一个训练样例后变型空间的特殊和一般边界;
2)列出最后形成的变型空间中的所有假设。
2. 写出ID3算法。(要求:除标准ID3算法外,要加入“未知属性值”和“过适合”两种情况的处理)。
3. 给出一个求最小属性子集的算法。
4. 给定训练例子集如下表。依据给定的训练例子,使用朴素贝叶斯分类器进行分类。
给定类别未知例子<高度=矮,头发=红,眼睛=兰>,计算这个例子的类别。(计算类别时要
5. 给定线性函数n
n x w x w w x f +++= 110)(ˆ及误差定义 ∑∈-=D
x x f x f E 2
))(ˆ)((2
1
其中,i x 是例子x 的第i 个属性值,f(x)是目标函数,D 是训练例子集合。请给出一个算法,
这个算法能求出一组Wi 值,使得线性函数)(ˆx f
逼近目标函数f(x)(本题要求写出算法的步骤,算法步骤的详细程度要符合书中算法的标准)。
6. 给定例子集(如下表),要求:1)用平面图直观画出例子的分布;2)给出一种规则好坏
7. 简述题
1) 简述“机器发现”的三个定律;
2) KBANN 、EBNN 、FOCL 是分析学习和归纳学习结合的三个算法。简述这三个算法与单纯的
归纳学习方法相比,分别有什么区别或优点。
8. 关于模式定理
1) 分析“选择步”对群体遗传的影响:令m(s,t)是群体中模式s 在时间t (或第t 代)的
实例数量,f(h)是个体h 的适应度,)(t f 是时间t (或第t 代)群体中所有个体的平均
适应度,n 为群体中个体的总数量,),(ˆt s u
是时间t (或第t 代)群体中模式s 的实例的平均适应度。在“选择步”中,每个个体被选中的概率为Pr(h)(Pr(h)的计算见公式
(1)),如果共进行了n 次独立选择,请给出在第(t+1)代(即下一代)的群体中,模式s 的实例存在的期望数量E[m(s,t+1)](要求给出分析过程)。 ∑
==
n
i i h f h f h 1
)
()
()Pr( (1)
2) 分析“变异步”对群体遗传的影响:令m(s,t)是群体中模式s 在时间t (或第t 代)的实例数量。设在模式s 中有R(s)个确定位,变异操作以概率Pm 选择一位并改变这位上的值。如果只考虑变异步对群体遗传的影响,请给出在第(t+1)代(即下一代)的群体
中,模式s的实例存在的期望数量E[m(s,t+1)](要求给出分析过程)。