最新机器学习试题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年春硕士研究生机器学习试题

下列各题每个大题10分,共8道大题,卷面总分80分

注意:在给出算法时,非标准(自己设计的)部分应给出说明。特别是自己设置的参数及变量的意义要说明。

1.下面是一个例子集。其中,三个正例,一个反例。“P”为正例、“N”为反例。这些例子

其中:“产地”的值域为(Japan,USA)、“生产商”的值域为(Honda, Chrysler

)、“颜色”的值域为(Blue

,Red

)、“年代”的值域为(1980,1990

)。这里规定“假设”的形式为4个属性值约束的合取;每个约束可以为:一个特定值(比如J a p a n、Blue等)、?(表示接受任意值)和 (表示拒绝所有值)。例如,下面假设:

(J a p a n,?,R e d,?)

表示日本生产的、红色的汽车。

1)根据上述提供的训练样例和假设表示,手动执行候选消除算法。特别是要写出处理了每一个训练样例后变型空间的特殊和一般边界;

2)列出最后形成的变型空间中的所有假设。

2. 写出ID3算法。(要求:除标准ID3算法外,要加入“未知属性值”和“过适合”两种情况的处理)。

3. 给出一个求最小属性子集的算法。

4. 给定训练例子集如下表。依据给定的训练例子,使用朴素贝叶斯分类器进行分类。

给定类别未知例子<高度=矮,头发=红,眼睛=兰>,计算这个例子的类别。(计算类别时要

5. 给定线性函数n

n x w x w w x f +++= 110)(ˆ及误差定义 ∑∈-=D

x x f x f E 2

))(ˆ)((2

1

其中,i x 是例子x 的第i 个属性值,f(x)是目标函数,D 是训练例子集合。请给出一个算法,

这个算法能求出一组Wi 值,使得线性函数)(ˆx f

逼近目标函数f(x)(本题要求写出算法的步骤,算法步骤的详细程度要符合书中算法的标准)。

6. 给定例子集(如下表),要求:1)用平面图直观画出例子的分布;2)给出一种规则好坏

7. 简述题

1) 简述“机器发现”的三个定律;

2) KBANN 、EBNN 、FOCL 是分析学习和归纳学习结合的三个算法。简述这三个算法与单纯的

归纳学习方法相比,分别有什么区别或优点。

8. 关于模式定理

1) 分析“选择步”对群体遗传的影响:令m(s,t)是群体中模式s 在时间t (或第t 代)的

实例数量,f(h)是个体h 的适应度,)(t f 是时间t (或第t 代)群体中所有个体的平均

适应度,n 为群体中个体的总数量,),(ˆt s u

是时间t (或第t 代)群体中模式s 的实例的平均适应度。在“选择步”中,每个个体被选中的概率为Pr(h)(Pr(h)的计算见公式

(1)),如果共进行了n 次独立选择,请给出在第(t+1)代(即下一代)的群体中,模式s 的实例存在的期望数量E[m(s,t+1)](要求给出分析过程)。 ∑

==

n

i i h f h f h 1

)

()

()Pr( (1)

2) 分析“变异步”对群体遗传的影响:令m(s,t)是群体中模式s 在时间t (或第t 代)的实例数量。设在模式s 中有R(s)个确定位,变异操作以概率Pm 选择一位并改变这位上的值。如果只考虑变异步对群体遗传的影响,请给出在第(t+1)代(即下一代)的群体

中,模式s的实例存在的期望数量E[m(s,t+1)](要求给出分析过程)。

相关文档
最新文档