机器学习试题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2010年春硕士研究生机器学习试题

下列各题每个大题10分,共8道大题,卷面总分80分

注意:在给出算法时,非标准(自己设计的)部分应给出说明。特别是自己设置的参数及变量的意义要说明。

1.下面是一个例子集。其中,三个正例,一个反例。“P”为正

例、“N”为反例。这些例子是关于汽车的。例子有4个属性,分别是“产地”、“生产商”、“颜色”、“年代”。

产地生产商颜色年代类别

1980 P

1990 P

1980 N

1980 P

其中:“产地”的值域为()、“生产商”的值域为(, )、“颜色”的值域为()、“年代”的值域为(1980,1990)。这里规定“假设”的形式为4个属性值约束的合取;每个约束可以为:一个特定值(比如、等)、?(表示接受任意值)和(表示拒绝所有值)。例如,下面假设:

(,?,,?)

表示日本生产的、红色的汽车。

1)根据上述提供的训练样例和假设表示,手动执行候选消除算法。特别是要写出处理了每一个训练样例后变型空

间的特殊和一般边界;

2)列出最后形成的变型空间中的所有假设。

2. 写出3算法。(要求:除标准3算法外,要加入“未知属性值”和“过适合”两种情况的处理)。

3. 给出一个求最小属性子集的算法。

4. 给定训练例子集如下表。依据给定的训练例子,使用朴素贝叶斯分类器进行分类。

给定类别未知例子<高度=矮,头发=红,眼睛=兰>,计算这个例子的类别。(计算类别时要先列出式子,然后再代入具体的数)。

5. 给定线性函数n n x w x w w x f +++=Λ110)(ˆ及误差定义

∑∈-=

D

x x f x f E 2

))(ˆ)((21

其中,i x 是例子x 的第i 个属性值,f(x)是目标函数,D 是训练例子集合。请给出一个算法,这个算法能求出一组值,使得线性函数)(ˆx f 逼近目标函数f(x)(本题要求写出算法的步骤,算法步骤的详细程度要符合书中算法的标准)。

6. 给定例子集(如下表),要求:1)用平面图直观画出例子的分布;2)给出一种规则好坏的评判标准;3)写出概念聚类算法。

7. 简述题

1) 简述“机器发现”的三个定律;

2) 、、是分析学习和归纳学习结合的三个算法。简述这三个算法与单纯的归纳学习方法相比,分别有什么区别或优点。

8. 关于模式定理

1) 分析“选择步”对群体遗传的影响:令m()是群体中模式s 在时间t (或第t 代)的实例数量,f(h)是个体h 的适应度,)(t f 是时间t (或第t 代)群体中所有个体的平均适应度,n 为群

体中个体的总数量,),(ˆt s u

是时间t (或第t 代)群体中模式s 的实例的平均适应度。在“选择步”中,每个个体被选中的概率为(h)((h)的计算见公式(1)),如果共进行了n 次独立选择,请给出在第(1)代(即下一代)的群体中,模式s 的实例存在的期望数量E[m(1)](要求给出分析过程)。 ∑

==

n

i i h f h f h 1

)

()

()Pr( (1)

2) 分析“变异步”对群体遗传的影响:令m()是群体中模式s 在时间t (或第t 代)的实例数量。设在模式s 中有R(s)个确定位,变异操作以概率 选择一位并改变这位上的值。如果只考虑变异步对群体遗传的影响,请给出在第(1)代(即下一代)的群体中,模式s 的实例存在的期望数量E[m(1)](要求给出分析过程)。

相关文档
最新文档