电子科技大学研究生模式识别试题 2014.04 (附答案)(优.选)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 / 5word.
电子科技大学研究生试卷
(考试时间: 至 ,共 2 小时)
课程名称 模式识别 教师 学时 40 学分 2 教学方式 课堂教学 考核日期 年 月 日 成绩 考核方式: (学生填写)
1、(5分)简述有监督学习和无监督学习的异同。 答:
(1)有监督学习必须要有训练集和测试样本,而非监督学习没有训练集; (2)有监督学习的目的就是识别事物,识别结果表现在给待识别数据加上了标号,因此训练样本集必须由带标号的样本组成,而非监督学习方法只有要分析的数据集本身,预先没有什么标号。
(3)非监督学习方法在寻找数据集中的规律性,这种规律性并不一定要达到分数据集的目的,也就是说不一定要“分类”。
2、(15分)计算单词model 和amdeol 的编辑距离,画出栅格图。 解: 栅格图为:
a m d e o l
m
o d e l
amdeol
从栅格图可计算,model 和amdeol 的编辑距离为3。
学 号 姓 名 学 院
……………………密……………封……………线……………以……………内……………答……………题……………无……………效……………………
2 / 5word.
3、(15分)已知A 类样本为:123[0,1];[2,2];[2,3]a a a ===,B 类样本为:123[3,1];[4,3];[1,5]b b b ===,计算最小二乘分类面的方程(取值为-1和+1),并写出LMS 算法的流程。 解:
(1)计算最小二乘分类面为[]0.4,0.26,1.45T
ω=--。 (2)LMS 算法流程:
步骤1. 初始化训练样本、权向量;
步骤2. 选择一个训练样本,利用下列公式更新权向量:
()[][1][1]2
()k k T k i
i
y μ
--=--w w x x
w 训练样本数目
步骤3. 重复所有样本。
4、(15分)在目标识别中,有1ω和2ω两种目标类型,它们的先验概率分别为0.8和0.2,在一次试验中,获得样本的类概率密度分别为()10.2p x ω=,()20.4p x ω=,并且已知110λ=,126λ=,211λ=,220λ=。试对该样本进行分类。 (1)基于最小错误率贝叶斯决策; (2)基于最小风险贝叶斯决策。
解:(1)利用贝叶斯公式,分别计算出1ω和2ω的后验概率:
()()()
()()
1112
1
0.20.8
0.66670.20.80.40.2
i
i
i p x P P x p x P ωωωωω=⨯=
=
=⨯+⨯∑
()()()
()()
2222
1
0.40.2
0.33330.20.80.40.2
i
i
i p x P P x p x P ωωωωω=⨯=
=
=⨯+⨯∑
根据贝叶斯决策规则,有
()()12P x P x ωω>
所以合理的决策是把该样本归类于1ω。
(2)根据(1)的计算结果可知后验概率为
3 / 5word.
()()120.6667,0.3333P x P x ωω==
计算条件风险
()()()()()()2
1112212
222111
1.9998
0.6667
i i i i i i R x P x P x R x P x P x αλωλωαλωλω========∑∑
由于()()12R x R x αα>,因此判断该样本为2ω。
5、(15分)试描述监督分类三种准则的原理及典型方法。
答:
回归分析,利用函数逼近的观点构造判决函数,典型方法包括:LMS 、RBF 网络等。
支持向量机,从几何角度,构造约束最优化模型,寻找最优分类面,典型方法包括:线性支持向量机和非线性支持向量机。
神经网络,从仿生学角度构造神经网络结构,通过最优化方法进行网络训练,典型方法包括:感知器模型,BP 网络等。
6、(20分)已知四个样本具有三个特征,分别为:
[]
10.15,0.19,0.79,0.06T
=v []
20.39,0.30,0.73,0.10T
=v []
3 1.08,0.99,3.05,0.33T
=v
1)计算其协方差矩阵,并对其进行主分量,并对结果进行分析。 2)简述mercer 定理及核主分量分析的原理。 解:
(1)协方差矩阵:
0.68960.7042 2.78750.70420.7918 2.99202.7875 2.992011.5589T ⎡⎤
⎢⎥==⎢⎥⎢⎥⎣⎦
R F F
其中,[]123,,=F v v v 。
4 / 5word.
求协方差矩阵的特征值为10λ=,20.0347λ=,313.0056λ=,两个主分量为2λ和
3λ对应的特征向量,分别为:
[]10.7098,0.7043,0.0111T
=-v
[]
20.2273,0.2440,0.9427T
=v
说明三个特征分量中有一个特征和另外两个特征相关,采用主分量分析可以识别该相关向量,达到降低特征空间维度的目的。
(2)Mercer 定理认为,映射变换后的内积可以写为函数的形式。
定义:
[]1(),...,()N l N ⨯Φx x =φφ
则有:
T T R K
=ΦΦΦΦ=Φy u a
T K K R λλ=ΦΦΦ=Φ=y u a a u
根据mercer 定理,
,(,)T i j i j K
k ⎡⎤⎡⎤ΦΦ=<>=⎣⎦⎣⎦y y x x
最后得到:
()=<(),>=()(,)k k k i i y x a i k x x ω
∈∑x u φ
相当于在投影域计算KL 变换,并进行PCA 。
7、(15分)请写出模式识别系统的主要系统组成,阐述各部分的功能及主要方法。
答:模式识别系统的主要系统组成如下:
识别样本,采集用于采集待识别问题的数据 数据预处理,主要消除采集系统差异对识别的影响
特征提取与选择,从数据中提取具特征,并进行去相关等处理
分类器,进行分类,包括监督分类和非监督分类两种,列举相关方法。