2014-2018年中国科学院自动研究所考博试题 模式识别

合集下载

2014年中国科学院英语考博大纲(附样题及答案)

2014年中国科学院英语考博大纲(附样题及答案)

中国科学院大学博士研究生入学考试英语考试大纲•招生办公室•2014年11月21日考试对象报考中国科学院大学各单位(具体指中国科学院所属各研究院、所、中心、园、台、站及校部各直属院系)相关专业拟攻读博士学位的考生。

考试目的检验考生是否具有进入攻读博士学位阶段的英语水平和能力。

考试类型、考试内容及考试结构本考试共有五个部分:词汇(占10%)、完形填空(占15%)、阅读理解(占40%)、英译汉(占15%),写作(占20%)。

试卷分为:试卷一(Paper One)客观试题,包括前三个部分,共75题,顺序排号;试卷二(Paper Two)主观试题,包括英译汉和写作两个部分。

一、词汇主要测试考生是否具备一定的词汇量和根据上下文对词和词组意义判断的能力。

词和词组的测试范围基本以本考试大纲词汇表为参照依据。

共20题。

每题为一个留有空白的英文句子。

要求考生从所给的四个选项中选出可用在句中的最恰当词或词组。

二、完形填空主要测试考生在语篇层次上的理解能力以及对词汇表达方式和结构掌握的程度。

考生应具有借助于词汇、句法及上下文线索对语言进行综合分析和应用的能力。

要求考生就所给篇章中15处空白所需的词或短语分别从四个选项中选出最佳答案。

三、阅读理解本部分共分两节。

要求考生能:1)掌握中心思想、主要内容和具体细节;2)进行相关的判断和推理;3)准确把握某些词和词组在上下文中的特定含义;4)领会作者观点和意图、判断作者的态度。

A节:主要测试考生在规定时间内通过阅读获取相关信息的能力。

考生须完成1800-2000词的阅读量并就题目从四个选项中选出最佳答案。

B节:主要测试考生对诸如连贯性和一致性等语段特征的理解。

考生须完成700-900词的阅读量(2篇短文),并根据每篇文章(约400词)的内容,从文后所提供的6段文字中选择能分别放进文章中5个空白处的5段。

四、英译汉要求考生将一篇近400词的英语短文中有下划线的5个句子翻译成汉语。

中国科学院(中科院)考博历年试题汇总

中国科学院(中科院)考博历年试题汇总

中国科学院(中科院)考博历年试题汇总中科院发育遗传所2002生物化学(博士)注:请将试卷写在答题纸上;不用抄题,但要写请题号;草稿纸上答题无效。

一、名次解释:(20分)二、以动物细胞或植物细胞为例说明细胞中的膜结构及其功能。

(12分)三、在研究位置基因的功能时往往采用推定的该基因所编码的氨基酸序列与已知功能的蛋白质的氨基酸序列比较来推断,你认为这种比较应采用什么原则?为什么?(12分)四、真核基因在原核细胞中表达的蛋白质常常失去生物活性,为什么?举例说明。

(12分)五、简述信号肽的结构特点、功能和从蛋白质产物中切除的机理。

(12分)六、分子筛、离子交换和亲和层析是三种分离、醇化蛋白质的方法,你如何根据所要分离、纯化的蛋白质的性质选择使用。

(12分)七、酶联免疫吸附实验(ELISA)的基本原理是什么?如何用此方法检测样品中的抗原和抗体?(12分)八、某一个蛋白,SDS凝胶电泳表明其分子量位于16900于37100标准带之间,当用巯基乙醇和碘乙酸处理该蛋白后经SDS凝胶电泳分析仍得到一条带,但分子量接近标准带13370处,请推断此蛋白质的结构?为什么第二次用前要加碘乙酸?(8分)中科院发育遗传所2000-2001生物化学(博士)2000年博士研究生入学考试生物化学试题1.酶蛋白的构象决定了酶对底物的专一性,请描述并图示酶与底物相互关系的几种学说。

(20分)2.什么是DNA的半保留复制和半不连续复制?如何证明?真核细胞与原核细胞的DNA复制有何不同?(20分)3.概述可作为纯化依据的蛋白质性质及据此发展的方法。

(20分)4.简述酵解和发酵两个过程并说明两者的异同。

(15分)5.吃多了高蛋白食物为什么需要多喝水?(10分)6.在非极端环境的生物体中是否存在氰化物不敏感的呼吸作用?如果有,其可能的生物学意义是什么?(5分)以下两题中任选一题(10分)7.概述植物或微生物细胞感应(应答)环境刺激因子(如养分缺乏、热、冷、干旱、强光等)的可能的生物化学过程模式。

2017-2018年中国科学院自动化研究所考博试题 模式识别

2017-2018年中国科学院自动化研究所考博试题 模式识别
2. (12 分) 关于概率密度函数估计:(1)源自设一维特征空间中的窗函数为
(u)

1, 0,
| u | 1/ 2 otherwise
。现有
n
个样本
xi,
i=1,…,n,
采用宽度为 hn 的窗函数,请写出概率密度函数 p(x)的 Parzen 窗估计 pn(x);(6 分) (2) 给定一维空间中的三个样本点{1,0,2},请写出概率密度函数 p(x)的最近邻(1-NN)
7. (12 分) 设有 n 个 d 维空间的训练样本,这些样本一共来自于 c 个类别。假定要设计一 个多层前向神经网络,将该网络训练之后可用于对新样本进行分类。请描述你所设计的 网络结构,给出训练该网络的主要计算步骤;从网络结构和网络训练的角度指出哪些因 素会对分类性能造成影响。
8. (10 分) 请从监督学习(学习过程中利用样本的类别标签)和无监督学习(学习过程 中不利用样本的类别标签)的角度,对如下方法进行归类:Parzen 窗概率密度估计方法、 K-近邻分类器、感知器准则方法、主成分分析方法、决策树方法、支持向量机方法、C 均值聚类方法、ISODATA 方法、罗杰斯特回归方法、分级聚类方法、核主成分分析方 法、LLE 方法、Adaboost 方法、自组织映射方法、Isomap 方法、Fisher 判别分析方法、 谱聚类方法、Recurrent Neural Network 方法、受限玻尔滋曼机方法、卷积神经网络方法。
科目名称:模式识别
第2页 共2页
中国科学院自动化研究所
2018 年招收攻读博士学位研究生入学统一考试试卷 科目名称:模式识别
考生须知:
1. 本试卷满分为 100 分,全部考试时间总计 180 分钟。 2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

2014年中国科学院英语考博大纲(附样题及答案)

2014年中国科学院英语考博大纲(附样题及答案)

中国科学院大学博士研究生入学考试英语考试大纲•招生办公室•2014年11月21日考试对象报考中国科学院大学各单位(具体指中国科学院所属各研究院、所、中心、园、台、站及校部各直属院系)相关专业拟攻读博士学位的考生。

考试目的检验考生是否具有进入攻读博士学位阶段的英语水平和能力。

考试类型、考试内容及考试结构本考试共有五个部分:词汇(占10%)、完形填空(占15%)、阅读理解(占40%)、英译汉(占15%),写作(占20%)。

试卷分为:试卷一(Paper One)客观试题,包括前三个部分,共75题,顺序排号;试卷二(Paper Two)主观试题,包括英译汉和写作两个部分。

一、词汇主要测试考生是否具备一定的词汇量和根据上下文对词和词组意义判断的能力。

词和词组的测试范围基本以本考试大纲词汇表为参照依据。

共20题。

每题为一个留有空白的英文句子。

要求考生从所给的四个选项中选出可用在句中的最恰当词或词组。

二、完形填空主要测试考生在语篇层次上的理解能力以及对词汇表达方式和结构掌握的程度。

考生应具有借助于词汇、句法及上下文线索对语言进行综合分析和应用的能力。

要求考生就所给篇章中15处空白所需的词或短语分别从四个选项中选出最佳答案。

三、阅读理解本部分共分两节。

要求考生能:1)掌握中心思想、主要内容和具体细节;2)进行相关的判断和推理;3)准确把握某些词和词组在上下文中的特定含义;4)领会作者观点和意图、判断作者的态度。

A节:主要测试考生在规定时间内通过阅读获取相关信息的能力。

考生须完成1800-2000词的阅读量并就题目从四个选项中选出最佳答案。

B节:主要测试考生对诸如连贯性和一致性等语段特征的理解。

考生须完成700-900词的阅读量(2篇短文),并根据每篇文章(约400词)的内容,从文后所提供的6段文字中选择能分别放进文章中5个空白处的5段。

四、英译汉要求考生将一篇近400词的英语短文中有下划线的5个句子翻译成汉语。

中国科学院 自动化研究所 北京 考博真题 数学

中国科学院 自动化研究所 北京 考博真题 数学
中国科学院自动化研究所 2016 年招收攻读博士学位研究生入学统一考试试卷
科目名称:数学
考生须知:
1.本试卷满分为 100 分,全部考试时间总计 180 分钟。 2.所有答案必须写在答题纸上,写在试题纸或草稿纸上一律无效。
本试卷可能用到的常数:分别以 Z ( ), n2 ( ), tn ( ), Fm,n ( ) 表示标准正态分布, 卡方分布,student-t 分布和 F 分布的上 分位数,则
F4,20 (0.05) 2.87 , F5,20 (0.05) 2.71, F4,24 0.05 2.78 。
一.
(14 分)求微分方程组
dx1 dt

3x1 8x3Fra bibliotekdx2 dt 3x1
2x2
6x3
dx3 dt

2 x1
5x3
满足初始条件 x1(0) 1, x2 (0) 0, x2 (0) 1 的解。
其中 i 1 。
2i i 0 4 2i
A


0 2
0 1
3 1
4
6 4i


四. (12 分)设 A Cnn , 是矩阵 A ai, j 的特征值,试证明下列结论:
1. A ; m
2. Re() 1 A AH
2
m
3. Im() 1 A AH 。
y x, 0 x 1 otherwise
试求:
fX Y (x
y

1) 。 2
七.(每小题
5
分,共
10
分)设总体
X
的密度函数为
f
(x, )

中科院-模式识别考题总结(详细答案)

中科院-模式识别考题总结(详细答案)

1.简述模式的概念及其直观特性,模式识别的分类,有哪几种方法。

(6’)答(1):什么是模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。

模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。

模式的直观特性:可观察性;可区分性;相似性。

答(2):模式识别的分类:假说的两种获得方法(模式识别进行学习的两种方法):●监督学习、概念驱动或归纳假说;●非监督学习、数据驱动或演绎假说。

模式分类的主要方法:●数据聚类:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。

是一种非监督学习的方法,解决方案是数据驱动的。

●统计分类:基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。

特征向量分布的获得是基于一个类别已知的训练样本集。

是一种监督分类的方法,分类器是概念驱动的。

●结构模式识别:该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。

(句法模式识别)●神经网络:由一系列互相联系的、相同的单元(神经元)组成。

相互间的联系可以在不同的神经元之间传递增强或抑制信号。

增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。

神经网络可以实现监督和非监督学习条件下的分类。

2.什么是神经网络?有什么主要特点?选择神经网络模式应该考虑什么因素?(8’)答(1):所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统(计算机)。

由于我们建立的信息处理系统实际上是模仿生理神经网络,因此称它为人工神经网络。

这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。

人工神经网络的两种操作过程:训练学习、正常操作(回忆操作)。

答(2):人工神经网络的特点:●固有的并行结构和并行处理;●知识的分布存储;●有较强的容错性;●有一定的自适应性;人工神经网络的局限性:●人工神经网络不适于高精度的计算;●人工神经网络不适于做类似顺序计数的工作;●人工神经网络的学习和训练往往是一个艰难的过程;●人工神经网络必须克服时间域顺序处理方面的困难;●硬件限制;●正确的训练数据的收集。

中科院考博真题2014植物学

中科院考博真题2014植物学

中国科学院大学
2014年招收攻读博士学位研究生入学统一考试试题
科目名称:植物学
考生须知:
1.本试卷满分为100分,全部考试时间总计180分钟。

2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

一、简答题(每题10分,共40分)
1.试比较说明裸子植物和被子植物维管组织结构的异同。

2.试简要说明单子叶植物与双子叶植物茎的结构一般特点及主要区别。

3. 矿质元素进入根系维管系统有哪些途径?受到何种结构的选择?
4.试从传粉的角度简要说明被子植物花的多样性的适应意义。

二、问答题(每题20分,共60分)
1. 试举例说明植物的光合作用有哪些主要途径?它们的主要特点是什么?各自适应哪些环境特征?
2. 试述有胚植物各大类群生活史过程的演化特征及其进化意义。

3. 随着生命科学研究相继进入基因组学以及后基因组学时代,植物学传统研究方法和体系都有了巨大变化。

试以植物进化生物学研究领域为例,阐述其研究方法和体系的变化及发展趋势。

科目名称:植物学第1页共1页。

(完整word版)模式识别试题及总结

(完整word版)模式识别试题及总结

一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。

2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。

3、聚类分析算法属于(1) ;判别域代数界面方程法属于(3) 。

(1)无监督分类(2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。

(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。

(1)(2)(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2) 中进行。

(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。

(1)感知器算法(2)H—K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4) 。

(1)({A, B}, {0,1}, {A®01, A® 0A1 ,A® 1A0 ,B®BA , B® 0}, A)(2)({A}, {0,1},{A®0, A® 0A},A)(3)({S},{a, b},{S ® 00S,S ® 11S, S ® 00,S ® 11},S)(4)({A},{0,1}, {A®01,A® 0A1, A® 1A0},A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。

10、欧式距离具有( 1、2 );马式距离具有( 1、2、3、4 )。

(1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。

中科院博士考试样卷附答案

中科院博士考试样卷附答案

中国科学院研究生院英语B考试大纲笔试部分笔试部分由试卷一和试卷二构成。

试卷一包括:听力、英语知识运用与阅读理解两部分。

试卷二为书面表达部分。

时间总长共150分钟,满分100分。

试卷一(75分)第一部分:听力(20分)本部分考查考生理解英语口语、获取特定信息以及简要笔记的能力,由A、B两节组成。

A节:共10题,每题1分。

要求考生根据所听到的10段对话,从每题所给的4个选项中找出最佳答案。

每题有12-15秒答题时间。

每段对话的录音只播放一遍。

B节:共10题,每题1分。

要求考生根据所听到的3篇对话或独白简要回答10道有关该对话或独白的问题。

问题在试卷中印出但不在录音中读出。

录音材料只播放一遍。

本部分大约需要25分钟。

第二部分:英语知识运用与阅读理解(55分)本部分考查考生对用于一定语境中的词汇、表达方式和结构的掌握和理解书面英语的能力,由A、B和C三节组成。

A节:共15题,每题1分。

在1篇约300词的短文中留出15个空白,要求考生从短文后提供的30个词或表达式中选出最佳选项,使补足后的短文意义通顺,前后连贯,结构完整。

其中有11-12道题考查词汇和表达方式,3-4道题考查语法和语篇结构。

本节大约需要20分钟。

B节:共20题,每题1.5分,共30分。

考查考生理解总体和特定信息、猜词悟义、推断作者态度和意图的能力。

要求考生根据所提供的4篇文章(平均每篇约400词)的内容,从每题所给的4个选择项中选出最佳选项。

本节大约需要35分钟。

C节:共10题,每题1分。

考查考生对诸如连贯性和一致性等语段特征的理解。

要求考生根据2篇留有5段空白的文章(平均每篇约400词)的内容,在每篇文后所提供的6段文字中选择能分别放进该文章中5个空白处的5段。

本节大约需要20分钟。

本部分总需时间约75分钟。

试卷二(25分)本部分考查考生英语书面表达的能力,由A、B两节组成。

A节:共1题,10分。

要求考生根据所提供的1篇长约450词的、有相当难度的文章写出1篇字数为120—150词的内容提要(约占原文的1/4-1/3)。

中科院_黄庆明_模式识别_考试试卷总结_国科大

中科院_黄庆明_模式识别_考试试卷总结_国科大



k j
来计算:
kh
w
hj
k j
j
因此,算出
kh
后,

k h
也就求出了。
如果前面还有隐蔽层,用

k h
再按上述方法计算
kl


k l
,以此类
推,一直将输出误差δ一层一层推算到第一隐蔽层为止。各层的δ
求得后,各层的加权调节量即可按上述公式求得。由于误差

k j
相当
于由输出向输入反向传播,所以这种训练算法成为误差反传算法
第四步:返回第二步,重复计算及合并,直到得到满意的分类结
果。(如:达到所需的聚类数目,或 D(n)中的最小分量超过给定阈值
D 等。)
聚类准则函数
(1)最短距离法:设 H 和 K 是两个聚类,则两类间的最短距离定义
为:
DH,K min{ d u,v}, u H, v K 其中,du,v 表示 H 类中的样本 xu 和 K 类中的样本 xv 之间的距离, DH,K 表示 H 类中的所有样本和 K 类中的所有样本之间的最小距 离。
k j

y
k j
)
2

1 2
{T
k j
k, j
F[
h
whj F (
i
wih xik )]}2
为了使误差函数最小,用梯度下降法求得最优的加权,权值先从
输出层开始修正,然后依次修正前层权值,因此含有反传的含义。
根据梯度下降法,由隐蔽层到输出层的连接的加权调节量为:
w
hj


E w hj
模式试卷总结
一、 模式
1.什么是模式:广义地说,存在于时间和空间中可观察的物体,如果我们可以区 别它们是否相同或是否相似,都可以称之为模式。 模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有 时间和空间分布的信息。 2.模式的直观特性:可观察性、可区分性、相似性 3.模式识别的分类:监督学习、概念驱动或归纳假说;非监督学习、数据驱动或 演绎假说。 4.模式分类的主要方法:数据聚类、统计分类、结构模式识别、神经网络。

中科院自动化所考博数学试题(2007年-2012年)

中科院自动化所考博数学试题(2007年-2012年)

中国科学院自动化研究所2008年招收攻读博士学位研究生入学统一考试试题科目名称:数学考生须知:1.本试卷满分为100分,全部考试时间总计180分钟。

2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

一. 设矩阵, 200111113A ⎡⎤⎢⎥=⎢⎥⎢⎥−⎣⎦求(i )A e ; (ii ), 其中t 属于实数; (iii )关于的导数。

tA e tA e t二. 求矩阵的QR (正交三角)分解。

041111032B ⎡⎤⎢=⎢⎢⎥⎣⎦⎥⎥三. 证明矩阵211211141112n n n C n n n n nn n ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦L L MM M M L 能够相似于对角矩阵,且C 的特征值都是实数。

四、设2维随机变量(,)X Y 的分布密度为:,,(,),x x y g x y ì<<<<ïï=íïïî30100其它x 1. 求边缘分布密度:;(),()X Y g x g y 2. 求条件分布密度:。

(|),(|)g x y g y x五、设随机变量X 的分布密度为:||()/,x f x e x -=-?<+21.求E(),Var(),E(||),Var(||)X X X X ; 2.求Cov(,||),Corr(,||)X X X X |; 3.X 与|X 是否独立?为什么?六、设,,...,N X X X 12和,,...,M Y Y Y 12分别是来自正态总体(,)N θσ21和(,)N θσ22的样本,其中,σσ12是已知的。

1. 求常数c , d ,使得ˆcX dY θ=+为θ的无偏估计,并使其方差达到最小(在所有形如aX bY +的无偏估计类中最小);2.基于估计ˆθ,求θ的置信系数为α-1的置信区间。

科目名称:数学第2页 共2页中国科学院自动化研究所2009年招收攻读博士学位研究生入学统一考试试题科目名称:数学考生须知:1.本试卷满分为100分,全部考试时间总计180分钟。

2019年中国科学院自动化研究所考博真题 数学

2019年中国科学院自动化研究所考博真题  数学

中国科学院自动化研究所2013年招收攻读博士学位研究生入学统一考试试卷科目名称:数 学考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。

2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

1. 已知222001111,(),(0)111300t t e t e ⎛⎫-⎛⎫⎛⎫ ⎪ ⎪⎪=-== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭A b x 1)(12分)求矩阵函数t e A ;2)(8分)求微分方程组 '()()()t t t =+x Ax b 满足初始条件 (0)(1,1,0)T=-x 的解。

2. (10分)试求矩阵101011000⎛⎫⎪= ⎪ ⎪⎝⎭A 的奇异值分解。

3. 设n 阶复数矩阵()ij n n a ⨯=A 的全部特征值为12,,,n λλλ, H A 是A 的共轭转置矩阵。

1)(5分)证明Schur 不等式:221,1||||nnrij r i j a λ==≤∑∑;2)(5分)证明上述不等式中等号成立的充分必要条件是 H H =A A AA 。

科目名称:数 学第1页 共2页4. (10分) 试求下面矩阵的Moore-Penrose 逆02022100022220211321i ii i i +⎛⎫⎪=---- ⎪ ⎪-⎝⎭A其中,i =5. (10分) 设某人从外地赶来参加紧急会议,他乘火车、轮船、汽车或者飞机来的概率分别为31110510、、及25。

他若乘飞机来,不会迟到;而乘火车、轮船、汽车赶来迟到的可能性分别为1114312、、。

若此人已迟到,请判断他最有可能是怎么来的。

6. (10分) 设两个相互独立的随机变量X 和Y 均服从正态分布(1,0.5)N ,若随机变量2Z X aY =-+满足条件2()Var Z EZ =,求a 的值。

7. (10分) 设(,)X Y 联合分布密度为224,01,01,(,)0,.x y xy x y f x y +-≤≤≤≤⎧=⎨⎩其他, 试求给定14X =时Y 的条件密度。

2017-2018年中国科学院自动化研究所考博试题 数学

2017-2018年中国科学院自动化研究所考博试题 数学

中国科学院自动化研究所2017年招收攻读博士学位研究生入学统一考试试卷科目名称:数学考生须知:1.本试卷满分为100分,全部考试时间总计180分钟。

2.所有答案必须写在答题纸上,写在试题纸或草稿纸上一律无效。

注:后面五个试题可能用到以下常数:19192020(0.95) 1.729,(0.975) 2.093,(0.95) 1.725,(0.975) 2.086t t t t ====0.0250.050.100.201.96, 1.64, 1.280.84u u u u ====,其中,()n t α表示自由度为n 的t 分布的上α分位数;u α表示标准正态分布的上α分位数。

一、(18分)已知矩阵011110101A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,试求矩阵A 的分解式A QDT =,其中Q 是正交矩阵,D 是对角矩阵,而T 是主对角线上元素全为1的上三角矩阵。

二、(15分)设12121,,,,,,,n n a a a b b b - 都是非零的实数,n 阶矩阵111211n n n a b b a A b b a --⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭ 1. 证明:矩阵A 的秩大于等于 1n - ;2. 证明:矩阵A 有n 个不同的实特征值。

三、(17分)已知矩阵200011101A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,试求矩阵函数sin ,tA A e ,其中,t 是实数。

科目名称:数学第1页 共2页四、(每小题5分共10分)某品牌跑车共有四种颜色:白、蓝、黑、红。

换挡则分为手动与自动。

下表是各种类型的车所占比例:令A={跑车为自动档},B={跑车为黑色},C={跑车为白色},计算:1. ()P B A ;2. ()C P A C ,其中C C 表示C 的补集。

五、(10分)设中国科学院自动化所共有学生1200名,假定一名学生连续一小时不间断用水,需水0.5吨,高峰时期每名学生用水的概率为0.05。

问每天用水高峰时期,每小时供应多少吨水才有95%的把握保证学生用水?六、(每小题5分共10分)设随机变量(,)X Y 的概率密度为1(,)0k y x f x y ⎧≤≤⎪=⎨⎪⎩当其它。

haihong166——中国科学院自动化所

haihong166——中国科学院自动化所

中国科学院自动化研究所2006年招收攻读博士学位研究生入学统一考试试题科目名称:模式识别考生须知:1.本试卷满分为100分,全部考试时间总计180分钟。

2.所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

1. (15分)对于M 类(M 1,ωωK )的分类问题,假设将第j 类样本分到第i 类的损失为ij λ,给定每一类的先验概率)(i P ω和条件概率密度)|(i p ωx 。

请用公式叙述基于最小风险的贝叶斯决策过程,说明在什么情况下最小风险决策等价于最大后验概率决策并证明之。

2. (10分)定性说明基于参数方法和非参数方法的概率密度估计有什么区别,用于模式识别各有什么优缺点。

3. (15分)假设一元随机变量的分布),(~)(2σµN x p ,给定 N 个设计样本N x i K ,1i ,=,请推导用最大似然法估计均值和方差的计算公式。

4. (20分)对于下列属于二类的6个二维模式(第一列和第二列为模式的值,第三列为理想输出值,1表示第一类,-1表示第二类),请分别用Fisher 线形判别准则和最小平方误差法(伪逆)求出最优线性判别函数。

⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡−−−−−110101100111110101(续下页)科目名称:模式识别 第1页 共2页5. (20分)假设二类模式服从如下的正态分布:⎥⎦⎤⎢⎣⎡=111µ, ⎥⎦⎤⎢⎣⎡=1-1-2µ, ⎥⎦⎤⎢⎣⎡=Σ=Σ5.200121, 5.021==P P 请分别求出使)(tr -1b w S S 和)(tr t S (b S S S +=w t )最大化的一维特征空间的变换矢量。

6. (10分)对于下面属于三类的9个四维模式,用顺序前项搜索法选择使∑=−3120i i µµ(其中i µ是第i 类的均值,0µ是总的均值)最大的三个特征。

21422114005.232211412535.00.535234133235.2333332221114321−−−−ωωωωωωωωωx x x x7. (10分)用k-means (c-means)聚类算法将下面的9个二维空间的点分成三类。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国科学院自动化研究所2014年招收攻读博士学位研究生入学统一考试试卷科目名称:模式识别考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。

2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

1. (16分) 关于统计学习与支持向量机,请回答如下问题:(1) 给出机器学习问题的形式化表示 (4分);(2) 解释学习机器的推广能力 (4分);(3) 从几何的角度阐述线性支持向量机的原理 (4分);(4) 基于两类支持向量机,设计一个c 类(c > 2)分类训练策略 (4分)。

2. (10分) (1) 请描述径向基函数网络的结构和功能 (4分);(2) 指出径向基函数网络的参数,分析在训练一个径向基函数网络时如何调节这些参数 (6分)。

3. (10分) (1) 简述Fisher 线性判别分析的原理 (4分);(2) 针对两类分类问题,试证明在正态等方差条件下,Fisher 线性判别等价于贝叶斯判别 (6分)。

4. (10分) 假设在某个局部地区细胞识别中正常 (1ω)和异常(2ω)两类的先验分别为1()0.85P ω=和2()0.15P ω=。

现有一待识别细胞,其观察值为x ,从类条件概率密度分布曲线上查得1(|)0.2=P x ω,2(|)0.4=P x ω,请对该细胞x 进行分类,并给出计算过程。

5. (10分) 现有七个位于二维空间的样本:1(1,0)=T x ,2(0,1)=T x ,3(0,1)=-T x ,4(0,0)=T x ,5(0,2)=T x ,6(0,2)=-T x ,7(2,0)=-T x ,其中上标T 表示向量的转置。

假定前三个样本属于第一类,后四个样本属于第二类,请画出最近邻法决策面。

6. (16分) 在一个模式识别问题中,有下列8个样本: 1(1,1)T =-x ,2(1,1)T =--x ,3(0,1)T =x ,4(0,1)T =-x ,5(2,1)T =x ,6(2,1)T =-x ,7(3,1)T =x ,8(3,1)T =-x ,其中上标T 表示向量的转置。

请回答如下问题:(1) 如果不知道这8个样本的类别标签,请采用K-L 变换,计算其特征值和特征向量(10分);(2) 对上述8个样本,假设前4个样本属于第一类,后4个样本属于第二类,请给出一种特征选择方法,并写出相应的计算过程 (6分)。

7. (16分) (1) 给定m 维空间中的n 个样本,请给出C -均值聚类算法的计算步骤(包含算法输入和输出) (8分);(2) 针对C -均值聚类算法,指出影响聚类结果的因素,并给出相应的改进措施 (8分)。

8. (12分) 某单位有n 位职员,现从每位职员采集到m (m >10)张正面人脸图像(可能因姿态、表情、光照条件的略微不同而不同)。

每张人脸图像为200(高度) ⨯160(宽度)像素大小的灰度图像。

现在拟设计一个人脸识别系统,请回答如下问题:(1) 描述拟采用的特征提取方法及计算步骤 (4分);(2) 描述拟采用的分类器构造方法及计算步骤 (4分);(3) 请从特征提取和分类器构造两方面对你所采用的方法进行评价(即解释采用它们的原因) (4分)。

科目名称:模式识别 第1页 共1页中国科学院自动化研究所2015年招收攻读博士学位研究生入学统一考试试卷科目名称:模式识别考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。

2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

1. (5分) 关于ROC 曲线。

(1)“ROC ”代表三个英文单词的首字母,请顺序写出这三个单词的全称 (3分);(2)针对两类分类问题,请描述“ROC ”曲线的绘制步骤 (2分)。

2. (15分) 关于线性分类器。

(1)请给出Fisher 线性判别分析的主要计算步骤和分类决策规则(10分);(2)请给出线性不可分情形下支持向量机学习模型 (5分)。

3. (8 分) 关于Boosting 方法。

假定有n 个m 维空间中的训练样本12{,,,}m n x x x R ,进一步假定这些样本属于两个不同的类别。

(1) 基于这些样本,请简述采用Boosting 方法学习一个两类分类器的步骤,并指出其中拟采用的弱分类器 (4分);(2) 基于两类Boosting 方法,请设计一个针对多类分类问题的分类器学习框架 (4分)。

4. (8分) 关于聚类。

(1) 请给出ISODATA 方法的主要计算步骤 (4分);(2)请指出ISODATA 方法和C 均值算法的不同点 (4分)。

5. (8分) 关于主成分分析。

(1)请简述主成分分析方法的原理 (4分);(2)采用核技巧,可以将主成分分析方法发展为核主成分分析方法,请结合核主成分分析方法解释核技巧的工作原理 (4分)。

6. (14分) 关于神经网络。

(1)针对多层前馈神经网络,请给出反向传播算法的工作原理和训练步骤 (10分);(2)请分析“在前馈神经网络中,隐含层数越多对分类预测可能产生的影响” (4分)。

(未完待续) 科目名称:模式识别 第1页 共2页7. (10分) 关于特征选择。

给定n 个m 维空间中的训练样本12{,,,}m n x x x R ⊂,且每个样本的类别标签是已知的。

请用迹比值判据4()()b w tr S J tr S =设计一个完整的特征选择算法,其中()tr ⋅表示矩阵求迹运算,b S 表示类间散度矩阵,w S 表示总类内散度矩阵。

8. (10分) 现有一个二维空间中的两类分类问题。

记两个类分别为1ω和2ω。

假定1ω和2ω出现的先验概率均相等,且1ω和2ω的类条件概率密度均为正态分布。

其中,1ω的类条件概率密度的均值为1[1,0]Tμ=-,协方差矩阵为110.50.51⎛⎫∑= ⎪⎝⎭;2ω的类条件概率密度的均值为2[1,0]T μ=,协方差矩阵为210.50.51-⎛⎫∑=⎪-⎝⎭,其中上标T 表示向量转置。

请写出负对数似然比决策规则。

9. (14分) 现有9个训练样本,分别属于三个不同的类别。

第一类的样本点集为{[1, 0]T , [2,0]T , [1, 1]T },第二类的样本点集为{[0, 1]T , [−1, 0]T , [−1, 1]T },第三类的样本点集为{[0,−1]T , [−1,−1]T , [0,−2]T },其中上标T 表示向量转置。

假定类先验概率均相等,请计算类间散度矩阵和总类内散度矩阵。

10. (8分) 关于非线性特征提取。

(1)请描述IsoMap (isometric feature mapping)方法的主要计算步骤 (3分);(2)现有一个房间,其四周墙壁均为白色,且室内光照明亮均匀。

在该房间的一张白色的桌子上平放着一把彩色茶壶,茶壶所有表面均绘有不同的花纹。

另外,室内有一个照相机可沿一个圆移动,该圆所在的平面与桌面平行。

茶壶的质心与该圆的圆心重叠。

在照相机运动的过程中,照相机的焦距等成像参数保持不变,但其拍摄方向始终对准茶壶,且能将茶壶定位于图像中央,并使整个茶壶大致占满整个图像。

假定照相机沿该圆均速运动一周一共连续拍摄到400张不同的图像。

现将IsoMap 方法应用于这些图像数据,并假定最终输出一个二维特征提取结果。

如果将这400个二维特征点在二维笛卡尔坐标系统中进行绘制,请分析可能呈现出的形状,并给出理由 (5分)。

科目名称:模式识别 第2页 共2页中国科学院自动化研究所2016年招收攻读博士学位研究生入学统一考试试卷科目名称:模式识别考生须知:1. 本试卷满分为100分,全部考试时间总计180分钟。

2. 所有答案必须写在答题纸上,写在试题纸上或草稿纸上一律无效。

1. (10分). 请写出如下十个在模式识别领域中的英文简写的全称(比如,PR 的全称为Pattern Recognition ):SVM 、KPCA 、MLP 、K-NN 、LDA 、SOM 、LLE 、ANN 、CNN 、RBF 。

2. (10分). 有四个二维空间中的样本,它们分别属于两个不同的类别,其中第一类的两个样本为(1,4) T 和(2,6) T ,第二类的两个样本为(1,2) T 和(2,2)T 。

这里,上标T 表示向量转置。

若采用规范化增广样本表示形式,并假设初始的权向量a =(0,1,0) T ,其中向量a 的第三维对应于样本的齐次坐标。

同时,假定梯度更新步长ρt 固定为1。

试利用感知器算法求解线性判别函数g (y )=a T y 的权向量a 。

(注:“规范化增广样本表示”是指对齐次坐标表示的样本进行规范化处理)。

3. (15分). 现有五个四维空间中的样本:x 1 = (1, 3, 2, 1)T 、x 2 = (2, 3, 1, 2)T 、x 3 = (2, 2, 1, 2)T 、x 4 = (5, 5, 1, 1)T 和x 5 = (5, 3, 2, 1)T 。

这里,上标T 表示向量转置。

请按最小距离准则对上述五个样本进行分级聚类,并画出聚类系统树图。

4. (15分). 设有n 个d 维空间的训练样本12,,...,n x x x ,它们分别属于两个不同的类别,其类别标签分别为12,,...,{1,1}n y y y ∈+−。

现有如下线性支持向量机学习模型:1,...,1,11max 2..0,0,1,2,...,n n nTi i j i j i j i i j n ii i i y y s t y C i nααααααα==−=≤≤=∑∑∑x x(1)请将上述模型扩展为核支持向量机学习模型 (6分);(2)写出核支持向量机分类决策函数 (4分);(3)给出两种不同的核函数,并描述一种基于训练数据的核函数参数选择方法 (5分)。

(未完待续) 科目名称:模式识别 第1页 共2页5. (12分). (1)设有一维窗函数()exp(||)u u ϕ=−,并假定有n 个一维空间中的样本12,,...,n x x x 。

现采用宽度为h n 的窗函数,请写出概率密度函数p (x )的Parzen 窗估计p n (x ) (8分);(2)给定一维空间三个样本点{-2,0,2},请写出概率密度函数p (x )的最近邻(1-NN )估计并画出概率密度函数曲线图(4分)。

6. (14分). (1)给出最小误差平方和聚类准则的目标函数(6分);(2)给出C 均值聚类算法的计算步骤,并指出至少两个能够影响C 均值聚类结果的因素(8分)。

7. (12分). (1)设有n 个d 维空间的样本12,,...,n x x x ,它们分别来自于c 个不同的类别。

假定要设计一个多层前向神经网络,将该网络训练之后可用于对新样本进行分类。

相关文档
最新文档