线性判别函数的正负和数值大小的几何意义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、线性判别函数的正负和数值大小的几何意义
2、支持向量机的判别函数,adaboost的判别函数
3、什么是聂曼-皮尔逊判决准,什么是最小最大判决准则
4、感知器算法特点
5、什么是特征,什么是特征提取,什么是特征选择?
6、分类和聚类有何区别?分别说出2-3种代表性算法
7、Fisher算法的特点?
8、数据预处理主要有哪些工作?
9、什么是大数据,大数据有何特点?
10、聚类中距离度量的方式有哪些,连续性数据和和二值数据分别怎么度量
9、什么是Gini指数,其作用是什么?
10、马式距离较之于欧式距离的优点
11、关联规则的经典算法有哪些,各自的优缺点?
12、什么是分类,什么是回归?分类的过程或步骤
13、分类评价标准,怎么评价分类的优劣
14、什么是数据,样本、什么是抽样
15、什么是机器学习以及机器学习的一般步骤
16. 样本属性的主要类型
17.人工神经网络的激活函数有哪些?
18.信息增益,在ID3算法中怎么用,表示什么含义
19.二维数据三个混合项的高斯模型的概率密度方程
20、什么是聚类?聚类分析有哪些主要距离度量方法
21、什么是频繁项集
22、关联规则的2大指标,支持度,可信度,(名词解释)
23、什么是关联规则?怎样通过频繁K项集产生关联规则
24、什么是贝叶斯网络及作用
25、ID3算法及步骤
26、神经网络的优缺点,bp网络的优缺点
27、分工神经网络主要是模拟人脑的哪些能力?单层感知器有什么缺点?
28、什么是过拟合,怎么解决过拟合?
29、衡量模式识别与机器学习算法优劣的标准
30、什么是有监督学习、什么无监督学习
31、基于最小错误率的贝叶斯决策及基于最小风险的贝叶斯决策解决实际问题。
32、贝叶斯决策算法,最小风险贝叶斯、感知器算法、Apriori 算法、、K-中心算法、k-均值算法,等算法,步骤及伪代码。
实际问题示例:
1、支持度20%,置信度20%,用Apriori 算法找出所有关联规则(要求完整步骤,写出所有
的候选集,k 项集,及所有关联规则)
2、识别鲈鱼和鲑鱼,其先验概率分别为 P(w 1)=0.9,P(w 2)=0.1,现有一待识别的鱼,其
观察值为x ,从类条件概率密度分布曲线上查得1()0.6P x w =,4.0)(2=w x P ,并且已知011=λ,123λ=,121=λ,022=λ,分别写出自小风险和最小错误率的贝叶斯决策过程。
3、使用ID3决策树算法对两个未知类型的样本进行分类。
(要求写出构建决策树的完整过程,以及各个属性的信息增益)。