主成分分析案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y1
0.286 0.331 0.323 0.299 0.261 0.309 0.344 0.348 0.346 0.303
y2
0.443 0.235 -0.172 -0.364 -0.509 0.409 0.256 0.036 -0.164 -0.267 1.769 17.69% 85.95%
y3
0.194 0.336 0.442 0.375 0.123 -0.034 -0.171 -0.290 -0.322 -0.522 0.75 7.5% 93.45%
2.5
6
8.1 6.2
. 3.9 .
7
6.0 7.2
8
5.4 7.5
9
3.8 7.0
10
2.5 9.0
3.5
3.0
2.8
3.0
1——5 组表示男性,6——10 组表示女性 1——5, 6——10 年龄从小到大排序
特征向量
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 特征根 i
方差贡献率 累 计 方 差 贡 献 率
5、各种型号的比例按 该组样品数/128 确定。
Practice makes perfect Wish you success!
用 y1 得分来表示食品嗜好程度可有七成把握。 在充分注意到人们普遍的嗜好程度基础上,进一 步考虑到青少年和老年人的嗜好程度,对食品业 的开发方针作出决策时,将有85%的把握。
特别喜欢吃的
醋拌生鱼片、冰激棱 男性喜欢 女性喜欢
一般喜欢
孩子 咖喱饭 炸肉饼、火腿面包 成人 鸡蛋烩饭、炸猪排 酸汤、大头鱼 孩子 干咖喱、浓汤 成人 煮牛肉、生蛋 菜粥、清汤
例1、主成分分析用于综合评价
主成分分析 法通过研究指标体系的内在结构 关系,从而将多个指标 转化为少数几个 相互独立 且包含原来指标大部分信息(80%或85%以上)的 综合指标。其优点在于它确定的权数是基于数据 分析而得出的指标之间的内在结构关系,不受主 观因素的影响,有较好的客观性,而且得出的综 合指标(主成分)之间相互独立,减少信息的交 叉,这对分析评价极为有利。
将被调查者按性别与年龄分成10组
以组为单位,在每组中每个成员都对100 种食品给 予评分,然后计算每组成员对每种食品评分的平均值。
食 品
1 2 3 . . 100
组号
1
7.8 1.6
. . 3.1
2
5.4 2.8
. 2.8
3
3.9 4.4
. 3.3
4
3.5 4.0
. 3.0
5
3.0 3.5 . .
Y2得分
-3.94396 2.43505 0.12551 3.34907 0.61942 1.90248 2.31576 2.53147 -0.79528 -1.07448 -1.09413 0.61915 -1.13709 -1.92281 -0.48313
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
主成分分析在 市源自文库研究中的应用
食品生产预测(日本户田)
为了对常用的100种食品的生产进行经营决策,
需要就消费者对食品的嗜好程度进行调查。对785名
消费者进行调查,要求每个消费者对100种食品进行 评价,按对食品的喜好程度评分,最受欢迎的给予 最高分9分,最不受欢迎的给予最低分1分。
假若你是该食品加工业决策部门的高级顾问,为 了对食品生产作出合理决策,请你对调查资料进 行分析,为决策者提供建议。
y2
0.20 0.14 -0.33 0.18 0.20 0.27 0.19 -0.37 0.07 -0.17 -0.35 -0.02 0.11 -0.37 -0.27 -0.36
y3
0.01 -0.06 0.14 0.03 0.03 -0.03 0.02 -0.15 0.63 -0.53 -0.20 -0.31 -0.02 0.25 0.14 0.24
• 样品的分类(图解样品)
1、计算y1、y2的得分。 2、以y1为横坐标、y2为纵坐标,描点。 3、把样品按在图上的集中情况分成若干组(g组)。 * * , y 4、取每一组的中心 ( y1 k 2k ) (k=1,2,…,g) 作为该组的 代表点。 相应原16个指标的尺寸: x ' r y * r y * 1 11 1k 12 2 k ' * * x r y r y 2 21 1k 22 2 k ' * * x16 r y r y 16 ,1 1k 16 , 2 2 k
6.826
68.26% 68.26%
主成分的含义
y1反映了公共平均嗜好程度, y1得分越大,表示大 众越喜欢吃此食品。 y2反映了年龄的作用。 y2得分为正时,表示孩子喜 欢吃; y2得分为负时,表示孩子不喜欢吃。 y3反映性别的作用。y3得分为正时,表示男性喜 欢吃; y3得分为负时,表示女性喜欢吃。
特征向量
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16
身长 坐高 胸围 头高 裤长 下裆 手长 领围 前胸 后背 肩厚 肩宽 袖长 肋围 腰围 腿肚
y1
0.34 0.27 0.23 0.34 0.33 0.29 0.29 0.19 0.09 0.15 0.10 0.24 0.32 0.18 0.27 0.16
反映地区社会经济发展的指标体系
X1:国内生产总值(GDP) X3:第三产业产值占GDP比重 X5:工业企业劳动生产率 X7:每万人拥有卫生技术人员数 X9:教育经费投入占GDP比重 X11:人均邮电业务总量 X13:人均固定资产投资 X15:地方财政收入占GDP比重 X17:科研经费占GDP比重 X2:人均GDP X4:人均出口额 X6:人均社会消费品零售额 X8:每万人高等学校在校生数 X10:人均货运总量 X12:每万人电话机装机数 X14:人均实际利用外资 X16:每万人科研机构数
4、主成分的表达式及其含义解释 5、计算主成分得分
第一主成分名次
地区
北京 上海 天津 广东 辽宁 福建 浙江 江苏 海南 新疆 吉林 黑龙江 山西 宁夏 云南
Y1得分
11.7257 10.1776 5.1235 2.7422 1.1325 0.5586 0.2718 0.1817 0.0795 -0.3075 -0.4873 -0.6307 -0.7467 -0.7791 -0.8203
饼干、带馅面包 酱面条、烧鱼
一般不喜欢 特别不喜欢
服装的定型分类问题
为了较好地满足市场的需要,服装生产厂 要了解所生产的一种服装究竟设计几种型号合 适?这些型号的服装应按怎样的比例分配生产 计划才能达到较好的经济效益?
对128名成年男子按16项指标进行测量。
X1:身长 X5:裤长 X9:前胸 X13:袖长 X2:坐高 X6:下裆 X10:后背 X14:肋围 X3:胸围 X7:手长 X11:肩厚 X15:腰围 X4:头高 X8:领围 X12:肩宽 X16:腿肚
对全国31个地区上述 17项指标的数据进行主成分分析, 应用SAS软件进行处理。 数据见CD.PCRex01
1、 求相关系数矩阵R
2、 计算R的特征值
主成分 特 征 根 Y1 11.1134 Y2 2.6656 Y3 0.9126 Y4 0.7052
贡献率( % )
累计贡献率
65.37
65.37
15.68
81.05
5.37
86.42
4.15
90.57
3、 求特征根所对应的单位特征向量
特征向量 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17
Y1
0.038466 0.276020 0.243654 0.263487 0.180546 0.290834 0.259842 0.280523 0.094233 0.215946 0.292016 0.288268 0.282016 0.259006 0.216793 0.259962 0.212293
y1 是刻画尺寸大小的因子。
y2 反映人的胖瘦情况,是一个体形因子。 反映“长” 的尺寸前面的系数为正; 反映“围”的尺寸前的系数为 负。 y3 系数多数取值很小,接近于0。只有三个系数绝 对值较大。 y3 是反映特殊体形的因子,区分有无畸形。
要解决的问题:
• 区分有几种型号 (分类) • 各种型号的生产量(比例)
特征值
7.03 2.61 1.63 0.84 0.77 0.64 0.58 0.46 0.36 0.31 0.24 0.22 0.17 0.14 0.07 0.04
贡献率
44% 16% 10% 6% 5% 4% 3% 3% 2% 2% 2% 1% 1% 1% 0 0
累计贡献率
44% 60% 70% 76% 81% 85% 88% 91% 93% 95% 97% 98% 99% 100%
Y2得分
-2.06481 2.32993 -1.47145 0.66326 -0.87181 1.25757 -1.40987 -0.36439 0.04577 -2.04139 -0.42078 0.33126 0.07660 0.86909 0.45974 -0.83575
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
第一主成分名次
地区
陕西 山东 青海 湖北 内蒙古 河北 甘肃 重庆 湖南 西藏 广西 四川 江西 河南 安徽 贵州
Y1得分
-0.9116 -1.0207 -1.1131 -1.1943 -1.2295 -1.4456 -1.8358 -1.8603 -1.8806 -1.9085 -1.9098 -2.1979 -2.3049 -2.3383 -2.4358 -2.6347
Y2
0.513225 0.203116 -0.182858 0.193618 0.217290 0.113642 -0.164527 -0.114637 -0.509240 -0.025832 0.083471 0.132592 0.105402 0.199407 -0.181330 -0.261367 -0.295756