多元统计分析课程设计题目知识分享
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析课程设
计题目
课程设计题目
1. 下表给出了1991年我国30个省、区、市城镇居民的月平均消费数据,所考
察的八个指标如下(单位均为元/人)
X1 :人均粮食支出; X2 :人均副食支出;
X3 :人均烟酒茶支出; X4 :人均其他副食支出;
X5 :人均衣着商品支出; X6 :人均日用品支出;
X7 :人均燃料支出; X8 :人均非商品支出;
问题:
(1)求样品相关系数矩阵R;
(2)从R 出发做主成分分析,求各主成分的贡献率,及前两个主成分的累积贡献率;
(3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,结果如何?
表一 1991年我国30个省、区、市城镇居民的月平均消费数据
省市X1 X2 X3 X4 X5 X6 X7 X8
1 山西8.35 23.53 7.51 8.6
2 17.42 10.00 1.04 11.21
2 内蒙古9.25 23.75 6.61 9.19 17.77 10.48 1.72 10.51
3 吉林8.19 30.50 4.72 9.78 16.28 7.60 2.52 10.32
4 黑龙江7.73 29.20 5.42 9.43 19.29 8.49 2.52 10.00
5 河南9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76
6 甘肃9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35
7 青海10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81
8 河北9.09 28.12 7.40 9.62 17.26 11.12 2.49 12.65
9 陕西9.41 28.20 5.77 10.80 16.36 11.56 1.53 12.17
10 宁夏8.70 28.12 7.21 10.53 19.45 13.30 1.66 11.96
11 新疆 6.93 29.85 4.54 9.49 16.62 10.65 1.88 13.61
12 湖北8.67 36.05 7.31 7.75 16.67 11.68 2.38 12.88
13 云南9.98 37.69 7.01 8.94 16.15 11.08 0.83 11.67
14 湖南 6.77 38.69 6.01 8.82 14.79 11.44 1.74 13.23
15 安徽8.14 37.75 9.61 8.49 13.15 9.76 1.28 11.28
16 贵州7.67 35.71 8.04 8.31 15.13 7.76 1.41 13.25
17 辽宁7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29
18 四川7.18 40.91 7.32 8.94 17.60 12.75 1.14 14.80
19 山东8.82 33.70 7.59 10.98 18.82 14.73 1.78 10.10
20 江西 6.25 35.02 4.72 6.28 10.03 7.15 1.93 10.39
21 福建10.60 52.41 7.70 9.98 12.53 11.70 2.31 14.69
22 广西7.27 52.65 3.84 9.16 13.03 15.26 1.98 14.57
23 海南13.45 55.85 5.50 7.45 9.55 9.52 2.21 16.30
24 天津10.85 44.68 7.32 14.51 17.13 12.08 1.26 11.57
25 江苏7.21 45.79 7.66 10.36 16.56 12.86 2.25 11.69
26 浙江7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87
27 北京7.78 48.44 8.00 20.51 22.12 15.73 1.15 16.61
28 西藏7.94 39.65 20.97 20.82 22.52 12.41 1.75 7.90
29 上海8.28 64.34 8.00 22.22 20.06 15.12 0.72 22.89
30 广东12.47 76.39 5.52 11.24 14.52 22.00 5.46 25.50
2. 下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1 ,X2 ,X3表示)
和摄入等量食糖一小时后的三个时刻的血糖含量(用小X4 ,X5 ,X6表示)的观测值(单位:mg/100ml).
问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于S和R的分析那个结果更为合理?
表二 49位女性在空腹和摄入食糖后三个不同时刻的血糖含量
编号
空腹摄入食糖
X1 X2 X3 X4 X5 X6
1 60 69 6
2 97 69 98
2 56 5
3 8
4 103 78 107
3 80 69 76 66 99 130
4 5
5 80 90 80 85 114
5 62 75 68 11
6 130 91
6 74 64 70 109 101 103
7 64 71 66 77 102 130
8 73 70 64 115 110 109
9 68 67 75 76 85 119
10 69 82 74 72 133 127
11 60 67 61 130 134 121