多元统计分析数据
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、聚类分析
例1、为深入了解我国人口的文化程度状况,现利用1990年全国人口普查数据对全国30个省市自治区进行聚类分析。分析选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人口占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分别用来反映
例2、根据信息基础设施的发展状况,对世界20个国家和地区进行分类。
这里选取了发达国家、新兴工业化国家、拉美国家、亚洲发展中国家、转型国家等不同类型的20个国家作聚类分析。描述信息基础设施的变量主要的有六个:call——千人拥有电话号码,movecall——每千户居民蜂窝移动电话,fee——高峰时期每三分钟国际电话成本,computer——每千人拥有的计算机数,mips——每千
例3、为了研究1982年全国各地区农民家庭收支的分布规律,根据抽样调查资料进行分类处理,共抽取28个省、市、自治区的样本,每个样本有六个指标,这六个指标反映了平均每人生活消费的支出情况,其原始数据见表3。
例4为了研究世界各国森林、草原资源的分布规律,共抽取了21个国家的数据,每个国家4项指标,原始
例5 若要从沪市的蒲发银行、齐鲁石化、东北高速、武钢股份、东风汽车等53家上市公司中优选适合开放式基金组合投资的10只股票,我们以总股本和流通股本为分类标志,根据这53家公司的总股本和A股流通股本数据(见表5.3),用聚类分析法将它们分成若干类,再从各类公司中选出比较活跃的股票建立股票池。
例6沪市上市公司2001年末总股本在10000—12000万股、流通股本在3600—5050万股之间共有23家(对于股本结构在其它范围内的上市公司,用雷同的方法,可以建立相应的每股收益预测模型),各公司2000年及2001年有关的财务数据见表。
二、判别分析
例1、人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素的指标指示分别采用出生时的预期寿命、成人识字率和实际人均GTP ,将以上三个指标指示数值合成为一个复合指数,即人文发展指数。
今从1995年世界各国人文发展指数的排序中,选取高发展水平、中等发展水平的国家各五个作为两组
S S S n n V
8
1
)(21ˆ2121=+-+=
=⎪⎪⎪
⎭
⎫ ⎝⎛----5.2625460975.1446875.5550975.14466125.66713
.21875.555713.2138.15
⎪⎪⎪⎭
⎫
⎝⎛=-=-00873.00122.06523.0)(ˆ)
2()1(1X X V
a
例2、对全国30个省、市自治区1994年影响各地区经济增长差异的制度变量:X 1——经济增长率(%)、X 2
治区的样本,每个样本有六个指标。先采用聚类分析将28个样本分为3类,其中有3个样本(北京、上海、广州)属于孤立样本,未归属于已分的三类中,现采用多组判别分析判定这28个样本的所属类别。原始数
据见表3。
因子分析及主成分分析
例1 (因子分析)我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的8个取样点,每日四次同时抽取大气样本,测定其中含有的6种气体的浓度,前后4天,每个取样点每种气体实测16次。计算每个取样
例2 (因子分析)对我国30个省市自治区的农业生产情况作因子分析。从农业生产条件和生产结果及效益出发,选取六项指标分别为:X1—乡村劳动力人口(万人)、X2—人均经营耕地面积(亩)、X3—户均生产性固定资产原值(元)、X4—家庭基本纯收入(元)、X5—人均农业总产值(千元/人)、X6—增加值占总产值比重(%),原始资料数据见下表。
典型相关分析
例1对某高中一年级男生38人进行体力测试(共有七项指标)及运动能力测试(共有五项指标),试对两组指标作典型相关分析。
体力测试指标:X1—反复横向跳(次),X2—纵向跳(cm),X3—背力(kg),X4—握力(kg),X5—台阶测试(指数),X6—立定体前屈(cm),X7—俯卧上体后仰(cm)。
运动能力测试指标:X8—50米跑(秒),X9—跳远(cm),X10—投球(m),X11—引体向上(次),X12—耐力跑(秒)。
原始数据表
Descriptive Statistics
Analysis N
Mean Std.
Deviation
X1 47.4211 3.3662 38
X2 60.2105 7.4513 38
X3 114.4737 15.6598 38
X4 44.6316 5.3546 38
X5 66.9105 14.4485 38
X6 15.3421 5.9515 38
X7 59.7368 8.1429 38
X8 7.1368 .3506 38
X9 441.0526 42.3888 38
X10 27.8158 2.7495 38
X11 7.5789 3.7821 38
X12 366.6053 31.2976 38
Correlation Matrix
X1 X2 X3 X4 X5 X6 X7 X8 X Correlation X1 1.000 .270 .164 -.029 .246 .072 -.166 -.401 .36 X2 .270 1.000 .269 .041 -.067 .346 .271 -.390 .55
X3 .164 .269 1.000 .319 -.243 .193 -.018 -.303 .55
X4 -.029 .041 .319 1.000 -.037 .052 .204 -.283 .27
X5 .246 -.067 -.243 -.037 1.000 .052 .323 -.430 -.18
X6 .072 .346 .193 .052 .052 1.000 .281 -.080 .26
X7 -.166 .271 -.018 .204 .323 .281 1.000 -.257 .15
X8 -.401 -.390 -.303 -.283 -.430 -.080 -.257 1.000 -.44
X9 .361 .558 .559 .271 -.184 .260 .150 -.443 1.00
X10 .412 .398 .554 -.041 -.012 .331 .039 -.265 .49
X11 .280 .451 .322 .247 .142 .236 .084 -.463 .60
X12 -.471 -.049 -.480 -.101 -.013 -.294 .192 .078 -.47
Correlation Matrix
VAR00001 VAR00002 VAR00003 VAR00004 VAR00005
Correlation VAR00001 1.000 -.443 -.265 -.463 .078
VAR00002 -.443 1.000 .499 .607 -.474
VAR00003 -.265 .499 1.000 .356 -.529
VAR00004 -.463 .607 .356 1.000 -.437
VAR00005 .078 -.474 -.529 -.437 1.000
Inverse of Correlation Matrix