多元统计分析作业一
多元统计分析填空和简答(一).doc
1.多元分析研究的是多个随机变量及其相互关系的统计总体。
2.多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。
3.协方差和相关系数仅仅是变量间离散程度的一种度量,并不能刻画变量间可能存在的关联程度。
4.人们通过各种实践,发现变量之间的相互关系可以分成相关和不相关两种类型。
5.总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为p 和n-p-1,其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。
7.偏相关系数是指多元回归分析中,当其他变量固定后,给定的两个变量之间的的相关系数。
8.Spss中回归方程的建模方法有一元线形回归、多元线形回归、岭回归、多对多线形回归等。
9.主成分分析是通过适当的变量替换,使新变量成为原变量的综合变量,并寻求相关性的一种方法。
10.主成分分析的基本思想是:设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
11.主成分的协方差矩阵为对角矩阵。
12.主成分表达式的系数向量是相关系数矩阵的特征向量。
13.原始变量协方差矩阵的特征根的统计含义是原始数据的相关系数。
14.原始数据经过标准化处理,转化为均值为0 ,方差为1 的标准值,且其协方差矩阵与相关系数矩阵相等。
15.样本主成分的总方差等于1 。
16.变量按相关程度为,在相关性很强程度下,主成分分析的效果较好。
17.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为方差贡献度。
19.因子分析是把每个原始变量分解为两部分因素,一部分是公共因子,另一部分为特殊因子。
20.变量共同度是指因子载荷矩阵中第i行元素的平方和。
21.公共因子方差与特殊因子方差之和为 1 。
22.聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的亲疏程度进行科学的分类。
23.Q型聚类法是按样品进行聚类,R型聚类法是按变量进行聚类。
应用多元统计分析作业
多元统计分析实验报告实验课程名称多元统计分析实验项目名称多元统计理论的计算机实现年级 2013专业应用统计学学生姓名侯杰成绩理学院实验时间:2015 年05 月07 日学生所在学院:理学院专业:应用统计学班级:9131137001代码及运行结果分析1、均值检验问题重述:某医生观察了16名正常人的24小时动态心电图,分析出早晨3小时各小时的低频心电频谱值(LF)、高频心电频谱值(HF),数据见压缩包,试分析这两个指标的各次重复测定均值向量是否有显著差异。
代码如下:Tsq.test<-function(data,alpha=0.05){data<-as.matrix(read.table("ch37.csv",header=TRUE,sep=",")) #读取数据xdat<-data[,2:4];xbar<-apply(xdat,2,mean); #计算LF指标的均值ydat<-data[,5:7];ybar<-apply(ydat,2,mean); #计算HF指标数据xcov<-cov(xdat); #计算LF样本协差阵ycov<-cov(ydat); #计算HF样本协差阵sinv<-solve(xcov+ycov);#求逆矩阵Tsq<-(16+16-2)*t(sqrt(16*16/(16+16)*(xbar-ybar)))%*%sinv%*%sqrt(16*16/(16+16)*(xbar-ybar)); #计算T统计量Fstat<-((16+16-2)-3+1)/((16+16-2)*3)*Tsq; #计算F统计量pvalue<-as.numeric(1-pf(Fstat,3,16+16-3-1));cat("p值=",pvalue,"\n");if(pvalue>0.05) #结果输出cat('均值向量不存在差异')elsecat('均值向量存在差异');}运行结果及分析:通过运行程序,我们可以得到如下结果:> Tsq.test()p值= 1.632028e-14均值向量存在差异即LF与HF这两个指标的各次重复测定均值向量存在显著差异。
《多元统计分析》习题
《多元统计分析》习题分为三部分:思考题、验证题和论文题思考题第一章绪论1﹑什么是多元统计分析?2﹑多元统计分析能解决哪些类型的实际问题?第二章聚类分析1﹑简述系统聚类法的基本思路。
2﹑写出样品间相关系数公式。
3﹑常用的距离及相似系数有哪些?它们各有什么特点?4﹑利用谱系图分类应注意哪些问题?5﹑在SAS和SPSS中如何实现系统聚类分析?第三章判别分析1﹑简述距离判别法的基本思路,图示其几何意义。
2﹑判别分析与聚类分析有何异同?3﹑简述贝叶斯判别的基本思路。
4﹑简述费歇判别的基本思路。
5﹑简述逐步判别法的基本思想。
6﹑在SAS和SPSS软件中如何实现判别分析?第四章主成分分析1﹑主成分分析的几何意义是什么?2﹑主成分分析的主要作用有那些?3﹑什么是贡献率和累计贡献率,其意义何在?4﹑为什么说贡献率和累计贡献率能反映主成分中所包含的原始变量的信息?5﹑为什么要用标准化数据去估计V的特征向量与特征值?6﹑证明:对于标准化数据有S=R。
7﹑主成分分析在SAS和SPSS中如何实现?第五章因子分析1﹑因子得分模型与主成分分析模型有何不同?2﹑因子载荷阵的统计意义是什么?3﹑方差旋转的目的是什么?4﹑因子分析有何作用?5﹑因子模型与回归模型有何不同?6﹑在SAS和SPSS中如何实现因子分析?第六章对应分析1﹑简述对应分析的基本思想。
2﹑简述对应分析的基本原理。
3﹑简述因子分析中Q型与R 型的对应关系。
4﹑对应分析如何在SAS和SPSS中实现?第七章典型相关分析1﹑典型相关分析适合分析何种类型的数据?2﹑简述典型相关分析的基本思想。
3﹑典型变量有哪些性质?4﹑典型相关系数和典型变量有何意义?5﹑典型相关分析有何作用?6 ﹑在SAS和SPSS中如何实现典型相关分析?验证题第二章聚类分析1、为了更深入了解我国人口的文化程度,现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析。
分析选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人都占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分别用来反映较高、中等、较低文化程度人口的状况。
多元统计分析方法练习题
2. 3.9 36.9 12.7
4. 4.5 58.8 12.3
6. 3.5 27.8 9.8
8. 4.5 40.2 8.4
10. 1.5 13.5 10.1
12. 8.5 56.4 7.1
14. 4.5 71.6 8.2
16. 6.5 52.8 10.9
18. 4.1 44.1 11.2
5.8 9.6 3.0 6.9 9.9 3.9
6.5 9.6 4.1 6.1 9.5 1.9
6.5 9.2 0.8 6.3 9.4 5.7
高拉速(B2)6.7 9.1 2.8 7.1 9.2 8.4
6.6 9.3 4.1 7.0 8.8 5.2
7.2 8.3 3.8 7.2 9.7 6.9
7.1 8.4 1.6 7.5 10.1 2.7
49 81.42 8.95 44 180 185 49.156
57 73.37 12.63 58 174 176 39.407
54 79.38 11.17 62 156 165 46.080
51 73.71 10.47 59 186 188 45.790
57 59.08 9.93 49 148 155 50.545
4155.3 45.0 74.0 4 150.0 50.2 87.0
5152.0 35.0 63.0 5 144.0 36.3 68.0
6158.3 44.5 75.0 6 160.5 54.7 86.0
7154.8 44.5 74.0 7 158.0 49.0 84.0
8164.0 51.0 72.0 8 154.0 50.8 76.0
3 142 89 138 99 138 99 142 108
多元统计分析作业1
一、聚类分析为了研究2010年全国各地区城镇居民家庭平均每人全年消费性支出的分布规律,根据抽样调查资料进行分类处理,共抽取31个省、市、自治区的样本,每个样本有7个指标:食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务。
这7个指标反映了平均每人生活消费的支出情况,其数据资料见下表1所示。
表1定义变量及标签:设:X1:地区X2:食品支出X3:衣着支出X4:居住支出X5:家庭设备用品及服务支出X6:医疗保健支出X7:交通和通信支出X8:教育文化娱乐服务支出通过SPSS软件操作,得到如下输出结果见表2—表5所示。
表2表3表4表4给出了聚类的凝聚过程情况。
表5给出了样品聚为三类时的样品归类情况。
C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+甘肃 28 -+青海 29 -+新疆 31 -+河北 3 -+---+山西 4 -+ |河南 16 -+ |宁夏 30 -+ |黑龙江 8 -+ +-------+陕西 27 -+ | |云南 25 -+-+ | |西藏 26 -+ | | |广西 20 -+ +-+ |海南 21 -+ | |江西 14 -+-+ |贵州 24 -+ +-----------------------------------+ 湖北 17 -+ | | 湖南 18 -+ | | 四川 23 -+ | | 安徽 12 -+ | | 江苏 10 -+-+ | | 福建 13 -+ | | | 辽宁 6 -+ +---------+ | 吉林 7 -+ | | 山东 15 -+-+ | 重庆 22 -+ | 内蒙古 5 -+ | 天津 2 -+ | 浙江 11 -+-+ | 北京 1 -+ +-+ | 广东 19 ---+ +-------------------------------------------+ 上海 9 -----+图1图1是聚类全过程的树形图。
最新多元统计分析作业
多元统计分析作业海洋地球化学多元统计分析作业一、预备工作:数据的输出管理首先设置File output manager output manager中,选中individual wind。
Also send to Report wind中,选中single report。
二、数据的导入数据表(data.xls)为一个深海沉积物柱中30个样品分析结果。
第1列为样品编号,第2列为样品的采样深度(单位),第三列起为分析的各元素含量。
将data.xls 数据导入Statistica worksheet中 (操作步骤为菜单Fileopen …data.xls)三、数据(图表)的输出统计分析过程中生成的结果都可以输出到Word文档中(菜单as …或PrtSc,粘贴到word中)。
对生成的图表,还可先菜单File Add to report,再粘贴到word中。
本项上机实习需完成以下统计分析一、相关及回归分析(Correlation matrices)1、分析两组分Co-Ni, CaO-Sr,Fe2O3-MnO,的相关关系,做出相关关系图,拟合出回归方程。
图1 Co-Ni 相关关系图图2 CaO-Sr 相关关系图图3 Fe2O3-MnO 相关关系图2、做出三组分Cu-Pb-Zn;Sr-Cu-CaO之间的散点图 (scatterplot) 。
图4 Cu-Co-Ni 散点图图5 Sr-Cu-CaO 散点图3、计算CaO、Co、Cu、Fe2O3、MnO、Ni、Sr之间的相关关系矩阵。
表1 沉积物中元素相关关系矩阵 (n=30,p<0.05)CaO Fe2O3MnO Co Cu Ni SrCaO 1.00Fe2O3-0.23 1.00MnO 0.18 0.18 1.00Co -0.21 0.85 0.41 1.00Cu -0.02 -0.01 0.36 0.26 1.00Ni -0.10 0.96 0.24 0.88 -0.03 1.00Sr 0.97 -0.25 0.23 -0.20 0.09 -0.13 1.00二、聚类分析(Cluster analysis)1、首先将数据进行标准化(分别进行和列的标准化),得到标准化的数据集。
应用多元统计作业一
作业一1-1解:(1)分析:从上面两图中可以看出,成年男子肺活量越大,其跑1.5英里所用的时间越少;并且随着成年男子年龄的增长,其肺活量呈现下降趋势。
(2)用SPSS作出七个变量的散布图如下:(3)绘制序号为1,2,21,22的四个人的雷达图:其中系列1,2,3,4分别表示绘制序号为1,2,21,22的四个人的数据绘制序号为1,2,21,22的四个人的轮廓图: 程序代码:X=[57 73.37 12.63 58 174 176 39.407; 54 79.38 11.17 62 156 165 46.08; 49 73.37 10.08 76 168 168 50.388; 44 89.47 11.37 62 178 182 44.609]t={'age','weight','time','spulse','rpulse','mpulse','OXY'}line([1:7],X')set(gca,'XTicklabel',t)ageweighttimespulserpulsempulseOX Y020406080100120140160180200其中各颜色轮廓线表示意义同上(3)绘制序号为1,2,21,22的四个人的调和曲线图:程序代码:t=-pi:pi/20:pi;y1=57/sqrt(2)+73.37*sin(t)+12.63*cos(t)+58*sin(2*t) +174*cos(2*t)+176*sin(3*t)+39.407*cos(3*t);y2=54/sqrt(2)+79.38*sin(t)+11.17*cos(t)+62*sin(2*t) +156*cos(2*t)+165*sin(3*t)+46.08*cos(3*t);y3=49/sqrt(2)+73.37*sin(t)+10.08*cos(t)+76*sin(2*t) +168*cos(2*t)+168*sin(3*t)+50.388*cos(3*t);y4=44/sqrt(2)+89.47*sin(t)+11.37*cos(t)+62*sin(2*t) +178*cos(2*t)+182*sin(3*t)+44.609*cos(3*t);plot(t,y1,t,y2,t,y3,t,y4,'linewidth',3)xlabel('t'),ylabel('f(t)')legend('f1(t)','f2(t)','f21(t)','f22(t)')-4-3-2-101234-300-200-1000100200300400500tf (t )f1(t)f2(t)f21(t)f22(t)其中f1(t),f2(t),f21(t),f22(t)分别表示绘制序号为1,2,21,22的四个人数据所对应的调和曲线。
应用多元统计分析试题及答案
一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为 Q型聚类和 R型聚类。
4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。
5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。
6、若()(,), Px N αμα∑=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。
二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。
选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。
被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
2、简述相应分析的基本思想。
相应分析,是指对两个定性变量的多种水平进行分析。
设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。
对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。
要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。
相应分析即是通过列联表的转换,使得因素 A 和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。
把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。
3、简述费希尔判别法的基本思想。
从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。
将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
北师大应用多元统计分析作业——主成分分析
应用多元统计分析作业(一)——主成分分析 8‐1:用主成分分析方法探讨城市工业主体结构。
解:执行SAS程序代码:data dxiti81;input number x1-x8;cards;1 90342 52455 101091 19272 82 16.1 197435 0.1722 4903 1973 2035 10313 34.2 7.1 592077 0.0033 6735 21139 3767 1780 36.1 8.2 726396 0.0034 49454 36241 81557 22504 98.1 25.9 348226 0.9855 139190 203505 215898 10609 93.2 12.6 139572 0.6286 12215 16219 10351 6382 62.5 8.7 145818 0.0667 2372 6572 8103 12329 184.4 22.2 20921 0.1528 11062 23078 54935 23804 370.4 41 65486 0.2639 17111 23907 52108 21796 221.5 21.5 63806 0.27610 1206 3930 6126 15586 330.4 29.5 1840 0.43711 2150 5704 6200 10870 184.2 12 8913 0.27412 5251 6155 10383 16875 146.4 27.5 78796 0.15113 14341 13203 19396 14691 94.6 17.8 6354 1.574;proc princomp data=dxiti81 out=oxiti81;var x1-x8;run;proc sort data=oxiti81;by prin1;proc print;id number;var prin1;run;proc sort data=oxiti81;by prin2;proc print;id number;var prin2;run;proc sort data=oxiti81;by prin3;proc print;id number;var prin3;run;proc plot;plot prin2*prin1=number;run;proc cluster data=oxiti81 method=ave pseudo ccc outtree=tr81;var x1-x8;id number;proc tree data=tr81 horizontal graphics;run;结果分析:◆我们使用原始数据的相关系数矩阵计算特征根矩阵。
应用多元统计分析作业
应用多元统计分析作业多元统计分析是一种广泛应用于科学研究和商业决策中的数据分析方法。
它通过同时考虑多个变量之间的关系和差异,能够更全面地了解数据的特征和规律。
本文将介绍多元统计分析的应用及其在作业中的实际运用。
首先,多元统计分析在科学研究中具有广泛的应用。
研究人员可以通过多元统计方法来探索不同变量之间的关系,发现隐藏在数据背后的规律。
例如,在医学领域中,研究人员可以使用多元统计分析来研究疾病的发病机制和影响因素。
他们可以收集患者的各种指标数据,并通过多元统计分析方法来确定哪些变量与疾病的发展和治疗效果相关。
这有助于为疾病的早期诊断和治疗提供科学依据。
其次,多元统计分析在商业决策中也有重要的应用。
企业可以使用多元统计方法来了解市场需求、消费者行为和产品特点等因素之间的关系。
通过收集大量的市场调查数据,企业可以使用多元统计分析来找出不同群体之间的差异和共同点。
这有助于企业更好地了解消费者的需求,优化产品设计和市场推广策略,提高企业竞争力。
在学术研究和商业决策中,多元统计分析方法的应用是非常复杂的,需要使用专门的统计软件进行计算和分析。
例如,研究人员可以使用SPSS、SAS等统计软件来进行多元方差分析、主成分分析、聚类分析等多元统计分析方法。
这些软件提供了丰富的统计工具和图表,可以通过可视化方式展示数据分析结果,便于研究人员和决策者进行数据分析和决策。
在作业中,多元统计分析也是一个重要的课题。
学生可以使用多元统计分析方法来解决实际问题,提高数据处理和分析的能力。
例如,学生可以选择一个感兴趣的研究主题,收集相关数据,并使用多元统计分析方法来探索不同变量之间的关系。
这有助于学生深入了解数据分析方法的原理和应用,提高解决实际问题的能力。
总之,多元统计分析是一种有效的数据分析方法,广泛应用于科学研究和商业决策中。
它能够帮助人们更全面地了解数据的特征和规律,并提供科学依据来支持决策。
在作业中,多元统计分析也是一个重要的课题,可以帮助学生提高数据处理和分析的能力。
(完整版)多元统计分析课后练习答案
第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z 标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
多元统计大作业2017.5.21.doc
北方民族大学多元统计分析作业题目:主成分分析应用一、题目:研究31个省市自治区九项经济指标的主成分析2013年全国各地区经济发展状况的分布规律,我们对全国31个省市自治区的经济发展基本情况进行主成分分析,每个样本有9个指标:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、社会消费品零售总额、居民消费价格指数、商品零售价格指数、工业总产值。
根据上述指标体系,选取2013年我国各地区对应指标的数据,数据来源于《2014年中国统计年鉴》。
其数据资料见下表1所示。
表1二、对指标数据的主成分分析定义变量及标签:X1 : GDPX2 :居民消费水平X3 :固定资产投资X4 :职工平均工资X5 :货物周转量X6 :社会消费品零售总额X7 :居民消费价格指数X8 :商品零售价格指数X9 :工业总产值三、分析过程按照主成分分析方法的实现步骤,运用SPSS统计分析软件,首先对数据资料是否符合主成分分析方法的要求进行判断,采用软件中KMO and Bartlett’s Test检验方法。
表2KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling.756Adequacy.Approx. Chi-Square 389.427Bartlett's Test ofSphericitydf 36Sig. .000表2知:KMO =0.756>0.5,KMO表示偏相关较小。
and Bartlett's Test检验的p=0.000<0.05,即变量间不独立,存在相关关系。
综上述而言适合于主成分分析。
表3 Correlation MatrixGDP(亿元)x1 居民消费水平(元)x2固定资产投资(亿元)x3职工平均工资(元)x4货物周转量(亿吨)x5社会消费品零售总额(亿元)x6居民消费价格指数x7商品零售价格指数x8工业总产值(亿元)x9Correlation GDP(亿元)x1 1.000 .421 .882 .065 .654 .992 -.554 -.412 .973居民消费水平(元)x2.421 1.000 .133 .844 .466 .420 -.266 -.692 .481 固定资产投资(亿元)x3.882 .133 1.000 -.232 .638 .860 -.555 -.218 .854 职工平均工资(元)x4.065 .844 -.232 1.000 .164 .067 .087 -.515 .159 货物周转量(亿吨)x5.654 .466 .638 .164 1.000 .630 -.549 -.382 .659 社会消费品零售总额(亿元)x6.992 .420 .860 .067 .630 1.000 -.553 -.440 .960居民消费价格指数x7-.554 -.266 -.555 .087 -.549 -.553 1.000 .676 -.475 商品零售价格指数x8-.412 -.692 -.218 -.515 -.382 -.440 .676 1.000 -.393 工业总产值(亿元)x9.973 .481 .854 .159 .659 .960 -.475 -.393 1.000由表3知:相关系数矩阵(Correlation Matrix),由相关系数矩阵可以看到,除了商品零售价格指数与居民消费价格指数两指标与其他指标的相关性较低外,其他指标之间均有很强的相关性,可以尝试进行主成分分析。
多元统计分析课题设计作业
课程名称:多元统计分析方法与SAS软件题目:运用多元统计分析某市综合医院的经营状况评价及发展战略日前,为适应进一步深化医药卫生体制改革的要求,加强对公立医院综合改革试点的指导,国家卫计委先后发布了《国务院办公厅关于全面推开县级公立医院综合改革的实施意见》和《国务院办公厅关于城市公立医院综合改革试点的指导意见》,要求公立医院充分发挥公益性质和主体作用,努力满足广大人民群众的医疗服务需求,这也敦促公立医院在医疗管理、医疗服务方面进行积极的调整和改革,以更大发挥各自的优势,并确定其主要的医疗发展方向与服务定位,使其在日趋激烈的医疗服务竞争中取得更好的社会效益。
各级医院及医疗单位的发展与定位需要对其现有的医疗管理水平、医疗服务经营状况进行恰当、实事求是的认识与评价,并进行相互比较,从而制定相应的发展战略。
目前,各级医院对其医疗管理水平、医疗服务水准及相互间的医疗服务定位比较缺乏科学,定量的分析。
因此,本课题设计选取某市有代表性的县级及县级以上综合医院,采用多元统计的因子分析与聚类分析,分析各个医院的医疗经营状况,从而更好的反应管理水平,明确各自地位,为继续深化体制改革提供参考。
一、指标体系的建立。
医院的经营状况是一个涵盖内容很广的概念,统计分析需要首先对众多指标进行科学的筛选,挑选出具有代表性、灵敏性、可靠性的指标,组成综合评价的指标体系。
医院的业务工作量反映一个医院接纳患者的人数;平均每个医生的负担体现医生工作量;业务收支比率反映医院的财务状况;病人负担表现医院接纳的病人所负担的各项费用。
按照以上筛选指标的标准,建立如下指标体系:X1---医院门急诊诊疗人次(人次),X2----医院出院人数(人),X3----医院实际占用总床日(床日),X4----平均每个医生负担的诊疗人次(人次),X5---平均每个医生负担的住院总床日(床日),X6---平均每个医生年业务收入(元),X7---医院业务收支比率(%),X8---平均每诊疗人次医疗费(元),X9---平均每一出院者住院医疗费(元),X10----出院者平均每天住院医疗费(元)二、经营状况的统计分析根据2013年某市卫生计财信息资料汇编,获得某市部分县级及县级以上综合医院的主要经营指标。
多元统计分析
多元统计分析习题集(一)一、填空题1.若()(,),(1,2,,)p X N n αμα∑= 且相互独立,则样本均值向量X 服从的分布是____________________。
2.变量的类型按尺度划分为___________、____________、_____________。
3.判别分析是判别样品_____________的一种方法,常用的判别方法有_____________、_____________、_____________、_____________。
4.Q 型聚类是指对_____________进行聚类,R 型聚类指对_____________进行聚类。
5.设样品12(,,,),(1,2,,)i i i ip X X X X i n '== ,总体(,)p X N μ∑ ,对样品进行分类常用的距离有____________________、____________________、____________________。
6.因子分析中因子载荷系数ij a 的统计意义是_________________________________。
7.主成分分析中的因子负荷ij a 的统计意义是________________________________。
8.对应分析是将__________________和__________________结合起来进行的统计分析方法。
9.典型相关分析是研究__________________________的一种多元统计分析方法。
二、计算题 1.设3(,)X N μ∑ ,其中410130002⎛⎫ ⎪∑= ⎪ ⎪⎝⎭,问1X 与2X 是否独立?12(,)X X '与3X 是否独立?为什么?2.设抽了5个样品,每个样品只测了一个指标,它们分别是1,2,4.5,6,8。
若样品间采用绝对值距离,试用最长距离法对其进行分类,要求给出聚类图。
多元统计分析作业
3-6 (均值向量各分量间的结构关系的检验)设总体),0(),(~>∑∑μp N X))(,,1()(p n n X >= αα为来自p 元正态总体X 的样本,记)',,(1p μμμ =.C 为p k ⨯常数)(p k <,r k C rank ,)(=为已知k 维向量.试给出检验r C H =μ:0的检验统计量与分布.解:令),,2,1()()(n CX Y ==μαα则),,1()(n Y =αα为来自k 维正态总体Y 的样本,且)',(~)(C C C N Y k ∑μα;记',C C C y y ∑=∑=μμ.检验:r H r C H y =⇐⇒=μμ::00这是单个k 维正态总体均值向量的检验问题.当'C C C y ∑∑=未知时均值向量的检测取检验统计量:),(~)1(2k n k F T kn kn F ---=其中).()(),(]'[)'()1()(][)'()1()(1)(112X X X XA r X C CAC r X C n n r Y A r Y n n T i ni i y --=---=---=∑=--3-11 表3.4给出15名2周岁婴儿的身高)(1X ,胸围)(2X 和上半臀围)(3X 的测量数据,假设男婴的测量数据)6,,1)(( =ααX 位来自总体),()2(3∑μN 的随机样本.试利用表3.4中的数据检验).05.0(:)2()1(0==αμμH表3.4某地区农村两周岁婴儿的体格测量数据解:这是两总体均值向量的检验问题.检验统计量取为:)9,6,3(===m n p)1,(~)2(102--+-+--+=p m n p F T pm n p m n F H 下其中)()()'()2(1212Y X A A Y X mn nmm n T -+-+-+=- 故检验统计量为))(()'(121Y X A A Y X mn nmp p m n F -+-+⨯--+=用观测数据代入计算可得:.4982.1,3117.52==F T显著性概率值 α=>=05.02693.0p故)05.0(:)2()1(0==αμμH 相容.4-3 设Y 与321,,x x x 有相关关系,其8组观测数据见表4.5.表4.5 观测数据(1)设εββββ++++=3322110x x x Y ,试求回归方程及决定系数2R 和均方误差2s ; (2)考虑二次回归模型:.3293182362252143322110εβββββββββ+++++++++=x x x x x x x x x x Y用逐步回归法筛选变量)05.0(==out in αα,并写出决定系数2R 和均方误差s .解:回归结果如下 Call:lm(formula 321~x x x y ++=)Residuals:1 2 3 4 5 6 7 81.4358 -0.4862 -2.2616 1.3942 1.0674 -2.6678 -0.8347 2.3528Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) -106.7267 13.5136 -7.898 0.001390 **1x 3.2518 0.4486 7.248 0.001923 ** 2x 1.3313 0.1491 8.927 0.000871 *** 3x -0.6746 0.3910 -1.725 0.159579---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 2.442 on 4 degrees of freedom Multiple R-squared: 0.9909, Adjusted R-squared: 0.9841 F-statistic: 145.4 on 3 and 4 DF, p-value: 0.0001543由回归分析结果可以看出回归方程为106.73 3.251 1.3320.673y x x x =-++-对应的回归系数为 99.02=R 均方误差计算得22.98s =5-1 已知总体)1(=m G i 的分布为)2,1)(,(2)(=i N i i σμ,按距离判别准则为(不防设21)2()1(,σσμμ<>)⎪⎩⎪⎨⎧≥≤∈<<∈.,,,,**2**1μμμμx x G x x G x 若若其中21)1(2)2(1*σσμσμσμ++=试求错判概率)1|2(P 和)2|1(P解:}{}{)},(~|{)},(~|{)1|2(111)1(11*1)1(21)1(21)1(***σμμσμσμμσμσμμσμμ-≥-+-≤-=≥+≤=X P X P N X X P N X X P P记.,12)1()2(1)1(12)2(1)1(21)1(21)1()2(1)1(21)1(2)2(11)1(**σσμμσμσσμσμσσμμσσμμσμσσμσμσσμμ--=⎥⎦⎤⎢⎣⎡--+=-=+-=⎥⎦⎤⎢⎣⎡-++=-=a b{}{})()()},(~|{)2|1(21)2()1(12)2()1(2)2(2)2(2)2(*2)2(22)2(***a b b U P a U P X P X P N X X P P Φ-Φ=⎪⎪⎭⎫⎝⎛+-Φ-⎪⎪⎭⎫ ⎝⎛--Φ=-≤--<=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤--⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-<-=<<=∴σσμμσσμμσμμσμσμμσμσμμμ)1,0(~(}{}{)1|2(N U a U P b U P P -≥+≤=)()(a b Φ+Φ=5-2 设三个总体321,G G G 和的分布分别为:)5.0,2(2N ,)1,3()2,0(22N N 和.试问样品5.2=x 应判归哪一类?(1)按距离判别准则;(2)按贝叶斯判别准则.,0,1)|(,31321⎪⎪⎭⎫ ⎝⎛⎩⎨⎧=≠====j i j i i j L q q q 取解: (1)按距离判别准则,当样品5.2=x 时,.25.01)35.2()(,5625.12)05.2()(,15.0)25.2()(222322222221=-==-==-=x d x d x d因为5625.1125.0<<,所以样品5.2=x 判归给3G .(2)按后验概率判别法(贝叶斯判别准则)计算样品x 属t G 的后验概率:)3,2,1()()()|(31==∑=t x f q x f q x t P i i i t t当样品5.2=x 时,经计算可得.3798.01172.00304.01613.01174.0)5.2|1(,0984.01172.00304.01613.00304.0)5.2|2(,5218.01172.00304.01613.01613.0)5.2|1(=++===++===++==x p x p x p因0984.03798.05218.0>>,所以样品判归给1G .8-2 已知题8-1中R 的特征值和特征向量分别为)'.1772.0,6379.0,7494.0(,3672.0,)'8432.0,4911.0,2186.0(,6795.0,)'5075.0,5932.0,6250.0(,9633.1332211--==--====l l l λλλ(1)取公共因子个数1=m 时,求因子模型的主成分解,并计算误差平方和)1(Q ; (2)取公共因子个数2=m 时,求因子模型的主成分解,并计算误差平方和)2(Q ; (3)试求误差平方和1.0)(<m Q 的主成分解.解:(1)1=m 的因子模型的主成分解为:.4943.00003091.00002331.0,7111.08312.08757.0)(11⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛==D l A λ⎪⎪⎪⎭⎫ ⎝⎛---=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛=+-=02411.001727.00979.0015911.016227.07279.01135.0145.063.01)'(1D AA R E 故1951.0)2411.01727.00979.0(2)1(22231312=++⨯==∑∑==i j ijQ ε(2)2=m 的因子模型的主成分解为:.01131.00001452.00002007.0,6950.07111.04048.08312.01802.08757.0)(2211⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛--==D l l A λλ,⎪⎩⎪⎨⎧+-=+-=+-=3213221212116950.07111.04048.08312.01802.08757.0εεεF F X F F X F F X⎪⎪⎪⎭⎫ ⎝⎛---=⎪⎪⎪⎭⎫ ⎝⎛-⎪⎪⎪⎭⎫ ⎝⎛=+-=00403.000475.01708.0013097.014975.08008.01135.0145.063.01)'(1D AA R E06611.0)0403.00475.01708.0(2)2(22231312=++⨯==∑∑==i j ijQ ε(3)因1.006611.0)2(<=Q ,故1=m 的主成分解满足要求.。
(完整word版)多元统计分析习题
1.已知n=4,p=3的一个样本数据阵143X =626,X S 833534ρ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦计算,,v,2.已知23514241130010322X ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦,用最短、最长、中间距离法聚类,并画出聚类树形图3.已知52=22⎡⎤∑⎢⎥⎣⎦,要求: ①求特征根12λλ, ②求特征向量12μμ,③构造主成分12,F F④计算1F 的方差Var(F 1)和2F 的方差Var(F 2)⑤计算()()()()11122122,,,,;;;F X F X F X F X ρρρρ4.设有12,G G 两个总体,从中分别抽取容量为3的样品如下:要求:(1)样本的均值向量()()12,XX 及离差阵12,S S(2)假定()()12==∑∑∑,用12,S S 联合估计∑(3)已知待判样品(27)X T=,分别用距离判别法、Fisher 判别法、Bayes 判别法判定X 的归属。
5.设111=n 个和122=n 个的观测值分别取自两个随机变量1X 和2X 。
假定这两个变量服从二元正态分布,且有相同的协方差阵。
样本均值向量和联合协方差阵为:⎥⎦⎤⎢⎣⎡--=111X ,⎥⎦⎤⎢⎣⎡=122X ,⎥⎦⎤⎢⎣⎡--=∑8.41.11.13.7。
新样品⎥⎦⎤⎢⎣⎡=21X ,要求用Bayes 法和Fisher 进行判别分析。
6.已知2变量协方差阵⎥⎦⎤⎢⎣⎡=∑3224,要求:(1)求∑的特征根及其对应的单位特征向量;(2)组建主成分1F 、2F ;(3)验证j j F Var λ=)(;(4)计算11x F ρ、21x F ρ。
7、试分析某海运学院100名新生的性别与来自的区域有无相关关系。
(20.05(1) 3.84χ=)8、已知4个样品3个数据的数据如下:44068644363X ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦,试求均值向量X 、协方差阵∑、相关阵R 。
9、已知随机向量X=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321x x x ,具有均值向量826X ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦和协方差阵,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=∑411161113。
多元统计因子分析作业
安徽省经济综合实力的评价指标体系(因子分析)一.原始数据及指标解释我们选取了反映安徽省经济综合实力的12个指标体系,分别为:x1--生产总值(亿元)X2---人均生产总值(元)X3--地方财政收入(万元)X4--人均地方财政收入(元) X5--财政支出 X6--就业人员平均工资(元)X7--规模以上工业增加值(亿元)X8--人均工业增加值(元)X9-农林牧渔业总产值(万元)X10--人均农林牧渔业总产值(元)X11-农民人均可支配收入(元) X12-社会消费品零售总额(万元)X13-人均社会消费品零售总额(元)数据来源于统计局数据,数据如表一:二.特征值及方差贡献率--确定因子个数按照特征值大于1的原则,选入3个公共因子,其累积方差贡献率为90.320%,特征值及累计贡献率,碎石图,因子载荷阵见表二:三.旋转后的因子载荷阵--1.给出因子模型 2.给出因子命名由于得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转,得到表三:计算因子得分,以各因子的方差贡献率占三个因子总方差贡献率的比重做为权重进行加权汇总,得出各省市县的综合得分F,既得F=(41.361*F1+37.392*F2+11.567*F3)/90.320以F1因子为X轴,F2因子为Y轴,画出各市县的因子得分图:四.结果分析由旋转后的因子载荷矩阵可以看出,公共因子F1在X2(人均生产总值),X4(人均地方财政收入),X6(就业人员平均工资),X8(人均工业增加值),X11(农民人均可支配收入),X13(社会消费品零售总额)上的载荷值都很大。
X6,X11是反映人均可支配收入的指标;X2是反映人均生产总值的指标;X8是反映工业发展规模的指标;X13是反映消费水平的指标;X4是反映地方财政的指标,政府作为国家的管理者和国有资产的所有者而获得的收入,在一定程度上反映了居民的收入水平。
因而F1为反映城市的工业化规模与人均收入和消费的关系的公共因子,在这个因子上得分越高,城市经济发展水平越高,城市工业化程度越高,人们的生活水平越高。
多元统计分析作业
海洋地球化学多元统计分析作业一、预备工作:数据的输出管理首先设置File output manager output manager中,选中individual wind。
Also send to Report wind中,选中single report。
二、数据的导入数据表(data.xls)为一个深海沉积物柱中30个样品分析结果。
第1列为样品编号,第2列为样品的采样深度(单位m),第三列起为分析的各元素含量。
将data.xls 数据导入Statistica worksheet中 (操作步骤为菜单File open …data.xls)三、数据(图表)的输出统计分析过程中生成的结果都可以输出到Word文档中(菜单File Save as …或PrtSc,粘贴到word中)。
对生成的图表,还可先菜单File Add to report,再粘贴到word中。
本项上机实习需完成以下统计分析一、相关及回归分析(Correlation matrices)1、分析两组分Co-Ni, CaO-Sr,Fe2O3-MnO,的相关关系,做出相关关系图,拟合出回归方程。
图1 Co-Ni 相关关系图图2 CaO-Sr 相关关系图图3 Fe2O3-MnO 相关关系图2、做出三组分Cu-Pb-Zn;Sr-Cu-CaO之间的散点图 (scatterplot) 。
图4 Cu-Co-Ni 散点图图5 Sr-Cu-CaO 散点图3、计算CaO、Co、Cu、Fe2O3、MnO、Ni、Sr之间的相关关系矩阵。
表1 沉积物中元素相关关系矩阵 (n=30,p<0.05)CaO Fe2O3MnO Co Cu Ni SrCaO 1.00Fe2O3-0.23 1.00MnO0.180.18 1.00Co-0.210.850.41 1.00Cu-0.02-0.010.360.26 1.00Ni-0.100.960.240.88-0.03 1.00Sr0.97-0.250.23-0.200.09-0.13 1.00二、聚类分析(Cluster analysis)1、首先将数据进行标准化(分别进行和列的标准化),得到标准化的数据集。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
出色完成30分
良好完成25分
基本完成20分
部分完成15分
初步完成5分
实验步骤
精益求精30分
比较完善25分
合乎要求20分
缺少步骤15分
少重要步骤5分
实验结论
(心得体会)
分析透彻20分
分析合理17分
合乎要求14分
结论单薄8分
难圆其说4分
工作态度
勇于探索20分
能够务实17分
中规中矩14分
华而不实8分
输出结果1-2
主体间因子
值标签
N
分类
边远及少数民族聚居区社会经济发展水平
9
全国经济平均发展水平
1
多变量检验a
效应
值
截距
Pillai的跟踪
.990
.000
Wilks的Lambda
.010
.000
Hotelling的跟踪
.000
Roy的最大根
.000
分类
Pillai的跟踪
.834
.101
Wilks的lambda
.166
.101
Hotelling的跟踪
.101
Roy的最大根
.101
a.精确统计量
4.实验结果(或心得体会):
通过实验,得出输出结果1-4是上面多重比较可信性的度量,并且由Sig.值可以让我们看到,比较检验是可信的。利用spss可将多指标数据进行良好的分析。
5.指导教师点评(总分100分,所列分值仅供参考,以下部分打印时不可以断页)
式中
(人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲)
分类
上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项 是因为不能肯定模型过原点。而模型没有通过显著性检验,意味着分类中的不同取值对Y的取值无显著影响,也就是说,不同分类的经济发展水平是相同的。
但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较。对此,对GLM模块的选项作如下设置:在GLM主对话框中点击Contrasts…按钮进入Contrasts对话框,在Change Contrasts框架中打开Contrasts右侧的下拉框并选择Simple,此时下侧的Reference Category被激活,默认是Last被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击Change按钮,Continue继续,OK进行,得到如下结果(见输出结果1-3)
课 程 名 称:多元统计回归分析
实 验 项 目:边远及少数民族聚居区和会经济发展水平
实 验 类 型:验证性
学 生 学 号:
学 生 姓 名:
学 生 班 级:
课 程 教 师:
实 验 日 期:2016-03-28
1.实验目的:
利用spss软件验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。
输出结果1-3
对比结果(K矩阵)
分类简单对比a
因变量
人均GDP
三产比重
人均消费
人口增长
文盲半文盲
级别1和级别2
对比估算值
假设值
0
0
0
0
0
差分(估计-假设)
标准误差
Sig.
.114
.656
.035
.355
.466
差分的95%置信区间
下限
上限
a.参考类别= 2
见输出结果1-3表示
(1)在显著性水平 的水平下,可以看到Sig.值分别为、、、、,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为元。人均GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别。
资料来源:《中国统计年鉴(1998)》,北京,中国统计出版社,1998。
五项指标的全国平均水平为:
3.实验步骤及结果:
解:(1)先利用SPSS软件检验各变量是否遵从多元正态分布(见输出结果1-1)
输出结果1-1
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
Df
Sig.
(2)在显著性水平 的水平下,可以看到Sig.值分别为、、、、均大于显著性水平 ,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别。
输出结果1-4
多变量检验结果
值
F
假设df
误差df
Sig.
Pillai的跟踪
.834
(2)提出原假设及备选假设
(3)做出统计判断,最后对统计判断作出具体的解释
SPSS的GLM模块可以完成多元正态分布有关均值与方差的检验。依次点选Analyze General Linear Mode lMultivariate……进入Multivariate对话框,将人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等这五项指标选入Dependent列表框,将分类指标选入Fixed Factor(s)框,点击OK运行,则可以得到如下结果(见输出结果1-2)。
边远及少数民族聚居区社会经济发展水平的指标数据
地区
人均GDP(元)
三产比重(%)
人均消费(元)
人口增长(%)
文盲半文盲(%)
内蒙古
5068
2141
广西
4076
2040
贵州
2342
1551
云南
4355
2059
西藏
3716
1551
宁夏
4270
1947
新疆
6229
2745
甘肃
3456
1612
青海
4367
2047
上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数n=9,所以此处选用Shapiro-Wilk统计量。则Sig.值分别为、、、、均大于显著性水平,由此可以知道,人均GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。
.101
Wilks的Lambda
.166
.101
Hotelling的跟踪
.101
Roy的最大根
.101
a.设计:截距+分类
b.精确统计量
上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。第二张表是多变量检验表,该表给出了几个统计量。由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的。实际上,GLM模型是拟合了下面的模型:
态度不端正0分
总 分
有抄袭剽窃行为则实验成绩记为零分,并且严重警告!!
教师签字: 日期: 年 月 日
注:验证性实验仅上交电子文档,设计性试验需要同时上交电子与纸质文档进行备份存档。
统计量
df
Sig.
人均GDP
.219
9
.200*
.958
9
.781
三产比重
.145
9
.200*
.925
9
.437
人均消费
.209
9
.200*
.873
9
.131
人口增长
.150
9
.200*
.949
9
.682
文盲半文盲
.246
9
.124
.898
9
.242
*.这是真实显著水平的下限。
a. Lilliefors显著水平修正
2.实验内容:
现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等9个内陆边远省区。选取人均GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占15岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异。