高级统计学-判别分析作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全国各地区消费水平的实例判别分析

摘要:针对我国各省(直辖)市的2009年度消费水平数据,选取9个经济指标进行系统聚类分析,得到我国3类不同的地区消费水平类型;利用实例进行判别分析, 结合实际情况分析结果。聚类结果为制订有针对性的地区消费市场战略提供依据。关键词:SPSS;判别分析;消费水平。

1.引言

由于传统的经济发展起点不同,加上地域、资源、技术和政策等条件的差异,各个地区的经济发展水平高低不齐,导致各地区的工资水平和消费水平的不同。因此,对各地区消费水平进行分类、比较和研究,总结出有助于市场调节和商业发展的对策,有针对性地制订地区经济发展战略,对促进国民经济协调发展有重要

意义。聚类分析和判别分析是是进行以上分析的两个重要的方法。

1.1判别分析

定义:判别分析是一种进行统计判别和分组的技术手段。根据一定量案例的一个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量之间的数量关系,建立判别函数,然后便可以利用这一数量关系对其他未知分组类型

所属的案例进行判别分组。

判别分析的基本思想:对已知分类的数据建立由数值指标构成的分类规则即判别函数,然后把这样的规则应用到未知分类的样本去分类。

本文针对我国各省(直辖)市的2009年度消费消费价格分类指数数据,考虑到数据的可得性和来源的权威性,选取9个消费指标进行系统聚类分析并假定上年相应价格指数为100,得到我国3类不同的地区消费水平类型;并利用实例进行判别分析,以确认聚类效果。聚类结果将为制订有针对性的地区经济发展战略提供依据。下述数据来源于《中国统计摘要-2010》,利用社会经济统计软件SPSS19.0建立数据库并对数据进行分析处理。

表-1:国内31个省、直辖市、自治区的9项消费指标数据

其中,北京、河北、山东、贵州、重庆五省、直辖市、自治区将作为实例样本数据利用判别分析进行分组归类,以检验聚类分析中的聚类结果。

2.判别分析

2.1判别分析步骤

将国内21省、直辖市、自治区的9项消费价格指标数据输入SPSS,做判别分析,具体步骤为:

(1)在数据编辑窗口的主菜单中选择“分析(A)”→“分类(F)”→“判别(D)”(如图-1所示)。

图-1

(2)弹出“判别分析”对话框,将“Group”变量选入“分组变量(G)”中,设置定义变量组的范围为1到3,将其他变量选入“自变量”中,并选择“使用步进式方法”如图-2所示。

图-2

(3)单击“统计量(S)”按钮,如图-3所示,依次选择“均值”、“单变量ANOV A”、“Box’s M”、“Fisher”、“未标准化”选项,各个选项表达的意思分别为:进行均数估计;进行各组均值相等检验;各组协方差阵相等检验;生成Fisher判别方程系数;生成Bayes判别方程系数。“方法(M)”保持默认设置。

图-3

(4)单击“分类(C)”按钮,如图-4所示,依次选择“根据组大小计算”、“个案结果”、“摘要表”、“不考虑该个案时的分类”、“在组内”、“合并图”选项,各选项相应意义分别为:选择样本量百分比为先验概率;显示每个单位判别后所属类别;显示判别符合率表;剔出某观察单位所建立的判别函数判别该观察单位所属类别;组内协方差阵;类别显示在同一散点图中。

图-4

(5)单击“保存(A)”按钮,如图-5所示,依次选择“预测组成员”、“判别得分”、“组成员概率”选项,各选项意义分别为:在数据中保存判别后数据所属类别;在数据中保存数据的判别分;观察单位属于某一类的概率。

图-5

(6)点击图-2中“确定”按钮开始进行判别分析。

2.1

表-2中分别为有效个案、缺失个案和个案总数的个数和百分数。此表中表明有21个变量100%录入,没有缺失值。

表-3显示的是各自变量的方差分析及λ统计量,λ统计量在0到1之间,越接近与0组间差异越显著,越接近与1组间差距越小。Sig.表示三类分组中各变量的差异程度,小于0.05有显著差异。

表-4中可以看到各个类别中变量及总变量的均值、方差和标准差等。

表-5汇聚的组内矩阵

表-5表示的是各变量之间的相关性矩阵。

表-6反映的是协方差阵的秩和行列式的对数值。由行列式的值可以看出,协方差阵不是病态矩阵。

表-7检验结果

箱的M 20.333

F 近似。 1.231

df1 12

df2 881.601

Sig. .257

对相等总体协方差矩阵的零假

设进行检验。

表-7是对个总体协方差阵是否相等的统计检验。由于Sig.大于0.05,我们接受原假设。采用组内协方差矩阵。

表-8中可以看出软件最终选取居民消费价格指数、衣着、家庭设备用品及服务为最终判别函数的自变量,其对应Sig.均为零,显著性很强。三个变量可以很好的表达不同组别的特性。

表-9是特征值表,从表显示出典型分析最终形成两个判别函数,判别函数F1的特征值为8.910,判别函数F2的特征值为0.997,可见判别函数F1的判别能力大于F2。方差百分比的算法为:

89.9%=8.910/(8.910+0.997)

10.1%=0.997/(8.910+0.997)

函数F1能够解释绝大部分方差。典型相关系数现实第一队典型变量的相关系数是0.948,第二对典型变量的相关系数是0.707。

表-10是判别函数显著性检验。原假设都是所列判别函数不显著。可见在0.05的显著性水平下,用F1、F2两个判别函数判别,Sig.=0.000,判别效果显著;单用F2判别,Sig.=0.003,判别效果显著。

表-11是标准化典型判别函数的系数,这里的*表示标准化变量,写成函数:

y1=0.946*X*1+0.17*X*4+0.535X*5

***

表-12是结构矩阵,即判别载荷。由判别权重和判别载荷可以看出,前5个变量对第一个判别函数贡献大,后4个变量对第二个判别函数贡献大。

表-13是非标准化的判别函数,我们可以根据这个判别函数计算每个观察的判别得分,表示为:

相关文档
最新文档