数据分析课程设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析课程设计
题目:四川农村居民的消费结构浅析
班级:2009级数学与应用数学1班
学号:20091615310028
姓名:张雪梅
指导老师:张燕
时间:2012年6月19日
【摘要】
随着人们生活水平的提高,消费结构也在日益变化,为了能够更好的为四川农村人们服务,更快的发展农村建设,让人们过上更好的生活。

在此,有必要研究农村人们的消费结构变化情况,以便做出正确的判断。

本文是基于四川统计年鉴中1995年—2010年中的14年的四川省农村居民人均纯收入与消费支出的相关数据,运用sas软件,采用因子分析方法,实证研究了该省农村居民的消费结构变动情况。

结论表明, 四川农村居民的生活质量有所提高,大多数人解决了住房、温饱等生活问题,对生活方面的支出有所减少,更多的开始关注文化教育和精神娱乐方面,最后给农村今后的发展提出了小小的建议。

【关键字】
四川省农村居民消费结构因子分析 sas
目录
摘要 (2)
关键字 (2)
目录 (3)
一、消费简介 (6)
1.消费结构概念 (6)
2 研究我省农村居民消费结构的必要性 (6)
二、因子分析概述 (7)
1、因子分析的概念和意义 (7)
2、因子分析的的数学模型 (7)
3、因子分析的基本步骤 (8)
4、因子的命名 (10)
5、计算因子得分 (10)
6、具体实施步骤 (10)
三、实证分析过程 (10)
1、数据的收集整理 (10)
2、相关系数矩阵的计算 (11)
3、因子载荷矩阵的计算 (12)
4、因子的方差贡献率及变量的共同度计算及分析 (14)
5、计算因子得分 (14)
四、结论与建议 (16)
1、结果分析 (16)
2、对于四川省农村居民消费结构的建议 (16)
五、参考文献 (18)
众所周知,我国的农村人口众多,一直以来农村居民的生活状况都在我国人们生活中占有突出重要的地位。

由于农业的特殊属性,农村居民往往既是消费者,又是直接的生产经营者和投资者,其生产消费和生活消费往往交织在一起,因此,中国农村居民收入来源复杂,支出去向多样。

居民消费结构不但能反映居民消费的具体内容,更能反映居民消费需求的满足情况,近年来随着经济的发展,社会生产力水平迅速提高,人民的生活水平也显著得到提高,消费质量和结构不断优化,很多人开始关注民生,开始用不同的方法来研究如何提高农村居民的生活质量。

王映,李晓慧,胡超根据凯恩斯的消费函数模型、统计学和计量经济学的方法,基于1993年到2007年的相关数据对四川省城镇居民消费水平和消费结构进行了实证分析,结果表明最多的项目为食品,其次为教育文化娱乐、衣着和居住,大体上各项消费支出是伴随收入的增加而增加,少数项目消费支出绝对额的减少是因为较多的增加了其他项目的消费支出。

2007年刘永贵根据扩展线性支出系统 ( ELES)模型的《我国四川农村居民消费结构变动趋势及财政对策研究》表明四川农村居民消费结构变动趋势基本上反映了四川农村居民随着收入的逐渐增加,消费结构的合理变动。

但同时,文教娱乐支出比重的逐步缩小却也反映了四川农村居民消费存在的某种盲目性,这种消费现状既不利于经济持续、快速、健康地发展, 也不利于农民知识水平的提高,进而从根本上影响农村经济的发展,影响农民生活的进一步提高,消费结构的进一步上档次。

因此,国家有必要从财政政策上给予进一步的支持, 从而进一步启动四川农村居民
的消费, 逐步实现四川农村居民消费结构的高级化。

经过几年的变化,通过本文的分析可知,相对于过去而言,居民对衣、食、住的消费需求已从追求数量转到追求质量,居民食品、医疗保健、交通通讯及服务支出比重增加速度已经开始放慢,更多的开始关注文化教育和精神娱乐,相应的支出也有所增加。

消费结构变化反映了需求的变动,因此分析消费结构的变动及其成因对合理引导消费、促进经济的发展都有重要的意义。

一、消费简介
1、消费结构概念
消费结构是指在一定的社会经济条件下人们在消费过程中消费的各种各样的消费数据的比例关系,它反映了人们消费的内容、水平和质量,同时也反映了人们消费需要的满足状况。

居民消费作为社会商品总消费的主体部分,具有持久性、稳定性和长期性的特点。

2、研究我省农村居民消费结构的必要性
市场经济条件下,消费结构的合理化是实现资源有效配置,引导产业结构调整,创造新的需求,实现企业技术创新的重要条件。

进入20世纪90年代以来,我国宏观经济形势发生了重大变化,占全国总人口70%的农村居民的消费需求对国民经济的影响不断增大,农村市场的需求不足严重影响了经济结构调整的方向,力度、效果和企业生产经营活动。

农村居民消费结构与经济、社会发展是否协调已成为关系到是否能为中国发展提供高素质劳动力、保证经济持续快速发展和社会安定的重大问题。

我国国情决定了农业、农村、农民问题是社会主义初级阶段面临的一个最基本的问题,在今后相当长的一个时期内,这个问题仍将是影响我国改革和发展进程的关键,在某种程度上可以说,“农民很苦,农民很穷,农业很危险”是我国经济发展的最大障碍,也是全面建设小康要解决的核心内容。

近年来随着我国经济体制改革的深入和居民可支配收入的增加,居民消费行为发生了深刻的变化,社会生产力水平迅速提高,人民的生活水平也显著得到提高,消费质量和结构不断优化,相对于过去而言,居民对衣、食、住的消费需求已从追求数量转到追求质量,居民食品支出比重不断下降,而医疗保健、交通通讯、文教娱乐及服务支出比重不断增加。

而这些变化过程主要反映在消费结构上,居民消费结构不但能反映居民消费的具体内容,更能反映居民消费需求的满足情况,因此分析消费结构的变动及其成因对合理引导消费、促进经济的发展都有重要的意义。

农村市场是省内的重要市场,农村居民消费结构是农村经济发展的一个重要问题,所以研究和认识四川省农村居民消费结构的变动,在十二五规划中提出要加强
社会主义新农村建设,加快发展现代农业。

坚持走中国特色农业现代化道路,提高农业综合生产能力、抗风险能力和市场竞争能力。

对于贯彻和落实科学发展观,实现四川小康社会的目标和率先发展,具有积极的意义。

二、因子分析概述
1、因子分析的概念和意义
在研究实际问题时往往希望尽可能多地收集相关变量,以期能对问题比较全面、完整的把握和认识。

但收集这些数据需投入许多精力,虽然它们能够较为全面、精确地描述事务,但是在实际数据模型中,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来许多问题,可以表现在:①计算量的问题。

②变量之间相关性问题。

变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。

为解决上述问题,最简单和最直接的解决方案是在削减变量个数的同时不会造成信息的大量丢失。

而因子分析正是这样一种能够有效降低变量维数,研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性,并已得到广泛应用的多元统计分析方法。

2、 因子分析的的数学模型
因子分析的核心是用较少的相互独立的因子反映原有变量的绝大部分信息。

可以将这一思想用数学模型来表示。

设有p 个原有变量123,,,...,p x x x x ,且每个变量(或经标准化处理后)的均值均为0,标准差均为1。

现将每个原有变量用()k k p <个因子123,,,...,p f f f f 的线性组合来表示,则有
111121311123221222322123123123...............k k k k p p p p pk p k f f f f x a a a a f f f f x a a a a f f f f x a a a a εεε⎧=+++++⎪=+++++⎪⎨⎪⎪=+++++⎩
(2.1)
式(2.1)便是因子分析的数学模型,也可以用矩阵的形式表示为:
X AF ε=+
式中,F 称为因子,由于它们均出现在每个原有变量的线性表达式中,因此又称为公共因子。

因子可理解为高维空间中互相垂直的k 个坐标轴;A 称为因子载荷矩阵,a ij (1,2,3,...,i p =;1,2,3,...,j k =)称为因子载荷,是第i 个原有变量在第j 个因子上的负荷。

如果把变量x i 看成k 维因子空间中的一个向量,则a ij 表示x i 在坐标轴f j 上的投影,相当于多元线性回归模型中的标准化回归系数;ε称为特殊因子,表示原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。

3、因子分析的基本步骤
(1)因子分析的前提条件
因子分析的目的是从众多的原有变量中综合出少数具有代表性的因子,这必定有一个潜在的前提要求,即原有变量之间应具有较强的相关关系。

本文采用pearson 相关系数矩阵进行检验,如果变量间有显性的线性关系,则可以用因子分析。

(2)因子提取和因子载荷矩阵的求解
因子分析的关键是根据样本数据求解因子载荷矩阵。

在此我们介绍最为广泛的主成分分析法。

主成份分析法通过坐标变换的手段,将原有的p 个相关变量x i 标准
化后进行线性组合,转换成另一组不相关的变量y i ,于是有
1211121311321221222323121233y ...y .........y ...p p p p p p p p p pp x x x x x x x x x x x x μμμμμμμμμμμμ=++⎧++⎪=++++⎪⎨⎪⎪=++++⎩
(2.2)
式(2.2)是主成分分析的数学模型。

其中,2222123....1i i i ip μμμμ++++=(1,2,3,...,i p =)对式(2.2)中的系数按照以下原则来求解:
(a )y i 与y j (i j ≠;,1,2,3,...,i j p =)相互独立。

(b )1y 与123,,,...,p x x x x 的一切线性组合(系数满足上述方程组)中方差最大的;
2y 是与1y 不相关的123,,,...,p x x x x 的一切线性组合中方差最大的;y p 是与1y ,2y ,…,1y p -都不相关的123,,,...,p x x x x 一切线性组合中方差最大的。

根据上述原则确定的1y ,2y ,3y , … ,1y p -依次称为原有变量1x ,2x ,3x ,…,p
x 的第1,2,3,….,p 个主成分。

其中,y i 在总方差中所占比例最大,它综合原有变量
1x ,2x ,3x ,….,p x 的能力最强,其余主成分2y ,3y ,….,1y p -在总方差中所占比例依次递减,即其余主成分综合原有变量的能力依次减弱。

可见,主成分分析法的核心是通过原有变量的线性组合以及各个主成分的求解来实现变量降维的。

基于上述原理,主成分数学模型的系数求解步骤归纳如下:
(a )将原有变量数据进行标准化处理;
(b )计算变量的简单相关系数矩阵R ;
(c )求相关系数矩阵R 的特征根123....0p λλλλ≥≥≥≥≥及对应的单位特征向量
123,,,...,p μμμμ.
通过上述步骤,计算'
y x i i μ=便得到各个主成分。

其中的p 个特征值和对应的
特征向量便是因子分析的初始解。

现在重新回到因子分析中来,因子分析利用上述p 个特征值和对应的特征值向
量,并在此基础之上计算因子载荷矩阵:
1111212122221212....................................p p p p pp a a a a a a A a a a μμμμμμμμμ⎛⎛⎫ ⎪ ⎪== ⎪ ⎪ ⎝⎭⎝ (2.3) 由于因子分析的目的是减少变量个数,因此在因子分析的数学模型中,因子数目k 小于原有变量个数p 。

4、因子的命名
因子的命名通过因子旋转实现,就是将因子载荷矩阵A 右乘一个正交矩阵τ后得到一个新的矩阵B 。

它并不影响变量i x 的共同度2i h ,却会改变因子的方差贡献2j S 。

因子旋转通过改变坐标轴,能够重新分配各个因子解释原始变量方差的比例,使因子易于解释。

5、计算因子得分
计算因子得分途径是用原有变量来描述因子,因子得分函数是原有变量线性组
合的结果,因子得分可看作各变量值的加权123(,,,...,)j j j jp ωωωω总和,权数大小表
示了变量对因子的重视程度,于是第j 个因子在第i 个样本上的值可表示为:
112233,...,j j j j jp p x x x x F ωωωω=++ (2.4)
(j =1,2,3,…,k )
6、具体实施步骤
(1) 使用1995-2010年间的四川农村居民在食品、衣着、居住、家庭设备、用品及服务、医疗保健、交通和通讯、文化教育娱乐用品及服务、其他商品和服务等 8个不同项目上的支出消费的数据来进行pearson 相关性检验。

(2) 通过计算相关系数矩阵R 的特征值和累计贡献率,选择因子个数,进行因子分析。

(3) 利用旋转使得因子变量更具有可解释性。

(4) 计算因子变量的得分。

(5) 分析得出结论及建议。

三、实证分析过程
1、数据的收集整理
将四川省农村居民人均生活费支出分为总的生活消费支出、食品、衣着、居住、家庭设备及服务、医疗保健、交通通讯、文教娱乐及服务、其他8个部分,它们在
人均生活费支出分别记为1,2,,8x x x ,四川省农村居民消费变化如表1所示。

表1 1995年~2010年四川省农村居民人均生活消费支出构成(单位:元)
2、相关系数矩阵的计算
运用sas 软件中的proc corr pearson ;语句进行相关系数矩阵的运算,得到结果如表2所示。

表2 指标间的相关系数矩阵R
由相关系数矩阵R可以看出,大部分的相关系数都较高,各变量呈较强的线性关系,因此,可以知道居民的消费水平可以用因子分析法进行分析。

接着由R得到相关系数矩阵的特征值及累计贡献率如表3。

表3 R的特征值和累计贡献率
由表3可以知道前两个特征值的累积贡献率已经达到94.19%,因此进行因子分析的时候可选取两个公共因子。

3、因子载荷矩阵的计算
通过语句
选取两个公公因子对变量x2~x9进行因子分析,得到因子载荷矩阵如表4。

表4 因子载荷矩阵A
采用方差最大法对因子载荷矩阵实行方差最大正交旋转以使因子具有命名解释性,得到正交因子载荷矩阵如表5。

表5 最大正交旋转后的因子载荷矩阵
根据表5可以写出该案例的因子分析模型:
21223123412451256126712781289129
0.925970.344130.942980.300410.875220.124310.959340.256730.908700.410370.893620.434570.267640.956180.856050.33504x F F x F F x F F x F F x F F x F F x F F x F F εεεεεεεε=++=++=++=++=++=++=++=++
由此模型可知:有7个变量在第一个因子上的载荷都很高,意味着它们与第一个因子的相关程度较高,第一个因子十分重要。

同时可知2345679,,,,,,x x x x x x x 在第1
个因子上有较高的载荷,第1个因子主要解释了这些变量;8x 在第2个因子上有较高的载荷。

因此根据原有变量与这2个因子的相关程度我们得到如下表6的因子命名。

表6 因子命名
4、因子的方差贡献率及变量的共同度计算及分析
由前面的相关语句得出各个因子的方差贡献率如表7.
表7 F1,F2的方差贡献率22
12,q q
方差贡献率分别为:22
12
5.8617418, 1.6738230q q ==,可以看出第一个因子的方
差贡献率非常的大,则表明因子1对消费结构的影响比较大。

得出变量129,,...,X X X 的共同度如表8。

表8 变量129,,...,X X X 的共同度
129
,,...,X X X 的共同度为:
2
221
,1,2,3,...,8i
ij j h a i ==
=∑
由特殊因子方差计算公式22
1i i
h σ=-及相关数据可知特殊因子的方差很小,对消费
结构的影响力较小。

5、计算因子得分
本文采用回归法估计因子得分系数,并输出因子得分系数如表9。

表9 因子得分
根据表9,可以写出得分函数:
1234567892234567890.1640.1910.2510.2180.1260.1090.3640.1430.0160.0790.2660.1410.0750.112 1.0640.006F x x x x x x x x F x x x x x x x x =+++++-+=----++++ 由此可见计算两个因子得分变量的变量值时,对于因子1,8x
的权重较高,但方向恰好相反,表示文教娱乐对因子1成负相关,其他变量的权重都为正,表明对因子是正相关,而对于因子2,x8的权重显然很大,且为正,表明文教娱乐的影响较大,这与因子的实际含义是相吻合的。

最后得到因子变动相关图为
图1 因子1随着时间的变动相关图
图2 因子2随着时间的变动相关图
四、结论与建议
1、结果分析
基于因子分析模型的分析,可以知道:
(1)四川省农村居民的食品、交通和通讯、医疗保健等的生活必须因素的支出比重已经达到较高水平,且较去年相比有所下降。

而以文化教育、精神娱乐等提高素质的相关支出有所上升这表明农民的生活已经有所改善,大部分人开始追求精神上的提高与享受。

(2)从总体上看,四川省农村居民的消费结构和消费水平还是处于升级变动之中,并且从国际常用的反映消费结构的恩格尔系数变动情况可以看出出农村居民的生活状况有了一定的改善。

从相关因子分析的数据也可以得出这样的结论,09年开始人们的生活水平已经开始相对稳定,从08年地震后人们的文化教育、娱乐方面有很大的提高,也有进一步发展的趋势。

2、对于四川省农村居民消费结构的建议
(1)在短期内,通过政策扶持来引导农村居民的消费倾向是具有一定效果的,比如家电下乡,农机补贴等政策。

这些惠农活动可以进一步提高偏远山区人们的消费水平,提高他们的生活质量。

(2)长期内,改善农村教育制度,加大力度完善农村的教育体系、文化建设有较好的作用。

如今的农村居民已经不局限于种地挣钱养家糊口的生活了,他们更加注
重学习,让子女能够有更好的教育,自己的生活更够更加的快乐,精神上得到一定的享受成为了重点。

开展农村文化教育活动,举办各种娱乐活动,更有益于人们的生活。

五、参考文献
[1] 尹世杰. (2003).消费经济学.北京:高等教育出版社
[2] 四川省统计信息网. 四川统计年鉴
[3] 余锦华,杨维权.多元统计分析与应用[M].广州:中山大学出版社,2005:162-224
[4]王映,李晓慧,胡超.四川省城镇居民消费水平和消费结构的实证分析.现代物业(中旬刊) ,2010,(03)
[5]刘永贵.我国四川农村居民消费结构变动趋势及财政对策研究.宜宾学院学报.2007.7;(7)
[6]范金城,梅长林.数据分析(第二版).科学出版社
[7]沈其君.sas统计分析.东南大学出版社。

相关文档
最新文档