定性数据分析 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1 j 1
ni n j nnij
=0.089234071
n 2 n ( n n n n ) 11 22 12 21 2 2 2 连续修正 统计量: =0.181632853 n1 n2 n1n2
4.对列联表进行检验(3)
Mentel Haenszel
2 检验:
2 检验检验的过程如下: (都考虑 0.05 )
频数 消费好 储蓄好 合计 似然比检验为: 172 110 282 期望频数 141 141 282
(ni -ni pi ) 2 / (ni pi )
6.815602837 6.815602837
2 =13.63120567
2ln() 2[172*ln(0.5 / (172 / 282)) 110*ln(0.5 / (110 / 282))] =1473.371998
2.数据来源: 数据来源于网上问卷调查表的数据,具体 的问卷调查表见附录1.具体的数据见附录 2. 调查问卷主要涉及到性别,年龄,居住地 ,月收入,喜欢消费还是储蓄以及职业等 16个问题,一共有282份调查问卷。
3.对数据进行基本处理
频数 消费好 储蓄好 合计 172 110 282 频率(%) 60.9929078 39.0070922 100
在 excel 中可以算出 20.95 (1) 3.841458821 。 统计量,似然比统计量都大,其 p 值算出为 0.000222481 ,
2
很小。所以拒绝原假设,得出人们对买东西的态度是不一样的。
4.对列联表进行检验(2)
4.2 研究男女对储蓄的态度是否一样。列联表如下: 消费好 男 女 合计 108 64 172 储蓄好 71 39 110 合计 179 103 282
表 1 消费和储蓄频数频率分布表 频数 男 女 合计 179 103 282 频率(%) 63.4751773 36.5248227 100
表 2 男和女频数频率分布表
3.数据的基本处理
4.对列联表进行检验(1)
由表 1,可以考虑人们对买东西和储蓄的态度是否一样,做出假设: 原假设 H 0 :人们对消费和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :人们对消费和储蓄的态度不一样(即 p1 p2 )
谢 谢!!
由 excel 算得 20.95 (1) 3.841458821。从上面的四个检验统计量中知道,他们都没有落在拒绝域中。 因此不拒绝原假设。说明男和女对储蓄的态度是相互一样的,是相互独立的。 4.3 研究不同年龄阶段对消费和储蓄之间的偏好差异以及相合性,列联表如下:
消费好 20-35岁 35-50岁 50-65岁 65岁以上 合计 2 99 51 20 172 储蓄好 2 47 40 21 110 合计 4 146 91 41 282
可以得出这些系数都是正的,那么他们是正相合的,也就是说随着年龄的增加,人们是来越 倾向于储蓄。
4.对列联表进行检验(4)
4.4 研究地方,性别和储蓄高维列联表之间关系和独立性检验。 买东西好 男 繁华城市 女 男 边远地区 女 合计 74 39 34 25 172 储蓄好 58 29 13 10 110 合计 132 68 47 35 282
而有逻辑斯蒂线性回归方程
ln
ˆ p 6.03235 0.25700 eco 。月收入的系数都为正,也即是说月收 ˆ 1 p
入越高的人,储蓄的概率也就越大。
6.总结
1.通过对居民储蓄的调查数据进行定性数据的分析研究,通过各种假设检验,独立性检验,相 合性检验以及建立模型研究,我们可以得出很多的结论以及变量之间的相互关系,例如: (1)人们对于储蓄和消费的态度是不一样的,现在的人们更加的倾向于消费,但是男人和女人 对消费和储蓄的态度相互之间是是相互独立的。 ( 2)在不同的地方,繁华的城市居民倾向于消费, 而在偏远的地区,则倾向于储蓄。 ( 3)不同年龄阶段的人,在对待消费和储蓄的观点上也是相互独 立的。 ( 4)收入和对待储蓄的态度是正相合的,也即是说收入越高人越倾向于储蓄。 (5)在地方, 性别与储蓄的高维列联表中,性别和储蓄是负相合的,也就是女的更加倾向于消费,而在分层的情 况,繁华的城市,是符合整体的相合性,但在偏远的地方,则是正相合的,女的倾向于储蓄。 ( 6) 还进行了独立性研究,发现地方,性别与消费储蓄之间是相互独立的。 (7)对月收入和储蓄之间的 关系,采取了逻辑斯蒂模型来研究,发现月收入越高的人,越倾向于储蓄,这于我们的相合性的检 验是一致的。 2.通过对定性数据的学习研究,发现这门课非常的实用,与实际结合得比较的紧密,同时通过 练习作业做报告,使我了解了很多,相信在以后会有用。
居民储蓄的调查研究分析
——定性数据分析报告
LOGO
报告的结构和主要内容
本次报告的主要内容: 1.本次报告背景和意义 2.介绍数据的来源 3.对数据进行基本处理 4.对列联表进行检验 5.逻辑斯蒂回归模型的运用 6.总结
1.报告的背景和意义
1.从改革开放以来,经济得到飞速的提高,居民的收入也大大 增加,因此居民储蓄也处于高增长的态势,高储蓄率为中 国经济增长提供了充足的资金来源,成为支持经济快速增 长的重要因素。 2.但是巨额的居民储蓄给我国宏观经济的正常运行带来了一定 压力。高储蓄率,低消费率导致我国内需疲软,要想促进 经济增长只有依靠投资和出口,而长期依赖投资和出口并 不利于我国经济长期稳定发展。因此对居民的储蓄进行调 查分析就具有意义。 3.通过做本次报告,懂得了怎么研究分析各种问卷调查数据, 得出结论,对各种软件也进一步的熟悉。
首先对表 9进行分层压缩,研究性别与对储蓄的态度的相合性,用 SAS 处理的结果如下图,对于整体 性别与储蓄之间是负相合的关系,繁华城市里,男女和消费储蓄相合性是负的偏远地区男女和消费 储蓄相合性是正的。
4.对列联表进行检验(4)
4.对列联表进行检验(4)
4.对列联表进行检验(4)
4.对列联表进行检验(4)
原假设 H 0 :男和女对买东西和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :男和女对买东西和储蓄的态度不一样(即 p1 p2 )
2 进行如下检验: 检验:
2
n(n11n22 n12 n21 )2 =0.089107424 n1 n2 n1n2
2 2
似然比检验: 2 ln() 2 nij ln
2
2
(n 1)(n11n22 n12 n21 ) 2 n1 n2 n1n2
=0.08879144
修正的 Mentel Haenszel
n (n 1)( n11n22 n12 n21 ) 2 2 =0.180988765 检验: 2 n1 n2 n1n2
5.运用逻辑斯蒂模型
利用逻辑斯蒂回归模型来研究月收入和储蓄之间关系
2000元以下 2000-5000元 5000-8000 8000元以上 合计 消费好 114 16 10 32 172 储蓄好 70 16 5 19 110 合计 184 32 15 51 282
其中数据如表所示,月收入是有序数据,我们用数1000,3500.5500, 8000分别表示年龄 2000元以 下,2000-5000元,5000-8000元,8000元以上。建立储蓄概率 p 关于月收入之间的逻辑斯蒂线性模型:
下面对地方,性别和储蓄进行独立性检验。这个利用 R 软件做,程序见附录 2 ,用表格列出:
原假设 情况1 情况2 P值 0.094897 72 0.591683 9 0.109608 8 0.049845 43 0.050990 12 0.402741 8 0.980797 5
G2
(A,B,C)
(A, BC)
lnBaidu Nhomakorabea
p 0 1 eco 1 p
其中的 eco 表示我们的月收入。用 R 软件中的 glm 函数计算上面的逻辑斯蒂线性回归模型,得到结 果如下。 (具体的程序表达式见附录3)
5.运用逻辑斯蒂模型
从上面的结果知道
0, 1 的极大似然估计分别为 0 6.03235, 1 0.25700 ,经检验 0 , 1 都是显著的。 从
4.对列联表进行检验(3)
原假设 H0 :不同年龄阶段的人对消费和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :不同年龄阶段的人对消费和储蓄的态度是不一样的(即 p1 p2 ) 利用 SAS 软件对这个假设检验问题进行处理得到如下结果:
4.对列联表进行检验(3)
从中得 2 统检验,似然比检验统计量分别为 6.5605, 6.5476, p 值都为 0.0873 大于 , 因此不拒绝原假设。 对于这个表格还可以进行相合性检验,利用 SAS 软件进行处理得到的结果如下:
7.910884 1.908168 6.041495 7.821636 5.952247 1.818919 0.038778 48
(B, AC)
(C, AB)
情况3
(AB,AC)
( BA, BC )
(CA, CB)
由上面结果表格可以看出,各个独立性检验的 p 值都大于 0.05.所以这三个属性是相互独立的。也就 是地方,性别和储蓄三个之间是相互独立的。
ni n j nnij
=0.089234071
n 2 n ( n n n n ) 11 22 12 21 2 2 2 连续修正 统计量: =0.181632853 n1 n2 n1n2
4.对列联表进行检验(3)
Mentel Haenszel
2 检验:
2 检验检验的过程如下: (都考虑 0.05 )
频数 消费好 储蓄好 合计 似然比检验为: 172 110 282 期望频数 141 141 282
(ni -ni pi ) 2 / (ni pi )
6.815602837 6.815602837
2 =13.63120567
2ln() 2[172*ln(0.5 / (172 / 282)) 110*ln(0.5 / (110 / 282))] =1473.371998
2.数据来源: 数据来源于网上问卷调查表的数据,具体 的问卷调查表见附录1.具体的数据见附录 2. 调查问卷主要涉及到性别,年龄,居住地 ,月收入,喜欢消费还是储蓄以及职业等 16个问题,一共有282份调查问卷。
3.对数据进行基本处理
频数 消费好 储蓄好 合计 172 110 282 频率(%) 60.9929078 39.0070922 100
在 excel 中可以算出 20.95 (1) 3.841458821 。 统计量,似然比统计量都大,其 p 值算出为 0.000222481 ,
2
很小。所以拒绝原假设,得出人们对买东西的态度是不一样的。
4.对列联表进行检验(2)
4.2 研究男女对储蓄的态度是否一样。列联表如下: 消费好 男 女 合计 108 64 172 储蓄好 71 39 110 合计 179 103 282
表 1 消费和储蓄频数频率分布表 频数 男 女 合计 179 103 282 频率(%) 63.4751773 36.5248227 100
表 2 男和女频数频率分布表
3.数据的基本处理
4.对列联表进行检验(1)
由表 1,可以考虑人们对买东西和储蓄的态度是否一样,做出假设: 原假设 H 0 :人们对消费和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :人们对消费和储蓄的态度不一样(即 p1 p2 )
谢 谢!!
由 excel 算得 20.95 (1) 3.841458821。从上面的四个检验统计量中知道,他们都没有落在拒绝域中。 因此不拒绝原假设。说明男和女对储蓄的态度是相互一样的,是相互独立的。 4.3 研究不同年龄阶段对消费和储蓄之间的偏好差异以及相合性,列联表如下:
消费好 20-35岁 35-50岁 50-65岁 65岁以上 合计 2 99 51 20 172 储蓄好 2 47 40 21 110 合计 4 146 91 41 282
可以得出这些系数都是正的,那么他们是正相合的,也就是说随着年龄的增加,人们是来越 倾向于储蓄。
4.对列联表进行检验(4)
4.4 研究地方,性别和储蓄高维列联表之间关系和独立性检验。 买东西好 男 繁华城市 女 男 边远地区 女 合计 74 39 34 25 172 储蓄好 58 29 13 10 110 合计 132 68 47 35 282
而有逻辑斯蒂线性回归方程
ln
ˆ p 6.03235 0.25700 eco 。月收入的系数都为正,也即是说月收 ˆ 1 p
入越高的人,储蓄的概率也就越大。
6.总结
1.通过对居民储蓄的调查数据进行定性数据的分析研究,通过各种假设检验,独立性检验,相 合性检验以及建立模型研究,我们可以得出很多的结论以及变量之间的相互关系,例如: (1)人们对于储蓄和消费的态度是不一样的,现在的人们更加的倾向于消费,但是男人和女人 对消费和储蓄的态度相互之间是是相互独立的。 ( 2)在不同的地方,繁华的城市居民倾向于消费, 而在偏远的地区,则倾向于储蓄。 ( 3)不同年龄阶段的人,在对待消费和储蓄的观点上也是相互独 立的。 ( 4)收入和对待储蓄的态度是正相合的,也即是说收入越高人越倾向于储蓄。 (5)在地方, 性别与储蓄的高维列联表中,性别和储蓄是负相合的,也就是女的更加倾向于消费,而在分层的情 况,繁华的城市,是符合整体的相合性,但在偏远的地方,则是正相合的,女的倾向于储蓄。 ( 6) 还进行了独立性研究,发现地方,性别与消费储蓄之间是相互独立的。 (7)对月收入和储蓄之间的 关系,采取了逻辑斯蒂模型来研究,发现月收入越高的人,越倾向于储蓄,这于我们的相合性的检 验是一致的。 2.通过对定性数据的学习研究,发现这门课非常的实用,与实际结合得比较的紧密,同时通过 练习作业做报告,使我了解了很多,相信在以后会有用。
居民储蓄的调查研究分析
——定性数据分析报告
LOGO
报告的结构和主要内容
本次报告的主要内容: 1.本次报告背景和意义 2.介绍数据的来源 3.对数据进行基本处理 4.对列联表进行检验 5.逻辑斯蒂回归模型的运用 6.总结
1.报告的背景和意义
1.从改革开放以来,经济得到飞速的提高,居民的收入也大大 增加,因此居民储蓄也处于高增长的态势,高储蓄率为中 国经济增长提供了充足的资金来源,成为支持经济快速增 长的重要因素。 2.但是巨额的居民储蓄给我国宏观经济的正常运行带来了一定 压力。高储蓄率,低消费率导致我国内需疲软,要想促进 经济增长只有依靠投资和出口,而长期依赖投资和出口并 不利于我国经济长期稳定发展。因此对居民的储蓄进行调 查分析就具有意义。 3.通过做本次报告,懂得了怎么研究分析各种问卷调查数据, 得出结论,对各种软件也进一步的熟悉。
首先对表 9进行分层压缩,研究性别与对储蓄的态度的相合性,用 SAS 处理的结果如下图,对于整体 性别与储蓄之间是负相合的关系,繁华城市里,男女和消费储蓄相合性是负的偏远地区男女和消费 储蓄相合性是正的。
4.对列联表进行检验(4)
4.对列联表进行检验(4)
4.对列联表进行检验(4)
4.对列联表进行检验(4)
原假设 H 0 :男和女对买东西和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :男和女对买东西和储蓄的态度不一样(即 p1 p2 )
2 进行如下检验: 检验:
2
n(n11n22 n12 n21 )2 =0.089107424 n1 n2 n1n2
2 2
似然比检验: 2 ln() 2 nij ln
2
2
(n 1)(n11n22 n12 n21 ) 2 n1 n2 n1n2
=0.08879144
修正的 Mentel Haenszel
n (n 1)( n11n22 n12 n21 ) 2 2 =0.180988765 检验: 2 n1 n2 n1n2
5.运用逻辑斯蒂模型
利用逻辑斯蒂回归模型来研究月收入和储蓄之间关系
2000元以下 2000-5000元 5000-8000 8000元以上 合计 消费好 114 16 10 32 172 储蓄好 70 16 5 19 110 合计 184 32 15 51 282
其中数据如表所示,月收入是有序数据,我们用数1000,3500.5500, 8000分别表示年龄 2000元以 下,2000-5000元,5000-8000元,8000元以上。建立储蓄概率 p 关于月收入之间的逻辑斯蒂线性模型:
下面对地方,性别和储蓄进行独立性检验。这个利用 R 软件做,程序见附录 2 ,用表格列出:
原假设 情况1 情况2 P值 0.094897 72 0.591683 9 0.109608 8 0.049845 43 0.050990 12 0.402741 8 0.980797 5
G2
(A,B,C)
(A, BC)
lnBaidu Nhomakorabea
p 0 1 eco 1 p
其中的 eco 表示我们的月收入。用 R 软件中的 glm 函数计算上面的逻辑斯蒂线性回归模型,得到结 果如下。 (具体的程序表达式见附录3)
5.运用逻辑斯蒂模型
从上面的结果知道
0, 1 的极大似然估计分别为 0 6.03235, 1 0.25700 ,经检验 0 , 1 都是显著的。 从
4.对列联表进行检验(3)
原假设 H0 :不同年龄阶段的人对消费和储蓄的态度一样(即 p1 p2 ) 备择假设 H1 :不同年龄阶段的人对消费和储蓄的态度是不一样的(即 p1 p2 ) 利用 SAS 软件对这个假设检验问题进行处理得到如下结果:
4.对列联表进行检验(3)
从中得 2 统检验,似然比检验统计量分别为 6.5605, 6.5476, p 值都为 0.0873 大于 , 因此不拒绝原假设。 对于这个表格还可以进行相合性检验,利用 SAS 软件进行处理得到的结果如下:
7.910884 1.908168 6.041495 7.821636 5.952247 1.818919 0.038778 48
(B, AC)
(C, AB)
情况3
(AB,AC)
( BA, BC )
(CA, CB)
由上面结果表格可以看出,各个独立性检验的 p 值都大于 0.05.所以这三个属性是相互独立的。也就 是地方,性别和储蓄三个之间是相互独立的。