第七讲 中国消费者信心指数影响因素分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2015-5-12 信息技术教学中心 7
项目问卷
如何变化? 1、非常好 2、比较好 3、保持现状 4、比较差 5、非常差 9、说不清/拒答 A9 您认为1年之后本地区的就业状况将会如何变化? 1、明显改善 2、略有改善 3、保持现状 4、略有变差 5、明显变差 9、说不清/拒答 A10 与现在相比,您认为5年后,本地区的经济将会出现怎 样的变化? 1、明显繁荣 2、略有改善 3、保持现状 4、略有衰退 5、明显衰退 9、说不清/拒答
问卷中的大多数主干题目均为五级得分,都需要转换为相 应的题目得分,以反映消费者的乐观或悲观态度,具体方 式为针对每一道题目,计算每个选项被选中的百分比,随 后使用以下公式计算其相对得分: 题目得分=100%+1.0*VF%+0.5*F%-0.5*U%-1.0*VU% 这一数值反映的是答案偏向乐观的人群和偏向悲观人群的比 例之差,当人群中两者比例基本平衡时,得分接近于100; 如果乐观人群比例偏高,则得分大于100;反之则小于100. 总消费者信心指数的计算是基于下面五道问题的回答进行的: A3、A4、A8、A10、A16
1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择线图组,将右侧出现的多重线图图标拖入 画布 3. 将月份time拖入横轴框中 4. 将总指数index1拖入纵轴框中。 5. 将城市S0拖入分组(设置颜色)框中,然后再双击该框, 在弹出的“分组区域”子对话框中将分组依据由“颜色” 改为“图案”。 6. 单击“确定”按钮绘制出图形,然后双击图形进入编辑 状态,将均值连续轴刻度范围修改为85~105,小数位数 更改为0,拖放调整图例位置和绘图区大小至合适比例。
2015-5-12 信息技术教学中心 16
2015-5-12
信息技术教学中心
17
考察性别、职业、婚姻状况等对信 心指数的影响
1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择条图组,将右侧出现的简单条图图标拖入 画布 3. 将职业S5拖入横轴框中 4. 将index1拖入纵轴框中 5. 确定 6. 双击图形进入编辑状态,选中类别分类轴,在属性对话 框的“类别”选项卡中,“排序依据”改为“统计”, “方向”改为“降序”单击“应用”按钮。
2015-5-12
信息技术教学中心
28
2015-5-12
信息技术教学中心
29
两两比较
下面进一步考虑同一因子各水平之间两两比较的问题,由 于模型中引入了协变量年龄,因此不能直接用两两比较子 对话框中的相应方法,需要采用选项中估计边际均数的功 能来完成,操作如下: 1. 进入“选项”子对话框 2. 将time、s0、S4等需要计算边际均数的因子全部选入右侧 的“显示均值”列表框中 3. 选中下方的“比较主效应”复选框 4. 置信区间调节选择“bonferroni” 5. 继续。
2015-5-12 信息技术教学中心 5
项目问卷
5. 3000~3999元 6. 4000~4999元 7. 5000~5999元 8. 6000~7999 9、8000~9999元 10、1000~14999元 11、15000~19999元 12、 20000~29999元 13、30000以上 98、无收入 99、拒答 C0 请问您的家庭目前有下列还贷支出吗? C0_1 房贷 1.有 2.无 99.拒答 C0_2 车贷 1.有 2.无 99.拒答 C0_3 其他一般消费还贷 1.有 2.无 99.拒答 O1 请问您有家用轿车吗? 1、有 2、没有 A3 请问与1年前相比,您的家庭现在的经济状况怎么样? 1、明显好转 2、略有好转 3、基本不变 4、略有变差 5、明显变差9、 说不清/拒答
2015-5-12
信息技术教学中心
11
研究目的
总目标: 不同人口特征及背景资料的受访者(家庭)在消费者信心上 具有怎样的差异,或者说不同人群之间是否存在信心指数的 差异。 分目标: 1、上述指标对信心指数的作用是否存在地域差异 2、上述指标对信心指数的作用是否细分至5个分项指标, 即进一步考察其内部的详细作用方式 北京、上海、广州在2007年4月、12月、2008年12月和 2009年12月的样本。
2015-5-12
信息技术教学中心
12
分析思路
首先拟合标准的方差分析模型,进行候选影响因素的筛选。 利用最优尺度回归方法,对影响因素的作用做进一步的确 认,并考虑各因素的内在作用方式 尝试按照多水平模型框架,分析各影响因素是否存在深层 次的变异构成 拟合多因素变量的方差分析模型,进一步探索影响因素对 各分项指标的作用方式。
2015-5-12 信息技术教学中心 6
项目问卷
A3a 为什么您这样说呢?(最多选两项) 0 中性原因 90 不知道/拒答 10 改善:收入相关 110、恶 化:收入相关 20 改善:就业情况相关 120 恶化:就业情 况相关 30、改善:投资相关 130、恶化:投资相关 40、改 善:家庭开支相关 140、恶化:家庭开支相关 50、改善: 政策/宏观经济 150、恶化:政策/宏观经济相关 A4 与现在相比,您觉得1年以后您的家庭经济状况将会如何 变化? 1、明显好转 2、略有好转 3、基本不变 4、略有变差 5、明显变差 9、说不清/拒答 A8 与现在相比,您认为1年后本地区的经济发展状况将会
2015-5-12 信息技术教学中心 14
城市对信心指数的影响
5. 切换至组/点ID选项卡:选中“行嵌板变量”复选框 6. 将S0城市选入画布上新增的嵌板框中。 7. 单击“选项”按钮,在选项对话框中确认未选中下方的 “换行嵌板”复选框 8. 确定
2015-5-12
信息技术教学中心
15
时间对信心指数的影响
2015-5-12
信息技术教学中心
10
信心指数的计算方法
首先计算出上述5道题的题目得分,将其直接相加,再除 以“基线”调查时的这一数值,即为当期的信心指数值。 因此,计算出来的指数代表当期数值相对于“基线”调查 数值的变动比例。如果乐观人群的比例高于基线,则指数 大于100;反之则小于100.目前作为基线水平的是2007年4 月的数值。
2015-5-12
信息技术教学中心
3
项目问卷
S0 受访者所在城市: 100.北京 200.上海 300.广州 S1 请问您贵姓是?_______
S2 记录被访者性别:
1.男性 2.女性 S3 请问您的实际年龄是?_____ S4 请问您的学历是? 1.初中/技校或以下
2015-5-12
2.高中/中专
2015-5-12 信息技术教学中心 2
案例背景
消费者信心是指消费者根据国家或地区的经济发展形势, 对就业、收入、物价、利率等问题综合判断后得出的一种看 法和预期,消费者信心指数则是对消费者整体所表现出来的
信心程度及其变动的一种测度。它是20世纪40年代后期提出,
60余年的历史证明了这一指标体系在预测未来宏观经济走向 方面具有不可替代的价值,目前已成为各市场经济国家非常 重要的经济风向标之一。
2015-5-12 信息技术教学中心 8
项目问卷
A16 对于大宗耐用消费品的购买,比如家用电器、电脑,以 及高档家具之类,您认为当前是购买的好时机吗? 1、很好的时机 2、较好时机 3、很难说,看具体情况而定 4、较差时机 5、很差的时机 9、不知道/拒答
2015-5-12
信息技术教学中心
9
信心指数的计算方法
2015-5-12
信息技术教学中心
31
最优尺度回归
问题 1. 家庭收入等变量目前按照无序分类被引入模型,如果考 虑有序的特征,又该如何对模型进行改善? 2. 同样是家庭收入这个变量,数据中约有10%为缺失值,这 些案例在方差分析模型中被直接删除了,如果将其加入 模型,会有怎样的结果? 3. 年龄S3目前是以协变量的方式纳入模型,意味着它和因 变量之间的作用方式只能是线性的,虽然在散点图中这 一趋势得到了确认,但又没有更加灵活的方式,可以判 断是否无存在其他关联趋势的可能。
3.大专 4.本科 5.硕士或以上
4
信息技术教学中心
项目问卷
S5 请问你的职业是? 1、企事业管理人员 2、工人/体力工作者(蓝领) 3、公司普 通职业(白领) 4、国家公务员 5、个体经营者/私营业主 6、 教师 7、学生 8、专业人士(医生、律师等) 9、无/待/失业、 家庭主妇 10、退休 11、其他职业 S7 请问你的婚姻状况是? 1.已婚 2.未婚 3.离异/分居/丧偶 S9 请问您的家庭月收入(包括工资、奖金和各种外快收入) 大约在什么范围? 1.999元或以下 2.1000~1499元 3.1500~1999元 4.2000~2999 元
数据分析与挖掘
Data Analysis & Mining 中国消费者信心指数影响因素分 析
2015-5-12
信息技术教学中心
1
学习要点
• 分析方法: -方差分析模型,多元方差分析模型,最优尺度回归,多水平模型 • 分析过程
– 统计图:直方图图组、线图、条图、散点图 – 一般线性模型:单变量、多变量 – 混合模型:线性 – 描述统计:序列图 – 回归:最佳尺度(CATREG)
2015-5-12
信息技术教学中心
13
数据理解
考察时间、地域对信心指数的影响 首先看总信心指数分布状况是否基本遵循正态分布,但是 在多次使用了直方图工具后,希望这次能够走得更远点:直 接在直方图中考察城市之间的信心指数水平是否存在差异, 具体操作如下: 1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择直方图组,将右侧出现的简单直方图图标 拖入画布 3. 在变量列表中知道index1,将其拖入画布的横轴框中。 4. 在元素属性对话框中“显示正态曲线”复选框,注意随 后一定要单击下方的“应用”按钮,否则相应的操作不 会生效
2015-5-12
信息技术教学中心
18
职业影响
2015-5-12
信息技术教学中心
19
性别影响
2015-5-12
信息技术教学中心
20
学历影响
2015-5-12
信息技术教学中心
21
婚姻状况
2015-5-12
信息技术教学中心
22
收入的影响
2015-5-12
信息技术教学中心
23
年龄的影响
选择“图形”——“图表构建程序”菜单命令。 将简单散点图图标拖入画布 将年龄S3拖入横轴框中 将index1拖入纵轴框中 确定 双击进入图形编辑状态,依次单击“元素”——“总计拟 合线” 7. 在“拟合线”选项卡中,将拟合方法更改为loess,单击 “应用”按钮 8. 关闭图形并退出。 1. 2. 3. 4. 5. 6.
2015-5-12
信息技术ቤተ መጻሕፍቲ ባይዱ学中心
30
多元方差分析模型的结果
拟合多元方差分析模型 1. 依次单击“分析”——“一般线性模型”——“多变量” 2. 将QA3、QA4、QA8、QA10和QA16选入“因变量”框 3. 将月份time、城市S0、职业S5、婚姻状况S7及家庭收入S9 选入“固定因子”列表框 4. 将年龄S3选入“协变量”框 5. 进入“模型”子对话框,将各因素的主效应选入“模型” 框 6. 进入“选项”子对话框,选择“缺乏拟合优度检验” 7. 确定
2015-5-12 信息技术教学中心 24
2015-5-12
信息技术教学中心
25
标准GLM框架下的建模分析
1. 2. 3. 建立总模型 依次单击“分析”——“一般线性模型”——“单变量” 将总指数Index1选入“因变量”框 将月份time、城市S0、性别S2、学历S4、职业S5、婚姻状况S7 及家庭收入S9选入“固定因子”列表框 4. 将年龄S3选入“协变量”框 5. 进入“模型”子对话框,将各因素的主效应选入“模型”框 6. 进入“保存”子对话框,选择保存“未标准化预测值”和“标 准化残差”。 7. 进入“选项”子对话框,选择“缺乏拟合优度检验”
2015-5-12
信息技术教学中心
26
8. 确定 9. 选择“图形”——“图表构建程序”菜单命令 10. 将简单散点图图标拖入画布 11. 将未标准化预测值拖入X轴框,标准化残差拖入Y轴框 12. 确定 13. 双击进入图形编辑状态,在图形中添加Y=0的横线。
2015-5-12
信息技术教学中心
27
项目问卷
如何变化? 1、非常好 2、比较好 3、保持现状 4、比较差 5、非常差 9、说不清/拒答 A9 您认为1年之后本地区的就业状况将会如何变化? 1、明显改善 2、略有改善 3、保持现状 4、略有变差 5、明显变差 9、说不清/拒答 A10 与现在相比,您认为5年后,本地区的经济将会出现怎 样的变化? 1、明显繁荣 2、略有改善 3、保持现状 4、略有衰退 5、明显衰退 9、说不清/拒答
问卷中的大多数主干题目均为五级得分,都需要转换为相 应的题目得分,以反映消费者的乐观或悲观态度,具体方 式为针对每一道题目,计算每个选项被选中的百分比,随 后使用以下公式计算其相对得分: 题目得分=100%+1.0*VF%+0.5*F%-0.5*U%-1.0*VU% 这一数值反映的是答案偏向乐观的人群和偏向悲观人群的比 例之差,当人群中两者比例基本平衡时,得分接近于100; 如果乐观人群比例偏高,则得分大于100;反之则小于100. 总消费者信心指数的计算是基于下面五道问题的回答进行的: A3、A4、A8、A10、A16
1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择线图组,将右侧出现的多重线图图标拖入 画布 3. 将月份time拖入横轴框中 4. 将总指数index1拖入纵轴框中。 5. 将城市S0拖入分组(设置颜色)框中,然后再双击该框, 在弹出的“分组区域”子对话框中将分组依据由“颜色” 改为“图案”。 6. 单击“确定”按钮绘制出图形,然后双击图形进入编辑 状态,将均值连续轴刻度范围修改为85~105,小数位数 更改为0,拖放调整图例位置和绘图区大小至合适比例。
2015-5-12 信息技术教学中心 16
2015-5-12
信息技术教学中心
17
考察性别、职业、婚姻状况等对信 心指数的影响
1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择条图组,将右侧出现的简单条图图标拖入 画布 3. 将职业S5拖入横轴框中 4. 将index1拖入纵轴框中 5. 确定 6. 双击图形进入编辑状态,选中类别分类轴,在属性对话 框的“类别”选项卡中,“排序依据”改为“统计”, “方向”改为“降序”单击“应用”按钮。
2015-5-12
信息技术教学中心
28
2015-5-12
信息技术教学中心
29
两两比较
下面进一步考虑同一因子各水平之间两两比较的问题,由 于模型中引入了协变量年龄,因此不能直接用两两比较子 对话框中的相应方法,需要采用选项中估计边际均数的功 能来完成,操作如下: 1. 进入“选项”子对话框 2. 将time、s0、S4等需要计算边际均数的因子全部选入右侧 的“显示均值”列表框中 3. 选中下方的“比较主效应”复选框 4. 置信区间调节选择“bonferroni” 5. 继续。
2015-5-12 信息技术教学中心 5
项目问卷
5. 3000~3999元 6. 4000~4999元 7. 5000~5999元 8. 6000~7999 9、8000~9999元 10、1000~14999元 11、15000~19999元 12、 20000~29999元 13、30000以上 98、无收入 99、拒答 C0 请问您的家庭目前有下列还贷支出吗? C0_1 房贷 1.有 2.无 99.拒答 C0_2 车贷 1.有 2.无 99.拒答 C0_3 其他一般消费还贷 1.有 2.无 99.拒答 O1 请问您有家用轿车吗? 1、有 2、没有 A3 请问与1年前相比,您的家庭现在的经济状况怎么样? 1、明显好转 2、略有好转 3、基本不变 4、略有变差 5、明显变差9、 说不清/拒答
2015-5-12
信息技术教学中心
11
研究目的
总目标: 不同人口特征及背景资料的受访者(家庭)在消费者信心上 具有怎样的差异,或者说不同人群之间是否存在信心指数的 差异。 分目标: 1、上述指标对信心指数的作用是否存在地域差异 2、上述指标对信心指数的作用是否细分至5个分项指标, 即进一步考察其内部的详细作用方式 北京、上海、广州在2007年4月、12月、2008年12月和 2009年12月的样本。
2015-5-12
信息技术教学中心
12
分析思路
首先拟合标准的方差分析模型,进行候选影响因素的筛选。 利用最优尺度回归方法,对影响因素的作用做进一步的确 认,并考虑各因素的内在作用方式 尝试按照多水平模型框架,分析各影响因素是否存在深层 次的变异构成 拟合多因素变量的方差分析模型,进一步探索影响因素对 各分项指标的作用方式。
2015-5-12 信息技术教学中心 6
项目问卷
A3a 为什么您这样说呢?(最多选两项) 0 中性原因 90 不知道/拒答 10 改善:收入相关 110、恶 化:收入相关 20 改善:就业情况相关 120 恶化:就业情 况相关 30、改善:投资相关 130、恶化:投资相关 40、改 善:家庭开支相关 140、恶化:家庭开支相关 50、改善: 政策/宏观经济 150、恶化:政策/宏观经济相关 A4 与现在相比,您觉得1年以后您的家庭经济状况将会如何 变化? 1、明显好转 2、略有好转 3、基本不变 4、略有变差 5、明显变差 9、说不清/拒答 A8 与现在相比,您认为1年后本地区的经济发展状况将会
2015-5-12 信息技术教学中心 14
城市对信心指数的影响
5. 切换至组/点ID选项卡:选中“行嵌板变量”复选框 6. 将S0城市选入画布上新增的嵌板框中。 7. 单击“选项”按钮,在选项对话框中确认未选中下方的 “换行嵌板”复选框 8. 确定
2015-5-12
信息技术教学中心
15
时间对信心指数的影响
2015-5-12
信息技术教学中心
10
信心指数的计算方法
首先计算出上述5道题的题目得分,将其直接相加,再除 以“基线”调查时的这一数值,即为当期的信心指数值。 因此,计算出来的指数代表当期数值相对于“基线”调查 数值的变动比例。如果乐观人群的比例高于基线,则指数 大于100;反之则小于100.目前作为基线水平的是2007年4 月的数值。
2015-5-12
信息技术教学中心
3
项目问卷
S0 受访者所在城市: 100.北京 200.上海 300.广州 S1 请问您贵姓是?_______
S2 记录被访者性别:
1.男性 2.女性 S3 请问您的实际年龄是?_____ S4 请问您的学历是? 1.初中/技校或以下
2015-5-12
2.高中/中专
2015-5-12 信息技术教学中心 2
案例背景
消费者信心是指消费者根据国家或地区的经济发展形势, 对就业、收入、物价、利率等问题综合判断后得出的一种看 法和预期,消费者信心指数则是对消费者整体所表现出来的
信心程度及其变动的一种测度。它是20世纪40年代后期提出,
60余年的历史证明了这一指标体系在预测未来宏观经济走向 方面具有不可替代的价值,目前已成为各市场经济国家非常 重要的经济风向标之一。
2015-5-12 信息技术教学中心 8
项目问卷
A16 对于大宗耐用消费品的购买,比如家用电器、电脑,以 及高档家具之类,您认为当前是购买的好时机吗? 1、很好的时机 2、较好时机 3、很难说,看具体情况而定 4、较差时机 5、很差的时机 9、不知道/拒答
2015-5-12
信息技术教学中心
9
信心指数的计算方法
2015-5-12
信息技术教学中心
31
最优尺度回归
问题 1. 家庭收入等变量目前按照无序分类被引入模型,如果考 虑有序的特征,又该如何对模型进行改善? 2. 同样是家庭收入这个变量,数据中约有10%为缺失值,这 些案例在方差分析模型中被直接删除了,如果将其加入 模型,会有怎样的结果? 3. 年龄S3目前是以协变量的方式纳入模型,意味着它和因 变量之间的作用方式只能是线性的,虽然在散点图中这 一趋势得到了确认,但又没有更加灵活的方式,可以判 断是否无存在其他关联趋势的可能。
3.大专 4.本科 5.硕士或以上
4
信息技术教学中心
项目问卷
S5 请问你的职业是? 1、企事业管理人员 2、工人/体力工作者(蓝领) 3、公司普 通职业(白领) 4、国家公务员 5、个体经营者/私营业主 6、 教师 7、学生 8、专业人士(医生、律师等) 9、无/待/失业、 家庭主妇 10、退休 11、其他职业 S7 请问你的婚姻状况是? 1.已婚 2.未婚 3.离异/分居/丧偶 S9 请问您的家庭月收入(包括工资、奖金和各种外快收入) 大约在什么范围? 1.999元或以下 2.1000~1499元 3.1500~1999元 4.2000~2999 元
数据分析与挖掘
Data Analysis & Mining 中国消费者信心指数影响因素分 析
2015-5-12
信息技术教学中心
1
学习要点
• 分析方法: -方差分析模型,多元方差分析模型,最优尺度回归,多水平模型 • 分析过程
– 统计图:直方图图组、线图、条图、散点图 – 一般线性模型:单变量、多变量 – 混合模型:线性 – 描述统计:序列图 – 回归:最佳尺度(CATREG)
2015-5-12
信息技术教学中心
13
数据理解
考察时间、地域对信心指数的影响 首先看总信心指数分布状况是否基本遵循正态分布,但是 在多次使用了直方图工具后,希望这次能够走得更远点:直 接在直方图中考察城市之间的信心指数水平是否存在差异, 具体操作如下: 1. 选择“图形”——“图表构建程序”菜单命令。 2. 从图库中选择直方图组,将右侧出现的简单直方图图标 拖入画布 3. 在变量列表中知道index1,将其拖入画布的横轴框中。 4. 在元素属性对话框中“显示正态曲线”复选框,注意随 后一定要单击下方的“应用”按钮,否则相应的操作不 会生效
2015-5-12
信息技术教学中心
18
职业影响
2015-5-12
信息技术教学中心
19
性别影响
2015-5-12
信息技术教学中心
20
学历影响
2015-5-12
信息技术教学中心
21
婚姻状况
2015-5-12
信息技术教学中心
22
收入的影响
2015-5-12
信息技术教学中心
23
年龄的影响
选择“图形”——“图表构建程序”菜单命令。 将简单散点图图标拖入画布 将年龄S3拖入横轴框中 将index1拖入纵轴框中 确定 双击进入图形编辑状态,依次单击“元素”——“总计拟 合线” 7. 在“拟合线”选项卡中,将拟合方法更改为loess,单击 “应用”按钮 8. 关闭图形并退出。 1. 2. 3. 4. 5. 6.
2015-5-12
信息技术ቤተ መጻሕፍቲ ባይዱ学中心
30
多元方差分析模型的结果
拟合多元方差分析模型 1. 依次单击“分析”——“一般线性模型”——“多变量” 2. 将QA3、QA4、QA8、QA10和QA16选入“因变量”框 3. 将月份time、城市S0、职业S5、婚姻状况S7及家庭收入S9 选入“固定因子”列表框 4. 将年龄S3选入“协变量”框 5. 进入“模型”子对话框,将各因素的主效应选入“模型” 框 6. 进入“选项”子对话框,选择“缺乏拟合优度检验” 7. 确定
2015-5-12 信息技术教学中心 24
2015-5-12
信息技术教学中心
25
标准GLM框架下的建模分析
1. 2. 3. 建立总模型 依次单击“分析”——“一般线性模型”——“单变量” 将总指数Index1选入“因变量”框 将月份time、城市S0、性别S2、学历S4、职业S5、婚姻状况S7 及家庭收入S9选入“固定因子”列表框 4. 将年龄S3选入“协变量”框 5. 进入“模型”子对话框,将各因素的主效应选入“模型”框 6. 进入“保存”子对话框,选择保存“未标准化预测值”和“标 准化残差”。 7. 进入“选项”子对话框,选择“缺乏拟合优度检验”
2015-5-12
信息技术教学中心
26
8. 确定 9. 选择“图形”——“图表构建程序”菜单命令 10. 将简单散点图图标拖入画布 11. 将未标准化预测值拖入X轴框,标准化残差拖入Y轴框 12. 确定 13. 双击进入图形编辑状态,在图形中添加Y=0的横线。
2015-5-12
信息技术教学中心
27