第2章 数据录入与数据获取
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)定序尺度(Ordinal Measurement):定序尺度是对事物之间的 等级或顺序差别的一种测度,可比较优劣或排序。用:序号(O)表示。 如:1.教授 2.副教授 3.讲师 4.助教。 特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的 准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能 排序,不能进行运算。
消费者总体信心可预测GDP增长趋势 (平均领先3个季度,相关系数0.9) 消费者就业信心可预测实际失业率 (平均领先3个季度,相关系数0.8) 消费者的物价预期可预测实际通胀率 (平均领先1个季度,相关系数0.9) 消费者购车信心可预测实际汽车销量 (平均领先2个季度,相关系数0.73)
@文彤老师
2018年9月18日
8
2.1 数据格式概述
• 2.1.1 统计软件中数据的录入格式
• (1)不同观测对象的数据不能在同一记录中出现,即同一
观测数据应当独占一行。 • (2)每一个观测量指标或影响因素只能占据一列的位置, 即同一指标的数量观测值都应当录入到同一个变量中去。 即:一个观测占一行,一个变量占一列
指数有效性在各国已得到广泛验证
中国消费者信心调研
遵循了美国密歇根大学消费者信心调研的方法学,并根据中国国情进行了修正 和深化,是密歇根大学消费者信心调研的中国版
@文彤老师
2018年9月18日
4
中国消费者信心调研(China Consumer Sentiment Survey, CCSS)
每月进行的、反映中国消费市场状况及消费者对家庭经济及宏观经济信心的独立第三方调研 目前属于全球最大的德意志证券交易所集团旗下产品 中国消费者信心调研的研究方法是在美国密歇根大学社会研究院消费者信心调查课题组负责人 Richard Curtin博士的协助与指导下完成的 中国消费者信心调研(CCSS)包括以下方面: 当前家庭经济状况 耐用品消费 未来1年家庭经济预期
数值型:数值型的数据是0-9的阿拉伯数字和其他符号,
标准 数值型 逗号 数值型 圆点 数值型 科学技术法 数值型 美元 数值型 用户自 定义型 日期型
如美元符号、逗号或圆点组成的。
用户自 定义型
字符型:字符型数据的默认显示宽度为8个字符位,系统不区
分变量名中的大小写字母,并且不能进行数学运算。 注意:在输入数据时不应输入引号,否则双引号将会作为字 符型数据的一部分。
第2章 数据录入与数据获取
本章主要解决两个问题:
第一个问题,根据问题类型的不同,将会从开放题、
单选题和多选题的录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类型 和文本格式的数据。
什么是消费者信心指数
– 消费者信心 (Consumer Confidence or Consumer Sentiment) 是指消费者根据国家或地区的经济发展 形势,对就业、收入、物价、利率等问题的综合判 断后得出的一种看法和预期 – 消费者信心指数(Consumer Sentiment Index, CSI) 的 概念和方法是由美国密歇根大学调查研究中心的乔 治 卡通纳(George Katona) 在上世纪40年代后期提出 的。
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行定义。 (1)定类尺度(Nominal Measurement):定类尺度是对事物的类别或 属性的一种测度,按照事物的某种属性对其进行分类或分组。用:名义 (N)表示。如,1.男 2.女 特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能 比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的 变量只能计算频数和频率。 在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型 变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥 原则。
密歇根大学消费者信心指数对美、欧股市以及美国政府的经济政策有直接影响
已列入美国商务部发布的主要综合指标,并被各大媒体广泛引用 前美国联邦储备委员会主席格林斯潘就曾表示,他非常重视消费者信心指数 在美国及全球各大消费品生产商中广泛使用,用于预测销量及利润
全球各国的消费者信心指数研究方式大致相同,其理论基础均源于密歇根大学的研究方法,
在spss中统称为“度量(S)”
三、变量名与变量标签值
Label:定义变量名标签 Value:定义变量值标签
四、缺失值
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失值 为点(.)。
2.2 数据的直接录入
• 2.1.1 操作界面说明
个测度值之间比值的一种计量尺度,它的测量结果同定距变量
一样表现为数值。如,销售收入、工资等 特点:定比变量是测量尺度的最高水平,它除了具有其他三种
测量尺度的全部特点外,还具有可计算两个测度值之间比值的
特点,因此它可以进行加、减、乘、除运算,而定居变量值可 进行加减运算。
由于后两种测度尺度在绝大多数统计分析时没有本质上的区别,
现状指数 月度总信心指数
预期指数
未来1年宏观经济预期
未来5年宏观经济预期
耐用品购买 房地产 行业分类指数 证券投资 汽车消费
消费者物价感受及预期 消费者利率预期 ……
@文彤老师
2018年9月18日
5
中国消费者信心调研的研究方法
发布频率 数据采集方式 样本选择 每月一次 CATI (电脑辅助电话访问),随机抽样,第一手调研 18-64岁中国城市居民,家庭开支或投资决策者 抽取中国经济最发达的30个城市 代表中国1/7的人口与1/3的GDP
A3 首先,请问与一年前相比,您的家庭现在的经济状况怎么样呢?是 变好、基本不变还是变差? 1 明显好转 2 略有好转 3 基本不变 4 略有变差 5 明显变差 9 说不清/拒答 A3a 为什么您这样说呢?(最多限选两项)___
0 中性原因 90 不知道/拒答 10 改善:收入相关 110 恶化:收入相关 20 改善:就业状况相关 120 恶化:就业状况相关 30 改善:投资相关 130 恶化:投资相关 40 改善:家庭开支相关 140 恶化:家庭开支相关 50 改善:政策/宏观经济 150 恶化:政策/宏观经济相关
日期型:日期型数据是用来表示日期或时间的。日期型数据
的显示格式有很多,SPSS以菜单方式列出日期型数据的显示
格式以供用户选择。
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示 “分”钟。
“mmm”表示要求书写英文月份单词的前三个字母组成的缩写。
“ddd”三个字母d表示要求用从元月一日算起的日数表示日期。 指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用 “/”或“—”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为 指定的格式,显示在单元各种。
• 消费者的看法、态度和预期这些心理的直接感受决定了 他们的消费支出计划。对消费者心理及其变动的测度就 是对消费总量变动测度的一个补充。根据消费者调查结 果可以计算消费者情绪指数(Consumer Sentiment Index), 又称“消费者信心”。
@文彤老师
2018年9月18日
2
消费者信心指数背后的经济学原理
2.2.2 开放题和简单单选题的录入
一、在spss中定义变量
录入数据的第一步是定义变量属性,随后才能进行数据录入。 二、开放题的录入
三、单选题的录入 单选题的录入可以采用字符直接录入、字符代码+值标签、 数值代码+值标签三种方式。
2.2.3多选题的录入
一、多重二分法(Multiple Dichotomy Method) 所谓多重二分法,是在编码的时候,对应每一个选项都要定义 一个变量,有几个选项就有几个变量,这些变量均为二分类, (二分类变量指的是该变量只有两个取值,如,选择或不选 择)他们各自代表对一个选项的选择结果。 二、多重分类法(Multiple Category Method) 多重分类法,也是利用多个变量对一个多选题的答案进行 定义,应该用多少个变量,由被访者实际可能给出的最多答 案个数而定。
– 1 初中/技校或以下 2 高中/中专 3 大专 4 本科 5 硕士或以上
@文彤老师 2018年9月18日 7
中国消费者信心指数研究问卷
C0 请问您的家庭目前有下列还贷支出吗?
C0_1 房贷 1 有 2 无 99 拒答 C0_2 车贷 1 有 2 无 99 拒答 C0_3 其他一般消费还贷 1 有 2 无 99 拒答
(3)定矩尺度(Interval Measurement):定矩尺度是对事物类别 或次序之间间距的测度。如温度。
特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指 出类别之间的差距是多少;定居变量通常以自然或物理单位为计量 尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减 运算。
(4)定比尺度(Scale Measurement):定比尺度是能够测算两
为了在统计分析过程中能有效的利用其它软件产生的数据,
SPSS软件编辑窗口除可以使用*.sav扩展名数据文件,还可以直接
打开和保存下述类型的文件: SPSS DOS版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS统计软件产生的数据文件。
2.1.2 变量属性介绍
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第一步:指定每个变量的各种属性; 第一步:录入数据。 变量名不能与spss保留字相同,spss的保留字有ALL、END、 BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。
一、变量的储存类型
• SPSS中,变量有三种的基本类型:数值型、字符型和日期型。
在【变量视图】表中,每一行描述一个变量,依次是: Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过8个 字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个 字符不能是句号。 Type:变量类型。变量类型有8 种,最常用的是Numeric数值型变量。其 它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数加一 个逗号)等。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认列宽为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺 度三种。
三、多选题录入在spss中的实现
• 居民在决策家庭的开销,特别是购买诸如 住宅、汽车等耐用商品时,是经过深思熟 虑才决定的。不仅是以目前的经济条件Байду номын сангаас 基础,同时结合了对未来收入、就业、物 价、利率变动等因素的判断和预期
• 六十多年的时间已经充分验证了上述理论 在解释宏观经济现状时的有效性与合理性
@文彤老师
2018年9月18日
3
密歇根大学消费者信心指数的价值已得到实际证明 是预测宏观经济走向的精确指标
访谈时间长度
问卷问题数量 样本量
10~15 分钟
不少于30题 每月不少于1,000样本
@文彤老师
2018年9月18日
6
中国消费者信心指数研究问卷
• S0 受访者所在城市:
– 100 北京 200 上海 300 广州
• S1 请问您贵姓是?___ • S2 记录被访者性别:
– 1 男性 2 女性
• S3 请问您的年龄是?___ • S4 请问您的学历是?
标尺栏 当前数据栏 标题栏 菜单栏 工具栏 数据输入区 数据编辑区
【数据视图】表可 以直接输入观测数 据值或存放数据, 表的左端列边框显 示观测个体 的 序 号 ,
最上端行边框显示
变量名。
窗口标签
状态栏
显示区滚动条
【变量视图】表用来定义和修改变量的名称、类型及其他属性,如图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的 属性,直接输入数据,系统将默认变量Var00001,Var00002等。