第七章 研究方法——spss
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、定义变量(续)
“变量定义界面”的各栏目含义:
栏目 含义 栏目 含义 name 变量名 values type 变量类型 missing width decimals label
变量值宽度 小数位数 变量标签 columns align measure
值标签 缺失值定义 显示列宽度 对齐方式 变量测度
由于变量名的长度有限,变量名常不能清楚地 表明变量的含义,SPSS设计了Label栏目,可进 一步说明有关变量的详细含义。 Values栏目: 对变量值的进一步说明,主要用于对名义级变 量和顺序级变量的“值”的说明。 例如,“f”=“女”, “m”=“男”,“1”=“不及 格”,“5”=“优秀”等。
主讲:吴婵君
一、SPSS For Windows的概述 二、使用SPSS的基础知识 三、SPSS的简单应用
一、SPSS For Windows的概述
1、简介
SPSS即Statistical Package for the Social Sciences,即社会科学统计程序。20世纪60年代末, 美国斯坦福大学的三位研究生研制开发了最早的统 计分析软件SPSS,成立了SPSS公司,迄今已有近40 年的历史,是国际著名三大社会科学统计软件包之 一。 随着SPSS产品服务领域的扩大和服务深度的增加, SPSS公司将其更名为Statistical Product and Service solutions,即“统计产品与服务解决方 案”。SPSS公司也已经由单一的统计软件开发商发 展成为集统计分析、数据挖掘、商业智能、客户关 系管理等多种产品和咨询服务于一体的跨国公司。
0 9.92 9.94 9.96 9.98 10.00 10.02 10.04
Cumulative Valid Percent Percent 3.3 3.3 3.3 6.7 3.3 10.0 6.7 16.7 10.0 26.7 13.3 40.0 13.3 53.3 13.3 66.7 6.7 73.3 10.0 83.3 6.7 90.0 6.7 96.7 3.3 100.0 100.0 Mean = 10.003
定义SPSS数据 文件结构 录入修改来自百度文库存 为SPSS数据
统计分析
解释分析结果
1、SPSS的界面
每一行对应一个case(即一个案例,或一个对象、 一个观察、一个个体),每一列对应一个变量。
2、定义变量
SPSS数据文件由数据的结构和内容两部分构成。 其中数据的结构记录数据类型、取值说明、数据缺 失等必要信息(Variable View); 数据的内容是 那些待分析的具体数据(Data View)。 定义变量是输入数据的前提。定义变量,不仅要按 照规则定义变量名,而且要定义变量的类型,说明 变量的实际含义。 变量名和变量属性的编辑是在“变量定义界面” (Variable View)中进行的。
Percentile Values栏,百分位数选择项。
Quartiles,输出四分位数; Cut points for equal groups,输出等分点的百分位数(2100之间);
Dispersion 离差栏:
Std.Deviation 标准差 Variance 方差 Range 全距 Minmum 最小值 Mmaxmun 最大值 S.E.mean 均数的标准误差
3、均值比较及检验
T Test 过程:对样本进行T检验的过程。
单一样本的T检验:检验单个变量的均值是否与给 定的常数之间存在差异;
独立样本的T检验:检验两组不相关的样本是否来 自具有相同均值的总体(均值是否相同,如男女 的平均收入是否相同,是否有显著性差异); 配对T检验:检验两组相关的样本是否来自具有相 同均值的总体(前后比较,如训练效果,治疗效 果)。
例1:定义变量
40个学生的一些信息:序号,性别,出生年,月, 日,身高,体质,血型。 计算身高平均值、标准差、中位数、众数、最大值、 最小值及饼图。
3、输入数据
单击“Data view”标签可进入“数据编辑界面” ;
按行(观测量)、按列(变量)、按单元格
4、保存数据
选择菜单File==>Save,将其存为SPSS自己的数据 格式(*.sav文件),在文件名框内键入并回车。
2、定义变量(续)
Missing栏目:定义变量缺失值的处理方法
Measure栏目:定义变量的测度级别
1)Scale (刻度级):仅适合于数值型变量 ; 2)Ordinal (序次级):可用数字表示,也可用 字母表示。如受教育程度这个序次测度等级的变 量,采用数字编码表示不同等级,文盲=1,小学 =2,初中=3,高中=4,大学=5; 3)Nominal (名义级):测量数值仅代表分类 或属性,数值无法比较大小 ,如喜欢的颜色。
例2:CH3CH4价格
操作步骤如下:
1 ) 单 击 Analyze →Descriptive Statistics →Frequencies ,弹出频次分析模块的主窗口; 2)在左侧源变量框中选择一个或多个变量送入 Variables(s)中;
根据需要选择相应的选择项:
①Display frequency tables 选择此项将显示频数 分布表。如果你只想画图可以不选择此项。 ②Statistics 选择此项,打开统计量选择对话框 如图所示。在对话框中选择输出统计量。 可选择的统计量分四组,每组中的统计量可以 并列选择。
Std. Dev. = 0.03098 N = 30 10.06
Frequency
某 品 格 单 : ) 商 价 ( 位 元
例3:CH4男女性别身高
操作步骤如下: 1 ) 单 击 Analyze →Descriptive Statistics → Descriptives ,弹出描述统计模块的主窗口; 2)在左侧源变量框中选择一个或多个变量送入 Variables(s)中。
One-Samples T Test:针对一个总体,检验样本平 均数与总体平均数是否有显著的差别。
例4:已知去年某小学五年级学生400米的平均成绩是 100秒,今年该校测得60个五年级学生的400米成绩, 检验该校五年级学生的400米的平均成绩是否仍为100 秒(有无提高或下降)[CH6参检1小学生400米]。 此检验的假设是H0:平均成绩是仍为100秒;H1:平 均成绩是不为100秒。 操作步骤:单击Analyze →Compare Means →OneSamples T Test;
8
某 品 格 单 : ) 商 价 ( 位 元
30 0 10.0030 .00566 10.0000 9.99a .03098 -.212 .427 -.165 .833 300.09 9.9800 10.0000 10.0300
Valid
6
4
25 50 75
2
9.93 9.95 9.96 9.97 9.98 9.99 10.00 10.01 10.02 10.03 10.04 10.05 10.06 Total
2、SPSS的应用领域
宏观经济管理的诸多领域(如宏观经济政策、金融政 策、产业结构分析、就业分析等);
企业经营管理的诸多领域(如市场研究、销售研究、 客户行为特征研究、人力资源管理、财务分析等); 行业管理与特征分析(如金融产品分析、资本市场分 析、货币市场分析,制造业分析、信息服务业分析、 农业与农民收入分析等); 社会学、民族学、人类学等社会科学领域; 医学、农学、工学、军事学领域等等。
三、 SPSS的简单应用
1、频次、频率分析
频数分布表是描述性统计中最常用的方法之一,此 外还可对数据的分布趋势进行初步分析。 利用变量的频数分布分析可以方便的对数据按组进 行归类整理,形成各观测量的不同水平(分组)的 频数分布情况表和图形,以便对数值的数量特征和 内部结构状况有一个概括的认识。
2、定义变量(续)
Name栏目: 定义变量名称
要求:名称长度控制在8位以内(汉字不能超过 4个),并尽量使用英文名称。
Type栏目: 定义变量类型
数值型:如分数、收入、销售额等; 字符型:如血型、等级等; 日期型; 注:SPSS默认的是数值型。
2、定义变量(续)
Label栏目:定义变量名标签
例5:用两种激励A与B,对同样工种的A、B两个班 进行激励,测得激励后业绩增长率。问:两种激励 方法的平均效果有无显著差异?[CH6CH7独立检验 激励实验] 操作步骤:1)单击Analyze →Compare Means → Independent-Samples T Test;
参考书:
卢纹岱主编,SPSS for Windows 统计分析, 电子工业出版社; 马庆国,管理统计:数据获取、统计原理与应用研 究,北京:科学出版社; 网络地址: 英文:www.spss.com
中文:www.spss.com.cn
二、使用SPSS的基础知识
建立SPSS数 据文件 数据的加工整理
3、SPSS的特点
SPSS集数据录入、资料编辑、数据管理、统计分析、 报表制作、图形绘制为一体。 SPSS统计功能囊括了《统计学》中所有的项目,包括 常规的集中量数和差异量数、相关分析、回归分析、 方差分析、卡方检验、t检验和非参数检验;也包括 近期发展的多元统计技术,如多元回归分析、聚类分 析、判别分析、主成分分析和因子分析等方法,并能 在屏幕(或打印机)上显示(打印)如正态分布图、 直方图、散点图等各种统计图表。 数据文件建好后,可对变量反复进行各种统计分析。 SPSS界面友好,操作简单。
统计结果分析
One-Sample Statistics N 小 生 400米 时 学 跑 的 间 60 Mean 105.3850 Std. Deviation 38.82007 Std. Error Mean 5.01165
Independent-Samples T Test:针对两个总体的独 立样本情形,即从两个独立的总体中抽取两个相互 独立的样本,通过两个样本的平均数检验两个总体 的平均数是否有显著差别。
集中趋势分析(众数、中位数、分位数、均值等) 离散趋势分析(方差、标准差、最小(大)值等)
偏度、峰度测量
统计图形分析(直方图、茎叶图、箱线图等)
统计结果分析
10
Histogram
Statistics 某 品 格 单 : ) 商 价 ( 位 元 N Mean Std. Error of Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Sum Percentiles Valid Missing
General Tendency 中心趋势栏
Mean 均数 Median 中位数 Mode 众数 Sum 算术和
Distribution 分布参数栏
Skewness 正态分布的偏度,同时显示偏度的标 准误差; Kurtosis 正态分布的峰度。
Format 设置频数表输出格式
Multiple variables 多变量栏
Compare variables,所有变量结果在一个图形中输出; Organize output by variables,为每一个变量单独输出 一个图形。
Charts 统计图形
2、统计描述分析
统计分析的目的是研究总体特征,而往往由于客观 条件的限制,我们只能得到从总体中随机抽取的一 部分观察对象,即样本,只有通过对样本的描述和 研究,才有可能对总体进行某种可能的推断。描述 统计分析是推断统计分析的基础。基本内容包括:
Frequency 1 1 1 2 3 4 4 4 2 3 2 2 1 30
Percent 3.3 3.3 3.3 6.7 10.0 13.3 13.3 13.3 6.7 10.0 6.7 6.7 3.3 100.0
a. Multiple modes exist. The smallest value is shown