SPSS复习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【数据】 【分类汇总】
分类汇总中的分类变量可以是多个,称为多重分类汇总
3.7、数据分组
组距分组: (n为数据个数)
数据标志分组的方法:1、单项式分组:一个变量为一组,适合于离散型变量且变动范围小
2、组距分组:以一定区间的变量为一个组,适合于连续变量或变动范围大的离散型变量(等距数列、异距数列)
【转换】 【重新编码为不同变量】
第一章
SPSS的英文缩写:
中文:社会科学统计软件包、统计产品与服务解决方案
1.1SPSS使用基础
SPSS的基本窗口
SPSS数据文件:.savSPSS输出文件:.spv
1.2SPSS的基本运行方式
1.3利用SPSS进行数据分析的基本步骤
建立数据文件加工整理数据数据分析解释分析结果
第二章、SPSS数据文件的建立和管理
2、交叉列联表行列变量间关系的分析
(1)、交叉列联表的卡方检验
第一步:提出原假设( ) 第二步:计算检验统计量
第三步:确定显著性水平和临界值
显著性水平 是指原假设为真却将其拒绝的风险,即弃真的概率。通常设为0.05或0.01。
第四步;得出结论和决策
方式一:如果卡方的观测值大于卡方临界值,则认为卡方值已经足够大,实际分布和期望分布之间的差距显著,可以拒绝原假设,断定列联表的行列变量间不独立,存在相关关系;相反,则不拒绝原假设;
【数据】 【排序个案】 【排序依据】 【排序顺序】
3.2、查找重复个案
【数据】 【标识重复个案】
3.3、变量计算(目的:派生新变量、变换数据的原有分布)
在原有数据的基础上,计算产生一系列的新变量
【转换】 【计算变量】 (对不满足指定条件的个案,不进行变量值计算)
3.4、数据选取:根据分析的需要,在大批数据中按一定的规则抽样分析
全距:也称极差,最大值和最小值之间的绝对差
3、刻画分布形态的描述统计量:偏度系数、峰度系数
峰度系数:左偏,峰度<0,表示数据的分布比标准正态更平缓;右偏,峰度>0,表示数据的分布比标准正态更陡峭。
4.3 交叉分组下的频数分析(列联表分析)
1、基本任务:a:根据收集到的样本数据编制交叉列联表
b:在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析
4.1、频数分析
基本任务:1、编制频数分布图;2、绘制统计图。
【分析】 【描述统计】 【频率】
扩展功能:计算分位数(刻画变量的取值分布状态)
分位数差是一种描述数据离散程度的方式,分位数越大,表示数据在相应分位段上的离散程度越大。
4.2、计算基本描述统计量
基本描述统计量三大类:刻画集中趋势、刻画离散程度、刻画分布形态
2.1、SPSS数据文件
1.原始数据(原始的调查问卷)的组织方式:在数据编辑器窗口中的一行为一个个案,一列为一个变量
2.计数数据(经分组汇总)的组织方式:在数据编辑器窗口中的一行为一个分组,一列仍为一个变量
2.2、SPSS数据的结构和定义方法
1.变量名(是变量访问的分析的唯一标识)
变量的起名规则
2.变量名/值标签:对变量名/取值含义的解释说明
【数据(D)】 【合并文件(G)】 【添加个案(C)】
横向合并数据文件:将一个SPSS数据文件的内容拼到数据编辑器窗口中当前数据的右边,依据两份数据文件的个案进行数据对接;(注:两个数据至少有一个名称相同的变量,都要先按关键变量值的升序排序)
【数据(D)】 【合并文件(G)】 【添加变量(V)】
合并变量包括一对一合并和一对多合并;一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。
第三章、SPSS数据的预处理
3.1、数据的排序
将数据编辑器窗口中的数据按照某个或多个指定变量的变量值升序或降序重新排列。当排序变量只有一个时称为单排序变量,有多个时称为多重排序。多重排序时,数据首先按主排序变量值的大小次序排序,然后对具有相同主排序变量值的数据再按第二排序变量依次排序。(数据排序是对整行数据排序,而不是只对某列变量排序)
注:在定义分组区间时应遵循“不重不漏”的原则(互斥、穷尽)(上限不在内)
3.8、数据预处理的其它功能
加权处理:【数据】 【加权个案】 【加权个案(W)】 【频率变量】(选择一个加权变量)
数据拆分:根据指定变量对数据进行简单排序和分组
【数据】 【拆分文件】
第四章、SPSS基本统计分析
对数据的基本统计分析包括
3.用户缺失值:将缺失的数据用指定的数据代替,分析时将缺失值与正常值区分
4.计量尺度 数据
5.SPSS数据定位:人工定位和自动定位
6.SPSS数据文件的合并
(*为当前文件,+为其它来源)
纵向合并数据文件:将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面,依据两份数据文件的变量名进行数据对接;
方式二:如果卡方观测值的概率P-值小于等于 ,拒绝原假设,断定列联表的行列变量间不独立,存在依存关系,若P-值大于等于 ,则不能拒绝原假设。
4.4 多选项分析(针对问卷调查中的多选项问题的)
多选项分析的分解胡两种方法:1、多选项二分法 2、多选项分类法
1、多选项二分法:将多选项问题中的每个答案设为一个SPSS变量,每个变量只有0和1两个取值,分别表示选择该答案和不选择该答案
选取方法 :【转换】—【随机数字生Biblioteka Baidu器】
3.5、计数:对所有个案或满足某条件的部分个案,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果存入一个新的变量中。(明确哪些变量参与计数、新变量名、计数区间)
【转换】 【对个案内的值计数】
3.6、分类汇总:根据某分类变量进行分类计算(明确分类变量、汇总变量)
1、刻画集中趋势的描述统计量:均值、中位数、众数
集中趋势:一组数据向某一中心值靠拢的倾向
均值标准误:对样本均值与总体均值之间平均差异程度的估计,定义:
足够多的样本均值服从正态分布: ~N( , ) ,n为样本量。
2、刻画离散程度的描述统计量:样本标准差、样本方差、全距
离散程度:一组数据据远离中心值的程度
相关文档
最新文档