统计分析软件SPSS详细教程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10.11统计分析软件&SPSS建立数据
目录
10.11统计分析软件&SPSS建立数据 (1)
10.25数据加工作图 (1)
11. 08绘图解答&描述性分析: (3)
2.描述性统计分析: (4)
四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7)
第七章非参数检验 (10)
1.单样本的非参数检验 (11)
(1)卡方检验 (11)
(2)二项分布检验 (13)
2.两独立样本的非参数检验 (14)
3.多独立样本的非参数检验 (16)
4.两相关样本的非参数检验 (16)
5.多相关样本的非参数检验 (18)
第五章均值检验与T检验 (21)
1.Means过程(均值检验)( (21)
4. 单样本T检验 (22)
5. 两独立样本T检验 (23)
6.两配对样本T检验 (24)
第六章方差分析 (26)
单因素方差分析: (26)
多因素方差分析: (30)
10.25数据加工作图
1.Excel中随机取值:=randbetween(55,99)
2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤:
3.排序:个案排秩
4.数据选取:数据-选择个案-如果条件满足:
计算新变量:
5.频次分析:分析-统计描述-频率
还原:个案-全部
6.加权:
还原
7.画图:
11. 08绘图解答&描述性分析:1.课后题:长条图
2.描述性统计分析:
(1)频数分析:
(2)描述性分析:
描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。
操作:
分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据:
任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态,
(3)探索分析:(检验是否是正态分布:茎叶图、箱图)
实例:
操作:
(4)交叉列联表(探索定类型的变量间的相关性):【纯数值的变量用回归分析,名义变量用交叉分析】操作:
实例:
四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布)
例子:
第1步建立数据文建:
第2步:对数据进行预处理;(给数据加权)
第3步进行卡方检验:
第4步结果分析
P=0.011<0.05,则在5%显著性水平下拒绝原假设,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
如何选sig值:期望值就是T 是理论频数 N是样本数量(合计)
对应:
1
2
3
配对卡方检验:
第1步建立数据文建:
第2步对数据进行加权处理
第3步进行配对卡方检验
结果分析:
第七章非参数检验
使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。
1.单样本的非参数检验 (1)卡方检验
分析步骤
第1 步 提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。 第2步 选择检验统计量:卡方分布选择的是Pearson 卡方统计量。已证明,当n 充分大时,它近似地服从自由度为k -1的卡方分布。
第3步 计算检验统计量的观测值和概率p 值。 第4步 给出显著性水平,作出决策。 实例:
某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的
五个工作日中?(
)
第1步 分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。
0.05α=
第2步数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保存。
第3步加权设置:将变量“number”定义为权变量。
第4步进行卡方检验:
第5步主要结果及分析
左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差
右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.014<0.05。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。
(2)二项分布检验
【例7-2】某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?
第1步分析:由于性别分为男与女两种状态,故应用二项分布检验。第2步数据的组织:数据分成两列,其变量名为“性别”,“频数”。输入数据并保存。进行加权处理。
第3步进行二项分布检验:
第4步主要结果及分析
从上表可知,相伴概率Sig.=0.736>0.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。
2.两独立样本的非参数检验
【例7-3】某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著性水平=0.05下,判断两个品牌间是否存在显著性差异?
第1步分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。
第2步数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。
第3步进行独立样本的非参数检验