统计分析软件SPSS详细教程

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.
【例7-3】某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表是两种品牌汽油每加仑的行驶里程数,在显著性水平=下,判断两个品牌间是否存在显著性差异?
A
B
33
第1步分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。
第3步两相关样本的非参数检验:设置如下图
Z统计量为,相伴概率为,小于显著水平,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。
结果分析:
Z统计量为,相伴概率为,小于显著水平,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。
其相伴概率为,小于,说明新工艺与旧工艺有显著性差异,这与Wilxocon检验结果是一致的。
第3步计算检验统计量的观测值和概率p值。
第4步给出显著性水平,作出决策。
实例:
某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?()
工作日
1
2
3
4
5
次品数
25
15
8
16
new
25
12
14
22
21
17
22
16
17
18
19
24
22
15
22
23
old
18
17
16
19
24
19
28
18
22
24
22
30Leabharlann Baidu
25
20
24
21
第1步分析:由于是同一批工人和同一批机器,其先后的成本是相关的,同时也不知数据的分布情况,故应用两相关样本的非参数检验。
第2步数据组织:数据分成两列,第一列为新工艺的成本,第二列为旧工艺的成本。
第1步分析:由于性别分为男与女两种状态,故应用二项分布检验。
第2步数据的组织:数据分成两列,其变量名为“性别”,“频数”。输入数据并保存。进行加权处理。
第3步进行二项分布检验:
第4步主要结果及分析
从上表可知,相伴概率Sig.=>,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。
26
第1步分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。
第2步数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保存。
第3步加权设置:将变量“number”定义为权变量。
第4步进行卡方检验:
第5步主要结果及分析
左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差
第2步:对数据进行预处理;(给数据加权)
第3步进行卡方检验:
第4步结果分析
P=<,则在5%显著性水平下拒绝原假设,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
如何选sig值:期望值就是T是理论频数N是样本数量(合计)
对应:
1)选第一个:
2)选
3)选
配对卡方检验:
第1步建立数据文建:
5.
某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。问这5个评委的判断标准是否一致。
节目1
节目2
节目3
节目4
节目5
评委1
9
评委2
10
评委3
评委4
评委5
第1步分析:由于5个评委打分是分别针对同一个节目,所以数据之间具有相关性,同时不知道数据所服从的分布,可以采用多相关样本的非参数检验。
第2步数据组织:由于是分析的评委之间的评判标准是否一致,故应将每个评委所打的分各分成一列。
统计分析软件
数据加工作图
中随机取值:=randbetween(55,99)
中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤:
3.排序:个案排秩
4.数据选取:数据-选择个案-如果条件满足:
计算新变量:
5.频次分析:分析-统计描述-频率
还原:个案-全部
任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态,
(3)探索分析:(检验是否是正态分布:茎叶图、箱图)
实例:
操作:
(4)交叉列联表(探索定类型的变量间的相关性):【纯数值的变量用回归分析,名义变量用交叉分析】操作:
实例:

例子:
第1步建立数据文建:
6.加权:
还原
7.画图:
11.
1.课后题:长条图
2.
(1)频数分析:
(2)描述性分析:
描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分 ,并以变量形式存入数据文件中,以便后续分析时应用。
操作:
分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据:
右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=<。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。

【例7-2】某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为)是否不同?
根据游程检验计算的Z统计量为,对应在单尾显著性概率为,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设。
从以上四种检验方法所得到的结果是相同的,即两种汽油之间无显著性差异。
3.
4.
某企业提出了一项新工艺,为了检验新工艺是否能降低单位成本,随机抽取16个工人分别用新旧工艺生产产品,测得单位成本资料如下表,请在显著性水平下检验是否新工艺降低了成本?
第2步数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。
第3步进行独立样本的非参数检验
双尾检验的相伴概率为,大于,说明两种汽油无显著性差异。
两个相伴概率都大于显著性水平,因此应接受零假设,认为两种汽油之间无显著性差异。
Kolmogorov-Smirnov Z值为,相伴概率值为,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设;
第2步对数据进行加权处理
第3步进行配对卡方检验
结果分析:
第七章
使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。
1.

分析步骤
第1步提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。
第2步选择检验统计量:卡方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。
相关文档
最新文档