SPSS课件假设检验和均值比较
合集下载
spss第九章均值比较分析
均值比较分析
假设检验的基本步骤
• 第一步,提出原假设( H0)和备择假设( H1) • 第二步,选择检验用统计量,并确定其分布形式 • 第三步,选择显著性水平α ,确定决策临界值 • 第四步,根据检验统计量的具体数值,做出决策
Page ▪ 2
单样本的均值检验
▪ 1、大样本下的均值检验
• 当总体服从正态分布时,样本均值也服从正态分布,当总体不服从正态分布时 ,若样本容量充分大,样本均值渐近服从正态分布。因此大样本下的均值检验 可采用Z统计量。 » 当总体方差已知时,检验统计量的计算公式为:
甲方法:31、34、29、32、35、38、34、30、29、32、31、26
乙方法:26、24、28、29、30、29、32、26、31、29、32、28
▪ 目的在于比较用方法甲的产品和用方法乙的产品的装配时间有无差异,即
μ1=μ2是否成立。假设H0: μ1-μ2=0; H1:μ1-μ2≠0
总体一 总体二
Spss分析
Page ▪ 5
输出结果
▪ t=0.604,自由度为14,P=0.555>0.05;按α=0.05水准,尚不能认为元件的 平均寿命大于225小时,即与理论分析的结果相同。
Page ▪ 6
独立样本的均值比较
▪ 正态总体方差已知 • 当两个总体均为正态分布,且两个总体的方差分别为σ1^2 ,σ2^2为已知。 x̅1 ,x̅2 表示两总体的平均数,
的装配时间是有显著差异的。
Page ▪ 9
Spss分析
▪ 正态性检验
Page ▪ 10
Page ▪ 11
▪ 输出结果表明两种方法的总体分布是符合正态性要求的,所以前面假设其 为正态分布是合理的,可以用t检验
假设检验的基本步骤
• 第一步,提出原假设( H0)和备择假设( H1) • 第二步,选择检验用统计量,并确定其分布形式 • 第三步,选择显著性水平α ,确定决策临界值 • 第四步,根据检验统计量的具体数值,做出决策
Page ▪ 2
单样本的均值检验
▪ 1、大样本下的均值检验
• 当总体服从正态分布时,样本均值也服从正态分布,当总体不服从正态分布时 ,若样本容量充分大,样本均值渐近服从正态分布。因此大样本下的均值检验 可采用Z统计量。 » 当总体方差已知时,检验统计量的计算公式为:
甲方法:31、34、29、32、35、38、34、30、29、32、31、26
乙方法:26、24、28、29、30、29、32、26、31、29、32、28
▪ 目的在于比较用方法甲的产品和用方法乙的产品的装配时间有无差异,即
μ1=μ2是否成立。假设H0: μ1-μ2=0; H1:μ1-μ2≠0
总体一 总体二
Spss分析
Page ▪ 5
输出结果
▪ t=0.604,自由度为14,P=0.555>0.05;按α=0.05水准,尚不能认为元件的 平均寿命大于225小时,即与理论分析的结果相同。
Page ▪ 6
独立样本的均值比较
▪ 正态总体方差已知 • 当两个总体均为正态分布,且两个总体的方差分别为σ1^2 ,σ2^2为已知。 x̅1 ,x̅2 表示两总体的平均数,
的装配时间是有显著差异的。
Page ▪ 9
Spss分析
▪ 正态性检验
Page ▪ 10
Page ▪ 11
▪ 输出结果表明两种方法的总体分布是符合正态性要求的,所以前面假设其 为正态分布是合理的,可以用t检验
假设检验概述与总体均值的检验(含SPSS操作)
2
1 2 σ 0 ) 。设 H 0 为真,即 μ = μ0 ,对 X 作标准 N
化变换,得到
Z=
( X − μ0 ) N
σ0
~ N (0,1)
(7.19)
5
上面的 Z 就是我们要构造的检验统计量。设定显着性水平 α 为 0.05,因为 Z ~ N (0,1) ,
| Z |≥ 1.96 的概率为 0.05,所以检验的拒绝域是 | Z |> 1.96 。就是说,如果由样本计算得到
第四节 总体均值的检验 一 单总体的 Z 检验和 t 检验 设 X 1 , X 2 ,L , X N 是取自正态总体 N ( μ , σ ) 的一个样本,要检验
2
H0 :
其中 μ 0 为已知的常数。
μ = μ0 , H1 :
μ ≠ μ0
(7.18)
为了说明如何构造检验统计量和拒绝域,先看一个简单的情形。设总体方差是已知的, 记为 σ 0 ,设 X 为样本均值,则 X ~ N ( μ ,
的 | Z |≥ 1.96 ,则拒绝零假设。这就是所谓的 Z 检验。 检验的推理过程是这样的:先设 H 0 为真,在有了观测样本后,由(7.19)就可以计算 统计量 Z 的值(此时公式中已经没有未知数) ,根据小概率原理,计算的 | Z | 应当小于 1.96。 如果计算的 | Z | 大于或等于 1.96,则与小概率原理矛盾,从而怀疑零假设 H 0 不真,并做出 拒绝 H 0 的检验结果。 但在实际应用中,总体的方差是未知的。因而需要用样本方差代替总体方差,相应地, 检验统计量变成了 t 统计量。 设 X 与 S 分别为样本均值和样本方差, 当 H 0 为真时, 由 (7.6) 可知统计量
图 7-2 两类错误及其关系示意图
1 2 σ 0 ) 。设 H 0 为真,即 μ = μ0 ,对 X 作标准 N
化变换,得到
Z=
( X − μ0 ) N
σ0
~ N (0,1)
(7.19)
5
上面的 Z 就是我们要构造的检验统计量。设定显着性水平 α 为 0.05,因为 Z ~ N (0,1) ,
| Z |≥ 1.96 的概率为 0.05,所以检验的拒绝域是 | Z |> 1.96 。就是说,如果由样本计算得到
第四节 总体均值的检验 一 单总体的 Z 检验和 t 检验 设 X 1 , X 2 ,L , X N 是取自正态总体 N ( μ , σ ) 的一个样本,要检验
2
H0 :
其中 μ 0 为已知的常数。
μ = μ0 , H1 :
μ ≠ μ0
(7.18)
为了说明如何构造检验统计量和拒绝域,先看一个简单的情形。设总体方差是已知的, 记为 σ 0 ,设 X 为样本均值,则 X ~ N ( μ ,
的 | Z |≥ 1.96 ,则拒绝零假设。这就是所谓的 Z 检验。 检验的推理过程是这样的:先设 H 0 为真,在有了观测样本后,由(7.19)就可以计算 统计量 Z 的值(此时公式中已经没有未知数) ,根据小概率原理,计算的 | Z | 应当小于 1.96。 如果计算的 | Z | 大于或等于 1.96,则与小概率原理矛盾,从而怀疑零假设 H 0 不真,并做出 拒绝 H 0 的检验结果。 但在实际应用中,总体的方差是未知的。因而需要用样本方差代替总体方差,相应地, 检验统计量变成了 t 统计量。 设 X 与 S 分别为样本均值和样本方差, 当 H 0 为真时, 由 (7.6) 可知统计量
图 7-2 两类错误及其关系示意图
spss课件-均值比较与检验
功能:分組計算、比較指定變數的描述統計量。包括均值、標準
差、總和、觀測數、方差等等,還可以給出方差分析表和線性檢驗 結果。描述統計量公式P126。
Analyze-> Compare Means->Means
• Dependent List:因變數(分析變數,一般為定距或定序變數) • Independent List:引數(分組變數,為分類變數,注意可分
要求:a. 被比較的兩組樣本彼此獨立, 沒有
配對關係 b. 兩組樣本均來自正態總體 c. 均值是對於檢驗有意義的描述統計量
兩組樣本方差相等和不等時使用的計算t值的公式不 同。因此應該先對方差進行齊次性檢驗。SPSS的輸出, 在給出方差齊和不齊兩種計算結果的t值,和t檢驗的 顯著性概率的同時,還給出對方差齊次性檢驗的F值 和F檢驗的顯著性概率。用戶需要根據F檢驗的結果自 己判斷選擇t檢驗輸出中的哪個結果,得出最後結論。
能否用樣本均值估計總體均值?兩個變數均值接近的 樣本是否來自均值相同的總體?換句話說,兩組樣本 某變數均值不同,其差異是否具有統計意義?能否說 明總體差異?這是各種研究工作中經常提出的問題。 這就要進行均值比較。
8.1.2 進行均值比較及檢驗的過程
MEANS過程:不同水準下(不同組)的描述統計量,如男女
的平均工資,各工種的平均工資。目的在於比較。術語:水準數 (指分類變數的值數,如sex變數有2個值,稱為有兩個水準)、 單元Cell(指因變數按分類變數值所分的組)、水準組合
T test 過程:對樣本進行T檢驗的過程
• 單一樣本的T檢驗:檢驗單個變數的均值是否與給定的常數之 間存在差異。
• 獨立樣本的T檢驗:檢驗兩組不相關的樣本是否來自具有相同 均值的總體(均值是否相同,如男女的平均收入是否相同,是 否有顯著性差異)
差、總和、觀測數、方差等等,還可以給出方差分析表和線性檢驗 結果。描述統計量公式P126。
Analyze-> Compare Means->Means
• Dependent List:因變數(分析變數,一般為定距或定序變數) • Independent List:引數(分組變數,為分類變數,注意可分
要求:a. 被比較的兩組樣本彼此獨立, 沒有
配對關係 b. 兩組樣本均來自正態總體 c. 均值是對於檢驗有意義的描述統計量
兩組樣本方差相等和不等時使用的計算t值的公式不 同。因此應該先對方差進行齊次性檢驗。SPSS的輸出, 在給出方差齊和不齊兩種計算結果的t值,和t檢驗的 顯著性概率的同時,還給出對方差齊次性檢驗的F值 和F檢驗的顯著性概率。用戶需要根據F檢驗的結果自 己判斷選擇t檢驗輸出中的哪個結果,得出最後結論。
能否用樣本均值估計總體均值?兩個變數均值接近的 樣本是否來自均值相同的總體?換句話說,兩組樣本 某變數均值不同,其差異是否具有統計意義?能否說 明總體差異?這是各種研究工作中經常提出的問題。 這就要進行均值比較。
8.1.2 進行均值比較及檢驗的過程
MEANS過程:不同水準下(不同組)的描述統計量,如男女
的平均工資,各工種的平均工資。目的在於比較。術語:水準數 (指分類變數的值數,如sex變數有2個值,稱為有兩個水準)、 單元Cell(指因變數按分類變數值所分的組)、水準組合
T test 過程:對樣本進行T檢驗的過程
• 單一樣本的T檢驗:檢驗單個變數的均值是否與給定的常數之 間存在差異。
• 獨立樣本的T檢驗:檢驗兩組不相關的樣本是否來自具有相同 均值的總體(均值是否相同,如男女的平均收入是否相同,是 否有顯著性差異)
SPSS统计分析- 第4章 平均数差异检验_PPT幻灯片
• (7)设置完成后,单击“继续”按钮返回均值主对话框,单 击 “确定”按钮,执行操作,输出结果。
4.2.4 实例分析:某普通高校本科生自尊平均水平
• 在某普通高校随机抽取152名本科生,运用缺憾感量表对其 自尊水平进行测量,收集测验数据。部分数据如下所示:
1.描述不同性别学生自尊的平均水平
解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊 水平;自变量是被试的性别和专业。要描述不同性别学生的 自尊平均水平,可以直接由均值比较的操作实现。
• 在统计学中,假设一般用来指对总体参数所做的假定性说 明。
• 在 统 计 学 上 有 两 种 假 设 , 一 种 称 为 虚 无 假 设 ( null hypothesis),或叫做零假设,记为H0;一种称为备择假 设(alternative hypothesis),或叫做对立假设,记为 H1。H1是研究者提出的研究假设。
• 如图所示,是H0为真时和H1为真时的分布,两个分布是有重合的 。
• 在这个阴影部分中既有可能是H0为真也有可能H1为真。但是我们 拒绝了H1为真的可能性,这就可能又犯错误了。统计学中将这类 不该拒绝H1却拒绝了H1的错误称为Ⅱ型错误(type Ⅱ error), 这类错误的概率用β表示,所以又称β型错误,这类错误往往导 致科学发现被埋没。
4.1.3 假设检验的两类错误
• 虽然小概率事件发生的可能性很小,但仍有发生的可能。
• 若设定临界概率为0.05,从某一平均数为μ0的总体中抽取
任一样本,样本平均数为。当没有落入总体分布两端5%概 率的范围内,如图阴影部分所示。
• 然而,即使概率再小(如α=0.01)、临界区域的面积再小,任 意抽取的仍有1%的概率落入临界区域,即这种小概率事件的发生 仍有1%的可能性是合理的。这时H0是真的,然而依据假设检验的 统计逻辑却要拒绝H0,这样就犯错误了。统计学中将这类不该拒 绝H0却拒绝了H0的错误称为Ⅰ型错误(typeⅠerror),因为常用 α表示概率,所以又常称为α型错误。这种错误往往导致虚假的 科学发现。
4.2.4 实例分析:某普通高校本科生自尊平均水平
• 在某普通高校随机抽取152名本科生,运用缺憾感量表对其 自尊水平进行测量,收集测验数据。部分数据如下所示:
1.描述不同性别学生自尊的平均水平
解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊 水平;自变量是被试的性别和专业。要描述不同性别学生的 自尊平均水平,可以直接由均值比较的操作实现。
• 在统计学中,假设一般用来指对总体参数所做的假定性说 明。
• 在 统 计 学 上 有 两 种 假 设 , 一 种 称 为 虚 无 假 设 ( null hypothesis),或叫做零假设,记为H0;一种称为备择假 设(alternative hypothesis),或叫做对立假设,记为 H1。H1是研究者提出的研究假设。
• 如图所示,是H0为真时和H1为真时的分布,两个分布是有重合的 。
• 在这个阴影部分中既有可能是H0为真也有可能H1为真。但是我们 拒绝了H1为真的可能性,这就可能又犯错误了。统计学中将这类 不该拒绝H1却拒绝了H1的错误称为Ⅱ型错误(type Ⅱ error), 这类错误的概率用β表示,所以又称β型错误,这类错误往往导 致科学发现被埋没。
4.1.3 假设检验的两类错误
• 虽然小概率事件发生的可能性很小,但仍有发生的可能。
• 若设定临界概率为0.05,从某一平均数为μ0的总体中抽取
任一样本,样本平均数为。当没有落入总体分布两端5%概 率的范围内,如图阴影部分所示。
• 然而,即使概率再小(如α=0.01)、临界区域的面积再小,任 意抽取的仍有1%的概率落入临界区域,即这种小概率事件的发生 仍有1%的可能性是合理的。这时H0是真的,然而依据假设检验的 统计逻辑却要拒绝H0,这样就犯错误了。统计学中将这类不该拒 绝H0却拒绝了H0的错误称为Ⅰ型错误(typeⅠerror),因为常用 α表示概率,所以又常称为α型错误。这种错误往往导致虚假的 科学发现。
SPSS推断统计之均值比较与方差分析 PPT课件
• H0: 某一数值 • 指定为 = 号,即 或 • 例如, H0: 3190(克)
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立的假设,也称“研究假设” 2. 研究者想收集证据予以支持的假设总是有不
等号: , 或 3. 表示为 H1
H0值 临界值 计算出的样本统计量
利用 P 值进行检验 (决策准则)
1. 单侧检验
• 若p-值 ,不拒绝 H0 • 若p-值 < , 拒绝 H0
2. 双侧检验
• 若p-值 /2, 不拒绝 H0 • 若p-值 < /2, 拒绝 H0
假设检验中的两类错误
1. 第一类错误(弃真错误)
• 原假设为真时拒绝原假设 • 会产生一系列后果 • 第一类错误的概率为
✓ 配对样本t检验
•Paired-samples t-test •同一变量、同一组在不同的情况、均值差异
Independent-samples t-test
例子:sex differences in self-esteem scores (dataFile1.sav) • 研究问题
Is there a significant difference in the mean of self-esteem scores for males and females? • 分析单元:个人 (Individual) • 自变量:性别 (分类变量) •因变量:self-esteem score (等比变量) • 需满足的假定条件
被称为显著性水平
2. 第二类错误(取伪错误)
• 原假设为假时接受原假设 • 第二类错误的概率为(Beta)
假设检验的流程
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立的假设,也称“研究假设” 2. 研究者想收集证据予以支持的假设总是有不
等号: , 或 3. 表示为 H1
H0值 临界值 计算出的样本统计量
利用 P 值进行检验 (决策准则)
1. 单侧检验
• 若p-值 ,不拒绝 H0 • 若p-值 < , 拒绝 H0
2. 双侧检验
• 若p-值 /2, 不拒绝 H0 • 若p-值 < /2, 拒绝 H0
假设检验中的两类错误
1. 第一类错误(弃真错误)
• 原假设为真时拒绝原假设 • 会产生一系列后果 • 第一类错误的概率为
✓ 配对样本t检验
•Paired-samples t-test •同一变量、同一组在不同的情况、均值差异
Independent-samples t-test
例子:sex differences in self-esteem scores (dataFile1.sav) • 研究问题
Is there a significant difference in the mean of self-esteem scores for males and females? • 分析单元:个人 (Individual) • 自变量:性别 (分类变量) •因变量:self-esteem score (等比变量) • 需满足的假定条件
被称为显著性水平
2. 第二类错误(取伪错误)
• 原假设为假时接受原假设 • 第二类错误的概率为(Beta)
假设检验的流程
《SPSS均值比较》课件
SPSS的主要功能
数据管理
SPSS提供了强大的数据导入、导出和编辑功能 ,支持多种数据格式。
数据可视化
SPSS支持多种图表类型,如柱状图、饼图、散 点图等,帮助用户更好地理解数据。
ABCD
统计分析
SPSS提供了广泛的数据分析方法,包括描述性 统计、推论性统计、多元统计分析等。
预测建模
SPSS的预测建模功能可以帮助用户构建预测模 型,进行预测和决策分析。
,从而进行比较和评价。
判断数据集的集中趋势
02
均值是描述数据集集中趋势的重要指标,通过计算和比较均值
,可以了解数据集的集中趋势。
揭示数据集的离散程度
03
通过计算标准差等指标,可以了解数据集的离散程度,从而判
断数据的稳定性。
均值比较的统计方法
01
T检验
用于比较两组数据的均值是否存 在显著差异,分为独立样本T检 验和配对样本T检验。
SPSS的界面介绍
菜单栏
SPSS的菜单栏包括文件、编辑、 查看器、数据、转换、分析、图 形、实用程序等选项卡,方便用 户进行各种操作。
主界面
SPSS的主界面包括菜单栏、工具 栏、数据编辑窗口和结果输出窗 口等部分。
工具栏
SPSS的工具栏提供了常用功能的 快捷按钮,方便用户快速执行操 作。
数据编辑窗口
均值比较的意义与价值
均值比较是统计分析中的基础方法,用于比较两组或多组数据的平均水平 ,从而了解数据之间的差异。
均值比较在社会科学、医学、经济学等领域有着广泛的应用,对于探究数 据背后的规律和趋势具有重要的价值。
通过均值比较,可以直观地展示数据的中心趋势,为进一步的数据分析和 挖掘提供基础。
未来研究的方向与展望
SPSS均值比较与检验 PPT课件
Test for linearity:产 生第一层最后一个变 量的R和R2。
6
三、例题分析
测得某城市12岁儿童的身高及体重信息, 用Means过程对其做基本的描述性统计分析。
7
1、操作步骤
1) 打开数据文件“data03-MEANS_01.sav” 。 2)按顺序Analyze Compare Means Means
10
2. 结果及分析
表3—1 观测量摘要 表(性别和年龄均放第 一层)
Case Processing Summary
身高 * 性别 身高 * 年龄
Included
N
Percent
27
100.0%
27
100.0%
Cases
Excluded
N
Percent
0
.0%
0
.0%
Total
N
Percent
27
算术平均值: 方差: 标准差:
n
xiwi
Mean
i1 n
wi
i1
n
wi (xi x)2
Variance i1 n
wi 1
i1
S Variance
均值标准误:
Stderr S N
2
有关公式
峰度: Kurtosis
N2 2N 3
F 39.587 109.435
4.664
Sig. .000 .000
.020
当前表是方差分析表,共6列:第一列方差来 源:组间的、组内的、总的方差;第二列为平 方和;第三列为自由度;第四列为均方;第五 列为F值;第六列为F统计量的显著值。
13
6
三、例题分析
测得某城市12岁儿童的身高及体重信息, 用Means过程对其做基本的描述性统计分析。
7
1、操作步骤
1) 打开数据文件“data03-MEANS_01.sav” 。 2)按顺序Analyze Compare Means Means
10
2. 结果及分析
表3—1 观测量摘要 表(性别和年龄均放第 一层)
Case Processing Summary
身高 * 性别 身高 * 年龄
Included
N
Percent
27
100.0%
27
100.0%
Cases
Excluded
N
Percent
0
.0%
0
.0%
Total
N
Percent
27
算术平均值: 方差: 标准差:
n
xiwi
Mean
i1 n
wi
i1
n
wi (xi x)2
Variance i1 n
wi 1
i1
S Variance
均值标准误:
Stderr S N
2
有关公式
峰度: Kurtosis
N2 2N 3
F 39.587 109.435
4.664
Sig. .000 .000
.020
当前表是方差分析表,共6列:第一列方差来 源:组间的、组内的、总的方差;第二列为平 方和;第三列为自由度;第四列为均方;第五 列为F值;第六列为F统计量的显著值。
13
SPSS课件假设检验和均值比较
z 要求样本数据来自于服从正态分布的单一总体 z 假设的基本形式:
H0 : μ = μ0 , H1:μ ≠ μ0
当然也可以有单侧检验的假设形式。
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 提出假设
基本步骤
H0 : μ = μ0 , H1:μ ≠ μ0
z 确定检验统计量
¾ 若总体方差已知,此时可构造标准正态分布Z检验统计量
≈ 4.47 ×10−28
(52) !
例
z 有52张洗均匀的扑克牌,把牌分给4个人。如果某人 断言这4个人在一次发牌中每人将得到13张同一花色 的牌,你认为这正常吗?
z 解:事实上,将52张牌分给4个人,每人得到13张同
一花色的牌的概率为
(13!) 4 4!
≈ 4.47 ×10−28
(52) !
z 这个数值是非常小的,此事件即为小概率事件,现 在某人竟然断言这样的小概率事件在一次发牌时就 会出现,则自然认为这是不正常的,我们怀疑其在 发牌时有作弊行为。
¾ H1:μ <某一数值,或μ >某一数值 ¾ 例如, H1:μ < 3910(克),或μ >3910(克)
北京大学教育经济与管理系:《教育统计与SPSS应用》
确定适当的检验统计量
什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 是大样本还是小样本 2. 总体方差已知还是未知
赢得100元 赢得50元 赢得20元
输掉100元 赢得20元 赢得50元 赢得100元
北京大学教育经济与管理系:《教育统计与SPSS应用》
13
结果 6个全红 5红1白 4红2白 3红3白 2红4白 1红5白 6个全白
H0 : μ = μ0 , H1:μ ≠ μ0
当然也可以有单侧检验的假设形式。
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 提出假设
基本步骤
H0 : μ = μ0 , H1:μ ≠ μ0
z 确定检验统计量
¾ 若总体方差已知,此时可构造标准正态分布Z检验统计量
≈ 4.47 ×10−28
(52) !
例
z 有52张洗均匀的扑克牌,把牌分给4个人。如果某人 断言这4个人在一次发牌中每人将得到13张同一花色 的牌,你认为这正常吗?
z 解:事实上,将52张牌分给4个人,每人得到13张同
一花色的牌的概率为
(13!) 4 4!
≈ 4.47 ×10−28
(52) !
z 这个数值是非常小的,此事件即为小概率事件,现 在某人竟然断言这样的小概率事件在一次发牌时就 会出现,则自然认为这是不正常的,我们怀疑其在 发牌时有作弊行为。
¾ H1:μ <某一数值,或μ >某一数值 ¾ 例如, H1:μ < 3910(克),或μ >3910(克)
北京大学教育经济与管理系:《教育统计与SPSS应用》
确定适当的检验统计量
什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 是大样本还是小样本 2. 总体方差已知还是未知
赢得100元 赢得50元 赢得20元
输掉100元 赢得20元 赢得50元 赢得100元
北京大学教育经济与管理系:《教育统计与SPSS应用》
13
结果 6个全红 5红1白 4红2白 3红3白 2红4白 1红5白 6个全白
SPSS数据分析教程均值的比较.完整版PPT
两独立样本是指两个样本所来自的总体相互独立,两个独立样本各自接受相同的测量,研究者或分析者的主要目的是分析两个独立样 本的均值是否有显著的统计差异
,选择【数据】→【拆分文件】 05,接受零假设,即没有变化。
掌握均值过程和输出结果的解释 假设随机选取了两组商务旅游人员各50人,给两个机场打分,请判断这两个机场的等级是否相同?见数据5-3 下面的分数是对测验焦虑的度量,有充分的证据支持考试题目的安排对分数有影响这一假设吗?见数据5-4 单样本T检验 实例分析: 国际航空运输协会对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数,最高10分,分数越高,等级越高。 某个航班往返票的平均折扣费3月份是258元。 医生为检验某种饮食方案是否对有家庭心脏病史的病人有效,对16个病人进行了了试验,记录他们在实行饮食方案前后的体重(磅) 以及甘油三酸酯的水平(mg/100ml)。 两独立样本T检验实例分析: 打开数据文件brakes. 可以先计算配对样本的差值变量,然后进行单样本的T检验。 两个样本所来自的总体应服从正态分布(大样本情况下,T检验较为稳健) 即受试对象的年龄、性别、体重等非处理因素都相同或相似;
因而假设检验有可能犯两类错误:
第一类错误:原假设正确,而错误地拒绝了它,即“拒真” 的错误,其发生的概率为犯第一类错误的概率。
第二类错误:原假设不正确,而错误地没有拒绝它,即“受 伪”错误,其发生的概率为犯第二类错误的概率。
三、显著性值
假设检验一般先对总体的比例、均值或分布做 某种假设,称为原假设;然后计算在该假设 成立条件下出现该事件的概率,称为p值,或 显著性值。
01,并假设通勤时间服从正态分布,这位研究者能得到什么结论? 选择【分析】→【比较均值】→【单样本T检验】 如果该事件发生的概率(或可能性)较大,即 p> ,则不拒绝原假设。 打开数据文件brakes. 第二类错误:原假设不正确,而错误地没有拒绝它,即“受伪”错误,其发生的概率为犯第二类错误的概率。 掌握单样本T检验方法、应用条件和输出结果 sav是对护士工资的调查,它调查了不同岗位的护士,记录了他们的小时工资、工作经验、年龄等指标。
,选择【数据】→【拆分文件】 05,接受零假设,即没有变化。
掌握均值过程和输出结果的解释 假设随机选取了两组商务旅游人员各50人,给两个机场打分,请判断这两个机场的等级是否相同?见数据5-3 下面的分数是对测验焦虑的度量,有充分的证据支持考试题目的安排对分数有影响这一假设吗?见数据5-4 单样本T检验 实例分析: 国际航空运输协会对商务旅游人员进行了一项调查,以便确定多个国际机场的等级分数,最高10分,分数越高,等级越高。 某个航班往返票的平均折扣费3月份是258元。 医生为检验某种饮食方案是否对有家庭心脏病史的病人有效,对16个病人进行了了试验,记录他们在实行饮食方案前后的体重(磅) 以及甘油三酸酯的水平(mg/100ml)。 两独立样本T检验实例分析: 打开数据文件brakes. 可以先计算配对样本的差值变量,然后进行单样本的T检验。 两个样本所来自的总体应服从正态分布(大样本情况下,T检验较为稳健) 即受试对象的年龄、性别、体重等非处理因素都相同或相似;
因而假设检验有可能犯两类错误:
第一类错误:原假设正确,而错误地拒绝了它,即“拒真” 的错误,其发生的概率为犯第一类错误的概率。
第二类错误:原假设不正确,而错误地没有拒绝它,即“受 伪”错误,其发生的概率为犯第二类错误的概率。
三、显著性值
假设检验一般先对总体的比例、均值或分布做 某种假设,称为原假设;然后计算在该假设 成立条件下出现该事件的概率,称为p值,或 显著性值。
01,并假设通勤时间服从正态分布,这位研究者能得到什么结论? 选择【分析】→【比较均值】→【单样本T检验】 如果该事件发生的概率(或可能性)较大,即 p> ,则不拒绝原假设。 打开数据文件brakes. 第二类错误:原假设不正确,而错误地没有拒绝它,即“受伪”错误,其发生的概率为犯第二类错误的概率。 掌握单样本T检验方法、应用条件和输出结果 sav是对护士工资的调查,它调查了不同岗位的护士,记录了他们的小时工资、工作经验、年龄等指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
¾ H0:μ = 某一数值 ¾ 指定为 = 号,即 ≤ 或 ≥ ¾ 例如, H0:μ = 3190(克)
北京大学教育经济与管理系:《教育统计与SPSS应用》
提出原假设和备择假设
z 什么是备择假设?(Alternative Hypothesis) z 1. 与原假设对立的假设 z 2. 总是有不等号: ≠, < 或 > z 3. 表示为 H1
功的概率为0.5,那么十次都猜中的概率为 2−10 = 0.0009766 z 这是一个很小的概率事件,是几乎不可能发生的!所以此假
设应该被拒绝。 z 被实验者每次成功的概率要比0.5大得多,这就不是完全的猜
测,而是他们的经验帮了他们的忙
北京大学教育经济与管理系:《教育统计与SPSS应用》
(13!) 4 4!
北京大学教育经济与管理系:《教育统计与SPSS应用》
这时,我们只能怀疑作为小概率事件A的前 提假设H0的正确性,于是否定H0。反之, 如果试验中A没有出现,我们就没有理由 否定假设H0,从而做出接受H0的结论。
下面我们通过实例来说明假设检验的基本思 想及推理方法。
北京大学教育经济与管理系:《教育统计与SPSS应用》
≈ 4.47 ×10−28
(52) !
例
z 有52张洗均匀的扑克牌,把牌分给4个人。如果某人 断言这4个人在一次发牌中每人将得到13张同一花色 的牌,你认为这正常吗?
z 解:事实上,将52张牌分给4个人,每人得到13张同
一花色的牌的概率为
(13!) 4 4!
≈ 4.47 ×10−28
(52) !
z 这个数值是非常小的,此事件即为小概率事件,现 在某人竟然断言这样的小概率事件在一次发牌时就 会出现,则自然认为这是不正常的,我们怀疑其在 发牌时有作弊行为。
两类错误分析
小概率原理是假设检验的基本依据,然而,对于小 概率事件,无论其概率多么小,还是可能发生的, 所以,利用小概率原理为基础的假设检验方法进行 检验,可能会做出错误的判断,主要有两种形式 (1)原假设H0实际是正确的,但却错误地拒绝了H0 ,这样就犯了“弃真”的错误,通常称为第一类错 误。由于仅当所考虑的小概率事件A发生时才拒绝 H0,所以犯第一类错误的概率就是条件概率:
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 小概率事件原理是概率论中具有实际应用意 义的基本理论。在概率论中将概率很小(小 于0.05)的事件叫做小概率事件。小概率事件 的原理又称为似然推理,即:如果一个事件 发生的概率很小,那么在一次试验中,可以 把它看成是不可能事件。
北京大学教育经济与管理系:《教育统计与SPSS应用》
一位产品经理认为其产品购买者的平均年龄 为35岁。为检验其假设,他进行了一项调查, 调查表明购买者平均年龄为38.5岁。调查结果 与其观点的差别是够足以说明此经理的观点是 不正确的?
北京大学教育经济与管理系:《教育统计与SPSS应用》
什么是假设?
z 对总体参数的一种看法
¾ 总体参数包括总体均值、比例、方差等 ¾ 分析之前必需陈述
北京大学教育经济与管理系:《教育统计与SPSS应用》
14
英国统计学家Savage曾考察的两个著名的统计实验 A:一位常饮牛奶的女士称她能辨别先倒入杯子里的是茶还是牛
奶,对此做了十次试验她都答对了。 B:一个音乐家声称他能从一页乐谱辨别是Haydn还是Mozart的
作品,十次试验中他都能正确辨别。 z 在这两个统计实验中,假如认为被实验者是在猜测,每次成
赢得100元 赢得50元 赢得20元
输掉100元 赢得20元 赢得50元 赢得100元
北京大学教育经济与管理系:《教育统计与SPSS应用》
13
结果 6个全红 5红1白 4红2白 3红3白 2红4白 1红5白 6个全白
出现的概率 1/924 3/77 75/308 100/231 75/308 3/77 1/924
¾ H1:μ <某一数值,或μ >某一数值 ¾ 例如, H1:μ < 3910(克),或μ >3910(克)
北京大学教育经济与管理系:《教育统计与SPSS应用》
确定适当的检验统计量
什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 是大样本还是小样本 2. 总体方差已知还是未知
3. 检验统计量的基本形式为 z = x − μ0 σn
北京大学教育经济与管理系:《教育统计与SPSS应用》
规定显著性水平α
什么是显著性水平? z 是一个概率值 z 原假设为真时,拒绝原假设的概率
¾ 被称为抽样分布的拒绝域
z 表示为 α (alpha)
¾ 常用的 α 值有0.01, 0.05, 0.10
z 由研究者事先确定
北京大学教育经济与管理系:《教育统计与SPSS应用》
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平α,查表得出相应 的临界值Ζα或Ζα/2
3. 将检验统计量的值与α 水平的临界值进
行比较 4. 得出接受或拒绝原假设的结论
北京大学教育经济与管理系:《教育统计与SPSS应用》
我认为到KFC消费的人 平均花费20元!
常见的是对总体均值或 比例和方差的检验;
在分析之前,被检验的 参数将被假定取一确定 值。
北京大学教育经济与管理系:《教育统计与SPSS应用》
市场调研中常见的假设检验问题
一项跟踪调查的结果表明,顾客对产品的了解 程度比6个月前所做的类似调查中的显示要低 。结果是否明显降低?是否低到需要改变广告 策略的程度?
z 在临床上,医生需要对病人治疗前后的状况进行控 制。例如通过对比一组病人使用某种药物后的身体 指标,可以判断该药物对病人是否有效,效果是否 显著。
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本的均值检验
均值的比较检验 独立样本的均值检验
配对样本的均值检验
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 要求样本数据来自于服从正态分布的单一总体 z 假设的基本形式:
H0 : μ = μ0 , H1:μ ≠ μ0
当然也可以有单侧检验的假设形式。
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 提出假设
基本步骤
H0 : μ = μ0 , H1:μ ≠ μ0
z 确定检验统计量
¾ 若总体方差已知,此时可构造标准正态分布Z检验统计量
z 通常在我们根据历史经验选取恰当的显著性 水平α后,通过扩大样本容量n的方式来使第 二类错误的概率减小。
北京大学教育经济与管理系:《教育统计与SPSS应用》
α 错误和 β 错误的关系
α和β的关系就像 翘翘板,α小β就 大, α大β就小
β
你不能同时减 少两类错误!
α
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本均值的检验
-检验样本所在总体的均值与给 定的已知值之间是否存在显著性差异
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本均值的检验
z 只对单一变量的均值加以检验
¾ 如检验今年新生的统计学平均成绩是否和往年有显著差异;推断 某地区今年的人均收入与往年的人均收入是否有显著差异等等。
假设检验的基本概念
基本概念
z 对总体的概率分布或分布参数作出某种 “假设”,
z 根据抽样得到的样本观测值,运用数理 统计的分析方法,检验这种“假设”是 否正确,
z 从而决定接受或拒绝“假设”,这就是 假设检验问题。
北京大学教育经济与管理系:《教育统计与SPSS应用》
什么是假设?
z 假设:定义为一个调研 者或管理者对被调查总 体的某些特征所做的一 种假定或猜想。是对总 体参数的一种假设。
北京大学教育经济与管理系:《教育统计与SPSS应用》
均值的比较检验
- 推断样本与总体或者两个总体之 间的差异是否显著
北京大学教育经济与管理系:《教育统计与SPSS应用》
相关实例
z 在企业市场结构的研究中,起关键作用的指标有市 场分额、企业规模、资本收益率、总收益增长率等 。为了研究市场结构的变动,研究人员通常需要将 调查所得的数据与历史数据进行比较。通过均值比 较检验,就能比较出现在的市场结构与过去是否存 在显著性差异。
Z = X − μ ∼ N (0,1) σ/ n
¾ 通常总体方差都是未知的,此时总体方差由样本方差代替,采用t分布
构造t检验统计量
t = X − μ ∼ t(n −1)
S/ n
其中S为样本标准差,定义为
z 做出统计推断
∑ S =
1 n −1
n i =1
(Xi
−Байду номын сангаас
X
)2
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 注意在SPSS中假设检验的判断原则不同 ¾ 在SPSS中是采用p( Sig.)值进行判断。(P值为统计量 观测值实现的概率)
在SPSS系统中,所有的假设检验(包括非参数检验)都 只要求使用者记住(必须记住!)检验的原假设H0是什 么,并且按照以下的准则去判断是否应该接受原假设:
¾若Sig.≥α,则接受原假设H0; ¾若Sig.<α,则拒绝原假设H0。
μ = 50
H0
样本均值
北京大学教育经济与管理系:《教育统计与SPSS应用》
小概率原理
小概率原理是假设检验的基本依据,即认 为小概率事件在一次试验中几乎是不可能 发生的。 当进行假设检验时,先假设H0正确,在此假 设下,若小概率事件A出现的概率很小,例 如P(A)=0.01或0.05,经过取样试验后, A出现了,则违反了上述原理,我们认为 这是一个不合理的结果。
北京大学教育经济与管理系:《教育统计与SPSS应用》
北京大学教育经济与管理系:《教育统计与SPSS应用》
提出原假设和备择假设
z 什么是备择假设?(Alternative Hypothesis) z 1. 与原假设对立的假设 z 2. 总是有不等号: ≠, < 或 > z 3. 表示为 H1
功的概率为0.5,那么十次都猜中的概率为 2−10 = 0.0009766 z 这是一个很小的概率事件,是几乎不可能发生的!所以此假
设应该被拒绝。 z 被实验者每次成功的概率要比0.5大得多,这就不是完全的猜
测,而是他们的经验帮了他们的忙
北京大学教育经济与管理系:《教育统计与SPSS应用》
(13!) 4 4!
北京大学教育经济与管理系:《教育统计与SPSS应用》
这时,我们只能怀疑作为小概率事件A的前 提假设H0的正确性,于是否定H0。反之, 如果试验中A没有出现,我们就没有理由 否定假设H0,从而做出接受H0的结论。
下面我们通过实例来说明假设检验的基本思 想及推理方法。
北京大学教育经济与管理系:《教育统计与SPSS应用》
≈ 4.47 ×10−28
(52) !
例
z 有52张洗均匀的扑克牌,把牌分给4个人。如果某人 断言这4个人在一次发牌中每人将得到13张同一花色 的牌,你认为这正常吗?
z 解:事实上,将52张牌分给4个人,每人得到13张同
一花色的牌的概率为
(13!) 4 4!
≈ 4.47 ×10−28
(52) !
z 这个数值是非常小的,此事件即为小概率事件,现 在某人竟然断言这样的小概率事件在一次发牌时就 会出现,则自然认为这是不正常的,我们怀疑其在 发牌时有作弊行为。
两类错误分析
小概率原理是假设检验的基本依据,然而,对于小 概率事件,无论其概率多么小,还是可能发生的, 所以,利用小概率原理为基础的假设检验方法进行 检验,可能会做出错误的判断,主要有两种形式 (1)原假设H0实际是正确的,但却错误地拒绝了H0 ,这样就犯了“弃真”的错误,通常称为第一类错 误。由于仅当所考虑的小概率事件A发生时才拒绝 H0,所以犯第一类错误的概率就是条件概率:
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 小概率事件原理是概率论中具有实际应用意 义的基本理论。在概率论中将概率很小(小 于0.05)的事件叫做小概率事件。小概率事件 的原理又称为似然推理,即:如果一个事件 发生的概率很小,那么在一次试验中,可以 把它看成是不可能事件。
北京大学教育经济与管理系:《教育统计与SPSS应用》
一位产品经理认为其产品购买者的平均年龄 为35岁。为检验其假设,他进行了一项调查, 调查表明购买者平均年龄为38.5岁。调查结果 与其观点的差别是够足以说明此经理的观点是 不正确的?
北京大学教育经济与管理系:《教育统计与SPSS应用》
什么是假设?
z 对总体参数的一种看法
¾ 总体参数包括总体均值、比例、方差等 ¾ 分析之前必需陈述
北京大学教育经济与管理系:《教育统计与SPSS应用》
14
英国统计学家Savage曾考察的两个著名的统计实验 A:一位常饮牛奶的女士称她能辨别先倒入杯子里的是茶还是牛
奶,对此做了十次试验她都答对了。 B:一个音乐家声称他能从一页乐谱辨别是Haydn还是Mozart的
作品,十次试验中他都能正确辨别。 z 在这两个统计实验中,假如认为被实验者是在猜测,每次成
赢得100元 赢得50元 赢得20元
输掉100元 赢得20元 赢得50元 赢得100元
北京大学教育经济与管理系:《教育统计与SPSS应用》
13
结果 6个全红 5红1白 4红2白 3红3白 2红4白 1红5白 6个全白
出现的概率 1/924 3/77 75/308 100/231 75/308 3/77 1/924
¾ H1:μ <某一数值,或μ >某一数值 ¾ 例如, H1:μ < 3910(克),或μ >3910(克)
北京大学教育经济与管理系:《教育统计与SPSS应用》
确定适当的检验统计量
什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 是大样本还是小样本 2. 总体方差已知还是未知
3. 检验统计量的基本形式为 z = x − μ0 σn
北京大学教育经济与管理系:《教育统计与SPSS应用》
规定显著性水平α
什么是显著性水平? z 是一个概率值 z 原假设为真时,拒绝原假设的概率
¾ 被称为抽样分布的拒绝域
z 表示为 α (alpha)
¾ 常用的 α 值有0.01, 0.05, 0.10
z 由研究者事先确定
北京大学教育经济与管理系:《教育统计与SPSS应用》
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平α,查表得出相应 的临界值Ζα或Ζα/2
3. 将检验统计量的值与α 水平的临界值进
行比较 4. 得出接受或拒绝原假设的结论
北京大学教育经济与管理系:《教育统计与SPSS应用》
我认为到KFC消费的人 平均花费20元!
常见的是对总体均值或 比例和方差的检验;
在分析之前,被检验的 参数将被假定取一确定 值。
北京大学教育经济与管理系:《教育统计与SPSS应用》
市场调研中常见的假设检验问题
一项跟踪调查的结果表明,顾客对产品的了解 程度比6个月前所做的类似调查中的显示要低 。结果是否明显降低?是否低到需要改变广告 策略的程度?
z 在临床上,医生需要对病人治疗前后的状况进行控 制。例如通过对比一组病人使用某种药物后的身体 指标,可以判断该药物对病人是否有效,效果是否 显著。
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本的均值检验
均值的比较检验 独立样本的均值检验
配对样本的均值检验
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 要求样本数据来自于服从正态分布的单一总体 z 假设的基本形式:
H0 : μ = μ0 , H1:μ ≠ μ0
当然也可以有单侧检验的假设形式。
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 提出假设
基本步骤
H0 : μ = μ0 , H1:μ ≠ μ0
z 确定检验统计量
¾ 若总体方差已知,此时可构造标准正态分布Z检验统计量
z 通常在我们根据历史经验选取恰当的显著性 水平α后,通过扩大样本容量n的方式来使第 二类错误的概率减小。
北京大学教育经济与管理系:《教育统计与SPSS应用》
α 错误和 β 错误的关系
α和β的关系就像 翘翘板,α小β就 大, α大β就小
β
你不能同时减 少两类错误!
α
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本均值的检验
-检验样本所在总体的均值与给 定的已知值之间是否存在显著性差异
北京大学教育经济与管理系:《教育统计与SPSS应用》
单一样本均值的检验
z 只对单一变量的均值加以检验
¾ 如检验今年新生的统计学平均成绩是否和往年有显著差异;推断 某地区今年的人均收入与往年的人均收入是否有显著差异等等。
假设检验的基本概念
基本概念
z 对总体的概率分布或分布参数作出某种 “假设”,
z 根据抽样得到的样本观测值,运用数理 统计的分析方法,检验这种“假设”是 否正确,
z 从而决定接受或拒绝“假设”,这就是 假设检验问题。
北京大学教育经济与管理系:《教育统计与SPSS应用》
什么是假设?
z 假设:定义为一个调研 者或管理者对被调查总 体的某些特征所做的一 种假定或猜想。是对总 体参数的一种假设。
北京大学教育经济与管理系:《教育统计与SPSS应用》
均值的比较检验
- 推断样本与总体或者两个总体之 间的差异是否显著
北京大学教育经济与管理系:《教育统计与SPSS应用》
相关实例
z 在企业市场结构的研究中,起关键作用的指标有市 场分额、企业规模、资本收益率、总收益增长率等 。为了研究市场结构的变动,研究人员通常需要将 调查所得的数据与历史数据进行比较。通过均值比 较检验,就能比较出现在的市场结构与过去是否存 在显著性差异。
Z = X − μ ∼ N (0,1) σ/ n
¾ 通常总体方差都是未知的,此时总体方差由样本方差代替,采用t分布
构造t检验统计量
t = X − μ ∼ t(n −1)
S/ n
其中S为样本标准差,定义为
z 做出统计推断
∑ S =
1 n −1
n i =1
(Xi
−Байду номын сангаас
X
)2
北京大学教育经济与管理系:《教育统计与SPSS应用》
z 注意在SPSS中假设检验的判断原则不同 ¾ 在SPSS中是采用p( Sig.)值进行判断。(P值为统计量 观测值实现的概率)
在SPSS系统中,所有的假设检验(包括非参数检验)都 只要求使用者记住(必须记住!)检验的原假设H0是什 么,并且按照以下的准则去判断是否应该接受原假设:
¾若Sig.≥α,则接受原假设H0; ¾若Sig.<α,则拒绝原假设H0。
μ = 50
H0
样本均值
北京大学教育经济与管理系:《教育统计与SPSS应用》
小概率原理
小概率原理是假设检验的基本依据,即认 为小概率事件在一次试验中几乎是不可能 发生的。 当进行假设检验时,先假设H0正确,在此假 设下,若小概率事件A出现的概率很小,例 如P(A)=0.01或0.05,经过取样试验后, A出现了,则违反了上述原理,我们认为 这是一个不合理的结果。
北京大学教育经济与管理系:《教育统计与SPSS应用》