第七章 两个总体的假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
训练前 训练后 94.5 85 101 110 103.5 96 97 86 88.5 80.5 96.5 87 101 93.5 104 93 116.5 102 89.5 101.5
在 = 0.05的显著性水平下,调查结果是否支持 该俱乐部的声称?
配对样本的 t 检验(计算表)
样本差值计算表
- 2.54 -2.45,拒绝原假设,即认为 前后有显著不同。
第二节 两个总体比例之差的Z检验
一、两个独立样本均值之差的检验
• (一)两个总体均值之 差的Z检验 (s12、 s22 已知) • (二)两个总体均值之 差的Z检验 (s12、 s22 未知,
大样本)
z ( x1 - x 2 ) - ( m 1 - m 2 )
s
2 1
n1
s
2 2
~ N (0,1)
n2
z
( x1 - x2 ) - ( m1 - m 2 ) S S n1 n2
样本均值
xD
D
i 1
n
i
nD
n
98.5 9.85 10
样本标准差 s D
2 ( D x ) i D i 1
nD - 1
43.525 2.199 10 - 1
配对样本的 t 检验(计算结果)
• H0: m1 – m2 8.5 检验统计量: • H1: m1 – m2 <8.5 x D - D0 9.85 - 8.5 t 1.94 = 0.05 s D n D 2.199 10 • df = 10 - 1 = 9 决策: • 临界值(s): 接受H0
第七章 两总体的假设检验
第一节 均值差异的假设检验 第二节 比例差异的假设检验 第三节 均值差异比较的SPSS应用
两个正态总体的参数检验
两个总体的检验 均值
独立样本 配对样本
比例
方差
Z 检验
(大样本)
t 检验
(小样本)
t 检验
(小样本)
Z 检验
F 检验
两个独立样本之差的抽样分布
s1
m1
抽取简单随机样 样本容量 n1 计算X1 计算每一对样本 的X1-X2
训练前 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5 合计 训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102 — 差值Di 9.5 11.5 8.5 7.5 11 8 9.5 7.5 11 14.5 98.5
配对样本的 t 检验(计算结果)
1、检验具有等方差的两个总体的均值 2、假定条件
– 两个样本是独立的随机样本 – 两个总体都是正态分布 – 两个总体方差未知但相等s12 s22
(二)两个总体均值之差的 t 检验 (s12、 s22未知,小样本)
3、检验统计量 ( x1 - x 2 ) - ( m 1 - m 2 ) t 1 1 sp n1 n 2
H 0 : u1 u 2 , H 1 : u1 u 2 Z
(x 1 - x 2 )
大学教师
机关、企业 工作人员
S1 S 2
n
2
2
(23700 - 21500 ) 2435 2 6804 2 50
n1 50
n2 50
x1 23700 x 2 21500 S1 2435 S1 6804
(一)两个总体均值之差的Z检验 (s12、 s22 已知)
1、假定条件
– 两个样本是独立的随机样本 – 两个总体都是正态分布 – 若不是正态分布, 可以用正态分布来近似(n130 和 n230;n1+n2100)
2、原假设:H0: m1- m2 =0;备择假设:H1: m1- m2 0 3. 检验统计量为
其中:
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 Sp 1 n1 n2 - 2
两个总体均值之差的 t 检验 (例子)
例:一个车间研究用两种不同的工艺 组装某种产品所用的时间是否相同。 让一个组的10名工人用第一种工艺组 装该产品,平均所需时间为 26.1分钟, 样本标准差为 12 分钟;另一组 8 名工 人用第二种工艺组装,平均所需时间 为17.6分钟,样本标准差为10.5分钟。 已知用两种工艺组装产品所用时间服 从正态分布,且s12=s22 。试问能否 认为用第二种方法组装比用第一中方 法组装更好?( = 0.05)
• H0: m1- m2 = 0 检验统计量: (x 1 - x 2 ) - ( m1 - m 2 ) 50 - 40 - 0 • H1: m1- m2 0 z 4.7 2 2 64 100 s1 s 2 = 0.05 32 40 n1 n2 • n1 = 32,n2 = 40 决策: • 临界值(s):
2200 2.15 1022 临界值为 1.96,所以拒绝H 0,即收入有差距。
• 练习:
1、为了比较已婚妇女对婚后生活得态度是否因 为婚龄而有所区别,将已婚妇女按照对婚后生 活得态度分为“不满意”和“满意”两组,从 “不满意”组中随机抽取500名妇女,平均婚 龄为9.2年,标准差为2.8年;从“满意”组随 机抽取600名妇女,均值为8.5年,标准差为 2.3年,试问在显著性水平为0.05情况下,两 组是否存在显著差异?
拒绝域 .05
ຫໍສະໝຸດ Baidu
结论:
有证据表明该俱乐部的宣称是可信的
-1.833
0
t
例:消费者先对公司打分,再让他们一天两次观看公司录像,一周后再对公司打 分。数据如下表所示,令α=0.05,检验看过一周录像后对公司的打分和之前相比 是否有显著差异?
个人 事前
1
2
3
4
5
6
7
32 11 21 17 30 38 14
z ( x1 - x 2 ) - ( m 1 - m 2 ) ~ N (0,1)
s
2 1
n1
s
2 2
n2
两个总体均值之差的Z检验 (例子)
•例 1 :有两种方法可用于制造某种以
抗拉强度为重要特征的产品。根据以 往的资料得知,第一种方法生产出的 产品其抗拉强度的标准差为 8 公斤, 第二种方法的标准差为 10公斤。从两 种方法生产的产品中各抽取一个随机 样本,样本容量分别为n1=32,n2=40, 测得x2= 50公斤,x1= 40公斤。问这 两种方法生产的产品平均抗拉强度是 否有显著差别? ( = 0.05)
样本均值
自由度df =n - 1
样本标准差
2 ( D x ) i D
xD
Di i
1
n
n
n
sD
i 1
n -1
配对样本的 t 检验(例子)
•例:一个以减肥为主要目标的健美俱乐部声称,参 加其训练班至少可以使减肥者平均体重减重8.5公斤 以上。为了验证该宣称是否可信,调查人员随机抽 取了10名参加者,得到他们的体重记录如下表:
H 0:m1 解 :
- m2 0 H 1:m1 - m 2 0 * x1 12.7% s1 0.38 % n1 11
x 2 14.1% s 2* 0.48 % n 2 10
t 2 (19) t0.025 (19) 2 .093
Sp
t
2 (n1 - 1) s12 (n2 - 1) s2 0.43 n1 n2 - 2
总体1
s2 m2
总体2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
抽样分布
m1- m2
第一节 均值差异的假设检验
• 假设:
– – H0:两总体不存在差异,即u1=u2, H1:两总体存在差异,即u1不等于u2。
•
要求:
1. 随机抽样; 2. 每个总体都是正态分布; 3. 两个总体的标准差相等。
两个总体均值之差的 t 检验
• H0: m1- m2 0 • H1: m1- m2 > 0 = 0.05 • n1 = 10n2 = 8 • 临界值(s):
检验统计量:
t
(x 1 - x 2 ) - (m1 - m2 )
sp
1 1 n1 n2
26.1 - 17.6 - 0 1 1 11.37 10 8
X D -5.857 S D 6.0945
事后 d
39 15 35 13 41 39 22 -7 -4 -14 4 -11 -1 -8
1、H 0 : D 0,D 0 2、检验统计量:
t
XD - D - 5.857 - 0 -2.54 SD 6.0945 7 n 3、临界值:t0.025(7 - 1) 2.45
• 1、检验两个相关总体的均值 – 配对或匹配 – 重复测量 (前/后) • 2、假定条件 – 两个总体都服从正态分布 – 如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )
在人事测评中,假如我们用同一套测验工具在不同时 间对某位销售主管施测两次,结果如何呢?是否两次的 测评分数会有非常显著的差异呢?
– 相关样本eg:配对样本(实验组与控制组); 同一样本前后时期的变化等; – 假设两相关样本间有n对个案,每对个案可能 都有差异d= (X1-X2),而这些差异的均值为 Xd , 标准差为Sd , Xd的抽样分布符合t分布。
配对样本的 t 检验(检验统计量)
统计量
x D - D0 t sD n
拒绝 H0
.025
两个总体均值之差的Z检验 (计算结果)
拒绝 H0
.025
拒绝H0
结论:
有证据表明两种方法生产的产品其抗拉强 度有显著差异
-1.96
0
1.96
Z
两个总体均值之差的Z检验 (s12、 s22 未知 ,大样本)
例:某大学欲比较大学毕业后留校工作与分配到其他岗位的人工资水平的差别, 因为工资还与工龄等其他因素有关,因此抽选大学毕业后满10年在校工作的教 师50人,另外抽选大学毕业后满10年在机关、企业工作的人员进行比较,取得 的数据如下。试比较大学毕业后留校当教师与分配在机关企业等工作人员的工资 水平是否有差异?(α=.05)
• 练习题2:
• 为了比较就近上学和因家远而乘车上学的小学生 学习成绩是否有差别。某校从就近上学的小学生 中随机抽查800名,平均学习总成绩为520分,标 准差为40分;从乘车上学的小学生中抽查1000名, 其平均总成绩为505分,标准差为50分。问二者 学习成绩是否有差别(0.05)?如果有差别那种 方式更好些?
2 1 2 2
~ N (0,1)
• (三)两个总体均值之 差的 t 检验 (s12、 s22未知,
小样本)
t
( x1 - x 2 ) - ( m 1 - m 2 ) sp 1 1 n1 n2
其中:
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 Sp 1 n1 n2 - 2
1.5
决策:
接受H0
拒绝域 0.05
结论:
没有证据表明用第二种方法组装更好
0
1.7459
t
• 某市卫生局对市场上出售的甲乙两种冰激 淋进行了检验,甲种抽了11只,查明冰激 淋含脂肪平均为127%,样本标准差为 038%;乙种抽了10只,查明冰激淋含脂 肪平均为141%,样本标准差为048%。试 以5%的显著水平检验甲种的脂肪含量是否 比乙种低?
1 2 M i M
x 11 x 12
x 21 x 22
D1 = x 11 - x 21 D2 = x 12 - x 22
M
x 1i M x 1n
M
x 2i M x 2n
M
DI = x 1i - x 2i M Dn= x 1n- x 2n
n
假设差值Di来自正态总体,若两样本无差异,则差值应属于随机误差,而随机误 差可以认为服从正态分布,均值为0。
A
第一次16PF测试结果 第二次16PF测试结果
B 6 7 M 3
C 9 N 7
E 8 O 5
F 7 8 6
G
H
I 3
7 8 L 2
10 9
10 9
10 10 3 2 8 2
Q1 Q2 Q3 Q4
第一次16PF测试结果
第二次16PF测试结果
2
4
6
3
6
5
9
2
配对样本的 t 检验(数据形式)
观察序号 样本1 样本2 差值
12.7 - 14.1 -0.745 1 1 1 1 Sp 0.43 n1 n2 11 10 决策:接受原假设。 结论:即甲种的脂肪含量不高于乙种。
x1 - x 2
NEXT
二、二个相关(配对或匹配)样本的均值检验 (配对样本t 检验)
有时为了比较两种产品,或两种仪器、两种方法等的差异,我们常在相同的条 件下作对比实验,得到一批成对的观察值,然后分析观察数据作出判断——配 对比较法。
在 = 0.05的显著性水平下,调查结果是否支持 该俱乐部的声称?
配对样本的 t 检验(计算表)
样本差值计算表
- 2.54 -2.45,拒绝原假设,即认为 前后有显著不同。
第二节 两个总体比例之差的Z检验
一、两个独立样本均值之差的检验
• (一)两个总体均值之 差的Z检验 (s12、 s22 已知) • (二)两个总体均值之 差的Z检验 (s12、 s22 未知,
大样本)
z ( x1 - x 2 ) - ( m 1 - m 2 )
s
2 1
n1
s
2 2
~ N (0,1)
n2
z
( x1 - x2 ) - ( m1 - m 2 ) S S n1 n2
样本均值
xD
D
i 1
n
i
nD
n
98.5 9.85 10
样本标准差 s D
2 ( D x ) i D i 1
nD - 1
43.525 2.199 10 - 1
配对样本的 t 检验(计算结果)
• H0: m1 – m2 8.5 检验统计量: • H1: m1 – m2 <8.5 x D - D0 9.85 - 8.5 t 1.94 = 0.05 s D n D 2.199 10 • df = 10 - 1 = 9 决策: • 临界值(s): 接受H0
第七章 两总体的假设检验
第一节 均值差异的假设检验 第二节 比例差异的假设检验 第三节 均值差异比较的SPSS应用
两个正态总体的参数检验
两个总体的检验 均值
独立样本 配对样本
比例
方差
Z 检验
(大样本)
t 检验
(小样本)
t 检验
(小样本)
Z 检验
F 检验
两个独立样本之差的抽样分布
s1
m1
抽取简单随机样 样本容量 n1 计算X1 计算每一对样本 的X1-X2
训练前 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5 合计 训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102 — 差值Di 9.5 11.5 8.5 7.5 11 8 9.5 7.5 11 14.5 98.5
配对样本的 t 检验(计算结果)
1、检验具有等方差的两个总体的均值 2、假定条件
– 两个样本是独立的随机样本 – 两个总体都是正态分布 – 两个总体方差未知但相等s12 s22
(二)两个总体均值之差的 t 检验 (s12、 s22未知,小样本)
3、检验统计量 ( x1 - x 2 ) - ( m 1 - m 2 ) t 1 1 sp n1 n 2
H 0 : u1 u 2 , H 1 : u1 u 2 Z
(x 1 - x 2 )
大学教师
机关、企业 工作人员
S1 S 2
n
2
2
(23700 - 21500 ) 2435 2 6804 2 50
n1 50
n2 50
x1 23700 x 2 21500 S1 2435 S1 6804
(一)两个总体均值之差的Z检验 (s12、 s22 已知)
1、假定条件
– 两个样本是独立的随机样本 – 两个总体都是正态分布 – 若不是正态分布, 可以用正态分布来近似(n130 和 n230;n1+n2100)
2、原假设:H0: m1- m2 =0;备择假设:H1: m1- m2 0 3. 检验统计量为
其中:
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 Sp 1 n1 n2 - 2
两个总体均值之差的 t 检验 (例子)
例:一个车间研究用两种不同的工艺 组装某种产品所用的时间是否相同。 让一个组的10名工人用第一种工艺组 装该产品,平均所需时间为 26.1分钟, 样本标准差为 12 分钟;另一组 8 名工 人用第二种工艺组装,平均所需时间 为17.6分钟,样本标准差为10.5分钟。 已知用两种工艺组装产品所用时间服 从正态分布,且s12=s22 。试问能否 认为用第二种方法组装比用第一中方 法组装更好?( = 0.05)
• H0: m1- m2 = 0 检验统计量: (x 1 - x 2 ) - ( m1 - m 2 ) 50 - 40 - 0 • H1: m1- m2 0 z 4.7 2 2 64 100 s1 s 2 = 0.05 32 40 n1 n2 • n1 = 32,n2 = 40 决策: • 临界值(s):
2200 2.15 1022 临界值为 1.96,所以拒绝H 0,即收入有差距。
• 练习:
1、为了比较已婚妇女对婚后生活得态度是否因 为婚龄而有所区别,将已婚妇女按照对婚后生 活得态度分为“不满意”和“满意”两组,从 “不满意”组中随机抽取500名妇女,平均婚 龄为9.2年,标准差为2.8年;从“满意”组随 机抽取600名妇女,均值为8.5年,标准差为 2.3年,试问在显著性水平为0.05情况下,两 组是否存在显著差异?
拒绝域 .05
ຫໍສະໝຸດ Baidu
结论:
有证据表明该俱乐部的宣称是可信的
-1.833
0
t
例:消费者先对公司打分,再让他们一天两次观看公司录像,一周后再对公司打 分。数据如下表所示,令α=0.05,检验看过一周录像后对公司的打分和之前相比 是否有显著差异?
个人 事前
1
2
3
4
5
6
7
32 11 21 17 30 38 14
z ( x1 - x 2 ) - ( m 1 - m 2 ) ~ N (0,1)
s
2 1
n1
s
2 2
n2
两个总体均值之差的Z检验 (例子)
•例 1 :有两种方法可用于制造某种以
抗拉强度为重要特征的产品。根据以 往的资料得知,第一种方法生产出的 产品其抗拉强度的标准差为 8 公斤, 第二种方法的标准差为 10公斤。从两 种方法生产的产品中各抽取一个随机 样本,样本容量分别为n1=32,n2=40, 测得x2= 50公斤,x1= 40公斤。问这 两种方法生产的产品平均抗拉强度是 否有显著差别? ( = 0.05)
样本均值
自由度df =n - 1
样本标准差
2 ( D x ) i D
xD
Di i
1
n
n
n
sD
i 1
n -1
配对样本的 t 检验(例子)
•例:一个以减肥为主要目标的健美俱乐部声称,参 加其训练班至少可以使减肥者平均体重减重8.5公斤 以上。为了验证该宣称是否可信,调查人员随机抽 取了10名参加者,得到他们的体重记录如下表:
H 0:m1 解 :
- m2 0 H 1:m1 - m 2 0 * x1 12.7% s1 0.38 % n1 11
x 2 14.1% s 2* 0.48 % n 2 10
t 2 (19) t0.025 (19) 2 .093
Sp
t
2 (n1 - 1) s12 (n2 - 1) s2 0.43 n1 n2 - 2
总体1
s2 m2
总体2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
抽样分布
m1- m2
第一节 均值差异的假设检验
• 假设:
– – H0:两总体不存在差异,即u1=u2, H1:两总体存在差异,即u1不等于u2。
•
要求:
1. 随机抽样; 2. 每个总体都是正态分布; 3. 两个总体的标准差相等。
两个总体均值之差的 t 检验
• H0: m1- m2 0 • H1: m1- m2 > 0 = 0.05 • n1 = 10n2 = 8 • 临界值(s):
检验统计量:
t
(x 1 - x 2 ) - (m1 - m2 )
sp
1 1 n1 n2
26.1 - 17.6 - 0 1 1 11.37 10 8
X D -5.857 S D 6.0945
事后 d
39 15 35 13 41 39 22 -7 -4 -14 4 -11 -1 -8
1、H 0 : D 0,D 0 2、检验统计量:
t
XD - D - 5.857 - 0 -2.54 SD 6.0945 7 n 3、临界值:t0.025(7 - 1) 2.45
• 1、检验两个相关总体的均值 – 配对或匹配 – 重复测量 (前/后) • 2、假定条件 – 两个总体都服从正态分布 – 如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )
在人事测评中,假如我们用同一套测验工具在不同时 间对某位销售主管施测两次,结果如何呢?是否两次的 测评分数会有非常显著的差异呢?
– 相关样本eg:配对样本(实验组与控制组); 同一样本前后时期的变化等; – 假设两相关样本间有n对个案,每对个案可能 都有差异d= (X1-X2),而这些差异的均值为 Xd , 标准差为Sd , Xd的抽样分布符合t分布。
配对样本的 t 检验(检验统计量)
统计量
x D - D0 t sD n
拒绝 H0
.025
两个总体均值之差的Z检验 (计算结果)
拒绝 H0
.025
拒绝H0
结论:
有证据表明两种方法生产的产品其抗拉强 度有显著差异
-1.96
0
1.96
Z
两个总体均值之差的Z检验 (s12、 s22 未知 ,大样本)
例:某大学欲比较大学毕业后留校工作与分配到其他岗位的人工资水平的差别, 因为工资还与工龄等其他因素有关,因此抽选大学毕业后满10年在校工作的教 师50人,另外抽选大学毕业后满10年在机关、企业工作的人员进行比较,取得 的数据如下。试比较大学毕业后留校当教师与分配在机关企业等工作人员的工资 水平是否有差异?(α=.05)
• 练习题2:
• 为了比较就近上学和因家远而乘车上学的小学生 学习成绩是否有差别。某校从就近上学的小学生 中随机抽查800名,平均学习总成绩为520分,标 准差为40分;从乘车上学的小学生中抽查1000名, 其平均总成绩为505分,标准差为50分。问二者 学习成绩是否有差别(0.05)?如果有差别那种 方式更好些?
2 1 2 2
~ N (0,1)
• (三)两个总体均值之 差的 t 检验 (s12、 s22未知,
小样本)
t
( x1 - x 2 ) - ( m 1 - m 2 ) sp 1 1 n1 n2
其中:
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 Sp 1 n1 n2 - 2
1.5
决策:
接受H0
拒绝域 0.05
结论:
没有证据表明用第二种方法组装更好
0
1.7459
t
• 某市卫生局对市场上出售的甲乙两种冰激 淋进行了检验,甲种抽了11只,查明冰激 淋含脂肪平均为127%,样本标准差为 038%;乙种抽了10只,查明冰激淋含脂 肪平均为141%,样本标准差为048%。试 以5%的显著水平检验甲种的脂肪含量是否 比乙种低?
1 2 M i M
x 11 x 12
x 21 x 22
D1 = x 11 - x 21 D2 = x 12 - x 22
M
x 1i M x 1n
M
x 2i M x 2n
M
DI = x 1i - x 2i M Dn= x 1n- x 2n
n
假设差值Di来自正态总体,若两样本无差异,则差值应属于随机误差,而随机误 差可以认为服从正态分布,均值为0。
A
第一次16PF测试结果 第二次16PF测试结果
B 6 7 M 3
C 9 N 7
E 8 O 5
F 7 8 6
G
H
I 3
7 8 L 2
10 9
10 9
10 10 3 2 8 2
Q1 Q2 Q3 Q4
第一次16PF测试结果
第二次16PF测试结果
2
4
6
3
6
5
9
2
配对样本的 t 检验(数据形式)
观察序号 样本1 样本2 差值
12.7 - 14.1 -0.745 1 1 1 1 Sp 0.43 n1 n2 11 10 决策:接受原假设。 结论:即甲种的脂肪含量不高于乙种。
x1 - x 2
NEXT
二、二个相关(配对或匹配)样本的均值检验 (配对样本t 检验)
有时为了比较两种产品,或两种仪器、两种方法等的差异,我们常在相同的条 件下作对比实验,得到一批成对的观察值,然后分析观察数据作出判断——配 对比较法。