假设检验方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

假设检验-1
Hypothesis Testing
假设检验方法
【例】一种机床加工的零件尺寸绝对平均误差允许值为1.35mm 。

生产厂家现采用一种新的机床进行加工以期进一步降低误差。

为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。

利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(α=0.1),数据见:”Parts .mtw ”
左侧检验
1.061.220.911.971.98
2.031.011.241.450.990.590.501.500.741.23 1.131.020.951.121.12 1.161.031.121.100.98 1.12
2.371.540.961.1950个零件尺寸的误差数据(mm)0.82
1.601.101.000.970.86
1.23
1.17
1.261.381.70 1.641.081.110.941.061.13 1.811.311.261-Sample Z Test —例题
应用Minitab 检验
假设检验-3
1-Sample Z Test—习题
1. 请打开“1-Sample Z Test .mtw”
C1为某钢丝绳索制造商声称其生产的钢丝绳的平均抗断强度为大于
5磅,已经知道总体标准差为1,请判断其声明是否正确?
注意:Ⅰ.当小样本时(n<25~30),且总体标准差未知时使用1-Sample T Test.
使用1-Sample T Test前,一定要检验正态性.
如果非正态时,可以考虑:
a.增加样本量,达到n≥25.
b.使用非参量设计(绿带教程一般不涉及)
Ⅱ. 当大样本时(n≥25~30),使用1-Sample Z Test.
不一定要求正态性.
如果不知道总体标准差时,可以使用样本标准差代替.
Ⅲ.当小样本时(n<25~30),但总体标准差已知时,也是使用1-Sample Z Test.
注意:小样本时;一定要保证正态性.
第一步设定H0和H a
1. H0: 钢丝绳的平均抗断强度≤5
H a:钢丝绳的平均抗断强度>5磅
2. 取α=0.05
假设检验-5
第二步比较均值
结论
One-Sample Z: Values
Test of mu= 5 vs mu> 5
The assumed sigma = 1
Variable N Mean StDev SE Mean
Values 30 5.435 0.984 0.183
Variable 95.0% Lower Bound Z P
Values 5.134 2.38 0.009
因为P小于0.05,所以对立假设成立。

即钢丝绳的平均抗断强度大于5磅
假设检验-7
练习:1-Sample Z test
用传统方法订购商品,平均交货期为6天,标准
差为2天.
现在改用新的方法订购, 请评估新方法的交货期是否比传统方法短?
数据在“Delivery time. Mtw”
Minitab分析结果
One-Sample Z: C1
Test of mu= 6 vs mu not = 6
The assumed sigma = 2
Variable N Mean StDev SE Mean
C1 36 4.278 1.760 0.333
Variable 95.0% CI Z P
C1 ( 3.625, 4.931) -5.17 0.000
结论:因为P<0.05,所以对立假设成立,即新方法的交货期比传统方法

假设检验-9
1-Sample T Test—习题
2.请打开“Steel wire .mtw”
C1为某钢丝绳索制造商声称其生产的钢丝绳的平均抗断强度为大于5磅,请判断其声明是否正确?
注意:Ⅰ.当小样本时(n<25),且总体标准差未知时使用1-Sample T Test.
使用1-Sample T Test前,一定要检验正态性.
如果非正态时,可以考虑:
a.增加样本量,达到n≥25.
b.使用非参量设计(绿带教程一般不涉及)
Ⅱ. 其他情况考虑1-Sample Z Test.或非参量检验(样本量小, 且非正态)
第一步设定H0和H a
1. H0: 钢丝绳的平均抗断强度≤5
Ha:钢丝绳的平均抗断强度>5磅2. 取α=0.05
假设检验-11
第二步正态性检验
第三步比较均值
假设检验-13
1-Sample t test 练习
设计工程师要评估电机的转距, 你只要
确认新电机的平均转距是否超过30newtons
就可以了.只抽取了少量的数据(16个),并进行检验. 数据在Visor.mtw
原假设和备择假设是?
1. H0: 新电机的平均转距等于30newtons
Ha:新电机的平均转距超过30newtons
2. 取α=0.05
结果
One-Sample T: pivtorq
Test of mu= 30 vs mu> 30
Variable N Mean StDev SE Mean
pivtorq16 31.369 2.831 0.708
Variable 95.0% Lower Bound T P
pivtorq30.128 1.93 0.036
结论:因为P〈0.05,所以对立假设成立,即新电机的平均转距
超过30newtons
假设检验-15
1-Sample Wilcoxon —习题
请打开Minitab中自带文件“Poplar2 .mtw”
宾夕法尼亚州立大学的研究人员在两个不同的地方,种植了一些白杨树,一个地方在小溪旁,土质肥沃,灌溉系统好;另一个地方是山地,土壤干燥,呈现沙性。

他们以厘米为单位测量直径,以米为单位测量高度;然后把它烘干,测量它的重量。

现在请判断当地方为山地时(Site=2)白杨树高度的中位数是否小于5.2米?
2-Sample T Test—习题
3.请打开“Height .mtw”
某机构欲调查男人与女人的平均身高
有无差别各随机抽样了一些人的身
高,请给出您的判断。

假设检验-17
第一步:正态性检验
注意:正态性检验时需要对不同组单独
做正态检验.是否正态对后面的等方差
测试判断有影响.
第二步:等方差检验
注意:等方差测试前,需要确认数据是
否已经堆栈?Minitab要求堆栈后,才能
进行等方差测试.
等方差测试后,如果发现方差不等,则
需要使用非参量检验.
假设检验-19
第三步:均值检验
注意:如果方差相等,则勾选下项.
结论
Two-Sample T-Test and CI: 南方,北方 Two-sample T for 南方 vs 北方
N Mean StDev SE Mean 南方 100 165.23 5.62 0.56 北方 100 169.62 5.00 0.50 Difference = mu 南方 - mu 北方 Estimate for difference: -4.397 95% CI for difference: (-5.881, -2.913) T-Test of difference = 0 (vs not =): T-Value = -5.84 P-Value = 0.000 DF = 195
因为P小于0.05,所以对立假设成立,即南方人的平均身高与北方 人的平均身高有差异
假设检验-21
2-Sample T Test—习题
4.请打开Minitab中自带文件“Pulse .mtw” 某机构欲调查男人与女人的平均体重有无差 别 各随机抽样了一些人的身高, 请给出您 的判断。


假设检验-22


Mann Whitney—习题
4.请打开Minitab中自带文件“Poplar2 .mtw” 宾夕法尼亚州立大学的研究人员在两个不同的地
方,种植了一些白杨树,一个地方在小溪旁,土质肥 沃,灌溉系统好;另一个地方是山地,土壤干燥,呈 现沙性。

他们以厘米为单位测量直径,以米为单位测 量高度;然后把它烘干,测量它的重量。

现在请判断 地方(Site)对白杨树高度是否存在显著影响?
假设检验-23
One way Anova Test—习题
5.请打开“Anova Test.mtw” 某公司要判断4种不同热处理方法对钢条的 长度变化有无影响?C2为4种不同热处理方 法,C1为长度变化。

请给出您的结论。


假设检验-24


结论
One-way ANOVA:
Analysis of Variance for Durabili
Source DF SS MS F P
Carpet 3 111.6 37.2 2.60 0.101
Error 12 172.0 14.3
Total 15 283.6
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---------+---------+---------+-------
1
4 14.483 3.157
(-------*-------)
2
4 9.735 3.566 (-------*--------)
3
4 12.808 1.506 (--------*-------)
4
4 17.005 5.691
(-------*-------)
---------+---------+---------+-------
Pooled StDev = 3.786
10.0 15.0 20.0
因为P大于0.05,所以不能否定归零假设,即不能否定4种不同热处理方法对钢 条的长度变化无影响
假设检验-25
第一步:正态性检验
假设检验-26


第二步:等方差检验
注意:ANOVA要求方差必须相等,否则需要 使用非参量检验.
假设检验-27
第三步:均值检验
假设检验-28


附录:ANOVA计算
(三个平方和的关系)
¨ 总变差平方和(SST)、组内平方和(SSE)、组间平 方和 (SSA) 之间的关系
∑∑( ) ∑ ( ) ∑∑( ) k
ni
xij − x 2 = k ni xi − x 2 + k
ni
xij

x j
2
i=1 j=1
i=1
i=1 j=1
SST = SSA + SSE
假设检验-29
附录:ANOVA计算 (三个平方和的关系)
SOURCE BETWEEN
WITHIN TOTAL
SS SS(Factor)
SS(Error) SS(Total)
df
MS
a -1
MS(Factor) = SS(Factor)/(a - 1) F = MS(B) / MS(Error)
N-a
MS(Error) = SS(Error)/(N - a)
N -1
假设检验-30


ANOVA练习
工程师研究不同的温度对垫片的断裂强度 有无显著影响?他的试验数据如表:请问三种 不同的温度对垫片的断裂强度有无显著影响?
数据请见:“Temp.mtw”
假设检验-31
Chi-square Test
• 假设你想通过样本来比较北京与上海的富人比例 是否有显著差别?你可以使用哪种假设检验?
区分
北京 上海 Total
富人 穷人 Total
20
80 100
20
80 100
40
160 200
假设检验-32


Chi-square Test
• 假设你想通过样本来比较北京与上海的富人比例 是否有显著差别?请用Chi-square Test.
区分
富人 穷人 Total
北京
20
80 100
上海
20
80 100
Total
40
160 200
Σ χ2 =
(fo - fe)2 fe
fo: O, Observed 观测值 fe: E, Expected 期望值 Df: Degrees of Freedom,自由度表示独立随机变 量的个数
假设检验-33
Chi-square Test 例题
随机调查了2000人, 询问他们是否吸烟 及咳嗽,见下表:
不吸烟 吸烟
不咳

1100
100
700
100
问: 吸烟与咳嗽有关系吗? 或问:吸烟者与不吸烟者患咳嗽的比率相同吗?
假设检验-34


Chi-square Test 例题
不咳 不吸 1100
1080 20
吸烟 700 720 -20
总和 1800 0.9

100 120 -20
100 80 20 200 0.1
总和 1200
800 2000
假设检验-35
Chi-square Test 例题
由卡方检验得知
Q=
k

(Oi
i=1
− Ei )2 Ei
~
χ 2 ((r
−1)(c −1))
其中,K=r*c, r = 行数, c =栏数,
df=((r-1)(c-1))=((2-1)(2-1))=1 自由度1.
假设检验-36


Chi-square Test 例题
代入具体数值计算可得:
Q
=
(1100 −1080)2 1080
+
(100 −120)2 120
+
(700 − 720)2 720
+
(100 − 80)2 80
=0.3704 +3.3333 +0.5556 +5.0000 =9.093
它比临界值3.841大,因此应拒绝H0。

可以算出p-value为0.0026,结论相同。

总之,吸烟确实与咳嗽有关,或可以断言:吸烟者与不 吸烟者患咳嗽的比率是不相同的。


假设检验-37
χ2 分布密度函数的图形
f (x)
n=1 n=4
n=10
0
x
假设检验-38


χ2分布的右侧α分位点
为χ 2分布中满足下式的的右侧α分位点 :
χα2 (n) P{χ 2 > χα2 (n) } = α
f (x)
α
0
x χα2 (n)
由给定的概率α和自由度,可查表得到 χα2 (n)
假设检验-39
用 Minitab 求
χ
2 α
(
n
)
假设检验-40


1.输入数据 3.选择变量
利用Minitab计算
2.Tables>Chi-square
假设检验-41
Minitab结果
Chi-Square Test: 不咳嗽 咳嗽
Expected counts are printed below observed counts
不咳嗽 咳嗽 Total 1 1100 100 1200
1080.00 120.00
H0: A与B相互独立 Ha: A与B不相互独立
2 700 100 800 720.00 80.00
Total 1800 200 2000
Chi-Sq = 0.370 + 3.333 + 0.556 + 5.000 = 9.259
P<0.05,所以否定原 假设,即吸烟与咳嗽
有关
DF = 1, P-Value = 0.002
假设检验-42


Chi square Test—习题
国家商务部统计了三个城市办理合资 企业营业执照的情况,请判断三城市办 事效率有无显著不同?
区分 天津 深圳 杭州 Total
及时办成 未及时办成 Total
87
134
221
260
265
525
146
178
324
493
577
1070
假设检验-43
Chi-square test 练习
某经理想判断良品与不良品数量与新员工,老 员工有无关系,新员工,收集的数据为,新员 工不良数为345个,良品数为3823个,老员工 不良数为356个,良品数为4678,请用卡方檢 驗作出判断,新员工与老员工有无显著差异?
假设检验-44


根据题义有:
提示
应用卡方分布有:
答案:P=0.03<0.05 所以有差别
假设检验-45
• 为了查出地区与对购买的手机品牌是否存在关联性,市场部调查了各200名顾客作为 对象,调查了先后顺序,得到如下结果.请给出您的判断
• Stat / Tables / Chi-Square Test
品牌
地区 北京 上海 广州
深圳
合计
SAMSUNG 21 18 10 18 67
NOKIA 121 133 147 138 539
Moto 58 49 43 44 194
合计 200 200 200 200 800
假设检验-46


• DID 事业部每年以新员工为对象实施现场实习。

为了查出他们的实习成绩和今后1年间 工作成绩之间是否有什么样的关系,以全体新员工400名为对象得到以下结果 按照下面资料,是否能看作新员工的现场实习成绩影响1年的工作,
• Stat / Tables / Chi-Square Test
工作成绩

实习成绩

23
良好
28
优秀
9
合计
60
良好 60 79 49 188
优秀 29 60 63 152
合计 112 167 121 400
独立性检验当中原假设和对立假设容易混淆,所以要注意。

在这里
原假设 : 实习成绩与工作成绩没有关系 对立假设 : 实习成绩与工作成绩有关系
假设检验-47
使用Minitab
假设检验-48


Chi-Square Test: 及时 不及时
计算结果
Expected counts are printed below observed counts H0: A与B相互独立 Ha: A与B不相互独立
及时 不及时 Total
1 87 134 221
101.83 119.17
P<0.05,所以否定原
2 260 265 525 241.89 283.11
假设,办事效率有显 著不同
3 146 178 324 149.28 174.72
Total 493 577 1070
Chi-Sq = 2.158 + 1.844 + 1.355 + 1.158 + 0.072 + 0.062 = 6.650
DF = 2, P-Value = 0.036
假设检验-49











相关文档
最新文档