3_2_1 T检验(比例检验)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2.1 T检验(比例检验)
北京桑兰特科技有限公司
1
2
4
连续型
离散型
X
Y
验证根本原因的统计工具
T检验(比例检验)
目标:
了解T检验(比例检验)及其应用
主要内容:
•单个正态总体均值的T检验
•两个正态总体均值的T检验
•成对数据T检验
•比例检验
5
单个正态总体均值的T检验的含义
设正态总体X:X~N(μ,σ²),在实际问题中,μ,σ²通常是很难知道的。
现从总体X中抽取样本x1,x2,…,x n,从样本均值X和样本标准差S出发来检验总体分布的均值μ是否等于(或大于、小于)定值μ0,这就是单个正态总体均值的T检验。
6
7
两个正态总体均值的T 检验的含义
设两个独立的正态总体X、Y :X ~N (μ1,σ²1),Y ~N(μ2,σ²2)同样μ1,μ2, σ²1,σ²2通常是很难知道的。
现从总体X 中抽取样本x 1,x 2,…,x n ,样本均值为,样本标准差为S x ,从总体Y 中抽取样本y 1,y 2,…y m ,样本均值为,样本标准差为Sy ,从样本均值,和样
本标准差Sx ,S y 来检验总体X 的均值μ1是否等于(或大于、小于)总体Y
的均值μ2,这就是两个正态总体均值的T 检验
Y X X Y
实例:
实例1:炼铁厂某号高炉的铁水含碳量X~N(μ,σ²),在正常情况下,铁水含碳量μ0=4.55%,今抽查5炉铁水的含碳量(%)分别为:4.28,4.40,4.42,4.35,4.37,试判断铁水含碳量μ是否正常?
实例2:实践表明,钢条的抗剪强度服从正态分布,现对生产线作工艺改进,在改进工艺前后,各测量了若干钢条的抗剪强度,数据如下:改进后:525,531,518,533,546,524,521,533,545,540
改进前:521,525,533,525,517,514,526,519
问:可以认为工艺改进前后钢条的平均抗剪强度有提高吗?
8
9
单个正态总体均值的T 检验步骤
步骤1:建立原假设H 0和备择假设H 1
通常有三类假设
H 0:μ=μ0 , H 1:μ≠μ0----双边假设检验
H 0: μ≤μ0, H 1: μ>μ0H 0: μ≥μ0, H 1:μ<μ0
----单边
假设检验
10
单个正态总体均值的T 检验步骤
步骤2:
选择检验统计量
这里μ0是定值,n 为样本容量,与s 分别表示样本x 1,x 2,…x n 的均值与标准差,t(n-1)是自由度为n-1的t 分布。
x
−
)
1(~0
−−=
n t n
s
x t µ
单个正态总体均值的T检验步骤
步骤3:给出检验中的显著性水平α
常取α=0.05,根据问题的具体情况,也可取α= 0.01或0.10
步骤4:给出临界值、确定拒绝域
根据选择的检验统计量的分布,以及给定的显著性水平α,可确定临界值和拒绝域,但在不同的三类假设下,拒绝域是不同的
11
单个正态总体均值的T检验步骤
步骤5:根据样本观察值,计算检验统计量的值,并作判断.
判断方法:
(1)若检验统计量的值落在拒绝域中,则拒绝原假设。
(2)由检验统计量计算P值,当P<α时拒绝原假设。
(3)若原假设的参数值μ0未落入总体均值的置信区间内,则拒
绝原假设
12
用MINTAB进行单个正态总体均值的T检验
实例1:
打开MINTAB工作表,输入数据:4.28,4.40,4.42,4.35,4.37•首先进行正态性检验
•Stat> Basic Statistics > Normality Test
13
正态性检验输出结果
14
实例1(续)
建立假设H0:μ=4.55 H1:μ≠4.55
•Stat>Basic Statistics>1-Sample t
•在Sample in Columns 下选择C1,在Test mean下输入4.55
•按Graphs 选择Box plot of data
•按Options 在Confidence level下输入95.0
在Alternative选择not equal
•OK
15
16
MINITAB 输出结果
One-Sample T: C1
Test of mu = 4.55 vs not = 4.55
Variable N Mean StDev
SE Mean 95% CI T P C1 5 4.36400 0.05413 0.02421 (4.29679, 4.43121)-7.68 0.002
结论:铁水含碳量在显著性水平α=0.05下不正常,且显著降低
17
两个正态总体均值的T 检验步骤
步骤1:建立原假设H O 和备择假设H 1
通常也有三类假设H O : μ1=μ2
, H 1: μ1≠μ2 ----双边假设检验
H O : μ1≤μ2, H 1: μ1>μ2 H O : μ1≥μ2
, H 1: μ1<μ2
----单边假设检
验
18
两个正态总体均值的T 检验步骤
步骤2:选择检验统计量
若= 且未知时,21
σ
s
w
22
σ
2
)1()1(22−+−+−m n s
m s n y
x =
其中
=
)
2(~1
1−++−=
m n t m
n s y x t w
两个正态总体均值的T检验步骤
步骤3: 检验两个总体是否服从正态分布;
步骤4:检验两个正态总体的方差是否相等,即方差齐性检验
可用MINTAB操作
Stat > Basic Statistics > 2 Variances
19
两个正态总体均值的T检验步骤
步骤5:给出检验中的显著性水平α
步骤6:根据备择假设,给出临界值,确定拒绝域
步骤7:根据样本观察值作统计判断
上述三个步骤与单个正态总体均值的T检验对应的步骤基本相同
20
用MINTAB进行两个正态总体均值的T检验
实例2:
打开文件:两总体T检验1
首先进行正态性检验
Stat > Basic Statistics > Normality Test
结论:两组样本数据均服从正态分布
21
22
实例2:(续)作方差齐性检验建立假设
H O : = , H 1: ≠•Stat > Basic Statistics > 2 Variances
•在Samples in different columns 下依次选择C 1,C 2•按Options 在Confidence level 下输入95.0•OK
21
σ
22σ
21σ2
2
σ
MINTAB输出结果
Test for Equal Variances
Level1 C1
Level2 C2
Conflvl95.0000
Bonferroni confidence intervals for
standard deviations
6.39571 9.77753 19.6885 10 C1
3.75367 6.00000 13.7429 8 C2
F-Test (normal distribution)
Test Statistic: 2.656
P-Value : 0.211
Levene's Test (any continuous distribution)
Test Statistic: 2.022
P-Value : 0.174
结论:两正态总体的方差在显著性水平α=0.05下无显著差异
23
实例2:(续)
作T检验
建立假设H O: μ1=μ2 ,H1: μ1>μ2 ,
Stat > Basic Statistics > 2-Sample t
•在Samples in different columns下依次选择C1,C2
•选择Assume equal Variances
•按Graphs 选择Box plots of data
•按Options 在Confidence level下输入95.0
在Test difference 输入0.0
在Alternative 下选择greater than
•OK
24
25
MINTAB 输出结果
Two-Sample T-Test and CI: C1, C2Two-sample T for C1 vs C2
N Mean StDev
SE Mean
C1 10 531.60 9.78 3.1C2 8 522.50 6.00 2.1Difference = mu C1 -mu C2Estimate for difference: 9.1095% lower bound for difference: 2.19
T-Test of difference = 0 (vs >): T-Value = 2.30
P-Value = 0.018
DF = 16
Both use Pooled StDev = 8.34
结论:工艺改进后,钢条的平均抗剪强度确有提高
26
用MINTAB
练习(一)
某热轧结构钢钢板厚度目标值为5.00mm,为了了解实际的厚度是否与目标值相吻合,测量了20个数据见文件:单总体T检验–C2
问:近阶段该产品厚度是否正常?
27
练习(二)
在某炼钢炉上进行一项试验以确定改变操作方法是否增加钢水收得率,试验在同一只炉上进行,每炼一炉时,除操作方法外,其他条件尽可能做到相同,先用原方法炼一炉,然后改变方法炼一炉,以后交替进行,各炼了10炉,其收得率数据见文件(两总体T检验2),且认为两个样本数据来自互相独立的正态总体
问:改变操作方法有否提高收得率?
28
对正态总体进行T检验时样本容量的确定
对正态总体均值作T检验时,通常事先指定显著性水平α,以
确定发生第一类错误(弃真错误)的概率α,再通过控制样本容
量n,对发生第二类错误(纳伪错误)的概率β进行控制
29
对正态总体进行T检验时样本容量的确定
两类错误造成的损失是不同类型的,其性质的严重性也是不同的,因此不同的问题会对两类错误的概率做出不同的选择。
所以常常会对发生两类错误所允许的概率先作出明确规定,然后确定适当的样本容量
样本容量除了与两类错误的概率α,β有关外,还与总体方差
σ²及被检参数的精度要求δ有关
30
对正态总体进行T检验时样本容量的确定
若第二类错误的概率为β,则定义检验功效(power of test)为1-β,即为“在备择假设成立时不犯第二类错误”的概率
计算样本容量可用MINTAB进行:
Stat > power and sample size > 1 Sample Z(σ已知)
1 Sample t (σ未知)
31
32
对正态总体进行T 检验时样本容量的确定
实例:某轧钢厂为提高某管坯的屈服强度,改变轧制工艺的某些参数作试验,从取得的部分数据分析知:均值为
=39.32,标准差
为S = 0.75,屈服强度服从正态分布,且目标值为40,若要作T 检验分析其改变工艺是否有效,试确定样本容量。
(取α= 0.05 ,β= 0.2)
x −
对正态总体进行T检验时样本容量的确定
•Stat > power and Sample Size > 1 Sample t
•分别输入δ= 0.68 1-β= 0.8 S = 0.75
•按Options,选择Greater than ,输入α= 0.05
•OK
33
MINTAB输入结果
Power and Sample Size
1-Sample t Test
Testing mean = null (versus > null)
Calculating power for mean = null + difference
Alpha = 0.05 Sigma = 0.75
Sample Target Actual
Difference Size Power Power
0.68 10 0.8000 0.8407
作T检验时,先确定样本容量!
34
35
成对数据T 检验
为比较两种产品,或两种仪器,两种方法等的差异,在相同条件下作对比实验,得到成对的观察值,根据观察值作统计推断时,可运用成对数据T 检验.成对数据T 检验原理:若 d =X-Y ~N(μ, σ²),作原假设H 0:μ=0,
备择假设H 1:μ≠0,选择检验统计量
)
1(~−=
n t n
s d t d
36
成对数据T 检验
•
保险公司的评估员认为汽车修理厂A 比汽车修理厂B 对汽车修理费用的评估要高。
为了证实他们的猜想,将最近出现事故的15辆汽车分别在两个汽车修理厂进行修理费用评估。
所得数据如下:•
维修费评估(单位:百元)
Car Company A
Company B 117.617.3220.219.1319.518.4411.311.5513.012.7616.315.8715.314.9816.215.3912.212.01014.814.21121.321.01222.121.01316.916.11417.616.715
18.4
17.5
用MINTAB进行成对数据T检验
实例:某团队对测量矿石中二氧化锰的两种分析方法进行对比,随机从过程的产品中抽样,将同一个样品用两种实验分析分别测量二氧化锰含量各一次,数据记录见文件(成对数据T检验 1 ),问两种分析方法的结果有无显著差异?(取显著性水平α=0.05)
37
用MINTAB进行成对数据T检验
•Stat > Basic Statistics > Paired t
•分别输入数据变量名
•按options,输入置信水平95.0,检验均值0.0
备择假设:not equal
•OK
38
MINTAB输出结果
Paired T-Test and CI: A, B
Paired T for A -B
N Mean StDev SE Mean
A 11 7.61818 3.90303 1.17681
B 11 7.40909 3.89036 1.17299
Difference 11 0.209091 0.284445 0.085763
95% CI for mean difference: (0.017998, 0.400184)
T-Test of mean difference = 0 (vs not = 0): T-Value = 2.44 P-Value = 0.035 Two-Sample T-Test and CI: A, B
Two-sample T for A vs B
N Mean StDev SE Mean
A 11 7.62 3.90 1.2
B 11 7.41 3.89 1.2
Difference = mu(A) -mu(B)
Estimate for difference: 0.209091
95% CI for difference: (-3.256860, 3.675041)
T-Test of difference = 0 (vs not =): T-Value = 0.13 P-Value = 0.901 DF = 20
Both use Pooled StDev= 3.8967
39
比例检验
单个比率的检验
例1:某厂规定产品必须经过检验合格后才能出厂,其不合格品率P 不得超过5%,现从一批产品中随机抽取50个进行检验,发现有4个不合格品,问该批产品能否出厂?(取α=0.05)
建立假设H0:P≤0.05 H1:P > 0.05
用MINTAB进行检验
40
比例检验
例1(续):打开MINTAB工作表
•Stat>Basic Statistics>1 Proportion
•在Summarized data分别输入50 ,4
•按Options,输入置信水平95.0 ,检验比例0.05
备择假设:greater than
•OK
41
MINTAB输出结果
Test and CI for One Proportion
Test of p = 0.05 vs p > 0.05
95% Lower Exact
Sample X N Sample p Bound P-Value
1 4 50 0.080000 0.027788 0.240
结论:不能拒绝H0,应允许这批产品出厂
练习:如果样本量增加,1000个产品中发现80个不合格品,这
批产品是否能出厂? 说明什么问题?
42
比例检验
两个比率的检验
例2:用铸造和锻造两种不同方法制造某种零件,从各自的零件
中分别随机抽取100个,其中铸造的有10个废品,锻造的有3个废品,在α=0.05水平上能否认为废品率与制造方法有关?
设铸造废品率为P1,锻造废品率为P2
建立假设H0:P1 = P2H1:P1≠P2
用MINTAB进行检验
43
比例检验
例2(续):打开MINTAB工作表
•Stat > Basic Statistics > 2 Proportion
•在Summarized data下分别输入100 ,10和100 ,3
•按Options输入置信水平95.0 ,检验差异0.0,备择假设:not equal •OK
44
45
MINTAB 输出结果
Test and CI for Two Proportions Sample X N Sample p 1 10 100 0.1000002 3 100 0.030000
Difference = p (1) -p (2)
Estimate for difference: 0.07
95% CI for difference: (0.00235994, 0.137640)
Test for difference = 0 (vs not = 0): Z = 2.03 P-Value = 0.043
* NOTE * The normal approximation may be inaccurate for small samples.Fisher's exact test: P-Value = 0.082
结论:拒绝H 0,即两种方法对废品率有显著差异
注: 比例检验均为基于大样本来进行的!
小结
•单个正态总体均值的T检验
•两个正态总体均值的T检验
•成对数据T检验
•比例检验
46。