统计推断-连续性数据的差异显著性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
)
n1 n 2 2
P≤a,拒绝原假设 P>a,不能拒绝原假设
22
统计答案


如果原假设成立,则: 1. 总体均值的置信区间包含目标值μo 2. 样本均值对应的t统计量t(a/2,df)<t<t(1-a/2,df) 3. p>0.05 反之,如果以上条件违反了,则可以拒绝原假设而接受备择假设。
23
差异的显著性检验

33
利用Minitab进行独立双样本t检验(供参考)

选择菜单“统计>基本统计量>双样本t...”,如下 进行设置:
34
利用Minitab进行独立双样本t检验(供参考)
双样本 T 检验和置信区间: 新工艺, 老工艺 新工艺 与 老工艺 的双样本 T 平均值 N 平均值 标准差 标准误 新工艺 16 129.71 2.31 0.58 老工艺 16 122.29 2.15 0.54 差值 = mu (新工艺) - mu (老工艺) 差值估计: 7.419 差值的 95% 置信下限: 6.080 差值 = 0 (与 >) 的 T 检验: T 值 = 9.40 P 值 = 0.000 自由度 = 30 两者都使用合并标准差 = 2.2312

24
假设检验要回答的问题
y = f (Байду номын сангаас)
结果 响应 输出

原因 条件 输入
假设检验要回答的问题: x是否影响y的重要原因? x在不同条件下y是否有显著差异?
25
假设检验的方法

根据数据的类型及其服从分布的不同,假设检验的方法也不同,以 下部分假设检验的检验方法将在之后的课程中讲解:
原假设
H0 :m = m0 H1 :m ≠m0
H0 :m m0 H1 : m < m0
H0 :m m0 H1 :m > m0
备择假设
9
案例-1

【例】一家研究机构估计,某 城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否 正确,该研究机构随机抽取了 一个样本进行检验。试陈述用 于检验的原假设与备择假设, 并说明你的理由。
新焊接工艺和旧焊接工艺下的焊点拉力没有区别 Ho:μ新 - μ老=0 备择假设:



新焊接工艺的焊点拉力比旧焊接工艺焊点拉力大

Ha:μ新 - μ老>0
使用文件:2t.mtw
32
独立双样本t检验

如上例,经计算得到:
n 新工艺 16 老工艺 16
Sp =
2
平均值 129.71 122.29
2 2
使用文件:1t.mtw
28
单样本t检验:均值和目标值存在差异吗?

单样本t检验:检验一组样本所在总体的均值和目标值是否 存在显著差异 建立假设: 原假设: Ho:μ=11.40 备择假设: Ha:μ≠11.40
29
利用Minitab进行样本t检验(供参考)

使用文件:1T.mtw
在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 小概率由研究者事先确定
19
假设检验的实施步骤

提出原假设和被选假设 选择检验统计量,确定拒绝域形式 确定显著性水帄


计算求得临界值,确定具体的拒绝域
收集样本观察值 计算检验统计量的值并作出统计决策
20
实施步骤图示
P/2
P/2
事实上,配对t检验转换成 以下的单样本t检验: Ho:差异=0 Ha:差异≠0
10.9
14.3 10.7 6.6 9.5 10.8 8.8
11.2
14.2 11.8 6.4 9.8 11.3 9.3
-0.3
0.1 -1.1 0.2 -0.3 -0.5 -0.5
结论是什么?
13.3
13.6
-0.3
38
离散型y
比例检验 卡方检验 逻辑回归
连续型y
t检验 ANOVA F检验 回归分析
离散型X 连续型X
26
连续型变量差异的显著性检验
t检验 F检验 ANOVA
单样本t检验

问题 产品长度的公称值为11.40mm,现怀疑某台设备加工出来的产品 长度偏离了此公称值,随机抽查了20个产品并测量了其长度,如 何评估?
原假设为真时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水帄

2.

第Ⅱ类错误(取伪错误)-- 错误
原假设为假时未拒绝原假设 第Ⅱ类错误的概率记为
16
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!


17
显著性水帄 (significant level)
31
独立双样本t检验
案例:拉不断焊接工艺 在汽车装配流程中,零件A和零件B需要焊接在一起为后 道工序作准备,焊点拉力对质量至关重要,为了提高焊 点拉力,流程工艺工程师在实验范围内研究了新的焊接 工艺,作为工厂经理,你如何决定是否在工厂范围内推 广新的焊接工艺? 目的:证明新的焊接工艺能够显著的提高焊点拉力 建立假设: 原假设:
F = S
2 2
=
2 . 15
2
= 1 . 15

0.349<1.15<2.86,新老工艺生产出的产品拉力的波动性 没有显著差异。
41
独立双样本t检验

在方差相等的前提下,双样本t检验的统计答案如下得到: 1. 计算统计量t
t = x1 x 2 S (
2 p
1 n1

1 n2
Sp =
2
( n1 1 ) s1 ( n 2 1 ) s 2

是一个概率值 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 由研究者事先确定


18
检验假设的特点

特点

采用逻辑反证法 依据统计上的小概率原理

什么小概率?


在一次试验中,一个几乎不可能发生的事件发生的概率
在质量工程师的职业生涯中,经常遇到以下的问题: 来料的重量是否偏离了工称值? 两台设备加工出来的工件表面粗糙度是否有差异? 经过改进,产品的合格率是否得到了显著的提高? 输入电压是否影响焊接拉力的重要参数?
以上的问题都涉及到差异的显著性检验,都可以利用统计学的思维来回答。 实际问题到统计问题的沟通 统计并不能代替专业的判断。

改进后的灯泡寿命是否明显地大于350小时
m 350m>350 H0:m 350 H:m>350

产品的合格率是不是真的地1%
m %m<% H0:m % H:m<%
8
假设形式
假设
双侧检验
单侧检验 左侧检验 右侧检验
10
案例-2

【例】某品牌洗涤剂在它的产品说 明书中声称:帄均净含量不少于500 克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品 来验证该产品制造商的说明是否属 实。试陈述用于检验的原假设与备 择假设,并说明你的理由。
500g
11
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 如果这是总 体的真实均值 ... 因此我们拒 绝假设 m = 50
选择“Minitab>统计>基本统 计量>单样本t"
30
利用Minitab进行样本t检验(供参考)

Minitab输出t检验结果如下:
单样本 T: 长度
mu = 11.4 与 ≠ 11.4 的检验
平均值 变量 N 平均值 标准差 标准误 95% 置信区间 T P 长度 20 11.3795 0.0311 0.0069 (11.3650, 11.3940) -2.95 0.008
36
配对t检验

目的:证明A和B材料制作的鞋底磨损程度不一样 建立假设: 原假设: A和B材料制作的鞋底磨损程度一样 Ho:μA-μB=0 备择假设: A和B材料制作的鞋底磨损程度不一样 Ha:μA-μB≠0 使用文件 Wear.MTW
37

配对t检验
Mat-A 13.2 8.2 Mat-B 14 8.8 差异(A-B) -0.8 -0.6
1-a
临界值
临界值
21
"P"值和显著性水帄"a"

“P”值: Ho为真的概率。 如果“P”值很小,基于小概率事件原理,我们就可以拒绝原假 设而接收备择假设。 “P”值的临界值叫做显著性水帄(Singificance level)“a”。 (1-a)称为置信度(Confidence Level) 一般取“a”为0.05。 “P”≤a,则拒绝Ho而接受Ha “P”>a,则不能拒绝Ho。 “P”值可以利用相关的统计软件如Minitab求得,当没有软件时, 可以利用各种抽样分布的统计量获得统计答案
6
什么是假设
原假设 (H0) 备择假设 (H1):
•通常用以描述差別 •以证据为基础接受或拒绝的类型
•通常用以描述现状 •除非其它方面有所 说明,否则就是人为 设想的
7
实例分析

精密电阻生产厂商生产的20欧电阻阻值是明显大于或小 于20欧
m=20 H0:m=20 m20 H:m20
样本检验的两种类型

双样本或者多样本检验存在以下两类型:
离散程度的检验 样本所在总体间的离散度是否 有差异? 对平均值的差异进行检验前先 对离散度的差异进行检验。 方差(σ2)的检验用到以下工 具: F检验(双样本方差) 建设检验阐述 Ho:σ1=σ2 Ha:σ1 ≠ σ2
平均值的检验 样本所在总体间的平均值是否 有差异? 对离散程度的差异进行检验后 再对平均值的差异进行检验。 平均值(μ)的检验用到以下 工具: 双样本t检验 建设检验阐述 Ho:μ1=μ2 Ha:μ1 ≠ μ2(>,<)
39
F分布

定义 设{X1,X2...Xn}和{X1,X2...Xk}是来自正态总体N(μ,σ2)的 两个样本,样本标准差分别为S1和S2,则:
H1, not =
Type 2 错误
Ho, =
释放
清白 释放
有罪 释放
Ho, =
裁决 H1, not =
监禁 清白 监禁
有罪 监禁
正确 决定 (1- ) Type 1 错误

Decision
H1, not =

正确 决定 (1- )
15
假设检验中的两类错误

1.

第Ⅰ类错误(弃真错误)-- 错误
20
m = 50 H0
样本均值
12
假设检验的过程
提出假设
总体
我认为人口的平 均年龄是50岁
作出决策
拒绝假设 别无选择!


抽取随机样本
均值 x = 20
13
假设检验-有罪 vs.无罪的案例
14
法庭和商业上的决策风险
真相 真相
Ho, =
清白
H1, not =
有罪
Ho, =
35
配对t检验


问题 一家制鞋公司想对比用作儿童鞋鞋底的两种材料A和 B的表现是否有差异。在此案例中10个儿童将穿上特 别制作的鞋进行试验,这双特别制作的鞋一只脚上 的鞋底是由A材料制作的,而另一只脚上的鞋底是由 B材料制作的。A和B材料随机分配至左右鞋底上。 几个月后鞋底的磨损将被测量。 数据特点 请注意这些数据是成对的,对成对的数据进行平均 值的t检验时,利用配对t检验要比独立双样本t检验 准确。
F =

S S
2 1 2 2
~ F ( df 1 , df 2 )
F(df1,df2)表示为F分布,卡方分布有以下特点: 非负非对称分布 F分布有两个自由度分别是分子自由度和分母自由度
40
F分布
F分布的分位值 可查表得到

前面拉不断案例中,新工艺拉力方差=2.31,老工艺方差 2 2 =2.15 S1 2 . 31
统计推断
差异的显著性检验
假设检验
如何鉴别流程能力的优劣
3
统计方法结构
4
统计分析的方法论
5
假设检验

什么是假设检验?

事先对总体参数(比如,均值,比例,方差等)作出判断 然后利用样本信息来判断原来的判定是否正确

假设检验的作用:



降低掌握总体情况的成本 找到影响流程变异或质量性能的关键因数 在试生产阶段预测流程的长期绩效 验证改善是否有效 比较不同对象,比如评审供应商 为赞成或反对某中观点提供作证 。。。。。。。
标准差 2.31 2.15
= 2 . 23
标准误 0.58 0.54
( n1 1 ) s1 ( n 2 1 ) s 2 n1 n 2 2
x1 x 2 S (
2 p
t =
= 9 .4 1 n2 )
1 n1

df = n 1 n 2 2 = 30
查表得到拒绝区域为t>1.72,因此拒绝原假设 而接受备择假设
相关文档
最新文档