统计学t检验简介(三)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
它
对1个层次的X进行比较
对 3 个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
研究稳定性 (若适用)
研究形状
研究离散
研究集中
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-8
注意样本量问题
数据是正态的吗?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-26
正态检验
Minitab命令
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-4
单一X
分析路线图:我们将讲授的是什么
X数据
多个X
离散
X数据
连续
X 数据 e离散
连续
离散
卡方检验
Y 数据
t-检验 / ANOVA 均值
中位数检验
GB208-17
对1个层次X进行比较
研究稳定性( 若适用)
研究形状
研究离
研究集中
散
OR
路线图中的分析步骤——1个样本
打开Minitab项目文件 t-Test.mpj 和工作表
1 Sample t.mtw
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-22
对1个层次X进行比较
路线图中的分析步骤——1个样本
Minitab
寻找或寻问什么
研究稳定性 (若适用)
研究形状
SPC 表 I-MR
描述统计图和标 准检验
是否有任何明显的倾向或模式表明该 数据并非只来自一个总体/序列?
数据是正态的吗? 小P值(<0.5)表示数据是非正态的。
注意样本量问题
回归
连续
多元 ANOVA
中位数检验
多元回归
离散Βιβλιοθήκη 单一 YY 数据连续
Y 数据
多个Y
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-5
数据
主管希望知道两个操作员在喷漆过程中其喷射的油漆是否明显不一样
GB208-3
分析 根源分析 多级Pareto排列图 5 Why 图 辨认浪费 多变量研究 ANOVA 相关性与回归
分析 根源分析 多级Pareto排列图 5 Why 图 辨认浪费 多变量研究 ANOVA 相关性与回归
控制 错误防范及实施SPC
更新控制计划 更新所有文件 交还给流程拥有者
统计检验
在假设检验部分,我们讨论了组间的比较 我们想到看看是否有显著的统计证据来拒绝零假设 因此我们采集数据,但我们如何检验数据呢? 根据我们比较的要素和数据类型,有多种不同的检验方法 这里我们着眼于输出变量为连续数据,输入变量为离散数据 的检验
记住目标均值 = 25
为了了解Bob的结果样本均值是否与目标值有明显的差别,我们需要一 些额外的信息:
值 (历史日常记录厚度数据的标准差为0.25)
可接受的a风险 即当它不同时,得出Bob的样本均值真的与不同这一结 论的机率)。 该风险还称为显著水平,它相当于1置信水平。让我们使用 a = 0.05
替代假设(Ha) :Bob的厚度均值高 于目标值
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-12
需要什么样的样本量N用于区别两个假设?
根据已知信息,我们有: 显著水平, a = 0.05 指数 Power = 1-b = 1 - 0.20 = 0.80 可侦测的均值自由度 d,
Rev. A Printed 2019/7/5 © 2003 by Sigma Breakthrough Technologies, Inc.
t检验与均值比较
GB208-1
目标
介绍t检验并演示其在比较样本均值中的作用 介绍几种不同检验方法的均值/中位数检验的基本 概念
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-20
Minitab命令:I-MR图
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-21
I-MR 图
是否有任何明显的倾向或模式表明该 数据并非只来自一个总体/序列?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-7
对1个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
或
路线图中的分析步骤
t-检验 / ANOVA 均值 / 中位数检验
我们将在 ANOVA中覆盖
可接受的b 风险 (即当它真的相同时,得出不存在差别的机率). 检验的权 重为1- b 。让我们使用b = 0.20
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-11
假设
零假设(H0) :Bob的厚度均值低于 或等于目标值
GB208-19
对1个层次X进行比较
研究稳定性( 若适用)
路线图中的分析步骤——1个样本
Minitab
寻找或寻问什么
SPC表 I-MR
是否有任何明显的倾向或模式表明该 数据并非来自一个总体/序列?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-23
3种检查它的方法
1) 直方图 数据分布是钟形的吗?
2) 正态图 数据图是直线吗?
3) 正态检验的值 p值 >.05 吗?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-16
利用Minitab
4. 选择替代假设
5. 输入显著 水平, a
指数Power和样本量
1-样本 t 检验 检验均值= null (versus > null) 计算mean均值的权重 = null + difference Alpha = 0.05 假设的标准差 = 0.25
差 样本量 Power目标指数 Power实际指数
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-9
样本量
但要先等等!!
在我们比较事物之前,我们是否应该指出我们需要多少个用 于确定是否真正存在差别的数据点?
回忆一下我们对假设检验的讨论
我们需要根据一些因子来确定判别统计差所需的测量 数。
GB208-18
路线图中的分析步骤——1个样本
1 Sample t.mtw
Bob
25.2969 26.0578 24.0700 24.8199 25.9851 25.3572
...
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-14
Minitab样本量计算
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-15
2. 输入增量, d
1. 输入权重, 1b
3. 输入sigma,
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
0.1
41
0.8
0.808582
Minitab输出
Minitab告诉我们,我们需要从Bob处测量的值的样本量为41(所需 Power 指数为0.80),以确保我们能够确定Bob的总体均值不会比目标 值大0.1以上。 (注意: N = 41 实际给出的权重为 0.8086)
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
样本 #
1 2 3 4 5
Bob
23.2 22.2 24.3 22.1 25.9
Jane
24.2 23.2 24.8 22.7 25.3
你怎样做判别?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-6
d = 25.1 - 25.0 = 0.1 测量厚度的标准差,
= 0.25
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-13
所需的样本量
计算样本量
假设测量厚度值是正态分布的, 和 N这5个变量间的关系可用下式表示:
N
2(Za / 2
d2
Zb
)2
2
注意,若我们知道5个变量中任何4个,我们就能够计算出第 5个变量。
利用Minitab,我们就要说明怎样计算样本量和统计权重:
样本量 = N
统计指数Power = 1-b
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
对1个层次的X进行比较
路线图中的分析步骤
T检验 / ANOVA 均值 / 中位数检验
对2个层次的X进行比较
对>=3个层次X进行比较
1 个层次的样本实例 有20个Bob喷漆样本
2 个层次的样本实例 有20个Bob & Jane喷漆样本
3个层次的样本实例 有20个Bob , Jane, 和Walt喷漆样本
x 样本均值 s 样本标准差 d Delta (我们感兴趣的漂移或自由度) a 风险水平
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-10
样本量计算
1个样本t检验
回到Bob
我们想要看看Bob的油漆厚度是目标值,因为我们怀疑它们超出了目标 值。
GB208-2
DMAIC流程
定义 识别差异 建立范围及边界 指派黑带及项目团队 建立项目定义表
测量 0级及价值流图 确定基线实施能力 起始 流程能力研究
流程能力 起始控制计划
详细流程图 测量系统分析(MSA) 因果矩阵 C & E Matrix
失效模式分析 FMEA
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-24
正态性
描述统计量
Minitab命令
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-25
Minitab输出
数据分布是钟形的吗?
数据是正态的吗? 数据产生小p值(<0.5)表示是非正态的
路线图中的分析步骤
t-检验 / ANOVA 均值 / 中位数检验
对1个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
或
注意: 只有1组(X有一个层次),我们讨论的是将我们的
样本与某个目标值进行比较 (例: = 25 或可能 = 2 )
1个层次的例子 有20个Bob喷漆样本 他喷射的是特定层次的漆量吗?(假设值为密 耳厚度)?
对1个层次的X进行比较
对 3 个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
研究稳定性 (若适用)
研究形状
研究离散
研究集中
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-8
注意样本量问题
数据是正态的吗?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-26
正态检验
Minitab命令
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-4
单一X
分析路线图:我们将讲授的是什么
X数据
多个X
离散
X数据
连续
X 数据 e离散
连续
离散
卡方检验
Y 数据
t-检验 / ANOVA 均值
中位数检验
GB208-17
对1个层次X进行比较
研究稳定性( 若适用)
研究形状
研究离
研究集中
散
OR
路线图中的分析步骤——1个样本
打开Minitab项目文件 t-Test.mpj 和工作表
1 Sample t.mtw
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-22
对1个层次X进行比较
路线图中的分析步骤——1个样本
Minitab
寻找或寻问什么
研究稳定性 (若适用)
研究形状
SPC 表 I-MR
描述统计图和标 准检验
是否有任何明显的倾向或模式表明该 数据并非只来自一个总体/序列?
数据是正态的吗? 小P值(<0.5)表示数据是非正态的。
注意样本量问题
回归
连续
多元 ANOVA
中位数检验
多元回归
离散Βιβλιοθήκη 单一 YY 数据连续
Y 数据
多个Y
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-5
数据
主管希望知道两个操作员在喷漆过程中其喷射的油漆是否明显不一样
GB208-3
分析 根源分析 多级Pareto排列图 5 Why 图 辨认浪费 多变量研究 ANOVA 相关性与回归
分析 根源分析 多级Pareto排列图 5 Why 图 辨认浪费 多变量研究 ANOVA 相关性与回归
控制 错误防范及实施SPC
更新控制计划 更新所有文件 交还给流程拥有者
统计检验
在假设检验部分,我们讨论了组间的比较 我们想到看看是否有显著的统计证据来拒绝零假设 因此我们采集数据,但我们如何检验数据呢? 根据我们比较的要素和数据类型,有多种不同的检验方法 这里我们着眼于输出变量为连续数据,输入变量为离散数据 的检验
记住目标均值 = 25
为了了解Bob的结果样本均值是否与目标值有明显的差别,我们需要一 些额外的信息:
值 (历史日常记录厚度数据的标准差为0.25)
可接受的a风险 即当它不同时,得出Bob的样本均值真的与不同这一结 论的机率)。 该风险还称为显著水平,它相当于1置信水平。让我们使用 a = 0.05
替代假设(Ha) :Bob的厚度均值高 于目标值
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-12
需要什么样的样本量N用于区别两个假设?
根据已知信息,我们有: 显著水平, a = 0.05 指数 Power = 1-b = 1 - 0.20 = 0.80 可侦测的均值自由度 d,
Rev. A Printed 2019/7/5 © 2003 by Sigma Breakthrough Technologies, Inc.
t检验与均值比较
GB208-1
目标
介绍t检验并演示其在比较样本均值中的作用 介绍几种不同检验方法的均值/中位数检验的基本 概念
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-20
Minitab命令:I-MR图
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-21
I-MR 图
是否有任何明显的倾向或模式表明该 数据并非只来自一个总体/序列?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-7
对1个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
或
路线图中的分析步骤
t-检验 / ANOVA 均值 / 中位数检验
我们将在 ANOVA中覆盖
可接受的b 风险 (即当它真的相同时,得出不存在差别的机率). 检验的权 重为1- b 。让我们使用b = 0.20
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-11
假设
零假设(H0) :Bob的厚度均值低于 或等于目标值
GB208-19
对1个层次X进行比较
研究稳定性( 若适用)
路线图中的分析步骤——1个样本
Minitab
寻找或寻问什么
SPC表 I-MR
是否有任何明显的倾向或模式表明该 数据并非来自一个总体/序列?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-23
3种检查它的方法
1) 直方图 数据分布是钟形的吗?
2) 正态图 数据图是直线吗?
3) 正态检验的值 p值 >.05 吗?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-16
利用Minitab
4. 选择替代假设
5. 输入显著 水平, a
指数Power和样本量
1-样本 t 检验 检验均值= null (versus > null) 计算mean均值的权重 = null + difference Alpha = 0.05 假设的标准差 = 0.25
差 样本量 Power目标指数 Power实际指数
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-9
样本量
但要先等等!!
在我们比较事物之前,我们是否应该指出我们需要多少个用 于确定是否真正存在差别的数据点?
回忆一下我们对假设检验的讨论
我们需要根据一些因子来确定判别统计差所需的测量 数。
GB208-18
路线图中的分析步骤——1个样本
1 Sample t.mtw
Bob
25.2969 26.0578 24.0700 24.8199 25.9851 25.3572
...
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-14
Minitab样本量计算
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-15
2. 输入增量, d
1. 输入权重, 1b
3. 输入sigma,
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
0.1
41
0.8
0.808582
Minitab输出
Minitab告诉我们,我们需要从Bob处测量的值的样本量为41(所需 Power 指数为0.80),以确保我们能够确定Bob的总体均值不会比目标 值大0.1以上。 (注意: N = 41 实际给出的权重为 0.8086)
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
样本 #
1 2 3 4 5
Bob
23.2 22.2 24.3 22.1 25.9
Jane
24.2 23.2 24.8 22.7 25.3
你怎样做判别?
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-6
d = 25.1 - 25.0 = 0.1 测量厚度的标准差,
= 0.25
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-13
所需的样本量
计算样本量
假设测量厚度值是正态分布的, 和 N这5个变量间的关系可用下式表示:
N
2(Za / 2
d2
Zb
)2
2
注意,若我们知道5个变量中任何4个,我们就能够计算出第 5个变量。
利用Minitab,我们就要说明怎样计算样本量和统计权重:
样本量 = N
统计指数Power = 1-b
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
对1个层次的X进行比较
路线图中的分析步骤
T检验 / ANOVA 均值 / 中位数检验
对2个层次的X进行比较
对>=3个层次X进行比较
1 个层次的样本实例 有20个Bob喷漆样本
2 个层次的样本实例 有20个Bob & Jane喷漆样本
3个层次的样本实例 有20个Bob , Jane, 和Walt喷漆样本
x 样本均值 s 样本标准差 d Delta (我们感兴趣的漂移或自由度) a 风险水平
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-10
样本量计算
1个样本t检验
回到Bob
我们想要看看Bob的油漆厚度是目标值,因为我们怀疑它们超出了目标 值。
GB208-2
DMAIC流程
定义 识别差异 建立范围及边界 指派黑带及项目团队 建立项目定义表
测量 0级及价值流图 确定基线实施能力 起始 流程能力研究
流程能力 起始控制计划
详细流程图 测量系统分析(MSA) 因果矩阵 C & E Matrix
失效模式分析 FMEA
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-24
正态性
描述统计量
Minitab命令
Rev. A Printed 7/5/2019 © 2003 by Sigma Breakthrough Technologies, Inc.
GB208-25
Minitab输出
数据分布是钟形的吗?
数据是正态的吗? 数据产生小p值(<0.5)表示是非正态的
路线图中的分析步骤
t-检验 / ANOVA 均值 / 中位数检验
对1个层次的X进行比较
研究稳定性 (若适用)
研究形状
研究离散
研究集中
或
注意: 只有1组(X有一个层次),我们讨论的是将我们的
样本与某个目标值进行比较 (例: = 25 或可能 = 2 )
1个层次的例子 有20个Bob喷漆样本 他喷射的是特定层次的漆量吗?(假设值为密 耳厚度)?