六西格玛培训课件-500强外企内部培训课程(22)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A y
B
C
x
评估 X、Y关系的工具
描述
假设
离散型 X 离散型Y
H0: 因子相互独 立
相对于目标的连 续型Y
H0: = 目标
2个水平的离散 型X,连续型 Y
H0: 1 = 2
3个以上水平的 离散型X,连续
型Y
H0: 1=…= k
连续型 X; 连续型 Y
H0: 斜率 = 0
检验 X2检验 单样本t检验 双样本t检验 方差分析
假设检验概念
假设检验允许我们…
• 正确处理不确定性 • 最小化主观性 • 质疑假设 • 防止遗漏重要的信息 • 控制判断失误的风险
整体方法
实际问题
统计问题
y f ( x1, x2 ,..., xk )
实际解决方案
统计解决方案
“有一天,统计学的思维方式将像读写能力一样 成为现代公民所必需的能力。”
- 圣地亚哥的一名读者
你会对她说什么?对她的丈夫又会说什么?
分析问题
• 平均怀孕时间是266天。 • 如果她告知怀孕时间是260天,你会怀疑吗? • 如果她告知怀孕时间是400天,你会怀疑吗? • 在哪一点你会开始产生怀疑?请标出
平均值
在圣地亚哥 感到担忧
220 230 240 250 260 270 280
过程分析 • 完成失效模式分析 • 进行多变量分析 • 明确潜在的关键输入 • 制定下一阶段的方案
过程改进 • 验证关键输入 • 优化关键输入
过程控制 • 实施控制方案 • 验证长期能力 • 持续改进过程
统计工具方法框架
• 目的
提供使用统计工具的有组织的方法
– “你越了解一个榔头… 任何事就越像一根钉子”
设想情况3
一个小组想看一下花在电视广告上的费用与消费性办公用品的销量之间是否 有关系
H0: 货运公司A准时送货=货运公司B准时送货 Ha: 货运公司A准时送货≠货运公司B准时送货
H0 = _______________________________________ Ha = _______________________________________
假设检验
统计问题
H0: 组A均值=组B均值 Ha: 组A均值≠组B均值
逻辑 回归
离散型
X 数据
离散型
连续型
多重 逻辑 回归
多重 逻辑 回归
Y数 据
t检验
回归
方差分析
连续型
2, 3, 4 向... 多变量分析
中位数检验
多重 回归
Y 数据
连续型
Y 数据
多个变量 Y
多变量分析
(注:这不同于多变量图)
数据
ABC R 5 10 25 S 80 50 75
Y Target
Y1
Y2
初步认识p值
• 投掷20个硬币并计算掷得正面的次数,得到以下的分布图 :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
假设检验和置信区间的比较
• 置信区间是与假设检验相关的概念
假设检验显示是否有统计差异 置信区间向你提供差异(如有)的估计值
拒绝 H0 第1类失误
风险)
正确
示例:饮用水安全
饮用水安全
实际情况
饮用水受到污染
水质检验结果
饮用水安全
正确
饮用水受到污染
第1类失误 风险)
后果: _____________ _____________ _____________
第2类失误 风险)
正确
后果: ________________________
亲爱的艾比: 你在你的专栏中写到妇女的怀孕期为266天。是谁这
么说的?我怀孕的时间是10个月零5天(共305天),这 是毫无疑问的,因为我知道受孕的确切日子。我的丈夫在 海军供职,我不可能在其他时间受孕,因为我每次见他的 时间只有一天,在孩子出生以前我没有再见过他。
我不酗酒,也不在外面闲荡,这个孩子不可能不是 我丈夫的。请书面声明收回266天怀孕期的说法,否则我 会有大麻烦!
H.G.威尔斯 Circa 1925年
• H0: 零假设 • Ha: 备择假设 • p值: 概率值
假设检验
• 逻辑:
假设没有差异 检查一下,数据是否提供存在差异的证据
假设检验
实际问题
H0: 年龄不是公司聘用员工的因素 Ha: 年龄是公司聘用员工的因素
H0: 产品组合在所有欧洲国家都是一样的 Ha: 产品组合在一些国家是不同的
• 要确定合适的样本大小,必须预先明确:
可接受判断风险的大小 检验敏感性
• 考虑实现一个合理抽样方案所面临的成本、时间和可获资 源等实际限制
假设和判断风险
提出一个“零假设” (H0)
收集证据(现实样本)
判断: 证据说明了什么? 拒绝 H0? 或 接受 H0?
假设检验和饮用水安全
• 假设零假设(H0)为真
假设检验问题
• 将以下情况转变为统计假设 (H0 和 Ha)。您想回答什么问 题?
已做出改变来缩短专利批准过程的周期。这是否影响了专 利申请的数量?
假设检验问题
• 将以下情况转变为统计假设 (H0 和 Ha)。您想回答什么 问题?
我们的客户在账单支付方面显示出很大的差异。新的政 策向15天内支付的客户提供奖励。我们希望这会减少差 异。
绿带 六西格玛 DMAIC 原理
假设检验介绍
目的
• 将假设检验作为一种关键的统计概念来介绍其基本概念 • 了解假设检验如何为分析统计数据提供基本框架 • 将假设检验与即将讨论的主题联系起来
流程
Y = f (x1, x2, x3, x4, . . . xn)
我们从 “Y”开始:
Y在一段时间中的
测量差异
设想情况2
人力资源部想看一下年龄(年长和年轻)与是否受聘之间是否有联系 Y是什么? ______________ 数据类型? _______________ X是什么? ______________ 数据类型? _______________
你将使用哪种类型的工具? _________________________
它们将过程的差异性考虑在内 提供更多有关结论不确定性的信息 在概念上与控制图上的控制限值类似 一般和p值一起成为Minitab的输出的组成部分
将假设检验与DMAIC联系起来
定义 • 范围和界限 • 定义缺陷 • 小组任务书和小组领
导人 • 估计经济影响 • 领导层批准
DMAIC
过程测量 • 绘制过程图,确认输入和输出 • 因果关系矩阵 • 确定测量系统能力 • 确定过程能力基期状况
类似于假设我们的饮用水是安全的
• 如果数据(水质检验)表明有污染的可能,只需将水煮沸 或饮用瓶装水(拒绝H0)
• 除非“无影响”的概率太小,否则我们不会认为我们的实 验有影响
判断失误
在判断是否拒绝时,我们可能出现两种判断失误之一
你的判断
实际情况
H0 为真
H0 为假
接受H0 正确
第2类失误 风险)
绩效 Y的差异
} 重复性 (设备)Fra bibliotek再现性 (员工/方法)
初始能力评估
过程图 因果关系矩阵
流程从许多琐碎的变量X中“ 过滤”出少数重要的几个
实际差异
FMEA
FMEA 减少 “错误输入” 引起的差异及其影响
多变量
x1, x7, x18, x22, x31, x44,多变量分析确认噪声变量,减少
x57
实验设计中的X
很小 – 实际没有信号或差异 – 只有噪声 很大 – 信号或差异比噪声明显 – 这是“真实的” • 如果信号对噪声比率足够大,我们认为结果是真实的
示例 – 信号对噪声
• 我们如何知道是否已将收音机调好?
我们听到清楚的说话声或音乐声(信号),而未注意任何 干扰(噪声)
• 我们如何知道过程是否以目标为中心?
• p值是所有数值统计检验的组成部分
p值较小 信号对噪声比率较大 拒绝H0
p值较大 信号对噪声比率较小 接受H0
假设和判断风险
p值极为重要
记住…. 如果 p 较小,必须拒绝H0!
P必须多小?
视情况而定!
• 我们希望这些观测值随机出现的机率不超过10% ( = .10) • 百分之五更合适 ( = .05) • 百分之一非常好 ( = .01) • 这个 水平是以“无差异”假设和某种参考分布为基础的
回归
设想情况1
一名主管想知道两个数据输入操作员输入其定单信息所花的时间是否有很大差异 Y是什么? ______________ 数据类型? _______________ X是什么? ______________ 数据类型? _______________
你将使用哪种类型的工具 ? ________________________
均值=0
均值=1
均值=2
均值=3
均值=4
均值=5
-5
0
5
10
信号对噪声的图表阐释
均值
噪声较大 均值变化:从0到5 较难探测到小信号
均值=0 均值=1 均值=2 均值=3
均值=4
均值=5
-5
0
5
10
p值
• p值: H0为真时,观测结果可能发生的概率
• 以假设或实际分布(正态、t分布、X2检验、F分布等)为基 础的p值
• 但是,这由兴趣和后果决定
在大多数情况下,我们将使用 = .05
初步认识p值
• 对于一枚“均衡”的硬币,我们预计投掷的结果有50%的 机率为正面
• 投掷20次后,你是否会怀疑硬币的均衡性…
– 有人11次掷到正面? – 有人19次掷到正面?
• 你什么时候会产生怀疑?
在下面划线
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
多变量研究有助于确立Y和关键
X之间的联系
Y = f (x7, x22, x57) I Chart for Chart 1 1
55 3.0SL=54.21
Individual Value
50
45 0
X=50.35
10
20
Observation Number
-3.0SL=46.50 30
实验设计确定关键X及其与Y的关系 对关键X进行适当控制
画出统计思维的总图 提供一个将Minitab与工具相联系的有组织的方法 减少混淆和焦虑
– “回归、方差分析和X2检验!”
• 根据你拥有的数据类型决定使用的工具 连续型 离散型
离散型
单个变量 Y
分析方法框架
单个变量 X
X 数据
X 数据
离散型
连续型
X2检验
逻辑 回归
Y数 据
t检验 方差分析
假设检验:判断
• 收集数据
• 计算检验统计数据
信号对噪声比率的某种形式,如:Z值或t值
• 确定 p值
如果p值很小(如:< 0.05),拒绝H0
• 作出判断
统计显著性 实际显著性
信号对噪声比率
• 信号是我们试图探测的变化或差异 • 噪声是系统内在的差异性 • 考虑比率
信号 • 如果比率
回归
连续型
离散型
多个变量 X
X 数据
离散型
连续型
多重 逻辑 回归
多重 逻辑 回归
2, 3, 4 向... 方差分析
中位数检验
多重 回归
Y 数据
连续型
Y 数据
多个变量 Y
多变量分析
(注:这不同于多变量图)
离散型
单个变量 Y
分析方法框架
传授内容
X 数据 单个变量 X
多个变量 X
X 数据
离散型
连续型
X2检验
290 300
背景
长期以来,医生们已经了解到自然分娩有以下的特点. . .
平均值 = _2_6_6__ 天 标准差 = _1__6__ 天
经验性规则 - 第1周回顾
+ 3 (观测值的99-100%)
+ 2 (观测值的90-98%)
+ 1 (观测值的60-75%)
假设检验的基本原理
• 根据现有的知识提出假设来解释未知的事物 (H0) 这种假设经常和我们希望说明的事物相反
• 假设H0 为真 • 收集数据 • 在数据中寻找令人信服的证据来支持或反驳H0
如果零假设被推翻,我们就拒绝该假设并接受备择假设 (Ha)
假设和判断风险
• 我们用已知的风险程度和置信程度来检验一个假设
H0: 线的斜率是 0 Ha: 线的斜率不是0
H0: 组A方差=组B方差 Ha: 组A方差≠组B方差
H0: 变量X独立于变量Y Ha: 变量X不独立于变量Y
假设检验问题
• 将以下情况转变为统计假设 (H0 和 Ha)。您想回答什么问题?
一种新产品使用AAA没有用过的原材料。有5个可能的供应商。 准时交货是关键的质量特性之一。目标是99%按时交货。
信号:过程平均值和目标间的差值 噪声:以过程差异为依据
信号对噪声
信号 噪声
较大的信号较容易探测到 较小的信号较难探测到 较小的噪声使得探测信号较为容易 较大的噪声使得探测信号较为困难
信号对噪声的图表阐释
噪声较小 均值变化:从0到5 容易探测到信号(组间差异)
均值