六西格玛统计工具介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
你的判定
接受 Ho 正确
拒绝 Ho
I类错误 (α-风险
)
II类错误 (β-风险
)
正确
16
假设检验的两种错误举例
实际清白
事实
实际有罪
陪审团的判决
他无罪
他有罪
正确
I类错误 (α-风险)
II 类错误 (β-风险)
正确
后果: 罪犯逍遥法外
17
后果:
清白的人 进监狱
假设检验
假设检验原理 − 假设检验其实是个比较的过程 − 两种假设的比较,是A还是B? − 我们总是用H0 来说话 − 我们的初衷多数时候是想看区别和差异,所以我们总是想放 弃H0 − 放弃H0 的决策不会总是正确的 ,任何决定都会有风险 − 但风险的高低及严重度,会影响我们决策 − 于是我们很急切的指导,我们做出放弃H0 的决策的风险有多 大? − 于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险 的大小就是我们长见的 P值(P-value)
− 如下图总体平均为μ,连续抽取10个样本,其中有一个样本不
包含总体平均
95%置信区间的解释:
− 大约100个置信区间中有95个会包含总体参数, 或者
− 我们有95%的把握确定总体参数在置信区间内
− 通常我们计算95%的置信区间
样本 1 样本 2
• • • • • • 样本 10
总体的平均 μ
9
− 为了确认小学生男女身高是否有差异 − 为了确认小学生男生比女生高 − 为了确认小学生身高和性别是否有相关性
13
假设检验
假设检验的种类 − 单边检验 One-sided hypothesis
− 双边检验 Two-sided hypothesis
14
假设检验的两种错误 − 第1种 错误 (TypeⅠError, α-风险) • 不顾Null Hypothesis 真实. Null Hypothesis放弃的错误 • 把良品判断为不良的时候(误判) • 既, 可以说生产者危险 • 1-α 就是置信区间
计量型数据 (连续型数据):通常是通过测量仪器测量得到的数 据 − 压力 − 时间 − 长度 − 重量
4
目录
假设检验相关基础概念 − 总体参数及样本统计量 − 推定 − 置信区间
假设检验介绍 − 目的与意义 − 假设检验概念介绍 − 假设检验原理 − 假设检验步骤 − 假设检验常见路径 − 双样本T 与配对T的区别
18
假设检验
假设检验原理(续) − 知道了做出放弃H0 的决策的风险的大小,那么风险小于多少 时我们才敢于做出放弃H0 的决策呢? − 于是我们需要提前设定一个风险判断标准α 而根据我们承受 力的大小及后果的严重度,这个标准各有不同,0.01 、0.05 、0.1 等 − 但我们通常设定α 为0.05 − 这也就是我们通常拿P值和0.05 进行大小比较的原因。 − 如果P>0.05 接受H0; P<0.05 放弃H0 (P Low H0 Go)
六西格玛统计工具介绍
1
精益六西格玛理论体系全景图
定性分析
定量分析
流程描述
客户
VoC分析
头脑风暴+KJ 失效树 鱼骨图 Why-Why分析
PFMEA 对标分析 访谈 现场调研 流程观察
……
流程图 (I/O)
因果矩阵
测量系统 控制
控制计划
实验设计
回归分析
统计过程 控制
过程能力 分析
多变量 分析
基本图表
置信区间
置信区间的计算 − 通用公式: • 置信区间C.I.=统计量±K*S(标准偏差) • 统计量=平均值、方差、Cp等 • K=统计分布常数 − 正态分布的置信区间公式( σ 知道的时候):
X Z
n / 2
− 样本的置信区间公式(σ不知道,只能计算S):
Confidence Level) − 是指区间估计时,能够包含总体参数的能力水平,即1- α 。
信赖水准
25%
25%
50%
z z0.25
0.25
=0.5(50%)
信赖区间 15% 5%
5%
90%
z0.05
z0.05
误差
=0.1(10%)
8
置信区间
90%的置信区间举例如下图
失效模式分析
精益六西格玛意识 统计基础
精益六西格玛推行综合管理
2
软件使用 精益工具 项目管理 精益六西格玛持续改进体系
课程大纲
假设检验概述 相关与回归
3
统计基础-数据类型
计数型数据(离散型数据,属性型数据):通常表示事物的分类 − 不良品数量/不良率 − 缺陷品数量/缺陷率 − 机器 A, 机器 B, 机器 C − 白班/中班/夜班
12
假设检验
假设检验的概念 − 对观测的样本资料分析后对总体差异的估计 − 是作出选择与否判断的统计性方法
假设检验术语 − 假设设定:对要进行判断的情况进行假设设定 • H0 -Null Hypothesis:说明没有变化或者差异的设定
• Ha- Alternative Hypothesis:说明有变化或者差异的设定 假设设定练习:
讨论及问答
5
假设检验相关基础概念
总体参数与样本统计量
总体
C
D C
A
A B D
D C
D
A
B A
A
B
A D
D B CD
C AC B B
抽样(Sampling)
标本
D C
A A
D B
C C
C BD
= 总体平均值
X = 样本平均值
= 总体标准差
参数
6
s = 样本标准差
估计
统计量
估计的概念
− 第2种 错误 ( TypeⅡError, β-风险) : • 不顾Null Hypothesis 假的. Null Hypothesis接受的错误 • 不良品当成良品的时候( 漏失 ) • 即, 可以说顾客危险 • 1-β 是检定力,即检出能力
15
假设检验的两种错误说明
真
Ho 对
实
情
况
Ho 错
S
n / 2,n1
10
置信区间
Minitab中置信区间的计算
11
这些都可 以计算出 置信区间
假设检验
假设检验的目的 − 假设检验是对差异较小的情形进行差异性比较,从而通过数 据作出客观的判断。 − 是为了解决选择的困难性
假设检验的意义 − 用统计的方法,通过数据进行客观的判断 − 把我决策的风险,提高决策水准 − 假设检验是我们政府部门最需要的工具之一。
点估计:通过抽样用一个具体的值估计总体的参数 − 举例:通过抽样调查中秋月饼的保质期是3个月 − 点估计的种类:平均的估计、标准差、方差的估计、比率的 估计等
区间估计:通过抽样用一个具体的值估计总体的参数 − 举例:通过抽样调查中秋的月饼的保质期是1-6个月
7
置信区间
置信区间的概念(Confidence Interval) − 误差是α,相同样本量的样本重复抽样测量样本中存在实际总 体参数的可能性的区间,即100(1- α )%