精益六西格玛 测量阶段概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12
Measure
7
总体和样本
参数的获取途径有两种:通过调查总体获得和通过抽查样品获得。
总体 (N)
具有某种特征的全体 对象或个体的集合。 包括对所有可能的对 象或个体的具体参数 或特征的测量。 总体可能指刚刚出厂 的所有盒装牛奶。
样本 (n)
总体的一个子集。在统计 学中,我们会遇到“随机 抽样”,或一组特选的样 本数据,每一次样本被选 中的几率都相同。
子组内流程的波动仅受普 遍原因的影响,它反映了 流程最好的能力即短期能 力。 子组间流程的波动受外来 因素(特殊原因)的影响, 它反映了流程的控制状态 即长期能力。
长期波动
(特殊原因) (Assignable Cause) Between Subgroups 合理子组间
50 40 30 20 10 0 -10 200 400 600 800 1000
显而易见的并可归结为某个指定的 的原因或流程输入的因素。
利用现行的技术可以对此类原因进 行控制。
随着时间的推移,此类因素的作用 会表现在流程输出的波动上。 通常我们把特殊原因归类为5M1E
人员(Manpower) 机器(Machinery) 方法(Method) 测量(Measurement) 物料(Materials) 环境(Environment)
地区
离散型数据不能再被细分
11
连续型数据和离散型数据的比较
在项目中,首先应考虑获取连续型数据,因为连续型数据提供的信息更多, 而需求的数据量更少。 当不能得到连续型数据的时候,就可以利用离散型数据进行分析,但需求 The Advantage of Continuous 的数据量更大。
Data
方差
x
i 1 i
n
n 1
方差可以有效反映偏离平均值的程度
24
自由度(Degree of freedom)
对于给定的样本量, 可以采用一个称为自 由度的术语(df)来计算不同的推论性参数。 自由度与样本量有关,等于样本量减1(n
-1)。
采用样本量是为了提供一个更保守的 (无偏的)参数估计。
22
离散程度的衡量
极差 (Range)
最简单的离散的测量。波动范围仅仅是测量的最大值和最小值的差
Range=Max Min
偏差 (Deviation) 偏差是测量值和从绘制的分布图获得的平均值的差距。 或
x x
i
x xi
方差 (Variance) 对于总体:方差等于偏差的平方和除以总体中个体总数N 对于样本:方差等于偏差的平方和除以样本量减一 (n-1)
测量阶段概述
Define 定义
Measure 测量
Analyze 分析
Improve 改进
Control 控制
测量系统分析
流程能力分析
确定问题所在
冠卓 • 精益六西格玛
1
测量阶段工作的目的
在定义阶段,我们确定了项目所要解决的问题,了解了问题的历 史状况,并且得到了管理层对项目的批准,接着项目来到了测量 阶段。 在测量阶段,我们工作的目的是:
To Obtain the Same Level of Understanding
cr D is
e te
$
Sparse Information
Continuous
$
Rich With Information
1_03_01_005
Scales of Measure
离散型数据需要更多的数据点才能进行有效的分析
为了能够正确对流程能力进行研究和找出问题所在,需要收集数 据
在正式收集数据之前明确数据收集的目的、制定数据收集的计划 将会使得数据收集更加有效,周期更短。
数据收集计划从以下几方面去考虑:
为什么要收集数据(Why)
需要收集哪些数据(What) 谁去收集数据(Who) 在哪里收集数据(Where) 什么时候去收集数据(When) 怎么样去收集数据(How)
7
数据属性与基本统计学
冠卓 • 精益六西格玛
8
数据的属性
数据来源于对象、情景和现象。 数据被用来分类、描述、改善和控制对象、情景和现象。 有些数据可以用连续的刻度来加以区别;换言之,这种刻度 可以被合理的细分到更准确的增量,因此这种数据被称为连 续型数据。 但我们也可以用记数的方式来获取数据。这种数据不能被合 理的细分,因此被称为离散型数据 。
短期波动
(普遍原因) (Common Cause) Within Subgroups 合理子组内 Each “Box” subgroup of 每一个小盒子 data 代表了一个子 组
我们需要制定数据收集计划来即能反映流程的短期变异又能捕捉到流 程的长期变异,这样的技术就叫做合理子组技术(Rational Subgroup)
15
10
5
0 46 47 48 49 50 51 52 53 54
distributions
17
描述数据分布的参数
通常以以下三方面来描述一个分布:
形状 反映分布曲线的形状。分布是就平均值对称的还是偏斜的,是呈尖 峰状的还是平缓的? 位置或者中心趋势 反映了分布的中心或者分布数据的中点。 离散程度 反映了分布数据的变化范围。
项目 批准 制定数据 收集计划 分析测 量系统 收集数据 分析流 程能力 制定改 善目标 数据分层 确定问 题所在 阶段评审
测量阶段用到的主要的工具: 测量系统分析
量具的偏移 测量系统R&R分析 一致性分析
流程能力分析
合理子组技术与数据收集 连续型数据流程能力分析 离散型数据流程能力分析
数据分层
例如: 今天出售的鞋尺码:
36, 42, 40, 41,43, 39, 40, 41, 40, 37, 38
观察每种尺码出现的数值,可以发现40是模数。
20
集中趋势的衡量
平均值或者均值 (Average or Mean) 一组数据的平均值仅仅是所有数据的几何平均
X
x
i 1
n
i
n
这里 X 代表观察到的变量,xi代表一组数据中的第i个 数据,S代表求和, X 代表所有数据的平均.
2
(x i ) i 1
N
2
N
s
2
(x i x ) i 1
n
2
n 1
23
离散程度的衡量
方差 (Variance) 对于总体:方差等于偏差的平方和 除以总体中个体总数N 2 对于样本:方差等于偏差的平方和 除以样本量 (n-1) 标准差 (Standard deviation) 标准差是方差的开方
每个方面都有相应的参数指标来衡量
18
分布的形状
有两个指标来衡量分布的形状:
偏斜度(SKEWNESS)
用来衡量数据的对称性。 当一组数据的 平均值大于其中位数时,此组数据就向右 倾斜。 正态分布偏斜度为0(K=0)
平均值大于其中位数右偏,K>0,正偏度
平均值小于其中位数左偏,K<0.负偏度 偏斜度指标的值越小,数据就越对称。
5
项目改善的焦点(问题所在)
我们利用一种叫做分层 (Stratification)的技术 来找出问题所在
40
问题所在
Pareto Chart for Defect
100 80 30
Count
60 20 40 10 20 0
狠
ぃ ire gd on Wr n ctio l ma rn i g te r on W al min ter ak bre er s Oth
制定收集计划 数据分层 柏拉图
精益生产指标
OEE 3
我们的数据可靠吗?
错误的数据将把我们引向错误的方 向
同一个产品,不同的测量人员测量可能会 有不同的结果? 产品品质的判定,是否会出现人员A判断不
合格,而人员B判断合格的情况?
测量系统分析(MSA)可以回答我们数据有多可靠
4
流程能力
合理子组(Rational Subgroup)技术可以帮忙收 集数据和进行流程能力分析
我们会经常使用自由度这个概念,因为大多数的统计工作 可以利用样本来分析 。
25
自由度 (Degree of freedom)
数学意思 : 样本数当中减去线性制约条件的值 例) Σxi ☞ 自由度 : n Σ(xi-x)2 ☞ 自由度 : n-1 附加说明 : 假设在某一集团当中选出2个data时,第一个data可 以任意抽出,但是第二个data选择不能在同样的data范围当中选 择。 下面拼图当中必须是 少一个才能移动。
26
离散程度的衡量
数据跨度 测量样本或者样本总体的数据跨度,常用于象均匀分布这样 不支持其他更精确的离散测量的分布类型 。
四分位数 对于从最小到最大排列的数据系列,四分位数可以帮助细分 离散单元。25%的数据点包含在第一个四分位数前,75%的数 据分布在第三个四分位数前。
对于我们的项目,这关 键的20%问题在哪里?
0
Defect
Count Percent Cum %
27 64.3 64.3
5 11.9 76.2
5 11.9 88.1
3 7.1 95.2
2 4.8 100.0
确定问题所在是测量阶段的工作关键
6
Percent
80%的缺陷会由20%的问 题产生
数据收集计划
9
数据的类型
• 连续型数据
• 变量数据 • 测量数据 连续数据以参数的形式,比如尺寸、重量或时间 来说明一个产品或流程的特性。测量刻度可以合 理的不断被细分使精确度提高
连续型数据可以根据精确度的要求进一步被细分
10
数据的类型
• 离散型数据
• 属性数据 • 计数数据
离散型数据是以发生的频数(Frequency)来表示 某件事发生或未发生的次数. 离散型数据也可以是分类数据.如:地区、班次、 物料种类、生产线。
峰度(KURTOSIS)
用来衡量分布曲线峰尖或着低平的状况。 正值的指标表示此分布比标准正态分布有 着更尖的峰和更陡的尾巴。 负值的指标表示此分布比标准正态分布有 着更低平的峰和更平缓的尾巴。
19
集中趋势的衡量
模数 (Mode) 模数,又叫众数,是一组数中出现频率最高的数值, 统计学中不常用。
如果我们要从工厂中随即 抽取10盒牛奶,那么我们 需要确保这10盒是从工厂 生产的所有同规格的盒装 牛奶中随意选取的。
我们通过分析样本来推测总体的参数
13
好样本的特质
1. 样本必须具有代表性。 在一个有代表性的样本里,收集的数据应该精确地反应 一个总体或过程。有代表性的抽样有助于避免偏颇于调 查中的总体或过程的某一特定区域。 2. 样本必须是随机的。 在一个随机的样本里,数据的收集无序进行,每一个 元素都有相等的机会被选来测量。随机抽样有助于避 免偏颇于收集数据的特定时间和顺序,操作员,或数 据收集员。
21
集中趋势的衡量
中位数 (Median)
中位数是一组数据中居中的那个数据。如果数据个数为奇数个, 则中位数是数据的中间那个;如果是偶数个,中位数就是中间 两个数据的平均。
例如: 对于数据列 15,17,18,19,22,25,26, 中位数是 “19”。 对于数据列 6,7,8,9,12,17, 中位数是 8.5 来自百度文库8和9的平 均)。
引起波动的原因
普遍原因
流程固有的未知因素。就目前 流程所用的技术而言,此类因 素是不可控制的。 此类因素也叫残差或背景噪音。 它限定了流程可达到的最小的 偏差,所以从偏差的角度来看, 普遍原因所造成的偏差代表了 流程的最好水平。 要想控制或改善普遍原因造成 的偏差需要对系统或流程采取 行动。
特殊原因
16
数据的分布
数据分布是一个概率分布。它是流程波动的数学模型。 下面的柱状图可以直观反映实际观察的分布概率,称为频率分布。
Histogram of distributions, with Normal Curve
分布曲线和直方图 (process = QCNArro)
25
20
Frequency
确定项目的问题所在(改善的焦点)
为了达到以上的目的,我们将要回答以下的问题:
我们的数据可靠吗? 流程现状能力如何(长期能力)? 流程的潜在最好能力能满足要求吗(短期能力)? 是管理问题还是技术问题? 改善的目标如何? 是哪些问题引起了大部分缺陷的产生(项目的焦点)?
2
测量阶段的工作流程
在测量阶段,我们将按照以下流程开展工作
14
波动
所有流程都存在波动,没有任何两件产品其质量特征是 完全一样的 我们预期观察值会有差异,如果没有差异,我们就会产 生怀疑。 通常我们不会仅仅依靠一个数据就做出结论,而是收集 多个数据并且非常注意如何收集这些样本,以减少偏差。
波动的产生是很自然的,是意料之中的。波动是统计学的基础
15
Measure
7
总体和样本
参数的获取途径有两种:通过调查总体获得和通过抽查样品获得。
总体 (N)
具有某种特征的全体 对象或个体的集合。 包括对所有可能的对 象或个体的具体参数 或特征的测量。 总体可能指刚刚出厂 的所有盒装牛奶。
样本 (n)
总体的一个子集。在统计 学中,我们会遇到“随机 抽样”,或一组特选的样 本数据,每一次样本被选 中的几率都相同。
子组内流程的波动仅受普 遍原因的影响,它反映了 流程最好的能力即短期能 力。 子组间流程的波动受外来 因素(特殊原因)的影响, 它反映了流程的控制状态 即长期能力。
长期波动
(特殊原因) (Assignable Cause) Between Subgroups 合理子组间
50 40 30 20 10 0 -10 200 400 600 800 1000
显而易见的并可归结为某个指定的 的原因或流程输入的因素。
利用现行的技术可以对此类原因进 行控制。
随着时间的推移,此类因素的作用 会表现在流程输出的波动上。 通常我们把特殊原因归类为5M1E
人员(Manpower) 机器(Machinery) 方法(Method) 测量(Measurement) 物料(Materials) 环境(Environment)
地区
离散型数据不能再被细分
11
连续型数据和离散型数据的比较
在项目中,首先应考虑获取连续型数据,因为连续型数据提供的信息更多, 而需求的数据量更少。 当不能得到连续型数据的时候,就可以利用离散型数据进行分析,但需求 The Advantage of Continuous 的数据量更大。
Data
方差
x
i 1 i
n
n 1
方差可以有效反映偏离平均值的程度
24
自由度(Degree of freedom)
对于给定的样本量, 可以采用一个称为自 由度的术语(df)来计算不同的推论性参数。 自由度与样本量有关,等于样本量减1(n
-1)。
采用样本量是为了提供一个更保守的 (无偏的)参数估计。
22
离散程度的衡量
极差 (Range)
最简单的离散的测量。波动范围仅仅是测量的最大值和最小值的差
Range=Max Min
偏差 (Deviation) 偏差是测量值和从绘制的分布图获得的平均值的差距。 或
x x
i
x xi
方差 (Variance) 对于总体:方差等于偏差的平方和除以总体中个体总数N 对于样本:方差等于偏差的平方和除以样本量减一 (n-1)
测量阶段概述
Define 定义
Measure 测量
Analyze 分析
Improve 改进
Control 控制
测量系统分析
流程能力分析
确定问题所在
冠卓 • 精益六西格玛
1
测量阶段工作的目的
在定义阶段,我们确定了项目所要解决的问题,了解了问题的历 史状况,并且得到了管理层对项目的批准,接着项目来到了测量 阶段。 在测量阶段,我们工作的目的是:
To Obtain the Same Level of Understanding
cr D is
e te
$
Sparse Information
Continuous
$
Rich With Information
1_03_01_005
Scales of Measure
离散型数据需要更多的数据点才能进行有效的分析
为了能够正确对流程能力进行研究和找出问题所在,需要收集数 据
在正式收集数据之前明确数据收集的目的、制定数据收集的计划 将会使得数据收集更加有效,周期更短。
数据收集计划从以下几方面去考虑:
为什么要收集数据(Why)
需要收集哪些数据(What) 谁去收集数据(Who) 在哪里收集数据(Where) 什么时候去收集数据(When) 怎么样去收集数据(How)
7
数据属性与基本统计学
冠卓 • 精益六西格玛
8
数据的属性
数据来源于对象、情景和现象。 数据被用来分类、描述、改善和控制对象、情景和现象。 有些数据可以用连续的刻度来加以区别;换言之,这种刻度 可以被合理的细分到更准确的增量,因此这种数据被称为连 续型数据。 但我们也可以用记数的方式来获取数据。这种数据不能被合 理的细分,因此被称为离散型数据 。
短期波动
(普遍原因) (Common Cause) Within Subgroups 合理子组内 Each “Box” subgroup of 每一个小盒子 data 代表了一个子 组
我们需要制定数据收集计划来即能反映流程的短期变异又能捕捉到流 程的长期变异,这样的技术就叫做合理子组技术(Rational Subgroup)
15
10
5
0 46 47 48 49 50 51 52 53 54
distributions
17
描述数据分布的参数
通常以以下三方面来描述一个分布:
形状 反映分布曲线的形状。分布是就平均值对称的还是偏斜的,是呈尖 峰状的还是平缓的? 位置或者中心趋势 反映了分布的中心或者分布数据的中点。 离散程度 反映了分布数据的变化范围。
项目 批准 制定数据 收集计划 分析测 量系统 收集数据 分析流 程能力 制定改 善目标 数据分层 确定问 题所在 阶段评审
测量阶段用到的主要的工具: 测量系统分析
量具的偏移 测量系统R&R分析 一致性分析
流程能力分析
合理子组技术与数据收集 连续型数据流程能力分析 离散型数据流程能力分析
数据分层
例如: 今天出售的鞋尺码:
36, 42, 40, 41,43, 39, 40, 41, 40, 37, 38
观察每种尺码出现的数值,可以发现40是模数。
20
集中趋势的衡量
平均值或者均值 (Average or Mean) 一组数据的平均值仅仅是所有数据的几何平均
X
x
i 1
n
i
n
这里 X 代表观察到的变量,xi代表一组数据中的第i个 数据,S代表求和, X 代表所有数据的平均.
2
(x i ) i 1
N
2
N
s
2
(x i x ) i 1
n
2
n 1
23
离散程度的衡量
方差 (Variance) 对于总体:方差等于偏差的平方和 除以总体中个体总数N 2 对于样本:方差等于偏差的平方和 除以样本量 (n-1) 标准差 (Standard deviation) 标准差是方差的开方
每个方面都有相应的参数指标来衡量
18
分布的形状
有两个指标来衡量分布的形状:
偏斜度(SKEWNESS)
用来衡量数据的对称性。 当一组数据的 平均值大于其中位数时,此组数据就向右 倾斜。 正态分布偏斜度为0(K=0)
平均值大于其中位数右偏,K>0,正偏度
平均值小于其中位数左偏,K<0.负偏度 偏斜度指标的值越小,数据就越对称。
5
项目改善的焦点(问题所在)
我们利用一种叫做分层 (Stratification)的技术 来找出问题所在
40
问题所在
Pareto Chart for Defect
100 80 30
Count
60 20 40 10 20 0
狠
ぃ ire gd on Wr n ctio l ma rn i g te r on W al min ter ak bre er s Oth
制定收集计划 数据分层 柏拉图
精益生产指标
OEE 3
我们的数据可靠吗?
错误的数据将把我们引向错误的方 向
同一个产品,不同的测量人员测量可能会 有不同的结果? 产品品质的判定,是否会出现人员A判断不
合格,而人员B判断合格的情况?
测量系统分析(MSA)可以回答我们数据有多可靠
4
流程能力
合理子组(Rational Subgroup)技术可以帮忙收 集数据和进行流程能力分析
我们会经常使用自由度这个概念,因为大多数的统计工作 可以利用样本来分析 。
25
自由度 (Degree of freedom)
数学意思 : 样本数当中减去线性制约条件的值 例) Σxi ☞ 自由度 : n Σ(xi-x)2 ☞ 自由度 : n-1 附加说明 : 假设在某一集团当中选出2个data时,第一个data可 以任意抽出,但是第二个data选择不能在同样的data范围当中选 择。 下面拼图当中必须是 少一个才能移动。
26
离散程度的衡量
数据跨度 测量样本或者样本总体的数据跨度,常用于象均匀分布这样 不支持其他更精确的离散测量的分布类型 。
四分位数 对于从最小到最大排列的数据系列,四分位数可以帮助细分 离散单元。25%的数据点包含在第一个四分位数前,75%的数 据分布在第三个四分位数前。
对于我们的项目,这关 键的20%问题在哪里?
0
Defect
Count Percent Cum %
27 64.3 64.3
5 11.9 76.2
5 11.9 88.1
3 7.1 95.2
2 4.8 100.0
确定问题所在是测量阶段的工作关键
6
Percent
80%的缺陷会由20%的问 题产生
数据收集计划
9
数据的类型
• 连续型数据
• 变量数据 • 测量数据 连续数据以参数的形式,比如尺寸、重量或时间 来说明一个产品或流程的特性。测量刻度可以合 理的不断被细分使精确度提高
连续型数据可以根据精确度的要求进一步被细分
10
数据的类型
• 离散型数据
• 属性数据 • 计数数据
离散型数据是以发生的频数(Frequency)来表示 某件事发生或未发生的次数. 离散型数据也可以是分类数据.如:地区、班次、 物料种类、生产线。
峰度(KURTOSIS)
用来衡量分布曲线峰尖或着低平的状况。 正值的指标表示此分布比标准正态分布有 着更尖的峰和更陡的尾巴。 负值的指标表示此分布比标准正态分布有 着更低平的峰和更平缓的尾巴。
19
集中趋势的衡量
模数 (Mode) 模数,又叫众数,是一组数中出现频率最高的数值, 统计学中不常用。
如果我们要从工厂中随即 抽取10盒牛奶,那么我们 需要确保这10盒是从工厂 生产的所有同规格的盒装 牛奶中随意选取的。
我们通过分析样本来推测总体的参数
13
好样本的特质
1. 样本必须具有代表性。 在一个有代表性的样本里,收集的数据应该精确地反应 一个总体或过程。有代表性的抽样有助于避免偏颇于调 查中的总体或过程的某一特定区域。 2. 样本必须是随机的。 在一个随机的样本里,数据的收集无序进行,每一个 元素都有相等的机会被选来测量。随机抽样有助于避 免偏颇于收集数据的特定时间和顺序,操作员,或数 据收集员。
21
集中趋势的衡量
中位数 (Median)
中位数是一组数据中居中的那个数据。如果数据个数为奇数个, 则中位数是数据的中间那个;如果是偶数个,中位数就是中间 两个数据的平均。
例如: 对于数据列 15,17,18,19,22,25,26, 中位数是 “19”。 对于数据列 6,7,8,9,12,17, 中位数是 8.5 来自百度文库8和9的平 均)。
引起波动的原因
普遍原因
流程固有的未知因素。就目前 流程所用的技术而言,此类因 素是不可控制的。 此类因素也叫残差或背景噪音。 它限定了流程可达到的最小的 偏差,所以从偏差的角度来看, 普遍原因所造成的偏差代表了 流程的最好水平。 要想控制或改善普遍原因造成 的偏差需要对系统或流程采取 行动。
特殊原因
16
数据的分布
数据分布是一个概率分布。它是流程波动的数学模型。 下面的柱状图可以直观反映实际观察的分布概率,称为频率分布。
Histogram of distributions, with Normal Curve
分布曲线和直方图 (process = QCNArro)
25
20
Frequency
确定项目的问题所在(改善的焦点)
为了达到以上的目的,我们将要回答以下的问题:
我们的数据可靠吗? 流程现状能力如何(长期能力)? 流程的潜在最好能力能满足要求吗(短期能力)? 是管理问题还是技术问题? 改善的目标如何? 是哪些问题引起了大部分缺陷的产生(项目的焦点)?
2
测量阶段的工作流程
在测量阶段,我们将按照以下流程开展工作
14
波动
所有流程都存在波动,没有任何两件产品其质量特征是 完全一样的 我们预期观察值会有差异,如果没有差异,我们就会产 生怀疑。 通常我们不会仅仅依靠一个数据就做出结论,而是收集 多个数据并且非常注意如何收集这些样本,以减少偏差。
波动的产生是很自然的,是意料之中的。波动是统计学的基础
15