数据分析与制程能力评估
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析与制程能力评估
张晓军 2015.11.23
我们的感觉可靠吗?
上面的蓝线和黑线哪根长? Sumbo创作
生日概率
如果一个房间里有50个人,那么至少有两 个人的生日相同的概率可能是多少?
Sumbo创作
真相是什么?
感觉不靠谱! 真相或许不存在,或许假象太有欺骗性 数据能够让人冷静和理性
Sumbo创作
统计学
对大多数人来说这是一个比较头疼的名词 但其实从运用的角度,它并不可怕,反而 非常的受用!
Sumbo创作
案例:改善了吗?
A公司去年的订单交付平均时间是8天, 今年的交付平均时间也是8天 请问进步了还是倒退了?
Sumbo创作
打靶
A B
谁打的最差 谁打的最好
C
D
Sumbo创作
意义:反映数据(尺寸)的波动范围,即 工艺过程“满足设计标准”的能力。
USL USL X Cpu 3 3s
双侧 单侧,Cpl计算相同
Sumbo创作
Cp图示
Sumbo创作
一般质量特性过程能力综合评定
范围 2.33>Cp>2 2≥Cp>1.67 1.67≥Cp>1.33 1.33≥Cp>1 1≥Cp 判断 措施 能力极过剩 更换设备,降低对设备精度的要求 能力过剩 理想状态 低风险 中风险 采取抽样检验,减少抽样频次,也可考 虑降低设备精度 对过程进行标准化作业 在不影响正常使用的情况下,可适度放 宽标准范围 适当增加检验频次,如对后续过程有影 响时,找出原因,加以改进
Ò Ó « Æ ¬ Ì Ö ·¼ ²
可能原因: 几种可能原因: ◆控制了公差下限 ◆左侧某些数据被遗弃(或样本被故意 抛弃) ◆工序分布右偏(如由于刀具、夹具等 的磨损) ◆工艺过程的特殊性
x 或3 x
若右偏态是由于工艺本身特殊性造成的,可依 次尝试以下转换: 1 ( 1 ) ( 2) (3)、logx或lnx x
Sumbo创作
实际案例演练
GS510 B件
Sumbo创作
Q&A
Sumbo创作
Sumbo创作
常见的一些名词
统计学名词 平均值 最大值 最小值 极差 偏差 标准差 Ca、Cp、CPK
抽样 样本数量 抽样方法 正态分布 管制上限 管制下限
设计名词 基准尺寸 上公差 下公差 公差带
Sumbo创作
正态分布特性
生产过程中众多彼此独立的偶然因素( 随机性)变异共同对生产对象产生影响 时,彼此相互影响、相互抵消——最终 使产品质量特性呈正态分布(中心极限 定理)。 正态分布有两个参数,即平均值μ和标 准差σ,可记作N(μ,σ):均数μ决 定正态曲线的中心位置;标准差σ决定 正态曲线的陡峭或扁平程度。
若右偏态是由于工艺本身特殊性造成的,可依 次尝试以下转换: (3)、logx或lnx
Sumbo创作
非正态分布---双峰形分布
造成双峰型分布的几种可能原因 ◆混料 ◆抽样方案不合理:抽样时将两 个不同的生产线、或两个班组 或两种材料或两种工艺的样本 放在一起。
Ð Î Ö » Ê ý OH- SPC11-20
平均数(算术平均数)
解释:一组数据中所有数据之和再除以数 据的个数
意义:常用来表示样本数据的“中心值 ”,但受样本中每个数据的影响,越极 端的数据对平均数的影响也越大. A班和B班的平均分都是80分,哪个班的 整体表现更好?
Sumbo创作
最大值、最小值、极差、偏差
最大值:反映一组数据的最大边界 最小值:反映一组数据的最小边界 极差=最大值-最小值(反映这组数据 的变化范围) 偏差:实际值与目标值的偏移量
V1.1
◆抽样间隔太长,而工艺又不稳定 ◆如果是供应商来料的抽样数据,则很可能是由于供应商事先做了分检。 ◆正常的生产过程一般不会造成双峰分布,因此,如果数据出现双峰分布,应立 即调查原因。
Sumbo创作
非正态分布---扁平型
几种可能原因: ◆工序参数调整误差大,且频繁调 整 ◆工序波动大 ◆机器(或刀具、夹具)出现严重 磨损,影响了精度 ◆特殊的工艺过程
2 2
2
Sumbo创作
标准差大小直观图示
Sumbo创作
不同标准差的分布比例
Sumbo创作
Ca
Ca: Caoability of Accuracy (准确度) 意义:制程平均值与規格中心值的差距, 数值越小越好。
Sumbo创作
Ca等级判读
Sumbo创作
CP (精确度)
CP(精确度):设计公差与制程整个变 异的比值。
Sumbo创作
非正态分布的几种情况
Sumbo创作
非正态数据下工序能力
■ 若数据呈非正态分布,首先应查找工序中是 否存在系统性原因,很多情况下,非正态性是 由于系统性原因造成的。若一旦发现了系统性 原因,应采取措施,将由于系统性原因产生的 数据删除,或将系统性原因排除后,重新搜集 数据。 ■ 若非正态性是由于工艺过程中特殊的工艺特 点造成的,应考虑将非正态数据转化为正态, 此时公差也要做同等转化。几种将非正态数据 转化为正态的方法:
Sumbo创作
质量变异的正态分布特性
x
一般来说,如果一个量 是由许多微小的独立随 机因素影响的结果,那 么就可以认为这个量具 有正态分布。是概率统 计中最重要的一种分布
x
3 2
%
%
μ
2
3
%
Sumbo创作
規 格 下 限 規 格 上 限
LCL
UCL
σ
3σ 6σ x
3σ
σ
Sumbo创作
制程能力一般:Cpk=1.0
LCL
UCL
規 格 下 限
規 格 上 限
3σ 6σ
3σ
Sumbo创作
制程能力非常好:CPK=1.67
日本常用
規 格 下 限 2σ
LCL
UCL
規 格 上 限
2σ
3σ 10σ
3σ
Sumbo创作
制程不良1:规格界限在6σ内
LCL
規格下限
規格上限
42.3%
UCL
46.53%
X
3σ 3σ
Sumbo创作
制程异常2:“UCL”超过规格上限
規 格 下 限
LCL
規 格 上 限
UCL
规格 中心
x
Sumbo创作
实际中:一定存在偏差
理想
现实
不良比 例?
Sumbo创作
不良率预测
第一.计算Z值
Z = 規格值 - 全部數據的平均值
σ (Sigama)
Sumbo创作
Foxconn 跳楼案例
记者
樊富珉
在短时间内发生这么多起跳楼的事件,如果站在理论 角度上,发生率算不算高? 按卫生部统计,目前中国自杀率大概是十万分之十六 左右。而富士康40多万人,约十万分之二三左右,大 学生我们也做过统计,大概十万分之二到三左右。如 果从全国的自杀率来比的话,应该还是低的
Sumbo创作
分析工序能力的步骤
1、确定样本含量(n) 2、确定合理的抽样方案 3、抽样 4、记录数据 5、绘制直方图 6、检查数据的正态性 7、检查是否存在系统性因素 8、计算工序能力 9、计算工序能力指数Cp, Cpk。
Sumbo创作
抽样及抽样方案
无论样本含量大小,抽样应是随机的, 不应有系统性变异。 进行工序能力分析时,一般随机抽样的 样本含量在100—200之间。
Sumbo创作
CPK
CPK: Capability index of process制程能 力指数,也称为“工序能力”。 意义:评估生产是否满足“规格要求”的 大批量生产的能力。 计算公式: Cpk=(1- |Ca|)*Cp
Sumbo创作
CPK能力判断
Sumbo创作
常见的制程能力分布
制程能力好,中心值在目 标上且分布均在规格内
Sumbo创作
数据分组及绘制直方图
首先进行数据分组 时常按斯特格斯(Sturges)提出的经验 公式来确定组数K:
N 2 K 1 log10 log10 其中N为数据的个数(总体单位数或样 本数
如数据个数为20,则 K=1+lg20/lg2=1+4.32=5.325
Sumbo创作
第二.根据Z值差Z分布统计表 第三.根据统计表,得出不良率值
Sumbo创作
Z分布统计表
Sumbo创作
运用举例
σ=0.00617
規格下限=0.82
3.44% 46.56%
規格上限=0.84
7.64% 42.36%
LCL=0.8127
X =0.8312
3σ 3σ
UCL=0.8497
Sumbo创作
制程能力尚可,中心值在目 标上,分布均在规格内但稍 微太分散
制程能力尚可,中心值有漂移 ,但分布尚在规格内
制程能力不好,中心值虽 在目标,但分布超出规格 外
制程能力不好,中心值 不在目标,分布虽集中 但超出规格外
制程能力最差,中心值不在目 标,分布不集中且超出规格外
Sumbo创作
良好的制程分布:CPK>1.33
Sumbo创作
非正态分布---左偏态分布
30 25 20 15 10 5 0
1 2 3 4 5 6 7
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
ó ׫ Æ ¬ Ì Ö ·¼ ²
几种可能原因: ◆控制了公差上限 ◆右侧某些数据被遗弃(或样要被 故 意抛弃) ◆工序分布左偏 ( 如由于刀具、夹 具等的磨损) ◆工艺过程的特殊性
良率预估
Z (UCL) = 規格上限 - 0.8312 σ = 0.84 - 0.8312 0.00617 = 1.426
查表超出規格上限的不良比率 = 7.64%
Z (LCL) = 規格下限 - 0.8312 σ
=
0.82 - 0.8312 0.00617
= -1.8152
超出規格下限的不良比率 = 3.44%
Sumbo创作
中心偏移量
Sumbo创作
标准差
标准差是样本平均数的一种平均距离,一般用s或 σ表示. 意义:用来衡量一批数据的波动大小(即这批数据 偏离平均数的大小,也即反映数据的离散程度) 。 在实际应用中,标准差常被理解为稳定性指标。 计算公式:
( x1 x) ( x2 x) ( xn x) s n
Sumbo创作
非正态分布---尾部被切除
◆样本数据中超公差部分 被遗弃 ◆仅从合格产品中抽样 ◆抽样不合理,如样本含 量太小 ◆一旦发现这种分布,应 立即调查原因
Sumbo创作
怎么运用?
我们需要考察供应商A的生产能力,如何 评价? 我们已知设计的公差,应该如何选择工艺 ? 我们量测了一组数据,如何推算量产的良 率? 根据我们量测的数据分布,如何去判断改 善方向?
预测合格率=1-7.64%-3.44%=88.92%
Sumbo创作
影响工序质量的六个基本因素
影响工序质量的六个基本因素6M(5M+1M) 人(Manpower) 机器(Machinery) 材料(Material) 方法(Method) 环境(Mother—natured) 测量(Measurement)
Sumbo创作
非正态数据下工序能力(续)
1、倒数转换:
2、平方根转移:
1 x x x
3、立方根转换: 3
4、对数转换:log x或lnx
5、BOX—COX转换*
Sumbo创作
非正态分布---右偏态分布
30 25 20 15 10 5 0
1 2 3 4 5 6 Leabharlann Baidu 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
数据分组及绘制直方图
然后确定组距(Width of classes):组距 是一个组的上限与下限之差 组距=(最大值 - 最小值)/组数 第三步,确定各组组限(Class limits)并 据此整理频数分布表。 第四步,绘制直方图确认分布状态
Sumbo创作
根据直方图判断是否为正态分布
根据直方图判断是否为正态分布
张晓军 2015.11.23
我们的感觉可靠吗?
上面的蓝线和黑线哪根长? Sumbo创作
生日概率
如果一个房间里有50个人,那么至少有两 个人的生日相同的概率可能是多少?
Sumbo创作
真相是什么?
感觉不靠谱! 真相或许不存在,或许假象太有欺骗性 数据能够让人冷静和理性
Sumbo创作
统计学
对大多数人来说这是一个比较头疼的名词 但其实从运用的角度,它并不可怕,反而 非常的受用!
Sumbo创作
案例:改善了吗?
A公司去年的订单交付平均时间是8天, 今年的交付平均时间也是8天 请问进步了还是倒退了?
Sumbo创作
打靶
A B
谁打的最差 谁打的最好
C
D
Sumbo创作
意义:反映数据(尺寸)的波动范围,即 工艺过程“满足设计标准”的能力。
USL USL X Cpu 3 3s
双侧 单侧,Cpl计算相同
Sumbo创作
Cp图示
Sumbo创作
一般质量特性过程能力综合评定
范围 2.33>Cp>2 2≥Cp>1.67 1.67≥Cp>1.33 1.33≥Cp>1 1≥Cp 判断 措施 能力极过剩 更换设备,降低对设备精度的要求 能力过剩 理想状态 低风险 中风险 采取抽样检验,减少抽样频次,也可考 虑降低设备精度 对过程进行标准化作业 在不影响正常使用的情况下,可适度放 宽标准范围 适当增加检验频次,如对后续过程有影 响时,找出原因,加以改进
Ò Ó « Æ ¬ Ì Ö ·¼ ²
可能原因: 几种可能原因: ◆控制了公差下限 ◆左侧某些数据被遗弃(或样本被故意 抛弃) ◆工序分布右偏(如由于刀具、夹具等 的磨损) ◆工艺过程的特殊性
x 或3 x
若右偏态是由于工艺本身特殊性造成的,可依 次尝试以下转换: 1 ( 1 ) ( 2) (3)、logx或lnx x
Sumbo创作
实际案例演练
GS510 B件
Sumbo创作
Q&A
Sumbo创作
Sumbo创作
常见的一些名词
统计学名词 平均值 最大值 最小值 极差 偏差 标准差 Ca、Cp、CPK
抽样 样本数量 抽样方法 正态分布 管制上限 管制下限
设计名词 基准尺寸 上公差 下公差 公差带
Sumbo创作
正态分布特性
生产过程中众多彼此独立的偶然因素( 随机性)变异共同对生产对象产生影响 时,彼此相互影响、相互抵消——最终 使产品质量特性呈正态分布(中心极限 定理)。 正态分布有两个参数,即平均值μ和标 准差σ,可记作N(μ,σ):均数μ决 定正态曲线的中心位置;标准差σ决定 正态曲线的陡峭或扁平程度。
若右偏态是由于工艺本身特殊性造成的,可依 次尝试以下转换: (3)、logx或lnx
Sumbo创作
非正态分布---双峰形分布
造成双峰型分布的几种可能原因 ◆混料 ◆抽样方案不合理:抽样时将两 个不同的生产线、或两个班组 或两种材料或两种工艺的样本 放在一起。
Ð Î Ö » Ê ý OH- SPC11-20
平均数(算术平均数)
解释:一组数据中所有数据之和再除以数 据的个数
意义:常用来表示样本数据的“中心值 ”,但受样本中每个数据的影响,越极 端的数据对平均数的影响也越大. A班和B班的平均分都是80分,哪个班的 整体表现更好?
Sumbo创作
最大值、最小值、极差、偏差
最大值:反映一组数据的最大边界 最小值:反映一组数据的最小边界 极差=最大值-最小值(反映这组数据 的变化范围) 偏差:实际值与目标值的偏移量
V1.1
◆抽样间隔太长,而工艺又不稳定 ◆如果是供应商来料的抽样数据,则很可能是由于供应商事先做了分检。 ◆正常的生产过程一般不会造成双峰分布,因此,如果数据出现双峰分布,应立 即调查原因。
Sumbo创作
非正态分布---扁平型
几种可能原因: ◆工序参数调整误差大,且频繁调 整 ◆工序波动大 ◆机器(或刀具、夹具)出现严重 磨损,影响了精度 ◆特殊的工艺过程
2 2
2
Sumbo创作
标准差大小直观图示
Sumbo创作
不同标准差的分布比例
Sumbo创作
Ca
Ca: Caoability of Accuracy (准确度) 意义:制程平均值与規格中心值的差距, 数值越小越好。
Sumbo创作
Ca等级判读
Sumbo创作
CP (精确度)
CP(精确度):设计公差与制程整个变 异的比值。
Sumbo创作
非正态分布的几种情况
Sumbo创作
非正态数据下工序能力
■ 若数据呈非正态分布,首先应查找工序中是 否存在系统性原因,很多情况下,非正态性是 由于系统性原因造成的。若一旦发现了系统性 原因,应采取措施,将由于系统性原因产生的 数据删除,或将系统性原因排除后,重新搜集 数据。 ■ 若非正态性是由于工艺过程中特殊的工艺特 点造成的,应考虑将非正态数据转化为正态, 此时公差也要做同等转化。几种将非正态数据 转化为正态的方法:
Sumbo创作
质量变异的正态分布特性
x
一般来说,如果一个量 是由许多微小的独立随 机因素影响的结果,那 么就可以认为这个量具 有正态分布。是概率统 计中最重要的一种分布
x
3 2
%
%
μ
2
3
%
Sumbo创作
規 格 下 限 規 格 上 限
LCL
UCL
σ
3σ 6σ x
3σ
σ
Sumbo创作
制程能力一般:Cpk=1.0
LCL
UCL
規 格 下 限
規 格 上 限
3σ 6σ
3σ
Sumbo创作
制程能力非常好:CPK=1.67
日本常用
規 格 下 限 2σ
LCL
UCL
規 格 上 限
2σ
3σ 10σ
3σ
Sumbo创作
制程不良1:规格界限在6σ内
LCL
規格下限
規格上限
42.3%
UCL
46.53%
X
3σ 3σ
Sumbo创作
制程异常2:“UCL”超过规格上限
規 格 下 限
LCL
規 格 上 限
UCL
规格 中心
x
Sumbo创作
实际中:一定存在偏差
理想
现实
不良比 例?
Sumbo创作
不良率预测
第一.计算Z值
Z = 規格值 - 全部數據的平均值
σ (Sigama)
Sumbo创作
Foxconn 跳楼案例
记者
樊富珉
在短时间内发生这么多起跳楼的事件,如果站在理论 角度上,发生率算不算高? 按卫生部统计,目前中国自杀率大概是十万分之十六 左右。而富士康40多万人,约十万分之二三左右,大 学生我们也做过统计,大概十万分之二到三左右。如 果从全国的自杀率来比的话,应该还是低的
Sumbo创作
分析工序能力的步骤
1、确定样本含量(n) 2、确定合理的抽样方案 3、抽样 4、记录数据 5、绘制直方图 6、检查数据的正态性 7、检查是否存在系统性因素 8、计算工序能力 9、计算工序能力指数Cp, Cpk。
Sumbo创作
抽样及抽样方案
无论样本含量大小,抽样应是随机的, 不应有系统性变异。 进行工序能力分析时,一般随机抽样的 样本含量在100—200之间。
Sumbo创作
CPK
CPK: Capability index of process制程能 力指数,也称为“工序能力”。 意义:评估生产是否满足“规格要求”的 大批量生产的能力。 计算公式: Cpk=(1- |Ca|)*Cp
Sumbo创作
CPK能力判断
Sumbo创作
常见的制程能力分布
制程能力好,中心值在目 标上且分布均在规格内
Sumbo创作
数据分组及绘制直方图
首先进行数据分组 时常按斯特格斯(Sturges)提出的经验 公式来确定组数K:
N 2 K 1 log10 log10 其中N为数据的个数(总体单位数或样 本数
如数据个数为20,则 K=1+lg20/lg2=1+4.32=5.325
Sumbo创作
第二.根据Z值差Z分布统计表 第三.根据统计表,得出不良率值
Sumbo创作
Z分布统计表
Sumbo创作
运用举例
σ=0.00617
規格下限=0.82
3.44% 46.56%
規格上限=0.84
7.64% 42.36%
LCL=0.8127
X =0.8312
3σ 3σ
UCL=0.8497
Sumbo创作
制程能力尚可,中心值在目 标上,分布均在规格内但稍 微太分散
制程能力尚可,中心值有漂移 ,但分布尚在规格内
制程能力不好,中心值虽 在目标,但分布超出规格 外
制程能力不好,中心值 不在目标,分布虽集中 但超出规格外
制程能力最差,中心值不在目 标,分布不集中且超出规格外
Sumbo创作
良好的制程分布:CPK>1.33
Sumbo创作
非正态分布---左偏态分布
30 25 20 15 10 5 0
1 2 3 4 5 6 7
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
ó ׫ Æ ¬ Ì Ö ·¼ ²
几种可能原因: ◆控制了公差上限 ◆右侧某些数据被遗弃(或样要被 故 意抛弃) ◆工序分布左偏 ( 如由于刀具、夹 具等的磨损) ◆工艺过程的特殊性
良率预估
Z (UCL) = 規格上限 - 0.8312 σ = 0.84 - 0.8312 0.00617 = 1.426
查表超出規格上限的不良比率 = 7.64%
Z (LCL) = 規格下限 - 0.8312 σ
=
0.82 - 0.8312 0.00617
= -1.8152
超出規格下限的不良比率 = 3.44%
Sumbo创作
中心偏移量
Sumbo创作
标准差
标准差是样本平均数的一种平均距离,一般用s或 σ表示. 意义:用来衡量一批数据的波动大小(即这批数据 偏离平均数的大小,也即反映数据的离散程度) 。 在实际应用中,标准差常被理解为稳定性指标。 计算公式:
( x1 x) ( x2 x) ( xn x) s n
Sumbo创作
非正态分布---尾部被切除
◆样本数据中超公差部分 被遗弃 ◆仅从合格产品中抽样 ◆抽样不合理,如样本含 量太小 ◆一旦发现这种分布,应 立即调查原因
Sumbo创作
怎么运用?
我们需要考察供应商A的生产能力,如何 评价? 我们已知设计的公差,应该如何选择工艺 ? 我们量测了一组数据,如何推算量产的良 率? 根据我们量测的数据分布,如何去判断改 善方向?
预测合格率=1-7.64%-3.44%=88.92%
Sumbo创作
影响工序质量的六个基本因素
影响工序质量的六个基本因素6M(5M+1M) 人(Manpower) 机器(Machinery) 材料(Material) 方法(Method) 环境(Mother—natured) 测量(Measurement)
Sumbo创作
非正态数据下工序能力(续)
1、倒数转换:
2、平方根转移:
1 x x x
3、立方根转换: 3
4、对数转换:log x或lnx
5、BOX—COX转换*
Sumbo创作
非正态分布---右偏态分布
30 25 20 15 10 5 0
1 2 3 4 5 6 Leabharlann Baidu 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
数据分组及绘制直方图
然后确定组距(Width of classes):组距 是一个组的上限与下限之差 组距=(最大值 - 最小值)/组数 第三步,确定各组组限(Class limits)并 据此整理频数分布表。 第四步,绘制直方图确认分布状态
Sumbo创作
根据直方图判断是否为正态分布
根据直方图判断是否为正态分布