直方现分布I直方图分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、 直方图的概念
直方图:用一系列等宽不等高的长方形来表示数据,宽度表 示数据范围的间隔,高度表示在给定间隔的数据出现的频 数,变化的高度形态反映了数据的分布情况。
作用: ➢ 显示各种数值出现的相对概率; ➢ 提示数据的中心、散布及形状; ➢ 快速阐明数据的潜在分布; ➢ 为预测过程提供有用的信息; ➢ 可以判断“过程是否满足顾客的要求”。
上限-偏右 下限-偏左
.
6)平顶型
多总体混在一起; 缓变因素起作用; 质量指标的均匀变化 。
.
四、直方图使用的注意事项
1、异常值应去除后再分组; 2、直方图是从样本测量值推测总体分布的最简单有效的 方法; 3、应取得时间、原料、测量者、设备、环境条件等方面 的详细的数据资料; 4、进行过程管理及分析改善时,可利用分层法,将更容 易找出问题的症结点。
6.确定各组界限
为确定边界,通常从最小值开始。把最小值放在第
一组的中间位置上,则本例中,最小值xmin=38,组距
h=3,故组界为 (xmi n h 2) (xm.i n h 2)
7.计算各组的组中心值wi
中心值wi是每组中间的数值,其计算公式为
某组的中心值(wi)=(某组的上限+某组的下限)/2
R=148-121=27
k=1+3.32log n=1+3.32 log 60
=1+3.32(1.78)=6.9
即约可分为6组或7组,本例取7组。
.
组距h=27/7=3.86mm,取组距h=4mm
第一组下界限可取为xmin-(h/2)=121-2=119;
下界限也可取xmin-测量单位/2,本例测量单位为mm,
59
3
96
96
9
60.5~63.5
62
4
100
100
.
8.统计各组频数,作频数分布表
将所有原始数据,按其数值大小归入相应的组中, 并统计各组的数据个数,即频数fi。
各组频数填好后检查一下其总数是否与数据个数 相符,避免重复或遗漏。
.
9.画直方图
⑴将频数分布表图表化,以横轴表示数值的变化,纵轴表示 频数; ⑵横轴与纵轴各取适当的单位长度。再将各组的组界分别标 在横轴上,各组界应为等距分布; ⑶以各组内的次数为高,组距为宽;在每一组上画成矩形, 则完成直方图; ⑷在图的右上角记入相关数据履历(数据总数n,平均值x, 标准差σ…),并划出规范的上、下限; ⑸填入必要事项:产品名称、工序名称、时间、制作日期、 制作者等。
.
3) 矩齿型
➢数据分组太多; ➢量仪误差太大; ➢测量方法有问题或读错数据 ; ➢假造数据 ; ➢测量仪器误差过大; ➢设备/工装异常; ➢组数的宽度不是倍数时。
.
4)陡壁型
经全数检查后,剔除不合格源自文库后的数据作图。
.
5)偏态型
当下限(或上限)受到规范等因素限制时; 工具磨损或松动时。 当尾巴拖长时,应检查是否在技术上能够接受。
.
频数f
25
23
20
18 16
17 15
15
1 2 3
4
10
5
52 2
34
6
7
0
8
1 2 34 5 67 8 9
9
.
例8.2-2:某厂成品尺寸规范为130至160mm,今按随机抽样 方式抽取60个样本,其测定值如表,试制作直方图。
解:
138 142 148 145 140 141 139 140 141 138 138 139 144 138 139 136 137 137 131 127 138 137 137 133 140 130 136 128 138 132 145 141 135 131 136 131 134 136 137 133 134 132 135 134 132 134 121 129 137 132 130 135 135 134 136 131 131 139 136 135
.
§8.3 因果图
一、因果图的概念
所谓因果图是一种用来分析一个问题的特性(结果) 与影响其特性的因素(原因)的图。
因果图是日本著名质量管理学者石川馨博士提出,所 以又称“石川图”,特性要因图或鱼刺图。
故可取下限为xmin-0.5=120.5,而上限则为124.5mm。 第二组的上界限值就是第二组的下界限值,第二组的 下界限值加上组距就是第二组的上界限值,也就是第 三组的下界限值,……,依此类推,可定出各组的组 界。
.
求组中点,作频数分布表
.
画直方图
.
三、直方图的观察和分析
1.判断分布类型 正常型与异常型
相对累计
组号
组界
组中值w 频数f 累计频数
频率%
1
36.5~39.5
38
2
2
2
2
39.5~42.5
41
2
4
4
3
42.5~45.5
44
16
20
20
4
45.5~48.5
47
18
38
38
5
48.5~51.5
50
23
61
61
6
51.5~54.5
53
17
78
78
7
54.5~57.5
56
15
93
93
8
57.5~60.5
.
二、直方图的制作
1.收集数据并记录 例10.2-1:
2.找出数据中的最大值、最小值 最大值xmax=63,最小值xmin=38,
.
3 求极差(R)
则极差R= xmax-xmin=63-38=25, 区间 [S,L]=[xmin ,xmax]称为散布范围。
.
4.确定分组数(k)
总数
分组数k
≤50 50—100
正常型:中间高,两边低,左右 近似对称 工序处于稳定状态
异常型:工序中有异常原因
常见的六种异常型 频数直方图:
锯齿型 陡壁型 孤岛型 高原型 双峰型 偏态型
.
1)孤岛型
出现这种情况是夹杂了其他分布的少量数据。如 ✓ 原料发生变化; ✓ 设备短时间故障; ✓ 中间有不熟练的人员参与加工; ✓ 测量有错误; ✓ 工序调节错误等所引起。
出现这种分布,表明一 定有异常原因存在,只要去 除,就可满足过程要求,生 产出符合规范的产品。
.
2) 双峰型
➢观察值来自两个总体, 即当 两种不同分布(且其平均值相 差较大)混在一起时,常出现 这种形状。
如:两台机器,两家不同供应商,两种工艺等 生产的产品混在一起时。因测量值不同的原 因影响,应先分层后再作直方图。
100—250 250以上
5~7 6—10
7—12
10--20
参照上表,取k=9
也可按史特吉斯公式: k=1+3.32lg n
本例 n=100,同样取. k=9
计算
5.求组距(h)
组距h,即组与组之间的间隔,等于极差R除以组数 h xmaxxmin k
本例中, h6 338 25 2.78 3
99
直方图:用一系列等宽不等高的长方形来表示数据,宽度表 示数据范围的间隔,高度表示在给定间隔的数据出现的频 数,变化的高度形态反映了数据的分布情况。
作用: ➢ 显示各种数值出现的相对概率; ➢ 提示数据的中心、散布及形状; ➢ 快速阐明数据的潜在分布; ➢ 为预测过程提供有用的信息; ➢ 可以判断“过程是否满足顾客的要求”。
上限-偏右 下限-偏左
.
6)平顶型
多总体混在一起; 缓变因素起作用; 质量指标的均匀变化 。
.
四、直方图使用的注意事项
1、异常值应去除后再分组; 2、直方图是从样本测量值推测总体分布的最简单有效的 方法; 3、应取得时间、原料、测量者、设备、环境条件等方面 的详细的数据资料; 4、进行过程管理及分析改善时,可利用分层法,将更容 易找出问题的症结点。
6.确定各组界限
为确定边界,通常从最小值开始。把最小值放在第
一组的中间位置上,则本例中,最小值xmin=38,组距
h=3,故组界为 (xmi n h 2) (xm.i n h 2)
7.计算各组的组中心值wi
中心值wi是每组中间的数值,其计算公式为
某组的中心值(wi)=(某组的上限+某组的下限)/2
R=148-121=27
k=1+3.32log n=1+3.32 log 60
=1+3.32(1.78)=6.9
即约可分为6组或7组,本例取7组。
.
组距h=27/7=3.86mm,取组距h=4mm
第一组下界限可取为xmin-(h/2)=121-2=119;
下界限也可取xmin-测量单位/2,本例测量单位为mm,
59
3
96
96
9
60.5~63.5
62
4
100
100
.
8.统计各组频数,作频数分布表
将所有原始数据,按其数值大小归入相应的组中, 并统计各组的数据个数,即频数fi。
各组频数填好后检查一下其总数是否与数据个数 相符,避免重复或遗漏。
.
9.画直方图
⑴将频数分布表图表化,以横轴表示数值的变化,纵轴表示 频数; ⑵横轴与纵轴各取适当的单位长度。再将各组的组界分别标 在横轴上,各组界应为等距分布; ⑶以各组内的次数为高,组距为宽;在每一组上画成矩形, 则完成直方图; ⑷在图的右上角记入相关数据履历(数据总数n,平均值x, 标准差σ…),并划出规范的上、下限; ⑸填入必要事项:产品名称、工序名称、时间、制作日期、 制作者等。
.
3) 矩齿型
➢数据分组太多; ➢量仪误差太大; ➢测量方法有问题或读错数据 ; ➢假造数据 ; ➢测量仪器误差过大; ➢设备/工装异常; ➢组数的宽度不是倍数时。
.
4)陡壁型
经全数检查后,剔除不合格源自文库后的数据作图。
.
5)偏态型
当下限(或上限)受到规范等因素限制时; 工具磨损或松动时。 当尾巴拖长时,应检查是否在技术上能够接受。
.
频数f
25
23
20
18 16
17 15
15
1 2 3
4
10
5
52 2
34
6
7
0
8
1 2 34 5 67 8 9
9
.
例8.2-2:某厂成品尺寸规范为130至160mm,今按随机抽样 方式抽取60个样本,其测定值如表,试制作直方图。
解:
138 142 148 145 140 141 139 140 141 138 138 139 144 138 139 136 137 137 131 127 138 137 137 133 140 130 136 128 138 132 145 141 135 131 136 131 134 136 137 133 134 132 135 134 132 134 121 129 137 132 130 135 135 134 136 131 131 139 136 135
.
§8.3 因果图
一、因果图的概念
所谓因果图是一种用来分析一个问题的特性(结果) 与影响其特性的因素(原因)的图。
因果图是日本著名质量管理学者石川馨博士提出,所 以又称“石川图”,特性要因图或鱼刺图。
故可取下限为xmin-0.5=120.5,而上限则为124.5mm。 第二组的上界限值就是第二组的下界限值,第二组的 下界限值加上组距就是第二组的上界限值,也就是第 三组的下界限值,……,依此类推,可定出各组的组 界。
.
求组中点,作频数分布表
.
画直方图
.
三、直方图的观察和分析
1.判断分布类型 正常型与异常型
相对累计
组号
组界
组中值w 频数f 累计频数
频率%
1
36.5~39.5
38
2
2
2
2
39.5~42.5
41
2
4
4
3
42.5~45.5
44
16
20
20
4
45.5~48.5
47
18
38
38
5
48.5~51.5
50
23
61
61
6
51.5~54.5
53
17
78
78
7
54.5~57.5
56
15
93
93
8
57.5~60.5
.
二、直方图的制作
1.收集数据并记录 例10.2-1:
2.找出数据中的最大值、最小值 最大值xmax=63,最小值xmin=38,
.
3 求极差(R)
则极差R= xmax-xmin=63-38=25, 区间 [S,L]=[xmin ,xmax]称为散布范围。
.
4.确定分组数(k)
总数
分组数k
≤50 50—100
正常型:中间高,两边低,左右 近似对称 工序处于稳定状态
异常型:工序中有异常原因
常见的六种异常型 频数直方图:
锯齿型 陡壁型 孤岛型 高原型 双峰型 偏态型
.
1)孤岛型
出现这种情况是夹杂了其他分布的少量数据。如 ✓ 原料发生变化; ✓ 设备短时间故障; ✓ 中间有不熟练的人员参与加工; ✓ 测量有错误; ✓ 工序调节错误等所引起。
出现这种分布,表明一 定有异常原因存在,只要去 除,就可满足过程要求,生 产出符合规范的产品。
.
2) 双峰型
➢观察值来自两个总体, 即当 两种不同分布(且其平均值相 差较大)混在一起时,常出现 这种形状。
如:两台机器,两家不同供应商,两种工艺等 生产的产品混在一起时。因测量值不同的原 因影响,应先分层后再作直方图。
100—250 250以上
5~7 6—10
7—12
10--20
参照上表,取k=9
也可按史特吉斯公式: k=1+3.32lg n
本例 n=100,同样取. k=9
计算
5.求组距(h)
组距h,即组与组之间的间隔,等于极差R除以组数 h xmaxxmin k
本例中, h6 338 25 2.78 3
99