直方图的做法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
步骤 1.将数据分组后的组中值、频数各列入一列; 步骤 2.在第xi列将频数最高的一组标为 0,以该组中心值作为均值x0来看; 步骤 3.在第xi列以以 0 为基准,比此中心值大的组依次记为 1、2、3,比此中心值小 的组依次记为-1、-2、-3……。 步骤 4. 其他计算按表第一行的公式进行计算。
10 40.8 44.3 48.1 49.1 50.7 53.1 56.1 58.8 64.8 77.0
在计算最大值、最小值、平均值和标准偏差的单元格内分别写入=MAX(A1:J10),
=MIN(A1:J10),=AVERAGE(A1:J10)和= STDEVA(A1:J10)。确定后可以求出最
大值为 77.0,最小值为 33.2,平均值为 52.2,标准偏差为 9.01。
和累计频率%。见表 7-5。
表 7-5 COD 去除率低原因分析统计表
第一组下限值:33.15 第一组上限值:33.15+4.4=37.55 第二组:37.55~41.95 第三组:41.95~46.35 …… 第十组:72.75~77.15
步骤 7 作频数表. 将 100 个数据一个个对号入座,计入所在组内,见表 1-11.
表 7-3 某金属拉伸强度频数表
下限
上限 中心值
工程能力指数=(77.0-33.5)/6s=43.5/54.06=0.805。 b 直方图的分析 直方图形状是多种多样的,一般有一般型(富士山型)、锯齿型、偏向型、双峰型、孤
岛型、平顶型、偏心型、绝壁型等。产生不同形态的原因是各种各样的,现将几种不同形态
直方图产生的主要原因分析如下。
一般性或对称型(见图 1-4 a),属正常情况下的正态分布形态; 绝壁性或偏向型(见图 1-4 b),直方图高峰明显偏向一边,通常控制指标是单侧控制时 容易出现这种情况,有时虽然指标是双侧控制但出于某种经济或收率原因的考虑,进行倾向 性控制会出现情况下的分布形态; 锯齿型(见图 7-2 c)直方图虽然大体对称,但参差不齐,产生这种情况的原因可能是分组 太多或测量仪器精度不够等引起; 双峰型(见图 7-2 d)图中出现两个高峰。出现这种情况的原因大多是因为有两个总体 数据混在一起,需要进行分层分析; 孤岛型(见图 7-2e)在分布图一侧图中出现一个孤岛。出现这种情况的原因大多是因为 有异常数据出现,或者是记录测试错误等原因造成的。需要追溯孤岛数据产生的原因,采取 措施,予以纠正。 高原型(见图 7-2 f)图中直方呈高原状分布,出现这种情况的原因比较复杂,也许是
去除率的原因,大家对下述几方面原因进行了仔细分析,经统计,主要有以下几个方面: DO 低 发生频数 62 次
SS 波动 发生频数 12 次
COD 波动 发生频数 33 次 CN 高 发生频数 5 次
操作失误 发生频数 1 次
其他
发生频数 2 次
请用排列图分析。
[解]
步骤 1 整理数据,将各种影响因素发生的频数由大到小进行排列,并计算出累计频数
49.0 60.1 61.4 53.1 53.1 48.9 52.4 37.5 66.2 46.4
[解] 用计算机 EXCEL 工作表计算并作图 步骤 1 将数据逐个审核确认为 100 个,即 n=100 步骤 2 将 100 个数据全部录入到 EXCEL 表格中,并按大小进行排列如表 7-2。
表 7-2 用EXCEL工作表排列后某金属制品拉伸强度表(kg/cm2)
4 36.6 43.1 46.4 48.5 49.9 51.9 54.6 57.0 60.9 68.5
5 37.5 43.1 46.5 48.5 49.9 52.2 54.6 57.5 61.2 68.7
6 38.7 43.2 46.7 48.8 50.0 52.3 54.7 57.7 61.3 70.4
组中心值
序号
1
35.35
2
39.75
3
44.15
小计∑
4
48.55
5
52.95
6
57.35
7
61.75
8
66.15
9
70.55
10
74.95
小计∑
合计
计算:
频数fi
5 6 12
27 17 15 7 4 5 2
100
表 7-4 计算表
xi
fi xi
f i xi2 xi + xi2
-3
-15
45
6
-2
-12
n
10
∑ ∑ s(标准偏差)= h ×
fi xi2 − ( fi xi )2 = 4.4 × 482 − 822 /100 = 9.0
n −1
99
Cr(变异系数)=s/ x =17.2%。
2) 排列图 排列图是意大利经济学家帕来托(pareto)于 1897 年,美国的经济学家 lorenz 于 1907 年发 表了研究资本主义社会人们财富分配所得的某种指数法则,画出的曲线发现,占人数比例很少 的一部分人占了人类财富的绝大部分。这条曲线称为 lorenz 曲线或者帕来托(pareto)曲线,按 此曲线作出的图称为帕来托(pareto)图。美国质量管理专家朱兰(J.M.Juran)将其作为质量管理 的手段之一,称为帕来托图,被日本质量管理专家称为全面质量管理 7 种工具之一。中国称为 排列图.它是以横坐标表示特性因素,纵坐标表示发生的不合格数的柱状图。通过排列图可 以明显看出,尽管引起产生不合格的因素很多,但是其中少数的几个因素可能是引起不合格的 主要因素,抓住关键的少数因素,就抓住了解决问题的关键。
多种数据混在一起,或者是在生产过程中由于某种缓慢因素的作用是分布中心缓慢向一侧移 动。
除此之外,其他类型还有常见的反映数据分布分散程度的所谓胖型、瘦型分布形态。
a
b
c
d
e
a
图 7-2 直方图几种分布形态
上述计算方法,如不用计算机,可按表 7-4 进行手工计算。这种计算方法称为等距分组 连乘法,计算步骤是:
数理统计技术讲座(7)
第七讲 数据的收集和整理(5)
——数据的图形整理法——
撰稿人:陈国铭
数据可以用简单的图形进行分析,可以很形象反映数据的分布状况。日本质量管理专家 提出的七种工具就包括了图形分析方法,将复杂的数理统计技术大大简化,非常适用。目前 许多现场使用的统计技术,图形分析占有很大比例。图形分析种类很多,特别是现在计算机 的普遍应用,很多过去用人工难以实现的图形均可以通过计算机作出来。
A
B
C
D
E
F
G
H
I
J
1 33.2 41.7 45.0 48.1 49.2 50.9 53.1 56.1 59.0 65.2
2 34.5 42.0 45.5 48.3 49.3 51.3 53.9 56.2 59.5 66.2
3 36.6 42.4 46.0 48.5 49.8 51.6 54.1 56.7 60.1 67.0
频数
30
25
n=100
20
x = 52.2
15
s=9.01
10
5
0
中心值 35.35 39.75 44.15 48.55 52.95 57.35 61.75 66.15 70.55 74.95
拉伸强度kg/cm2
图 7-1 某金属拉伸强度直方图 作图人:李 力 日期 1998.3.12.
步骤 9 当有规格要求时,应把规格要求的上下限画在图上。通常根据规格要求要计算 工程能力指数。假设规格要求是 33.5~77.0,则:
7 38.7 43.8 47.1 48.9 50.1 52.4 55.0 57.7 61.4 70.6
8 39.3 44.0 47.2 49.0 50.1 52.5 55.3 58.0 61.7 71.3
9 40.3 44.1 47.6 49.0 50.4 52.6 56.0 58.1 63.2 75.8
频数
33.15 37.55 35.35
5
37.55 41.95 39.75
6
41.95 46.35 44.15
12
46.35 50.75 48.55
27
50.75 55.15 52.95
17
55.15 59.55 57.35
15
59.55 63.95 61.75
7
63.95 68.35 66.15
1) 直方图(histogram) 直方图是推行全面质量管理的 7 种工具之一,是在数据频数整理基础上画出来的。它可 以使数据的分布状态看得更直观。作直方图要求有足够的数据,一般应有 100 个或 100 个以 上数据。作直方图目的是: 1)、可以把握总体分布形状、分布的中心位置和总体分布的离散程度; 2)可以调查分布的中心和规格中心位置的偏差程度,了解工程能力,调查不良品来源 等,便于和规格或标准值进行比较。 因此,直方图可以提供大量信息,以便针对问题,采取措施,实现持续改进。 a 直方图的作法 直方图作法主要步骤是: 步骤 1、做频数分布表(如第六讲中的表 6-3); 步骤 2、建立直角坐标系,以纵坐标表示频数,横坐标表示特性值; 步骤 3、以直方的个数等于分组数,直方图的高为频数,依频数分布表的顺序进行排列 作直方图; 步骤 4、标注必要的所作图的信息。如图名,作图时间,作图人,地点,数据总数,平 均值,标准偏差等。例 7-1 是作直方图的详细步骤。 [例 7-1 ] 某金属加工厂生产一种金属制品,其拉伸强度是一个重要指标,该厂为了了 解产品质量情况,从中抽取了 100 个样品,对其拉伸强度进行测定,测定的数据见表 7-1。 请用直方图进行解析。
y=kx -d
人口y
所得金额x
图 7-3 帕来托(pareto)曲线
(图中 y 表示 x 元以上所得的人数,公式的 k、d 是根据不同社会取不同的常数) 排列图做法通过[例 7-2]予以说明。 [例 7-2] 某公司 QC 小组为了对影响炼油厂污水处理 COD 去除率的因素进行了分析,他
们采取集思广益的讨论会方式,会上从人、机、料、法、环五方面找出了一系列影响 COD
步骤 3 确定计量最小单位为 0.1 kg/cm2
步骤 4 决定分组数 k,分 10 组。分组原则见第六讲中表 6-4。
步骤 5 决定分组数据范围,即幅度.
h= xmax − xmin = 77.0 − 33.2 =4.38→4.4(取测定单位整数倍)
k
10
步骤 6 决定最小组的下侧边界值为:
xmin -测定值最小单位/2=33.2-0.1/2 =33.15
24
2
-1
-12
12
0
-39
81
0
1
17
17
2
2
30
60
6
3
21
63
12
4
16
64
20
5
25
125
30
6
12
72
42
121
401
82
482
fi (xi + xi2 )
30 12 0 42
34 90 84 80 150 84 522 564
∑ x (均值)= x0 +
fi xi × h = 48.55 + 82 × 4.4 = 52.2
4
68.35 72.75 70.55
5
72.75 77.15 74.95
Βιβλιοθήκη Baidu
2
表 7-3 中的频数计算可用 EXCEL 工作表中 CONTIF 函数进行计算,方法见第六讲中的表
6-5。计算结果录入到表格中。
步骤 8 作直方图,将表 7-3 数据复制到 EXCEL 电子表格中或在 Word 文件中可直接作 图,打开计算机 Word 文件,点击[插入]、[对象]、选 Microsoft Graph 2000 图表,将表 7-3 数 据复制到表格中,将图进行适当修饰,即可划出图 7-1 的直方图。注意,要在图上标明数据 个数,平均值和标准偏差等作图信息。
表 7-1 某金属制品拉伸强度(kg/cm2) 48.1 49.9 49.8 57.7 38.7 49.3 50.4 61.3 54.7 61.2 75.8 34.5 68.7 68.5 48.5 54.1 64.8 77.0 51.9 40.3 40.8 46.5 44.3 49.0 70.4 46.7 50.0 56.0 43.1 54.6 38.7 71.3 42.0 44.0 48.1 42.4 39.3 49.1 43.1 70.6 57.0 48.8 52.6 50.1 56.2 53.9 36.6 48.3 33.2 67.0 61.7 56.1 47.1 41.7 50.9 47.2 59.0 55.0 63.2 52.3 52.2 58.0 59.5 51.6 65.2 50.7 56.7 47.6 48.5 43.2 50.1 55.3 57.7 57.5 45.5 58.1 54.6 43.8 58.8 49.9 60.9 56.1 52.5 46.0 44.1 45.0 49.2 36.6 51.3 48.5
相关文档
最新文档