直方图之excel画法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
品质管理工具介绍之直方图
俗话说:工欲善其事必先利其器,品质管理工具在品质管理过程中就体现他的作用。ISO9001质量管理体系要求组织确定、收集和分析适当的数据,一方面对过程、产品进行监视和测量,另一方面确定产品的特性和质量趋势,以寻找持续改进的机会。而品质管理工具就是数据分析,确定该机机会的工具。在此之前我们介绍了排列图,但排列图运用的是80/20原则,在质量管理中体现的是部分因素对质量水平的决定作用;而直方图运用的是统计学正态分布的规律,不受显著因素的控制,它是表征过程状态工具。不管是从成图的原理还是表现的内容,直方图与排列图完全不一样。下面就对直方图进行详细介绍。
2、用于进行过程能力调查和不合格品率估计;
3、客观地反映操作者的技术水平和主观努力程度。
4、与产品规格界限做比较,可直观地判断分布中心是否偏离规格中心,以确定是否需要调整并求出其调整量;
5、还可判断数据分布的散差(分布范围)是否满足规格范围的要求,以确定是否采取缩小散差的技术性措施;
四、如何运用直方图来判断工序质量问题:
点击D17,在单元格的右下角出现一个小黑方块,如图7所示。将鼠标移到方块那里,单击后往下拉到D25即可。如图8所示这样就完成了下侧数据的计算
上侧数据的计算:
在上侧数据E16的单元格输入=D16+$B$21,然后回车,就得到第一组的上界,然后如求上侧数据操作,具体见下图.
中心值的计算:
在F16单元格输入=(D16+E16)/2回车,得到结果,然后重复上侧数据的操作,得到10组数据的中心值,具体见下图:
1、μ的估计量:根据统计学中矩估计、极大似然估计法,求出μ的估计量为:且没
有系统误差,所以μ的估计量就以代替,这个式子表示的是平均值。
2、σ的估计量:由于按照统计学中矩估计和极大似然估计的到了相同的结果,就是
但是这个估计量的偏差比较大,而经过理论证明是样本的无偏估计,不存在系统误差,所以这个估计我们可以采用,故以后的计算均以 代替。
一、直方图(Histogram)的定义:
直方图是频数直方图的简称,也叫柱形图。它是用一系列宽度相等、高度不等的长方形表示数据的图。长方形表示数据范围的间隔,长方形的高度表示在规定的间隔内的数据数。
二、直方图的图形:
三、直方图的作用:
1、整理计量值的观测数据,检验数据分布的类型,分析数据是否服从正态分布,判断数据有无异常,用于对总体的分布特征进行推断;
1、 正态分布的概率密度函数为 ,其图形如图1中曲线,它是单峰并关于X=μ对称,若μ值增大,函数的图形往右移动,如果μ值减小,函数的图形就往左移,而不改变曲线的形状。
2、概率密度曲线与X轴围成的面积为样本的概率和,不管那种分布,样本的概率和是1,它是一个常量。当X=μ时,概率密度函数f(x)取得最大值为 ,当σ变小时,f(x)的最大值变大;当σ变大时,f(x)的最大值变小,具体见图2。而概率密度曲线与x轴的面积是个常量,所以当σ变小时,概率密度曲线f(x)越来越尖,这表示数据落在μ附近的可能越来越大,也表示数据也来越集中,尺寸的加工变异越来越小,但不改变中心μ;当σ变小时,概率密度曲线越来越平坦,数据也远离中心μ,这表明数据也来越分散,尺寸的加工的变异性也来越大,但不改变中心μ。所以μ与σ相互独立,共同决定概率密度函数。
4、组数的计算法:在需要输入组数的单元格内输入“=”,然后按照组数计算方法输入1+3.32LOG10(B16)可以得到组数,也可以根据经验值取,一般取10组。
5、上下侧数据:
下侧数据的计算:
在下侧数据D16那一栏输入=B17-0.5回车后得到第一组的下界,如图5所示,
在D17所在单元格输入=D16+$B$21,然后回车就得到如图6所示的第一组数据的上界。
4、双峰型
双峰型往往是由于两个不同的分布混在一起所致,把来自两个总体的数据混在一起作图。例如,两个人在加工同一批产品,两台设备加工的产品混为一批等。
5、平顶型
直方呈平顶型,往往是由于生产过程中缓慢变化的因素在起作用所造成。如:刀具的磨损、操作者疲劳等,应采取措施,控制该因素稳定地处于良好的水平上。
6、断齿型
选择G12:G21的数据区域,将光标移到函数栏“=FREQUANCY(A1:J10,E12:E21)”的“=”左边,同时按住Ctrl、Shift和enter键,便能得到如下的结果。
7、正态曲线的各点数据的计算
选取需要输入概率密度函数值的H12单元格,点击fx选择统计函数中的NORMDIST函数,见下图:
然后点击确定出现如图2的画面;点击value1选项按钮,选择样本的总体A1:J10,具体如图3,然后按2次回车或者点击图3的圆圈处,出现图4的画面,点击确定就在B16中出现函数计算的结果100。
2、MAX、MIN、STDEV和AVERAGE函数与COUNT函数操作基本相同,在这里只介绍STDEV的用法。
34
14
42
38
6
28
32
22
25
36
39
24
18
28百度文库
16
38
36
21
20
26
20
18
8
12
37
40
28
28
12
30
31
30
26
28
47
42
32
34
20
28
34
20
24
27
24
29
18
21
46
14
10
21
22
34
22
28
28
20
38
12
32
19
30
28
19
30
20
24
35
20
28
24
24
32
40
1、COUNT函数的用法:先点击B16,然后点击fx,在“或选择类别”一栏点击图1中圆圈中的箭头,选择“统计”,然后拉动滚动条,选择count函数,如图1的对话框;
1、正常型
正常型又称对称型。它的特点是中间高,两边低,呈左右基本对称,说明工序处于稳定状态。
2、孤岛型
孤岛型的特点是在远离主分布中心的地方出现小的地方,形如孤岛。孤岛的存在揭示我们短时间内有异常因素在起作用,使加工条件起了变化。如原材料混杂,操作疏忽,测量工具有误差等。
3、偏向型
偏向型的直方的顶峰偏向一侧,所以也叫偏坡形。计数值或计量值只控制一侧界限时,常出现此形状。有时也因加工习惯造成这样的分布,如孔加工往往偏小,而轴加工往往偏大等等。
单击B18所在的单元格,然后点击fx,见下图:
点击“或选择类别”一栏选择统计,拉动滚动条选择STDEV后单击确定,依次出现如下的对话框:
点击“Number1”栏的按钮,选择A1:J10的数据区域,回车两次,就得到了STDEV的值
或者如下图所示单击圆圈中的按钮,然后点击确定即可
3、极差的计算方法:在需要输入极差值的单元格内单击,输入等号,然后点击刚才求到的最大值所在的单元格,然后点击“-”,再点击求到的最小值所在的单元格,最后回车即可。
8、直方图的绘制:
选择中心值、频率和概率密度的数据F12:H21,点击插入→图表→自定义类型→两轴线-柱图,点击完成。
单击生成的图,右击选择源数据→系列→系列2→分类(X)轴标志(T)数据选择按钮→选择F12:F21区域的数据,两次回车即可。删除系列2的柱子。
双击柱子→选项→分类间距调整为0→确定→完成直方图的制作。
Frequancy:是用来求特定区间包含的数据的个数。
Normdist:该函数是用来求特定点的概率密度函数的值。
Normsdist:该函数是用来求推算总体的不良率
直方图制作过程中具体的操作:
一、数据准备:
43
28
27
26
33
29
18
24
32
14
34
22
30
29
22
24
22
28
48
1
24
29
35
36
30
六、手工画图步骤:详见QCC活动指南。
七、Excel作图介绍:
作图用到的函数的介绍:
Count:该函数是用来求样本的含有数据的数量。
Max函数:该函数是用来求样本中的最大值。
Min函数:该函数是用来求样本中的最小值。
极差range=Xmax-Xmin
Stdev:该函数是用来求样本的标准偏差。
Average:该函数是用来求样本的平均值。
断齿型的直方图,大量出现参差不起,但整个图形的整体看起来还是中间高、两边低,左右基本对称。造成这种情况的原因不是生产上的问题,而可能是分组过多或测量仪器精度不够、读数有误等原因所致。
五、正态分布的介绍:
正态分布是连续型随机变量的分布规律的一种,它是计量型数据的分布规律。在日常生活中,正态分布是最常见的分布,它有很多良好的性质,这些性质是其它分布所不具备的。
点击“X”栏的数据选择按钮,选择上侧数据E12:E21,操作与前面一样;点击“Mean”一栏的数据选择按钮,选择mean均值栏B19的数据;点击“Standard_dev”数据选择按钮,选择标准差所在的单元格B18的数据,最后在“Cumulative”一栏中输入数据0,单击确定后得到第一组数据。
然后的操作与求频率一样,求得其它九个数据,具体如图:
6、频率的计算:
单击G12所在的单元格,在点击fx,在“或选择类别”选择“统计”,在“选择函数(N):”选择FREQUANCY,如图所示;
点击确定,在Data_array一栏点击红色按钮,选择A1:J10数据区域,点击红色按钮后在Data_array一栏出现A1:J10,见下图:
点击Bins_array一栏的数据选择按钮,选择上侧数据再次点击数据选择按钮后,弹出的对话框中Bins_array显示E12:21,点击确定就得到数据区间0.5-5.5中包含的样本数据的频数。或者两次回车也可以达到同样的效果。具体见下图:
3、关于正态分布的统计量:
由于我们在统计分析时使用的都是样本,所以一般情况下我们都是在分析样本,也就是我们常说的抽样,它也是以后推断总体的基础。为了知道总体的性质,同时满足经济性原则,我们需要抽取一定的数量的样本,测量并记录观察值,分析这些数据,对比实际的情况,然后得出关于总体的论断。
但是统计学中的正态分布没有告诉我们改如何求μ与σ,那么我们必须建立μ与σ的估计方法。既然是估计,那么就有误差,不仅包含系统误差,也包含偶然误差。下面给出μ与σ的估计公式,并略作说明。
俗话说:工欲善其事必先利其器,品质管理工具在品质管理过程中就体现他的作用。ISO9001质量管理体系要求组织确定、收集和分析适当的数据,一方面对过程、产品进行监视和测量,另一方面确定产品的特性和质量趋势,以寻找持续改进的机会。而品质管理工具就是数据分析,确定该机机会的工具。在此之前我们介绍了排列图,但排列图运用的是80/20原则,在质量管理中体现的是部分因素对质量水平的决定作用;而直方图运用的是统计学正态分布的规律,不受显著因素的控制,它是表征过程状态工具。不管是从成图的原理还是表现的内容,直方图与排列图完全不一样。下面就对直方图进行详细介绍。
2、用于进行过程能力调查和不合格品率估计;
3、客观地反映操作者的技术水平和主观努力程度。
4、与产品规格界限做比较,可直观地判断分布中心是否偏离规格中心,以确定是否需要调整并求出其调整量;
5、还可判断数据分布的散差(分布范围)是否满足规格范围的要求,以确定是否采取缩小散差的技术性措施;
四、如何运用直方图来判断工序质量问题:
点击D17,在单元格的右下角出现一个小黑方块,如图7所示。将鼠标移到方块那里,单击后往下拉到D25即可。如图8所示这样就完成了下侧数据的计算
上侧数据的计算:
在上侧数据E16的单元格输入=D16+$B$21,然后回车,就得到第一组的上界,然后如求上侧数据操作,具体见下图.
中心值的计算:
在F16单元格输入=(D16+E16)/2回车,得到结果,然后重复上侧数据的操作,得到10组数据的中心值,具体见下图:
1、μ的估计量:根据统计学中矩估计、极大似然估计法,求出μ的估计量为:且没
有系统误差,所以μ的估计量就以代替,这个式子表示的是平均值。
2、σ的估计量:由于按照统计学中矩估计和极大似然估计的到了相同的结果,就是
但是这个估计量的偏差比较大,而经过理论证明是样本的无偏估计,不存在系统误差,所以这个估计我们可以采用,故以后的计算均以 代替。
一、直方图(Histogram)的定义:
直方图是频数直方图的简称,也叫柱形图。它是用一系列宽度相等、高度不等的长方形表示数据的图。长方形表示数据范围的间隔,长方形的高度表示在规定的间隔内的数据数。
二、直方图的图形:
三、直方图的作用:
1、整理计量值的观测数据,检验数据分布的类型,分析数据是否服从正态分布,判断数据有无异常,用于对总体的分布特征进行推断;
1、 正态分布的概率密度函数为 ,其图形如图1中曲线,它是单峰并关于X=μ对称,若μ值增大,函数的图形往右移动,如果μ值减小,函数的图形就往左移,而不改变曲线的形状。
2、概率密度曲线与X轴围成的面积为样本的概率和,不管那种分布,样本的概率和是1,它是一个常量。当X=μ时,概率密度函数f(x)取得最大值为 ,当σ变小时,f(x)的最大值变大;当σ变大时,f(x)的最大值变小,具体见图2。而概率密度曲线与x轴的面积是个常量,所以当σ变小时,概率密度曲线f(x)越来越尖,这表示数据落在μ附近的可能越来越大,也表示数据也来越集中,尺寸的加工变异越来越小,但不改变中心μ;当σ变小时,概率密度曲线越来越平坦,数据也远离中心μ,这表明数据也来越分散,尺寸的加工的变异性也来越大,但不改变中心μ。所以μ与σ相互独立,共同决定概率密度函数。
4、组数的计算法:在需要输入组数的单元格内输入“=”,然后按照组数计算方法输入1+3.32LOG10(B16)可以得到组数,也可以根据经验值取,一般取10组。
5、上下侧数据:
下侧数据的计算:
在下侧数据D16那一栏输入=B17-0.5回车后得到第一组的下界,如图5所示,
在D17所在单元格输入=D16+$B$21,然后回车就得到如图6所示的第一组数据的上界。
4、双峰型
双峰型往往是由于两个不同的分布混在一起所致,把来自两个总体的数据混在一起作图。例如,两个人在加工同一批产品,两台设备加工的产品混为一批等。
5、平顶型
直方呈平顶型,往往是由于生产过程中缓慢变化的因素在起作用所造成。如:刀具的磨损、操作者疲劳等,应采取措施,控制该因素稳定地处于良好的水平上。
6、断齿型
选择G12:G21的数据区域,将光标移到函数栏“=FREQUANCY(A1:J10,E12:E21)”的“=”左边,同时按住Ctrl、Shift和enter键,便能得到如下的结果。
7、正态曲线的各点数据的计算
选取需要输入概率密度函数值的H12单元格,点击fx选择统计函数中的NORMDIST函数,见下图:
然后点击确定出现如图2的画面;点击value1选项按钮,选择样本的总体A1:J10,具体如图3,然后按2次回车或者点击图3的圆圈处,出现图4的画面,点击确定就在B16中出现函数计算的结果100。
2、MAX、MIN、STDEV和AVERAGE函数与COUNT函数操作基本相同,在这里只介绍STDEV的用法。
34
14
42
38
6
28
32
22
25
36
39
24
18
28百度文库
16
38
36
21
20
26
20
18
8
12
37
40
28
28
12
30
31
30
26
28
47
42
32
34
20
28
34
20
24
27
24
29
18
21
46
14
10
21
22
34
22
28
28
20
38
12
32
19
30
28
19
30
20
24
35
20
28
24
24
32
40
1、COUNT函数的用法:先点击B16,然后点击fx,在“或选择类别”一栏点击图1中圆圈中的箭头,选择“统计”,然后拉动滚动条,选择count函数,如图1的对话框;
1、正常型
正常型又称对称型。它的特点是中间高,两边低,呈左右基本对称,说明工序处于稳定状态。
2、孤岛型
孤岛型的特点是在远离主分布中心的地方出现小的地方,形如孤岛。孤岛的存在揭示我们短时间内有异常因素在起作用,使加工条件起了变化。如原材料混杂,操作疏忽,测量工具有误差等。
3、偏向型
偏向型的直方的顶峰偏向一侧,所以也叫偏坡形。计数值或计量值只控制一侧界限时,常出现此形状。有时也因加工习惯造成这样的分布,如孔加工往往偏小,而轴加工往往偏大等等。
单击B18所在的单元格,然后点击fx,见下图:
点击“或选择类别”一栏选择统计,拉动滚动条选择STDEV后单击确定,依次出现如下的对话框:
点击“Number1”栏的按钮,选择A1:J10的数据区域,回车两次,就得到了STDEV的值
或者如下图所示单击圆圈中的按钮,然后点击确定即可
3、极差的计算方法:在需要输入极差值的单元格内单击,输入等号,然后点击刚才求到的最大值所在的单元格,然后点击“-”,再点击求到的最小值所在的单元格,最后回车即可。
8、直方图的绘制:
选择中心值、频率和概率密度的数据F12:H21,点击插入→图表→自定义类型→两轴线-柱图,点击完成。
单击生成的图,右击选择源数据→系列→系列2→分类(X)轴标志(T)数据选择按钮→选择F12:F21区域的数据,两次回车即可。删除系列2的柱子。
双击柱子→选项→分类间距调整为0→确定→完成直方图的制作。
Frequancy:是用来求特定区间包含的数据的个数。
Normdist:该函数是用来求特定点的概率密度函数的值。
Normsdist:该函数是用来求推算总体的不良率
直方图制作过程中具体的操作:
一、数据准备:
43
28
27
26
33
29
18
24
32
14
34
22
30
29
22
24
22
28
48
1
24
29
35
36
30
六、手工画图步骤:详见QCC活动指南。
七、Excel作图介绍:
作图用到的函数的介绍:
Count:该函数是用来求样本的含有数据的数量。
Max函数:该函数是用来求样本中的最大值。
Min函数:该函数是用来求样本中的最小值。
极差range=Xmax-Xmin
Stdev:该函数是用来求样本的标准偏差。
Average:该函数是用来求样本的平均值。
断齿型的直方图,大量出现参差不起,但整个图形的整体看起来还是中间高、两边低,左右基本对称。造成这种情况的原因不是生产上的问题,而可能是分组过多或测量仪器精度不够、读数有误等原因所致。
五、正态分布的介绍:
正态分布是连续型随机变量的分布规律的一种,它是计量型数据的分布规律。在日常生活中,正态分布是最常见的分布,它有很多良好的性质,这些性质是其它分布所不具备的。
点击“X”栏的数据选择按钮,选择上侧数据E12:E21,操作与前面一样;点击“Mean”一栏的数据选择按钮,选择mean均值栏B19的数据;点击“Standard_dev”数据选择按钮,选择标准差所在的单元格B18的数据,最后在“Cumulative”一栏中输入数据0,单击确定后得到第一组数据。
然后的操作与求频率一样,求得其它九个数据,具体如图:
6、频率的计算:
单击G12所在的单元格,在点击fx,在“或选择类别”选择“统计”,在“选择函数(N):”选择FREQUANCY,如图所示;
点击确定,在Data_array一栏点击红色按钮,选择A1:J10数据区域,点击红色按钮后在Data_array一栏出现A1:J10,见下图:
点击Bins_array一栏的数据选择按钮,选择上侧数据再次点击数据选择按钮后,弹出的对话框中Bins_array显示E12:21,点击确定就得到数据区间0.5-5.5中包含的样本数据的频数。或者两次回车也可以达到同样的效果。具体见下图:
3、关于正态分布的统计量:
由于我们在统计分析时使用的都是样本,所以一般情况下我们都是在分析样本,也就是我们常说的抽样,它也是以后推断总体的基础。为了知道总体的性质,同时满足经济性原则,我们需要抽取一定的数量的样本,测量并记录观察值,分析这些数据,对比实际的情况,然后得出关于总体的论断。
但是统计学中的正态分布没有告诉我们改如何求μ与σ,那么我们必须建立μ与σ的估计方法。既然是估计,那么就有误差,不仅包含系统误差,也包含偶然误差。下面给出μ与σ的估计公式,并略作说明。