质量常用统计技术.pptx
合集下载
质量管理基础知识与常用的统计方法.pptx
性能 耐久性 可靠性 安全性 经济性 外观
衡量标准 质量标准 企业标准 部颁标准 国内标准 国际标准
一、基础知识
注意区分产品质量、工作质量和工程质量
工程质量:由操作者、原材料、机器设备、加工方法、工作环 境等综合作用下形成的产品质量,对产品质量起着直接影响。
工作质量:企业的管理工作、技术工作和组织工作对达到产品 质量标准的保证程度。
海尔的质量管理意识
质量提高
质量管理的重要性及收益
增加市场占有率
信誉提高 销量提高 价格提高
降低成本
生产率提高 返工和废品率减少 产品保修成本降低
利润增加
一、基础知识
(二)质量与质量管理的概念
1、质量 GB/T19000----ISO 9000:2000版标准。定义:质量是 一组固有特性满足要求的程度。
在此基础上,青岛海尔重视职工素质的提高。他们制定了5年 教育计划和年度计划,实行全员培训,组织了36次近千人的培 训班,参加全国质量管理统考,有913人获得合格证书。公司共 成立了32个学习小组,取得了38项成果,其中6项获青岛优秀成 果奖,3项获省优质成果奖,3项获国家优秀成果奖。
强烈的质量意识和优秀的质量管理取得了巨大的效果。 1989年12月轻工部主办的全国最优最劣售后服务单位评选活动 中,青岛海尔以总投诉率为万分之零点四六、全国同行业第一 的优异成绩获“双龙杯”奖。1990年,海尔集团又获“国家质 量管理奖”和“全国十佳企业优秀管理金马奖”。如今,海尔 已经在国际、国内获得各方面的肯定和公认。海尔冰箱获得冰 箱行业第一枚国优金牌;海尔是全国十大驰名商标之一,是家 电行业中唯一的消费者最信得过的冰箱商标;海尔在国际竞争 中10次中标,海尔是中国家电最先获得国际认证,并获得国际 最权威性的美国、德国、加拿大等各种认证。
质量统计技术基础知识专业培训课件(完整内容版)
第一节 统计数据
数据是统计的对象。
习惯上把由数字组成的 数字数据称为数据。
数据的分类
计量值数据。计量值数据是指可以连续取值,在有限的区间内可以无限取值的数据。 计数值数据。计数值数据是只能间断取值,在有限的区间内只能取有限数值的数据。
第二节 统计技术、统计方法和统计工具
共性是均是研究随机现象中确定的数字规律, 但也有其各自的特点。
• 目前,统计技术已在科学和生产的各个方面得到广泛的应用,特别是在质量管理方面的应用更 为引人瞩目。
第二节 统计技术在产品生产质量管理中的应用
• 在产品生产的各道工序都可看到原材料、中间产品及最终产品质量变异的存在。 • 统计技术能使企业更好地利用可获得的数据做出决策,因而有助于企业在质量
管理各过程包括产品实现过程中改进产品、过程的质量,持续提高质量管理体 系的有效性。
第三节 分层抽样方法
在各层内按比例分别随机抽取一定数量的单位产品,然后合在一起组成一个 样本,称为分层抽样。 一般来说,抽样结果比简单随机抽样和系统抽样更能反映总体的情况。
• 对数量关系的研究,开始人们只知道数量的四则运算和其他简单的代数运算,这是常量间的数 量关系。
• 后来数学家创立了微分学,人们开始可以研究变量之间的数量关系。自变量与因变量之间有完 全确定的关系,称之为函数关系。
第一节 统计技术的创立和发展
• 20世纪30年代以来,工业生产高速化、自动化,更加促进了作为概率论的应用科学——数理统 计的迅速发展。
第三节 计量值数据的正态分布
正态分布
频率分布 “正态分布”的规律
第五章 有效数字与计算法则
➢ 第一节 有效数字的位数 ➢ 第二节 近似数的运算规则 ➢ 第三节 数值修约规则
质量统计.ppt
A
B
C
C
B
A
x
• 控制图中1点落于中心线一侧的概率为0.50,则连续9点落于中心线同 一侧的概率为0.509 =0.00195。 •连续9点落于中心线以下,则反应了参数μ的减小,若连续9点落于中心 线以上,则反应了分布参数μ的增大。
控制图判稳准则 在点子随机排列的情况下,符合下列各点之一就认为过程处 于稳态: 1. 连续25个点子都在控制界限内。 2. 连续35个点子至多1个点子落在控制界限外。 3. 连续100个点子至多2个点子落在控制界限外。
2024/10/8
27
统计过程控制-控制图判断
控制图判异准则(过程异常的检验模式) 准则1:点落在A区以外
P-Value:0.000
1.02
1.12
1.22
1.32
1.42
Average: 1.18537 StDev: 0.0835489 N: 125
C2
Anderson-Darling Normality Test A-Squared: 0.206 P-Value: 0.867
P-Value:0.867
正态分布的要素: 1.平均值:决定正态分布曲线的中 心位置; 2.标准偏差:决定正态分布曲线的 宽窄。
2024/10/8
7
统计学基本知识-正态分布
下面是用新络纳素片含量指标50批数据画出的频率直方图。
红线是拟合 的正态密度 曲线
2024/10/8
8
3 准则
统计学基本知识-正态分布
X
可以认为,随机变量X的取值几乎全部集中在
用以表明一批数据的分散程度的另一参数 s
n
(Xi X)2
i1
n 1
质量管理常用统计技术培训.ppt
其他:方针目标的确定、管理评审的输入、顾客需求的 确定、资源需求的确定等。
2003年9月
统计技术与方法培训
13
2000版ISO9000族标准对统计 技术的要求(续)
ISO10017《统计技术应用指南》技术报 告,识别了QMS中广泛应用的12种统计 技术。
描述性统计;测量分析;可靠性分析;统计 过程控制图;试验设计;过程能力分析;抽 样;统计公差法;假设检验;回归分析;模 拟;时间序列分析 表1 用于支持ISO9001:2000条款要求的统计 技术综述 word
2003年9月
统计技术与方法培训
22
排列图应用程序
1)选择要进行质量分析的项目。 2)选择用于质量分析的度量单位,如出现的 次数(频数)、成本、不合格品数、金额等。 3)选择进行质量分析的时间范围。 4)画横坐标。按质量单位量值递减的顺序自 左向右在横坐标上列出项目,将量值最小的1 个或几个项目归并为“其他”项,把它放在最 右端。
2003年9月
统计技术与方法培训
30
图2:从不同角度确定分类项目
2003年9月
统计技术与方法培训
31
排列图应用中常见问题(续)
2)纵向层层展开,通过绘制分层排列图 找出主要问题 (图3)
2003年9月
统计技术与方法培训
32
图3:分层排列图
2003年9月
统计技术与方法培训
33
排列图应用中常见问题(续)
2003年9月
统计技术与方法培训
7
推断性统计技术
在对统计数据描述的基础上,进一步对 其反映的问题进行分析、解释并做出推 断性结论。 举例: SPC(控制图)、统计抽样、试 验设计等
质量管理统计方法PPT课件
组中值 196.25 197.75 199.25 200.75 202.25 203.75 205.25
频数 5 8 14 17 7 6 3
11
第11页/共59页
三、数据的整理与显示
分组
组限
频数
频率 (%)
累计频数
向上
向下
1
[195.5,197.0)
5
8.3
5
60
2
[197.0,198.5)
8
13.3
计量值数据是指在某个区间上的可能取值具有连续性 的数据,即在该区间内可以取无穷多个实数值。常见 的有质量、面积、长度、体积,等等。
2.计数值数据
计数值数据是指在有限的区间内只能取有限个整数值 的数据,其取值只能是大于或等于零的整数,否则将 失去其实际意义。如铸件内的气孔个数、一批产品中 不合格产品的件数,等等。
2
第2页/共59页
二、数据的收集与分析
(一)总体、个体及样本
类别 总体
个体 样本
定义
需要研究考察的对象的全体即被称为总体,总体是 由个体组成的。
总体中包含的个体数量称为总体容量,用大写字母 N表示
被抽取出来的这一部分个体就组成了一个样本,而 样本中所包含的个体数目称为样本容量,用小写字 母n表示。
23
第23页/共59页
二、随机变量的概率分布
(二)离散型随机变量的概率分布
设一个离散型随机变量X的所有可能取值为xi( i = 1, 2, …, n),并且与 其相对应的概率P(X = xi)= pi都是已知的,那么也就确定了该随机变量
的概率分布。也可以用表格的形式更直观地表示出来:
X
X1
X2
X3
质量管理中常用统计方法分析PPT(20张)
二、质量管理常用的统计方法
• • 1、排列图
(1)排列图内涵
• 排列图法也叫巴雷特图法,它是用来寻找 影响产品质量主要因素的一种方法,是依据 “关键的少数和次要的多数”的原则制作的。
(2)应用排列 图的注意事项
• ①是主要因素不要过多。 • ②是纵坐标频数的选择可依据分析的问题而定,原则是以找到主要影 响因素。 • ③是合并一些一般因素。 • ④是逐层深入,即确定了主要因素。采取了相应的措施之后,为了检 查措施效果还要重新画排列图
• • • • •
关系图的基本形式
要素1
问题 要素2
问题2
流程图
流程图就是将 一个过程的步骤用 图的形式表示出来。
•
•
矩阵数据分析法
矩阵数据分析法是在矩阵图法的基础上提出来的。矩阵图法 只能定性地明确问题的所在,但不能用数量关系把问题表示 出来,而矩阵数据分析法就是用定量的数据表示质量问题之 间的相关关系。 用途: ①进行产工作质量以及较为复杂的服务质量及工作质量的评 价。 ②对生产品质量下降的多种元素进行分析。 ③评价复杂的技术经济问题和质量问题。
• 因果图
• 因果图又叫石川图、特性要因图、树 枝图、鱼刺图等。它是揭示质量特性波动 与其潜在原因关系,即表达和分析因果关 系一种图表。
因果图的问题)
• 分层法
• 分层法又叫分类法和分组法,是按照一定 的标志,把搜集到的大量有关某一特定主题的 统计数据加以归类、整理和汇总的一种方法。 分层的目的在于把杂乱无章和错综复杂的数据 和意见加以归类汇总,使之更能确切地反映客 观事实。 常用的数据分层标志有:按数据发生的时 间分、按不同类型的操作人员分、按使用的设 备分、按操作方法分、按原材料不同分、按不 同的测量工具和测量方法分、按不同的加工环 境分,以及按其他标志分类。一般地说,数据 分类的目的不同,所采用的分层标志也就不会 相同。
《质量统计知识》PPT课件
直方图—图例
与要求相比偏高
20
SL=130
15 10
5
Sμ=160 与要求相比偏低 正常
过程波动小
120.5 124.5 128.5 132.5 136.5 140.5 144.5 148.5
过程波动大
规范
32
表示分布特征的变量有哪些?
均值 X
标准差
33
什么是正态分布
直方图→正态分布
14
二、如何收集和记录数据
15
如何收集和记录数据
数据分类 计量型数据:长度、重量、温度、速度、厚度等等
(直尺、卷尺、千分尺等) 计数型数据:不合格数、缺陷数
(塞规、样板、塞尺)
16
如何收集和记录数据
测量设备的分辨率应为公差的1/10 例:公差±0.05mm,分辨率为0.01mm
设备应被校准 在测量时不能取整所测得的值 收集有用且真实的数据 记录数据来源:时间、地点、操作者、工序、设备
质量统计知识
蔡春妹
1
课程目标
提高现场员工的质量意识 掌握质量统计知识的应用
2
课程内容
第一部分 概述 第二部分 如何收集和记录数据 第三部分 统计工具的应用 第四部分 质量改进活动的步骤
3
一、概述
4
在生产中出现不合格品是必然的吗?
在工厂的生产流水线,我们可以看到这样的场景: 成型好的胎胚正在一件接着一件地随着传送带向前面移 动,胎胚检查员站在传输带旁注视着源源而来的产品, 不断地检查盖章,并挑出不合格品或可疑品放在胎胚上。
22
排列图
3、注意事项 §纵轴至少要与总计数一样高; §数据种类按照降序排列; §“关键的少数因素”的累计百分比在80%以上。
常用质量统计技术共67页文档
Silan Azure 士兰明芯
几个常见离散型分布
超几何分布:
诚信 忍耐
探索
热情
Faith Endurance Exploration Enthusiasm
14
Company Confidential
Silan Azure 士兰明芯
连续型随机变量分布 概率密度函数p(x)的特征:
诚信 忍耐
探索
热情
18
Company Confidential
Silan Azure 士兰明芯
正态分布的特点:
诚信 忍耐
探索
热情
Faith Endurance Exploration Enthusiasm
19
Company Confidential
Silan Azure 士兰明芯
正态分布的特点:
诚信 忍耐
探索
热情
统计量:不含未知参数的样本函数 描述样本中心趋势的统计量:均值、中位数、众数 描述样本离散程度的统计量:极差、方差、标准差
8
Company Confidential
Silan Azure 士兰明芯
诚信 忍耐
探索
热情
Faith Endurance Exploration Enthusiasm
随机变量及分布
随机变量(数据)的分类:
1、连续型数据(计量数据) 所有可能取值充满数轴上一个区间,如腔体温度、压力、薄膜厚度、图形高 度等 2、离散型数据(计数数据) 数值取值数轴上有限个点或可列个点,如抛硬币出现的面、掷塞子出现的点 数、备件的不同材质、材料的不同厂家、不同的外延炉、一批制品的异常数 等。
6
Company Confidential
质量管理中的统计技术与方法(PPT 63页)
控制图
控制图又叫管理图。它是用来区分由异常原因引起的波动、 或是由过程固有的随机原因引起的偶然波动的一种工具
控制图建立在数理统计学的基础上,它利用有效数据建立控
制界限。控制界限一般分为上控制限(UCL)和下控制限(
LCL)
质量特性值
●
●
●
●
●
●
●● ● ●
UCL 3倍标准偏差(3σ)
CL 3倍标准偏差(3σ)
正态分布的“68-95-99.7法则”或“经验法则”
所以我们把
2σ定义为警戒限,数值出现在这区间概率为95.4% 3 σ定义为行动限,数值出现在这区间概率为99.7% 超出3 σ既为超出规格标准
控制限与规格限
控制图中的控制限与规格限是完全不同的两种概念,不能 混为一谈
规格限是产品设计结果,属于技术、质量标准的范畴,是 对产品做“合格”与“不合格”的符合性判断的依据
SL
X18源自1频率 61 2
8
4
SU
n=100 X=33.6 S=2.98 Cp=1.30 Cpk=1.10
27。5
33。5
39。5
内径尺寸
成型树脂内(c径m)尺寸的直方图
直方图
} 1、数据的分布形状
2、数据分布的中心位置 3、数据分散的程度
一目了然
4、数据和规格的关系
主要用途:
➢ ◆ 直观的显示过程质量状况 ;
排 序: 20 21 22 24 26
中位位数置: 22 1 2 3 4 5
六个数据取中位数
原始数据: 10 5 9 12 6 8
排 序: 位 置:
5 6 8 8.5 9 10 12
123
质量常用统计技术课件
S A 1304 Se 188 ST 1492
自由度
fA 2 fe 9 fT 11
均方和
F比
MS A 652 F=31.21 MSe 20.9
(5) 如果给定 =0.05,从F分布表查得
F0.95(2,9) 4.26
由于F>4.26,所以在 =0.05水平上结论是因 子A是显著的。这表明不同的工厂生产的零件强 度有明显的差异。
试验中所考察的指标(可以是质量特性也可 以是产量特性或其它)用Y表示。Y是一个随机变 量。
单因子试验:
若试验中所考察的因子只有一个。
[例2.1-1] 现有甲、乙、丙三个工厂生产同一种零 件,为了了解不同工厂的零件的强度有无明显的差 异,现分别从每一个工厂随机抽取四个零件测定其 强度,数据如表所示,试问三个工厂的零件的平均 强度是否相同?
(3)计算各离差平方和:
ST=121492-12002/12=1492, SA=485216/4-12002/12=1304, Se= 1492-1304=188,
fT=3×4-1=11 fA=3-1=2 fe=11-2=9
(4)列方差分析表: [例2.1-1]的方差分析表
来源 偏差平方和
因子A 误差e 总计T
水平 A1 A2 … Ar
单因子试验数据表
试验数据
和
y11 , y12 ,, y1m
T1
y21 , y22 ,, y2m
T2
…
…
yr1 , yr 2 ,, yrm
Tr
均值
y1 y2
… yr
m
记第i 水平下的数据和为Ti,Ti yij ; j 1
记第i水平下的数据均值为 yi ,总均值为 y 。此 时共有n=rm个数据,这n个数据不全相同,它们的 波动(差异)可以用总离差平方和ST去表示
质量数据及分析统计基本方法ppt
b. 直方图:用一系列宽度相等,高度不等的矩形表示数
据分布的图。
直方图统计
▪ 收集一组数据 ▪ 计算数据的变化范围(极差R) ▪ 确定组数(样本大小n, 组数k) ▪ 计算组距h, h一般取整数 ▪ 确定组边界 ▪ 计算频数,例如唱票法 ▪ 计算频率 ▪ 绘制频数分布表 ▪ 绘制频数直方图,纵轴为频数 ▪ 绘制频率直方图,纵轴为频率 ▪ 进行分析
频数 2 3 5 16 20 29 12 8 4 1
USL
第六步:按频数/频率画横坐标、纵坐标与直方图
30.50 30.30 29.00 27.75 26.45 25.15 23.85 22.55 21.25 19.95 18.65 17.35
LSL
10
20
30
直方图分析
▪ 1:对称型:质量特性分布范围B在T的中间,平均值X基 本与公差中心重合,质量特性分布的两边还有一定的 余地,这很理想;
不良数 31 18 13 7 2 2 73
不良率 42.5% 22.7% 17.8% 9.6% 2.7% 2.7% 100%
累计不良率 42.5% 67.2% 85% 94.6% 97.3% 100%
排列图不良率与累计不良率计算
1:不良率 P=单项不良数/总不良数
2:累计不良率 Np=P1+P2+P3+P4…
微震动;原材料的微小变化
合格的原材料
普通原因的变差(正常变差)无法从工序中以较 特殊原因的变差(异常变差)能被检测出来,采
少代价消除之
取措施,消灭其原因,所花的代价通常是合算的
如果仅仅只有普通原因的变差出现,则说明工序 如果出现特殊原因的变差,则说明该工序并不是
解 释 方 面
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
fT 试验数 1 f A 水平数 1 fe fT f A
因子或误差的离差平方和与相应的自由度 之比称为因子或误差的均方和,并分别记为:
MS A S A f A
MSe Se fe
两者的比记为:F MSA MSe
当F F1 ( f A, fe )时认为在显著性水平 上因
子A是显著的。其中 F1 ( f A , fe ) 是自由度为 f A , fe 的F分布的1-α分位数。
S A 1304 Se 188 ST 1492
ห้องสมุดไป่ตู้
自由度
fA 2 fe 9 fT 11
均方和
F比
MS A 652 F=31.21 MSe 20.9
(5) 如果给定 =0.05,从F分布表查得
F0.95(2,9) 4.26
由于F>4.26,所以在 =0.05水平上结论是因 子A是显著的。这表明不同的工厂生产的零件强 度有明显的差异。
yi
y
2
r
Ti2
i1 m
T2 n
Se ST S A
其中 Ti 是第i个水平下的数据和;T表示 所有n=rm个数据的总和。
进行方差分析的步骤如下:
(1)计算因子A的每一水平下数据的和 T1,T2,…,Tr及总和T;
(2)计算各类数据的平方和 yi2j , Ti2 ,T 2; (3)依次计算ST,SA,Se; (4)填写方差分析表;
单因子方差分析表
来源 偏差平方和
因子A
SA
误差e
Se
总计T
ST
自由度
fA r 1 fe n r fT n 1
均方和
F比
MS A S A f A F MS A MSe MSe Se fe
各个离差平方和的计算:
ST
rm
i1 j1
yij
y
2
r
m
yi2j
i1 j1
T2
n
SA
r
m
i1
二、单因子方差分析
假定因子A有r个水平,在Ai水平下指标服 从正态分布,其均值为 i,方差为 2 ,i=1,2, …, r。每一水平下的指标全体便构成一个总体,共 有r个总体,这时比较各个总体的问题就变成比 较各个总体的均值是否相同的问题了,即要检验 如下假设是否为真:
H0 : 1 2 r
(3)计算各离差平方和:
ST=121492-12002/12=1492, SA=485216/4-12002/12=1304, Se= 1492-1304=188,
fT=3×4-1=11 fA=3-1=2 fe=11-2=9
(4)列方差分析表: [例2.1-1]的方差分析表
来源 偏差平方和
因子A 误差e 总计T
质量常用统计技术
方差分析 回归分析 试验设计
上海质量教育培训中心 2005年
第一节 方差分析
一、几个概念 二、单因子方差分析
一、几个概念
在试验中改变状态的因素称为因子,常用大写 英文字母A、B、C、…等表示。
因子在试验中所处的状态称为因子的水平。 用代表因子的字母加下标表示,记为A1,A2,… ,Ak。
三个工厂的零件强度
工厂
量件强度
甲
103 101 98 110
乙
113 107 108 116
丙
82 92 84 86
在这一例子中,考察一个因子: 因子A:工厂
该因子有三个水平:甲、乙、丙 试验指标是:零件强度
这是一个单因子试验的问题。每一水平下的 试验结果构成一个总体,现在需要比较三个总体 均值是否一致。如果每一个总体的分布都是正态 分布,并且各个总体的方差相等,那么比较各个 总体均值是否一致的问题可以用方差分析方法来 解决。
二是由于存在随机误差,即使在同一水平下 获得的数据间也有差异,这是除了因子A的水平 外的一切原因引起的,我们将它们归结为随机误 差,可以用组内离差平方和表示:
r m
Se
yij yi 2
i1 j1
Se:也称为误差的离差平方和
可以证明有如下平方和分解式:
ST S A Se
ST、SA、Se 的自由度分别用 fT 、f A、fe 表示,它们也有分解式: fT f A fe ,其中:
ST
r
m
(
yij
y )2
i1 j1
引起数据波动(差异)的原因不外如下两个:
一是由于因子A的水平不同,当假设H0不真 时,各个水平下指标的均值不同,这必然会使试 验结果不同,我们可以用组间离差平方和来表示, 也称因子A的离差平方和:
SA
r
m
yi
y
2
i 1
这里乘以m是因为每一水平下进行了m次试验。
试验中所考察的指标(可以是质量特性也可 以是产量特性或其它)用Y表示。Y是一个随机变 量。
单因子试验:
若试验中所考察的因子只有一个。
[例2.1-1] 现有甲、乙、丙三个工厂生产同一种零 件,为了了解不同工厂的零件的强度有无明显的差 异,现分别从每一个工厂随机抽取四个零件测定其 强度,数据如表所示,试问三个工厂的零件的平均 强度是否相同?
(5)对于给定的显著性水平α,将求得的F 值与F分布表中的临界值 F1 f A, fe 比较,当 F F1 f A, fe 时认为因子A是显著的,否则认为 因子A是不显著的。
对上例的分析 (1)计算各类和: 每一水平下的数据和为: T1 412,T2 444,T3 344 数据的总和为T=1200 (2)计算各类平方和: 原始数据的平方和为: yi2j 121492 每一水平下数据和的平方和为 Ti2 485216
当 H0 不真时,表示不同水平下的指标的均 值有显著差异,此时称因子A是显著的,否则 称因子A不显著。检验这一假设的分析方法便 是方差分析。
方差分析的三个基本假定
1. 在水平 Ai 下,指标服从正态分布N ( i ,2 ) ; 2. 在不同水平下,各方差相等; 3. 各数据 yij 相互独立。
设在一个试验中只考察一个因子A,它有r个 水平,在每一水平下进行m次重复试验,其结果用 yi1 , yi2 ,, yim 表示,i=1,2, …, r。 常常把数据列成 如下表格形式:
水平 A1 A2 … Ar
单因子试验数据表
试验数据
和
y11 , y12 ,, y1m
T1
y21 , y22 ,, y2m
T2
…
…
yr1 , yr 2 ,, yrm
Tr
均值
y1 y2
… yr
m
记第i 水平下的数据和为Ti,Ti yij ; j 1
记第i水平下的数据均值为 yi ,总均值为 y 。此 时共有n=rm个数据,这n个数据不全相同,它们的 波动(差异)可以用总离差平方和ST去表示
因子或误差的离差平方和与相应的自由度 之比称为因子或误差的均方和,并分别记为:
MS A S A f A
MSe Se fe
两者的比记为:F MSA MSe
当F F1 ( f A, fe )时认为在显著性水平 上因
子A是显著的。其中 F1 ( f A , fe ) 是自由度为 f A , fe 的F分布的1-α分位数。
S A 1304 Se 188 ST 1492
ห้องสมุดไป่ตู้
自由度
fA 2 fe 9 fT 11
均方和
F比
MS A 652 F=31.21 MSe 20.9
(5) 如果给定 =0.05,从F分布表查得
F0.95(2,9) 4.26
由于F>4.26,所以在 =0.05水平上结论是因 子A是显著的。这表明不同的工厂生产的零件强 度有明显的差异。
yi
y
2
r
Ti2
i1 m
T2 n
Se ST S A
其中 Ti 是第i个水平下的数据和;T表示 所有n=rm个数据的总和。
进行方差分析的步骤如下:
(1)计算因子A的每一水平下数据的和 T1,T2,…,Tr及总和T;
(2)计算各类数据的平方和 yi2j , Ti2 ,T 2; (3)依次计算ST,SA,Se; (4)填写方差分析表;
单因子方差分析表
来源 偏差平方和
因子A
SA
误差e
Se
总计T
ST
自由度
fA r 1 fe n r fT n 1
均方和
F比
MS A S A f A F MS A MSe MSe Se fe
各个离差平方和的计算:
ST
rm
i1 j1
yij
y
2
r
m
yi2j
i1 j1
T2
n
SA
r
m
i1
二、单因子方差分析
假定因子A有r个水平,在Ai水平下指标服 从正态分布,其均值为 i,方差为 2 ,i=1,2, …, r。每一水平下的指标全体便构成一个总体,共 有r个总体,这时比较各个总体的问题就变成比 较各个总体的均值是否相同的问题了,即要检验 如下假设是否为真:
H0 : 1 2 r
(3)计算各离差平方和:
ST=121492-12002/12=1492, SA=485216/4-12002/12=1304, Se= 1492-1304=188,
fT=3×4-1=11 fA=3-1=2 fe=11-2=9
(4)列方差分析表: [例2.1-1]的方差分析表
来源 偏差平方和
因子A 误差e 总计T
质量常用统计技术
方差分析 回归分析 试验设计
上海质量教育培训中心 2005年
第一节 方差分析
一、几个概念 二、单因子方差分析
一、几个概念
在试验中改变状态的因素称为因子,常用大写 英文字母A、B、C、…等表示。
因子在试验中所处的状态称为因子的水平。 用代表因子的字母加下标表示,记为A1,A2,… ,Ak。
三个工厂的零件强度
工厂
量件强度
甲
103 101 98 110
乙
113 107 108 116
丙
82 92 84 86
在这一例子中,考察一个因子: 因子A:工厂
该因子有三个水平:甲、乙、丙 试验指标是:零件强度
这是一个单因子试验的问题。每一水平下的 试验结果构成一个总体,现在需要比较三个总体 均值是否一致。如果每一个总体的分布都是正态 分布,并且各个总体的方差相等,那么比较各个 总体均值是否一致的问题可以用方差分析方法来 解决。
二是由于存在随机误差,即使在同一水平下 获得的数据间也有差异,这是除了因子A的水平 外的一切原因引起的,我们将它们归结为随机误 差,可以用组内离差平方和表示:
r m
Se
yij yi 2
i1 j1
Se:也称为误差的离差平方和
可以证明有如下平方和分解式:
ST S A Se
ST、SA、Se 的自由度分别用 fT 、f A、fe 表示,它们也有分解式: fT f A fe ,其中:
ST
r
m
(
yij
y )2
i1 j1
引起数据波动(差异)的原因不外如下两个:
一是由于因子A的水平不同,当假设H0不真 时,各个水平下指标的均值不同,这必然会使试 验结果不同,我们可以用组间离差平方和来表示, 也称因子A的离差平方和:
SA
r
m
yi
y
2
i 1
这里乘以m是因为每一水平下进行了m次试验。
试验中所考察的指标(可以是质量特性也可 以是产量特性或其它)用Y表示。Y是一个随机变 量。
单因子试验:
若试验中所考察的因子只有一个。
[例2.1-1] 现有甲、乙、丙三个工厂生产同一种零 件,为了了解不同工厂的零件的强度有无明显的差 异,现分别从每一个工厂随机抽取四个零件测定其 强度,数据如表所示,试问三个工厂的零件的平均 强度是否相同?
(5)对于给定的显著性水平α,将求得的F 值与F分布表中的临界值 F1 f A, fe 比较,当 F F1 f A, fe 时认为因子A是显著的,否则认为 因子A是不显著的。
对上例的分析 (1)计算各类和: 每一水平下的数据和为: T1 412,T2 444,T3 344 数据的总和为T=1200 (2)计算各类平方和: 原始数据的平方和为: yi2j 121492 每一水平下数据和的平方和为 Ti2 485216
当 H0 不真时,表示不同水平下的指标的均 值有显著差异,此时称因子A是显著的,否则 称因子A不显著。检验这一假设的分析方法便 是方差分析。
方差分析的三个基本假定
1. 在水平 Ai 下,指标服从正态分布N ( i ,2 ) ; 2. 在不同水平下,各方差相等; 3. 各数据 yij 相互独立。
设在一个试验中只考察一个因子A,它有r个 水平,在每一水平下进行m次重复试验,其结果用 yi1 , yi2 ,, yim 表示,i=1,2, …, r。 常常把数据列成 如下表格形式:
水平 A1 A2 … Ar
单因子试验数据表
试验数据
和
y11 , y12 ,, y1m
T1
y21 , y22 ,, y2m
T2
…
…
yr1 , yr 2 ,, yrm
Tr
均值
y1 y2
… yr
m
记第i 水平下的数据和为Ti,Ti yij ; j 1
记第i水平下的数据均值为 yi ,总均值为 y 。此 时共有n=rm个数据,这n个数据不全相同,它们的 波动(差异)可以用总离差平方和ST去表示