统计学基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、数据的特征值
(一)数据的位置特征值 1)平均值
如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为:
n-数据个数; x i -第i 个数据数; ∑-求和。
2)中位数
有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。
3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。
4)众数
在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。
(二)数据的离散特征值 1)极差R
测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。
2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。
无偏方差
各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示:
~
x _x _
x ∑
=--=-=n i i x x n n S s 1
2
_2)(1112
_
2
_
22
_
1)(...)
()
(x x x x x x n -+-+-∑=-n
i i x x 1
2
_
)(S = =
标准偏差s
2
(三)变异系数
以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上
上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。
_x
Ca、Cp、Cpk的计算
过程准确度指数(Ca值):表示过程特性中心位置的偏移程度,越小越好
Ca=(样本平均值-规格中心值)/(规格公差/2)
等级A:|Ca|≦12.5% 表示作业员遵守作业规范,并达规格要求
等级B :12.5%< |Ca|≦25% 表示必要时尽可能提升至A级
等级C:25%< |Ca|≦50% 表示作业员可能看错或未按标准作业,或须修改规格及作业标准。等级D:50%< |Ca| 表示应采取紧急措施,全面整改可能影响之因素,必要时应停止生产。
过程精密度能力系数(Cp值):表示过程特性分散的程度,值越大越集中。
Cp=(规格上限-规格下限)/(6×标准差)
合格:1.33≦Cp表示能力足够
警告:1.00 ≦Cp< 1.33表示能力无足够宽度,平均值稍有偏差时,不良率既会增加。
不合格:Cp< 1.00表示能力不足,有不合格品,须全数筛选,并设法缩小变异或整改规格公差。过程综合能力系数(Cpk值):同时考虑“偏移”程度及“分散程度
Cpk=(1-Ca) ×Cp
此系数为过程评价用系数,用于过程改善
客户指定Cpk值时,欲达到此Cpk值,可先探讨Ca及Cp值:“准确度”“精密度”是否有适当能力
一般客户是指定值多数为≧1.33;Cpk值≧3.00时,表示过程能力已经足够了,继续维持即可;若想进一步改善,应考虑成本效益。
Cp=(Ucl-Lsl)/6δ
Cpku=(Ucl-Xbar)/3δ
Cpkl=(Xbar-Lsl)/3δ
Cpk=min(Cpku : Cpkl)
二、 回归分析
(一)什么是回归分析
回归分析是用来研究一个指标与几个变量间的相关关系的方法。
设有两个变量x 和y ,前者为自变量,后者为因变量,并均为随机变量。当自变量X 变化时,Y 会产生相应的变化,如果具有大量或较多的统计数据(x i ,y i ),则可以用数学方法找出两者之间的统计关系y =f(x),这种数学方法称为回归分析。
当y =a +bx 时,称之为一元线性回归;
当y =f(x)为非线性函数关系时,称之为非线性回归;
当x 变量不止1个,有几个时,即有(x 1,x 2···,x n ),则y =f (x 1,x 2···,x n )称之为多元回归。
当有y =a +b 1 x 1+b 2 x 2+···+b n x n 时,称之为多元线性回归,否则为多元非线性回归。
回归分析可用于预测、质量控制等方面。
(二) 一元线性回归方程的计算方法
设一元线性回归方程的表达式为: y=a+bx
现在给出了n 对数据(x i , y i ),要求根据这些数据去估计a 与b 的值。则:
其中 L xx:----x 的离差平方和 L yy ----y 的离差平方和 L xy ----x ,y 的离差成积之和
2
n
1
i )
Lx x x x i -=∑
=(2
n
1
i )
Lyy y y i -=∑
=(x
b y -=a xx xy L L =b )y )(Lx y n
1
i y x x i i --=∑
=(
三、统计过程控制基本概念
Statistical Process Control(SPC---统计过程控制)的概念是:应用统计技术对过程中的各个阶段进行评估和检察,保持过程处于可接受的和稳定的水平,以保证产品与服务满足要求的均匀性。
这里的统计技术涉及到数理统计内容,但所应用的主要工具是控制图。
SPC可以判断过程的异常,及时告警。但是不能告知此异常是什么因素引起的,发生于何处。20世纪80年代起,我国的张公绪先生提出Statistical Process Diagnosis理论(SPD---统计过程诊断)。20世纪90年代起又发展为Statistical Process Adjustment (SPA---统计过程调整)。三者循环关系如下:
SPC---告诉过程是否有异常
SPD---告诉过程是否有异常,若异常,告知问题出在哪里
SPA---告诉过程是否有异常,若异常,告知问题出在哪里,如何进行调整
所以SPC是质量改进循环的首要步骤,应该熟练掌握运用。