统计学基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、数据的特征值

(一)数据的位置特征值 1)平均值

如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为:

n-数据个数; x i -第i 个数据数; ∑-求和。

2)中位数

有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。

3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。

4)众数

在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。

(二)数据的离散特征值 1)极差R

测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。

2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。

无偏方差

各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示:

~

x _x _

x ∑

=--=-=n i i x x n n S s 1

2

_2)(1112

_

2

_

22

_

1)(...)

()

(x x x x x x n -+-+-∑=-n

i i x x 1

2

_

)(S = =

标准偏差s

2

(三)变异系数

以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上

上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。

_x

Ca、Cp、Cpk的计算

过程准确度指数(Ca值):表示过程特性中心位置的偏移程度,越小越好

Ca=(样本平均值-规格中心值)/(规格公差/2)

等级A:|Ca|≦12.5% 表示作业员遵守作业规范,并达规格要求

等级B :12.5%< |Ca|≦25% 表示必要时尽可能提升至A级

等级C:25%< |Ca|≦50% 表示作业员可能看错或未按标准作业,或须修改规格及作业标准。等级D:50%< |Ca| 表示应采取紧急措施,全面整改可能影响之因素,必要时应停止生产。

过程精密度能力系数(Cp值):表示过程特性分散的程度,值越大越集中。

Cp=(规格上限-规格下限)/(6×标准差)

合格:1.33≦Cp表示能力足够

警告:1.00 ≦Cp< 1.33表示能力无足够宽度,平均值稍有偏差时,不良率既会增加。

不合格:Cp< 1.00表示能力不足,有不合格品,须全数筛选,并设法缩小变异或整改规格公差。过程综合能力系数(Cpk值):同时考虑“偏移”程度及“分散程度

Cpk=(1-Ca) ×Cp

此系数为过程评价用系数,用于过程改善

客户指定Cpk值时,欲达到此Cpk值,可先探讨Ca及Cp值:“准确度”“精密度”是否有适当能力

一般客户是指定值多数为≧1.33;Cpk值≧3.00时,表示过程能力已经足够了,继续维持即可;若想进一步改善,应考虑成本效益。

Cp=(Ucl-Lsl)/6δ

Cpku=(Ucl-Xbar)/3δ

Cpkl=(Xbar-Lsl)/3δ

Cpk=min(Cpku : Cpkl)

二、 回归分析

(一)什么是回归分析

回归分析是用来研究一个指标与几个变量间的相关关系的方法。

设有两个变量x 和y ,前者为自变量,后者为因变量,并均为随机变量。当自变量X 变化时,Y 会产生相应的变化,如果具有大量或较多的统计数据(x i ,y i ),则可以用数学方法找出两者之间的统计关系y =f(x),这种数学方法称为回归分析。

当y =a +bx 时,称之为一元线性回归;

当y =f(x)为非线性函数关系时,称之为非线性回归;

当x 变量不止1个,有几个时,即有(x 1,x 2···,x n ),则y =f (x 1,x 2···,x n )称之为多元回归。

当有y =a +b 1 x 1+b 2 x 2+···+b n x n 时,称之为多元线性回归,否则为多元非线性回归。

回归分析可用于预测、质量控制等方面。

(二) 一元线性回归方程的计算方法

设一元线性回归方程的表达式为: y=a+bx

现在给出了n 对数据(x i , y i ),要求根据这些数据去估计a 与b 的值。则:

其中 L xx:----x 的离差平方和 L yy ----y 的离差平方和 L xy ----x ,y 的离差成积之和

2

n

1

i )

Lx x x x i -=∑

=(2

n

1

i )

Lyy y y i -=∑

=(x

b y -=a xx xy L L =b )y )(Lx y n

1

i y x x i i --=∑

=(

三、统计过程控制基本概念

Statistical Process Control(SPC---统计过程控制)的概念是:应用统计技术对过程中的各个阶段进行评估和检察,保持过程处于可接受的和稳定的水平,以保证产品与服务满足要求的均匀性。

这里的统计技术涉及到数理统计内容,但所应用的主要工具是控制图。

SPC可以判断过程的异常,及时告警。但是不能告知此异常是什么因素引起的,发生于何处。20世纪80年代起,我国的张公绪先生提出Statistical Process Diagnosis理论(SPD---统计过程诊断)。20世纪90年代起又发展为Statistical Process Adjustment (SPA---统计过程调整)。三者循环关系如下:

SPC---告诉过程是否有异常

SPD---告诉过程是否有异常,若异常,告知问题出在哪里

SPA---告诉过程是否有异常,若异常,告知问题出在哪里,如何进行调整

所以SPC是质量改进循环的首要步骤,应该熟练掌握运用。

相关文档
最新文档