(六西格玛管理)数理统计_方差与标准差

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(六西格玛管理)数理统计_方差与标准差

心理和教育方面的实验或调查所得到的数据,大均具有随机变量的性质。而对这些随机变量的描述,仅有前壹章所讲集中趋势的度量是不够的。集中量数只描述数据的集中趋势和典型情况,它仍不能说明壹组数据的全貌。数据除典型情况之外,仍有变异性的特点。对于数据变异性即离中趋势进行度量的壹组统计量,称作差异量数,这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等等。

第壹节方差和标准差

方差(Variance)也称变异数、均方。作为统计量,常用符号S2表示,作为总体参数,常用符号σ2表示。它是每个数据和该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差,于数理统计中又常称之为二阶中心矩或二级动差。它是度量数据分散程度的壹个很重要的统计特征数。标准差(Standarddeviation)即方差的平方根,常用S或SD表示。若用σ表示,则是指总体的标准差,本章只讨论对壹组数据的描述,尚未涉及总体问题,故本章方差的符号用S2,标准差的符号用S。符号不同,其含义不完全壹样,这壹点望读者能够给予充分的注意。

壹、方差和标准差的计算

(壹)未分组的数据求方差和标准差

基本公式是:

(3—la)

(3—1b)

表3—1说明公式3—1a和3—1b的计算步骤

表3—1未分组的数据求方差和标准差

应用3—1公式的具体步骤:①先求平均数X=36/6=6;②计算X i-X;③求(Xi-X)2即离均差x2;④将各离均差的平方求和(∑x2);⑤代入公式

3—1a和3—1b求方差和标准差。具体结果如下:

S2=10/6=1.67

(二)已分组的数据求标准差和方差

数据分组后,便以次数分布表的形式出现,这时原始数据不见了,若计算方差和标准差可用下式:

(3—3a)

(3—3b)

式中d=(Xc-AM)/i,AM为估计平均数

Xc为各分组区间的组中值

f为各组区间的次数

N=Σf为总次数或各组次数和

i为组距。

下面以表1—8数据为例,说明分组数据求方差和标准差的步骤: 表3—2次数分布表求方差和标准差

具体步骤:

①设估计平均数AM,任选壹区间的Xc充任;

②求d

⑧用f乘d,且计算Σfd;

④用d和fd相乘得fd2,且求Σfd2;

⑤代入公式计算。

二、方差和标准差的意义

方差和标准差是表示壹组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述和统计分析中最常应用的差异量数。它基本具备壹个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差均随之变化;②有壹定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这壹点和其他差异

量数比较稍有不足,但其意义仍是较明白的。

除上述之外,方差仍具有可加性特点,它是对壹组数据中造成各种变异的总和的测量,能利用其可加性分解且确定出属于不同来源的变异性(如组间、组内等)且可进壹步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。于描述统计部分,只需要标准差就足以表明壹组数据的离中趋势了。标准差比其他各种差异量数具有数学上的优越性,特别是当已知壹组数据的平均数和标准差后,便可知占壹定百分比的数据落于平均数上下各俩个标准差,或三个标准差之内。对于任何壹个数据集合,至少有1壹1/h2的数据落于平均数的h(大于1的实数)个标准差之内。(切比雪夫定理)。例如某组数据的平均数为50,标准差是5,则至少有75%(1壹1/22)的数据落于50-2*5至50+2*5即40至60之间,至少有88.9%(1壹1/32)的数据落于50-3*5至50+3*5=35—65之间(h=2,1-1/h2=1-1/22=3/4=75%,h=3,-1/h2=1-1/32=8/9=88.9%)。

如果数据是呈正态分布,则数据将以更大的百分数落于平均数上下俩个标准差之内(95%)或三个标准差之内(99.%)。

三、由各小组的标准差求总标准差

由于方差具有可加性特点,于已知几个小组的方差或标准差的情况下,能够计算出几个小组联合于壹起的总的方差或标准差。这种计算常于科研协作中应用,例如先了解各班学生情况,再了解全年级情况;或先了解各年级情况,再了解全校总的情况。但这种方差或标准差的合成,只有于应用同壹种观测手段,测量的是同壹个特质,只是样本不同时,才能应用。

计算总方差或总标准差的公式如下;

(3—4a)

(3—4b)

式中为总方差

为总标准差

N1…N n为各小组数据个数

为总平均数为各小组的平均数

四、标准差的应用

(壹)差异系数(Coefficientofvariation)

当所观测的样本水平比较接近,而且是对同壹个特质使用同壹种测量工具进行测量时,要比较不同样本之间离散程度的大小,壹般可直接比较标准差或方差的大小-标准差的值大说明该组数据较分散,若标准差小,则说明该组数据较集中。标准差的单位和原数据的单位相同,因而有时称它为绝对差异量。于对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:①俩个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?②即使使用的是同+种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?于第壹种情况下,标准差的单位不同,显然不能直接比较标准差的大小。第二种情况虽然标准差的单位相同,但俩样本的水平不同,这可从平均数的大小明显不同确定。通常情况下,平均数的值较大,其标准差的值壹般也较大,平均数的值较小,其标准差的值也较小。这种情况下,若直接比较标准差取值的大小,借以比较不同样本的分散情况是无意义的。可见,上述俩种情况下,若用绝对差异量进行直接比较以确定其分散程度的大小是不行的,这时可用相对差异量进行比较。最常用的相对差异量就是差异系数。差异系数,.又称变异系数、相对标准差等,通常用符号CV表示,其计算如下,

CV=S/M*100%(3—5)

式中S为某样本的标准差

M为该样本的平均数。

差异系数于心理和教育研究中常用于:①同壹团体不同观测值离散程度的比较,②对于水平相差较大,但进行的是同壹种观测的各种团体,进

行观测值离散程度的比较。

例2已知某小学壹年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差为6.2厘米,问体重和身高的离散程

度哪个大?

相关文档
最新文档