变异系数、偏度、峰度的认识及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变异系数、偏度、峰度的认识及应用
一、变异系数
1、名词解释:
变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。简单来说就是:在表示离散程度上,标准差并不是全能的,当度量单位或平均数不同时,只能用变异系数了,它也是表示离散程度,是标准差与平均数的比值称为变异系数,记为C·V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。
2、计算公式
变异系数C.V =(标准偏差SD÷平均值MN )× 100%
3、应用:
例题:已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。
此例观测值虽然都是体重,单位相同,但它们的平均数不相同,只能用变异系数来比较其变异程度的大小。
由于,长白成年母猪体重的变异系数:C.V = 10.5 / 190 * 100% =
5.53%
大约克成年母猪体重的变异系数:C.V = 8.5 / 196 * 100% = 4.34%
所以,长白成年母猪体重的变异程度大于大约克成年母猪。
二、偏度
1、名词解释:
偏度以bs表示,xi是样本测定值,是样本n次测定值的平均值。表征概率分布密度曲线相对于平均值不对称程度的特征数。
2、偏度与与正态分布的关系:
正态分布的偏度为0,两侧尾部长度对称。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。若知道分布有可能在偏度上偏离正态分布时,可用偏离来检验分布的正态性。右偏时一般算术平均数>中位数>众数,左偏时相反,即众数>中位数>平均数。正态分布三者相等。
3、计算方法:
其中i X 是第i 个样本,sd 是样本标准差,1g 是总体偏度的有偏估计。
三、峰度
1、名词解释:
峰度,又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了尾部的厚度。
2、特点:
峰度以k b 表示,i Y 是样本测定值,bar Y 是样本n 次测定值的平均值,s
为样本标准差。正态分布的峰度为3。
3k b <称分布具有不足的峰度,3k b >称分布具有过度的峰度。若知道分布有可能在峰度上偏离正态
分布时,可用峰度来检验分布的正态性。
3、计算方法:
随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比值。
某单位引体向上测试总体分布情况分析
一、测试成绩
X(单位:个):
i
三月份测试成绩:
8、8、10、7、11、14、6、5、7、7、9、10、12、4、6、8、7、11、8、
9、10、12、9、8、6、5、8、9、5、8、8、10、8、11
五月份测试成绩:
4、10、9、4、11、6、8、9、7、11、12、7、9、6、10、8、9、7、8、14、12、9、8、7、8、9、
5、7、8、10、8、5、
6、8、14
二、数据分析:
三月份:
样本容量:35
n=
样本方差:13.34602
五月份:
样本容量:35
m=
样本方差:14.14776
三、图像:
如上图所示,其中横轴为引体向上的个数,纵轴为达到相同个数的频数。
由上图可以发现,三月份我单位成员引体向上测试总体分布情况服从28.352941,13.34602σμ==的正态分布;五月份我单位成员引体向上测试总体分布情况服从28.371429,14.14776σμ==的正态分布。
四、假设检验:
现给定显著性水平0.05α=,进行假设检验。 提出原假设:00:H μμ= ()0,1N 2113.34602s =,2214.14776s =. )2212
s =所以统计量的值