分布的离中趋势

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目
分布的离中趋势
二、分布的离中趋势
数据的离散程度是数据分布的另一个重要特征, 它反映的是各变量值远离其中心值的程度,又称离中 趋势。数据的离散程度越大,集中趋势的测度值对该 组数据的代表性越差;反之,其代表性越好。常用的 描述数据离散程度的测度值有全距、四分位差 (quartile deviation)、方差(variance)、标准差 (standard deviation)和离散系数等。
二、分布的离中趋势
【例4-20】 某年级学生的资料见表4-13,求成数的标准差。
表4-13 某年级学生的资料
二、分布的离中趋势
解:成数的平均数为 成数的标准差为
由具体数值可计算出 男生成数的标准差为
二、分布的离中趋势
四 、 离散系数
上面介绍的各离散程度测度值都是反映数据分散程度的绝对值。 其数值的大小,一方面取决于原变量值本身水平的高低,即与变量的 均值大小有关,变量值的绝对水平越高,离散程度的测度值越大;变 量值的绝对水平越低,离散程度的测度值越小。另一方面,它们与原 变量值的计量单位相同,但当采用不同计量单位计量变量值时,其离 散程度的测度值将不同。因此,对于平均水平不同或计量单位不同的 不同组别的变量值,是不能直接用标准差比较的。为了消除变量值平 均水平高低和计量单位对离散程度测度值的影响,需要计算离散系数。
二、分布的离中趋势
二、 四分位差
1. 四分位差的概念
四分位数是通过三个点将全部数据四等分。如 果用上四分位数减去下四分位数,可得内四分位间 距或四分位间距。这个指标与一般极差的区别在于 计算范围较窄,因而排除了部分极端值对变异指标 的影响。但在运用指标进行分析时,人们一般习惯 于取四分位间距的一半(四分位差,用QD表示)。
二、分布的离中趋势
2. 四分位差的计算
计算四分位差的步骤是:首先求 出Q1、Q3所在的位置;然后根据位 置确定其对应标志值,即Q1、Q3; 最后取这两者差额的一半。
二、分布的离中趋势
三 、 方差和标准差
1. 方差和标准差的概念
方差是总体各单位标志值与其算术平均 数的离差平方和的算术平均数,用σ2表示。 标准差又称均方差,是总体各单位标志值与 其平均数离差平方和的算术平均数的平方根 ,用σ表示。标准差是测定离散程度最常用、 最重要的指标。
二、分布的离中趋势
一 、 全距
全距也称为极差,它是表明总体单ห้องสมุดไป่ตู้标志数值
变动范围的指标,是总体各单位全部变量值中两个极
端值(最大值和最小值)之差,用R表示。其计算公
式为
R=xmax-xmin
(4-17)
式中,R为全距;xmax为标志的最大值;xmin为标
志的最小值。
二、分布的离中趋势
用全距衡量总体分布的离散程度,计算 方法简单,便于理解,能说明总体中各标志 值变动的最大范围。但全距是根据总体中的 两个极端标志值进行计算的,并不能反映所 有标志值差异的大小和总体单位的分配情况 ,并且受极端值的影响较大。
二、分布的离中趋势
【例4-22】 某企业有甲、乙两个车间,甲车间的平均产量为81件,标 准差为9.9件,乙车间的生产情况见表4-14。试计算乙车间的平均产量, 并比较甲、乙两个车间哪个车间的平均产量更具代表性。
表4-14 乙车间的生产情况
二、分布的离中趋势
解:(1)乙车间的平均产量为 乙车间平均产量的标准差为
二、分布的离中趋势
(1)样本方差的 计算。
(2)样本标准差 的计算。
二、分布的离中趋势
4. 标准差的计算应用
(1)未分组数据标准差的计算应用。 【例4-18】 某工厂某车间甲、乙两个组各有10名工人,每人日 产某种零件数(单位:件)为 甲组:20,21,21,22,22,22,23,23,23,23 乙组:14,15,16,21,22,22,23,28,29,30 试计算两组工人的日产量的标准差。 解:计算过程见表4-11。
二、分布的离中趋势
表4-11 甲、乙两组工人日产量的标准差计算
从计算结果可以看出,在甲、乙两组工人平均日产量相等的情况下,乙 组的标准差大于甲组,因而乙组平均数的代表性更差一些。
二、分布的离中趋势
(2)已分组数据标准差的计算应用。 由于方差的计算单位为平方单位,不易于直接比较,因而,标准
差在经济统计中应用得更为广泛。 以上计算的标准差是通过一系列的变量值与平均数计算后而得出
二、分布的离中趋势
2. 方差和标准差的计算
(1)方差的 计算。
(2)标准差的 计算。
二、分布的离中趋势
3. 样本方差和样本标准差的计算
样本方差是样本各单位标志值与其 算术平均数的离差平方和的算术平均 数,用s2表示。样本标准差是样本各单 位标志值与其平均数离差平方和的算 术平均值的平方根,用s表示。
二、分布的离中趋势
在统计实践中,有时需要计算成数的标准差,即是非标志的标准 差。是非标志把总体分成两个部分:一部分具有某种标志,另一部 分不具有此种标志。这种用“是”或“非”来表示总体单位特征的 标志,称为是非标志。
计算是非标志的标准差时要把是非标志从质的差别转化为量的差 别,一般把“是”的标志值用“1”代替,把“非”的标志值用 “0”代替;总体单位数用N表示;具有所研究的标志的单位数用N1 表示,成数用P表示,P=N1/N;不具有所研究的标志的单位数用N0 表示,成数用Q表示,Q=N0/N。显然,N1+N0=N,P+Q=1。
量的变动程度更大。
由σ乙=9.16(件) 从计算结果看,虽然<σ甲,但是由于甲、乙两个车间的平均产量 不等,故不能直接肯定说明甲车σ乙间产量的变动程度比乙车间大,应该通过计算标准差 系数来加以判断。σ乙=9.16(件)
二、分布的离中趋势
(2)甲车间的标准差系数为
乙车间的标准差系数为 因为V甲<V乙,所以,甲车间的平均产量更具有代表性,即乙车间产
的变异结果,它是针对变量(数量标志)现象而言的。如果是品质标志, 它所表现的属性只分为两种情况。如性别这一品质标志只分为男、女 两种属性;产品质量这一品质标志只分为合格和不合格两种属性;等 等。通常,要研究的那个属性称为“是”,非研究的那个属性称为 “非”。我们经常研究“是”属性所占的比重,即成数。
相关文档
最新文档