第五章离散趋势的测量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
庭人均月收入的四分位差为:
• QU—QL=?
• 上四分位数 下四分位数: • 数值型分组数据的四分位数(计算公式)
• 四分位差主要用于测度顺序数据的离散程
度。当然,对于数值型数据也可以计算四 分位差,但不适合于分类数据。
• 优缺点:主要是避免了全距受极端值影响
的缺点,其他优缺点同全距:数据利用率 低,信息丧失严重;受抽样变动影响大。
第五章 离散趋势测量法
本章主要内容:
离散趋势的测定方法(重、难点) 各种离散趋势测量指标的比较
第一节 变异指标相关概念
• 一、变异指标含义
• 平均指标是统计总体中各单位某一数量标志的
一般水平,反映了总体分布的集中趋势。集中 趋势只是数据分布的一个特征,它所反映的是 各变量值向其中心值聚集的程度。而这种聚集 的程度显然有强弱之分,这与各变量值的差异 有着密切的联系。变量值的差异越大,数值的 集中趋势越弱,变量值的差异越小,数据的集 中趋势越强。因此,要全面描述数据的分布特 征,除了要对数据集中趋势加以度量外,还要 对数据的差异程度进行度量。数据的差异程度 就是各变量值远离其中心值的程度,因此也称 为离中趋势。
特征值,因此,它在统计分析、统计推断 中具有很重要的作用。具体可以概括为以 下几点:
• 1.反映总体各单位变量值分布的均衡性
• 一般来说,标志变异指标数值越大,总体
各单位变量值分布的离散趋势越高、均衡 性越低,反之,变量值分布的的离散趋势 越低、均衡性就越高。
• 2.判断平均指标对总体各单位变量值代表性的高
• QU的位置=
3(n+1) 4
=
3
(9+1) 4
=7.5
,即QU在第7个数值
(1500)和第8个数值(1630)之间0.5的
位置上,因此
• QU=(1500+1630)÷2=1565(元)
• QL和QU之间包含了50%的数据,因此,我
们可以说有一半的家庭人均月收入在815~ 1565元之间。
• 根据例3.2资料计算上下四分位数,那么家
Q·D=(Q3-Q1) /2
• 四分位差反映了中间50%数据的离散程度,
其数值越小,说明中间的数据越集中;数 值越大,说明中间的数据越分散。此外, 由于中位数处于数据的中间位置,因此, 四分位差的大小在一定程度上也说明了中 位数对一组数据的代表程度。
• [例3.2]在某城市中随机抽取9个家庭,调查
缺点:
(1)受极端值影响大,遇含开口组的资料时 无法计算;
(2)数据利用率低,信息丧失严重; (3)受抽样变动影响大(一般大样本的全距会 比小样本的全距大)。
二、四分位差(inter-quartile range) 上四分位数与下四分位数之差的平均数,称
为四分位差,亦称为内距或四分间距。 四分位差的计算方法:
• 从计算结果看,甲、乙两组平均生产件数
相等,但由于甲组的平均差(1.2件)小于 乙组的平均差(16件),因而其平均数的 代表性比乙组大。
第三节、平均差(Mean deviation)
• 平均差是各变量值与其算术平均数离差绝
对值的平均数,用A.D表示。根据掌握资料 的不同,平均差有以下两种计算方法:
• 1. 简单平均法 • 对于未分组资料,采用简单平均法。其计
算公式为:
• [例3.13] 某厂甲、乙两组工人生产某种产
品的产量资料如表3.8所示。
最小值。由于全距是根据一组数据的两个极值表
示的,所以全距表明了一组数据数值的变动范围。
越大,表明数值变动的范围越大,即数列中各变
量值差异大,反之,越小,表明数值变动的范围 越小,即数列中各变量值差异小。
• [例3.12] 例3.1给出的40个同学统计学的考
试成绩,其最高成绩为99分,最低成绩为 36,则全距为:
离势,主要有异众比率、标准差系数、平 均差系数和一些常用的偏态系数。
第二节、全距与四分位差
• 一、全距
• 1、未分组资料计算公式
• 全距又称极差,是一组数据的最大值与最小值之
差,用表示。计算公式为:in( X i )
• 式中,max(Xi) 、min( Xi分) 别表示为一组数据的最大值与
得到每个家庭的人均月收入数据如下(单 位:元),1500、750、780、1080、850、 960、2000、1250、1630,计算人均月收 入的四分位数。
•
解:QL的位置=
n+1 4
=
9+1 4
=2.5
,即QL在第2个数值(780)
和第3个数值(850)之间0.5的位置上,因
此
• QL=(780+850)÷2=815(元)
低
• 平均指标作为总体各单位某一数量标志的代表值,
其代表性的高低与总体差异程度有直接关系:总 体的标志变异指标值愈大,平均数的代表性愈低; 反之,标志变异指标值愈小,平均数代表性愈高。 另一方面,平均指标代表性的高低同总体各单位 变量值分布的均衡性也有直接关系:总体各单位 变量值分布的均衡性越高,平均指标代表性就越 高;反之,总体各单位变量值分布的均衡性越低, 平均指标代表性就越低。
• 3.在实际工作中,借助标志变异指标还可
以对社会经济活动过程的节奏性和均衡性 进行评价
• 4.标志变异指标是衡量风险大小的重要指
标。
• 四、变异指标的分类 • 变异指标按数量关系来分有以下两类:
• 凡用绝对数来表达的变异指标,统称绝对
离势,主要有极差、平均差、四分位差、 标准差等。
• 凡用相对数来表达的变异指标,统称相对
• 二、变异指标的概念
• 在统计研究中,通常把一组数值之间的差
异程度叫做标志变动度。测定标志变动度 大小的指标叫做标志变异指标。标志变动 度与标志变异指标在数值上成正比。如果 说平均指标说明总体分布的集中趋势的话, 标志变异指标则说明总体分布的离中趋势。
• 三、变异指标的作用
• 变异指标是描述数据分布的一个很重要的
• R 99 36 63 (分)
2、分组资料计算公式
R=最高组上限 - 最低组下限
• R=最高组组中组-最低组组中值 • R=最高组组中组-最低组下限 • R=最高组上限-最低组组中值 • 如果资料经过整理,并形成组距分配数列,
全距可近似表示为:
• R≈最高组上限值-最低组下限值
3、优缺点: 优点:计算简单,易于理解。
• QU—QL=?
• 上四分位数 下四分位数: • 数值型分组数据的四分位数(计算公式)
• 四分位差主要用于测度顺序数据的离散程
度。当然,对于数值型数据也可以计算四 分位差,但不适合于分类数据。
• 优缺点:主要是避免了全距受极端值影响
的缺点,其他优缺点同全距:数据利用率 低,信息丧失严重;受抽样变动影响大。
第五章 离散趋势测量法
本章主要内容:
离散趋势的测定方法(重、难点) 各种离散趋势测量指标的比较
第一节 变异指标相关概念
• 一、变异指标含义
• 平均指标是统计总体中各单位某一数量标志的
一般水平,反映了总体分布的集中趋势。集中 趋势只是数据分布的一个特征,它所反映的是 各变量值向其中心值聚集的程度。而这种聚集 的程度显然有强弱之分,这与各变量值的差异 有着密切的联系。变量值的差异越大,数值的 集中趋势越弱,变量值的差异越小,数据的集 中趋势越强。因此,要全面描述数据的分布特 征,除了要对数据集中趋势加以度量外,还要 对数据的差异程度进行度量。数据的差异程度 就是各变量值远离其中心值的程度,因此也称 为离中趋势。
特征值,因此,它在统计分析、统计推断 中具有很重要的作用。具体可以概括为以 下几点:
• 1.反映总体各单位变量值分布的均衡性
• 一般来说,标志变异指标数值越大,总体
各单位变量值分布的离散趋势越高、均衡 性越低,反之,变量值分布的的离散趋势 越低、均衡性就越高。
• 2.判断平均指标对总体各单位变量值代表性的高
• QU的位置=
3(n+1) 4
=
3
(9+1) 4
=7.5
,即QU在第7个数值
(1500)和第8个数值(1630)之间0.5的
位置上,因此
• QU=(1500+1630)÷2=1565(元)
• QL和QU之间包含了50%的数据,因此,我
们可以说有一半的家庭人均月收入在815~ 1565元之间。
• 根据例3.2资料计算上下四分位数,那么家
Q·D=(Q3-Q1) /2
• 四分位差反映了中间50%数据的离散程度,
其数值越小,说明中间的数据越集中;数 值越大,说明中间的数据越分散。此外, 由于中位数处于数据的中间位置,因此, 四分位差的大小在一定程度上也说明了中 位数对一组数据的代表程度。
• [例3.2]在某城市中随机抽取9个家庭,调查
缺点:
(1)受极端值影响大,遇含开口组的资料时 无法计算;
(2)数据利用率低,信息丧失严重; (3)受抽样变动影响大(一般大样本的全距会 比小样本的全距大)。
二、四分位差(inter-quartile range) 上四分位数与下四分位数之差的平均数,称
为四分位差,亦称为内距或四分间距。 四分位差的计算方法:
• 从计算结果看,甲、乙两组平均生产件数
相等,但由于甲组的平均差(1.2件)小于 乙组的平均差(16件),因而其平均数的 代表性比乙组大。
第三节、平均差(Mean deviation)
• 平均差是各变量值与其算术平均数离差绝
对值的平均数,用A.D表示。根据掌握资料 的不同,平均差有以下两种计算方法:
• 1. 简单平均法 • 对于未分组资料,采用简单平均法。其计
算公式为:
• [例3.13] 某厂甲、乙两组工人生产某种产
品的产量资料如表3.8所示。
最小值。由于全距是根据一组数据的两个极值表
示的,所以全距表明了一组数据数值的变动范围。
越大,表明数值变动的范围越大,即数列中各变
量值差异大,反之,越小,表明数值变动的范围 越小,即数列中各变量值差异小。
• [例3.12] 例3.1给出的40个同学统计学的考
试成绩,其最高成绩为99分,最低成绩为 36,则全距为:
离势,主要有异众比率、标准差系数、平 均差系数和一些常用的偏态系数。
第二节、全距与四分位差
• 一、全距
• 1、未分组资料计算公式
• 全距又称极差,是一组数据的最大值与最小值之
差,用表示。计算公式为:in( X i )
• 式中,max(Xi) 、min( Xi分) 别表示为一组数据的最大值与
得到每个家庭的人均月收入数据如下(单 位:元),1500、750、780、1080、850、 960、2000、1250、1630,计算人均月收 入的四分位数。
•
解:QL的位置=
n+1 4
=
9+1 4
=2.5
,即QL在第2个数值(780)
和第3个数值(850)之间0.5的位置上,因
此
• QL=(780+850)÷2=815(元)
低
• 平均指标作为总体各单位某一数量标志的代表值,
其代表性的高低与总体差异程度有直接关系:总 体的标志变异指标值愈大,平均数的代表性愈低; 反之,标志变异指标值愈小,平均数代表性愈高。 另一方面,平均指标代表性的高低同总体各单位 变量值分布的均衡性也有直接关系:总体各单位 变量值分布的均衡性越高,平均指标代表性就越 高;反之,总体各单位变量值分布的均衡性越低, 平均指标代表性就越低。
• 3.在实际工作中,借助标志变异指标还可
以对社会经济活动过程的节奏性和均衡性 进行评价
• 4.标志变异指标是衡量风险大小的重要指
标。
• 四、变异指标的分类 • 变异指标按数量关系来分有以下两类:
• 凡用绝对数来表达的变异指标,统称绝对
离势,主要有极差、平均差、四分位差、 标准差等。
• 凡用相对数来表达的变异指标,统称相对
• 二、变异指标的概念
• 在统计研究中,通常把一组数值之间的差
异程度叫做标志变动度。测定标志变动度 大小的指标叫做标志变异指标。标志变动 度与标志变异指标在数值上成正比。如果 说平均指标说明总体分布的集中趋势的话, 标志变异指标则说明总体分布的离中趋势。
• 三、变异指标的作用
• 变异指标是描述数据分布的一个很重要的
• R 99 36 63 (分)
2、分组资料计算公式
R=最高组上限 - 最低组下限
• R=最高组组中组-最低组组中值 • R=最高组组中组-最低组下限 • R=最高组上限-最低组组中值 • 如果资料经过整理,并形成组距分配数列,
全距可近似表示为:
• R≈最高组上限值-最低组下限值
3、优缺点: 优点:计算简单,易于理解。