第4章数据分布特征的测度(修改版)
统计学第四章课后习题答案
![统计学第四章课后习题答案](https://img.taocdn.com/s3/m/306b5e45ac02de80d4d8d15abe23482fb4da0267.png)
第四章一.思考题1、一组数据的分布特征可以从哪几个方面进行测度?答:可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。
2、怎样理解平均数在统计学中的地位?答:平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。
从统计学思想上看,平均数是一组数据的重心所在,是数据误差相互抵消后的必然结果。
3、简述四分位数的计算方法。
答:四分位数是一组数据排序后处于25%和75%位子上的值。
四分位数是通过3个点将全部数据等分成4分,其中每部分包含25%的数据。
中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上的数值和处在75%位置上的数值。
它是根据为分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数据就是四分位数。
4、对于比率数据的平均数为什么采用几何平均?答:几何平均数是适用于特殊数据的一种平均数,主要适用于计算平均比率。
当所掌握的变量值本身是比率的形式时,采用几何平均法计算平均比率更为合理。
5、简述众数、中位数、平均数的特点和应用场合。
答:众数是数据中出现次数次数最多的变量值。
主要应用于分类数据。
中位数是一组数据排序后处于中间位置的变量值,其适用于顺序数据。
平均数也称均值,它是一组数据相加后除以数据个数的结果,是集中去世的主要测量值,它适用于数值型数据。
6、简述异众比率、四分位差、方差、标准差的使用场合。
答:异众比率主要适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。
四分位差主要用于测度顺序数据的离散程度。
方差和标准差适用于测度数值型数据的离散程度。
7、标准分数有哪些用途?答:首先是比较不同单位和不同质数据的位置。
其次是和正态分布结合起来,求得概率和标准分值之间的对应关系。
还有就是在假设检验和估计中应用。
第4章 数据分布特征的度量(1).ppt
![第4章 数据分布特征的度量(1).ppt](https://img.taocdn.com/s3/m/a5632ee7bceb19e8b9f6ba13.png)
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
例4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的 原始数据。
要求 试计算计算该班35名学生统计学考试成绩的众数。 解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
MO
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
4.1 集中趋势的度量
原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据 分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数 据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和 内在联系,还应对数据分布特征进行综合性的度量。
数据分布特征的度量包括三个方面的内容,一是数据分布的集中趋势, 反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是 数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的 综合程度;三是数据分布的偏态和峰度,反映各个总体单位的数值水平 的分布形态是对称或偏倚,平坦或尖耸的具体数值。
4.1.1众数 众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的
统计学习题答案 4~9章
![统计学习题答案 4~9章](https://img.taocdn.com/s3/m/876a2e3cc281e53a5802ff58.png)
统计学
第4章 数据分布特征的测度
4.1 一家汽车零售店的10名销售人员5月份销售的汽 车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数; M 0 10,M e 10,x 9.6, (2)根据定义公式计算四分位数;QL 5.5,QU 12, (3)计算销售量的标准差;
n ( xi x )3 1.08
(4)计算偏态系数和峰态系数;
(n 1)(n 2) s 4 2 2 n(n 1) ( xi x ) 3[ ( xi x ) ] (n 1)
3
(n 1)(n 2)(n 3)s
4
0.77
(5)对网民年龄的分布特征进行综合分析。 样本数据的均值为24岁,但标准差较大,说明网民 年龄之间差异较大.
0
30
60
经管类 核心课程
统计学
第3章 数据的整理与显示
3.1 为评价家电行业售后服务的质量,随机抽取了由 100家庭构成的一个样本。服务质量的等级分别 表示为:A.好;B.较好;C.一般;D.较差;E.差。 调查结果如下表:
B E C C A D C B A E
D
A B C D B
A
D A B A E
SK 0.203,K 0.688
600以上
合计
11
120
(2) 计算分布的偏态系数和峰态系数。
经管类 核心课程
统计学
第4章 数据分布特征的测度
4.7 为研究少年儿童的成长发育状况,某研究所的 一位调查人员在某城市抽取100名7~17岁的少 年儿童作为样本,另一位调查人员则抽取了 1000名7~17岁的少年儿童作为样本。请回答下 面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的 少年儿童的平均身高较大?或者这两组样本的 平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的 少年儿童身高的标准差较大?或者这两组样本 的标准差相同?
第四章 数据分布特征度量
![第四章 数据分布特征度量](https://img.taocdn.com/s3/m/370fb7ed6294dd88d0d26be7.png)
220-230 230-240 合计
4 5 120
115 120 -
9 5 -
二、定序数据:中位数/四分位数
2. 四分位数(Quartile) 一组数据排序后处于25%、75%位臵上的变量值
25% 25% 25% 25%
QL
QM
QU
四分位数的计算 数据排序 确定四分位数位臵(n/4、 3n/4 ) 确定该位臵上的数值(QL、QU)
1. 极差(全距) 一组数据的最大值与最小值之差 特点 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布
7 8 9 10
计算公式: R = max(xi) - min(xi)
7 8 9 10
2. 平均差(平均绝对离差 ) 各变量值与其平均数离差绝对值的平均数 计算公式 n xi x 简单平均差
可看作是均值的一种变形
X
i 1
n i 1
n
i
1 lg G (lg x1 lg x2 lg xn ) n
lg x
n
i
几何平均法的含义 从最初水平 a0 出发,每期按平均发展速度发展, 经过 n 期后将达到最末期水平 an 只与序列的最初观察值 a0 和最末观察值 an 有关
§4.2
离散趋势的度量
离散趋势 不同类型的数据有不同的 离散程度测度指标 常用测度指标: 异众比率 四分位差 方差和标准差 离散系数
§4.2 离散趋势的度量
一、定类数据:异众比率
非众数组的频数占总频数的比例 特点 用来衡量众数对一组数据的代表程度 主要用于定类数据 计算公式 k fi f m f Vr i 1 k 1 k m fi fi
统计学-数据分布特征
![统计学-数据分布特征](https://img.taocdn.com/s3/m/c9a47c1ab52acfc789ebc97b.png)
2
描述集中趋势的统计
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响
14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68
对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:
第四章 数据分布特征的测度
![第四章 数据分布特征的测度](https://img.taocdn.com/s3/m/55a0114be45c3b3567ec8bd4.png)
第四章数据分布特征的测度教学目的与要求:统计平均指标是表明总体数量特征的一个重要指标,它是将总体各单位标志值的差异抽象化,反映总体各单位标志值的一般水平,揭示总体分布的集中趋势。
变异指标是反映总体各单位标志值的差异程度,揭示总体分布离中趋势的又一重要数量特征指标。
通过本章的学习,要求理解统计平均指标的意义和作用;掌握各种统计平均指标的特点、应用条件、应用范围和计算方法;理解变异指标的意义和作用;掌握各种变异指标的性质和计算方法;能运用变异指标衡量平均数代表性的大小。
教学重点与难点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。
难点是不同条件下平均指标和变异指标的计算。
统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。
为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。
对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。
这三个方面分别反映了数据分布特征的不同侧面。
第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。
测度集中趋势也就是寻找数据一般水平的代表值或中心值。
低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。
因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。
一、分类数据:众数(M o)众数是指一组数据中出现次数最多的变量值。
•出现次数最多的变量值•不受极端值的影响•一组数据可能没有众数或有几个众数•主要用于分类数据,也可用于顺序数据和数值型数据从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数。
第四章数据特征测度平均指标
![第四章数据特征测度平均指标](https://img.taocdn.com/s3/m/812d4a4da6c30c2259019e7a.png)
m1 m2 mn
1 x1
m1
1 x2
m2
1 xn
mn
m 1 m x
调和平均数
(例题分析)
【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三 种蔬菜该日的平均批发价格
某日三种蔬菜的批发成交数据
蔬菜 名称
甲 乙 丙
批发价格(元) xi
1.20 0.50 0.80
成交额(元) mi=xi fi 18000 12500 6400
分组资料: (x x)2 f 为最小。
这两个性质是进行趋势预测、回归预测、 建立数学模型的重要数学理论依据。
算术平均数(均值,mean ) 小结
1. 集中趋势的最常用测度值 2. 一组数据的均衡点所在(重心) 3. 体现了数据的必然性特征 4. 易受极端值的影响 5. 用于数值型数据,不能用于分类数据和顺
f 1 f 2 fn
i 1 n
fi
i 1
简写为:
x
xf f
分组资料时,各组变量值应用组中值M代替。
加权算术平均数
(权数对均值的影响)
甲乙两组各有10名学生,他们的考试成绩及其分布数据如下
甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8
乙组: 考试成绩(x): 0 20 100
2.平均指标可以反映现象总体的综合特征 3.平均指标经常用来进行同类现象在不同空间
、不同时间条件下的对比分析
二、平均指标的类别及计算
算术平均数(Mean) 均 值(Mean) 调和平均数(Harmonic mean)
几何平均数(Geometric mean) 中位数 (Median)
众 数 (Mode)
值 x及各组的标志总和 m 即 xf 时,可采用加权调和
统计学课后习题与答案 郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量
![统计学课后习题与答案 郑贵华、颜泳红主编 湘潭大学出版:第四章 数据分布特征的度量](https://img.taocdn.com/s3/m/f9a0c5d7ed630b1c58eeb543.png)
第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。
2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。
3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。
4.简单算术均值是__________的特例。
4.几何均值主要用于计算__________的平均。
5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。
6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。
7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。
8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。
(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。
()2.当总体单位数n为奇数时,中位数=(n+1)/2。
()3.根据组距分组数据计算的均值是一个近似值。
()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。
第四章数据分布特征的测度
![第四章数据分布特征的测度](https://img.taocdn.com/s3/m/41809407a31614791711cc7931b765ce05087a82.png)
第四章数据分布特征的测度一、选择题1.一组数据中出现频数最多的变量值称为()。
A.众数B.中位数C.四分位数D.均值2.下列关于众数的叙述,不正确的是()。
A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3.一组数据排序后处于中间位置上的变量值称为()。
A.众数B.中位数C.四分位数D.均值4.一组数据排序后处于25%和75%位置上的值称为()。
A.众数 B.中位数C.四分位数D.均值5.非众数组的频数占总额数的比率称为()。
A.异众比率B.离散系数C.平均差D.标准差6.如果一个数据的标准分数是-2,表明该数据()。
A.比平均数高出2个标准差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差7.比较两组数据的离散程度最适合的统计量是()。
A.极差B.平均差C.标准差D.离散系数8.偏度系数测度了数据分布的非对称性程度。
如果一组数据的分布是对称的,则偏度系数()。
A.等于0 B.等于1 C.大于0 D.大于1 9.某专家小组成员的年龄分别为29,45,35,43,45,58,他们的年龄中位数为()。
A.45 B.40 C.44 D.3910.某居民小区准备建一个娱乐活动场所,为此,随机抽取了80户居民进行调查,其中表示赞成的有59户,表示中立的有12户,表示反对的有9户。
该组数据的中位数是()。
A.赞成B.59 C.中立D.1211.对于右偏分布,均值、中位数和众数之间的关系是()。
A .均值>中位数>众数B .中位数>均值>众数C .众数>中位数>均值D .众数>均值>中位数12.某班学生的大学英语平均成绩是70分,标准差是10分。
如果已知该班学生的考试分数为对称分布,可以判断成绩在60分~80分之间的学生大约占( )。
A .95%B .89%C .68%D .99%13.当一组数据中有一项为零时,不能计算( )。
第4章 数据分布特征的度量
![第4章 数据分布特征的度量](https://img.taocdn.com/s3/m/bb22cd09eefdc8d376ee3246.png)
2020年1月4日/上午12时56分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
例4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的 原始数据。
要求 试计算计算该班35名学生统计学考试成绩的众数。 解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98
4.1 集中趋势的度量
例4.3 表4.2为第三章中表3.7“某学期某班35名学生的统计学考试成 绩”中的部分数据。根据表4.2的已经分组的数值型数据,计算该班35 名学生的统计学考试成绩众数的近似数值。
表4.2 某学期某班35名学生的统计学考试成绩
考 分 /分 60 以下 60—70 70—80 80—90 90—100 合计
4.1 集中趋势的度量
2020年1月4日/上午12时56分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
2020年1月4日/上午12时56分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
MO
2020年1月4日/上午12时56分
《统计学教程》
第4章 数据分布特征的度量
计算均值的数据需要具备数值型数据的属性,均值是一个数值型的集 中趋势测度。通过计算均值的运算过程,首先将各个数据之间的数量差 异抽象掉了,以一个抽象性的综合测度概括地反映事物的集中趋势。其 次将不同总体的总量规模抽象掉了,表现出来的只是一个一般性的代表 水平,有利于不同规模的同类总体在不同空间和时间上的广泛比较。
第四章 数据分布特征的测度讲解
![第四章 数据分布特征的测度讲解](https://img.taocdn.com/s3/m/71ca791a90c69ec3d5bb7592.png)
第四章数据分布特征的测度学习目的和要求:通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。
难点释疑:(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。
(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。
在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。
(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。
掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。
(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。
标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。
标准差是实际中应用最广泛的离散程度测度值。
(五)标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。
练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.平均指标反映了()。
①总体变量值分布的集中趋势②总体分布的离散特征③总体单位的集中趋势④总体变动趋势2.加权算术平均数的大小( )。
①受各组标志值的影响最大 ②受各组次数的影响最大③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。
统计学多选题
![统计学多选题](https://img.taocdn.com/s3/m/b9d5718acc22bcd126ff0c41.png)
第一章导论1.统计的基本方法包括( )。
A.大量观察法B.综合分析法C.统计分组法D.归纳推断法E.指标体系法2.统计总体的基本特征表现在( )。
A.客观性B.数量性C大量性D.同质性E.差异性3.要了解某地区全部成年人口的就业情况,那么( )。
A.全部成年人是研究的总体B成年人口总数是统计指标C.成年人口就业率是统计标志D.“职业”是每个人的特征,“职业”是数量指标E.某人职业是“教师”,这里的“教师”是标志表现4.国家统计系统的功能或统计的职能是( )。
A。
信息职能B.咨询职能C监督职能D.决策职能E.协调职能5.下列统计指标中,属于质量指标的有( )。
A.工资总额B.单位产品成本C出勤人数D.人口密度E.合格品率6.我国统计调查的方法有( )。
A.,统计报表B.普查C抽样调查D.重点调查 E.典型调7.在工业设备普查中( )。
A.工业企业是调查对象B.工业企业的全部设备是调查对象C.每台设备是填报单位D.每台设备是调查单位E.每个工业企业是填报单位8.对某市工业生产进行调查,得到以下资料,其中的统计指标是( )。
A.某企业为亏损企业B.实际产值为1.1亿元C职工人数为10万人 D.某企业资金利税率为30%E.机器台数为750台9.设某地区五家全民所有制企业的工业总产值分别为25万元、22万元、40万元、33万元和65万元,则( )。
A. “全民所有制”是企业的品质标志B.“工业总产值”是企业的数量标志C “工业总产值”是个变量D “工业总产值”是企业的统计指标E.25、22、40、33、65这几个数字是变量值10.某商场800名职工的每个人的工资资料中( )。
A.职工资总额是统计指标B.800名职工是总体单位C有800个标志值D.职工工资是统计标志E.该商场工资总额等于800人乘以其平均工资11.在全国人口普查当中( )。
A.每个人是总体单位B.男性是品质标志C年龄是数量标志D.人口平均寿命是数量标志E.全国人口数是数量总体第二章数据的收集1.人口普查属于( )。
统计学第4章_统计数据分布特征的度量
![统计学第4章_统计数据分布特征的度量](https://img.taocdn.com/s3/m/7c3086beeefdc8d376ee32a4.png)
类型
结构相对数 比例相对数 比较相对数 动态相对数 强度相对数
相对指标比较
计算 方法
同一 总体
总体部分指标数值 总体全部数值
是
总体部分指标数值
总体其他部分数值
是
某条件下某类指标数值
另一条件下同类指标数 值 否
报告期指标数值
基期指标数值
是
某一总量指标数值
否
另一总量指标数值
实际完成数
计划任务数
是
同类 指标
X G 5 0.95 0.92 0.90 0.85 0.80 5 0.5349 88.24﹪
【例】某金融机构以复利计息。近12年来的年 利率有4年为3﹪,2年为5﹪,2年为8﹪,3年 为10﹪,1年为15﹪。求平均年利率。
解:
X G 42 1 1 0.034 1 0.052 1 0.15
n n1
(2)加权调和平均数(分组)
x i1 i
n
xH
m1 m2 ... mn
m1 m2 ... mn
x1
x2
xn
mi
i1
n mi
x i1 i
3.几何平均数 是变量值的连乘积开变量值的项数次方。 (1)简单几何平均数---末分组
n
xG n x1.x2 ...xn n xi i 1
12 2.2154 106.85﹪ 平均年利率 X G 1 106.85﹪1 6.85﹪
案例分析 某公司的生产情况如下: (单位:万元)
计划
第四季度工业增加值
实
际
绝对值
比重%
完成计划 %
第三季度 实际工 业增加 值
报告期 比基 期%
甲
1
2
第4章 数据的分布特征的测定
![第4章 数据的分布特征的测定](https://img.taocdn.com/s3/m/e0bb08dfad51f01dc281f1e1.png)
4 N+ 下四分位数(QL)位置 = 1 4 3(N+1) 上四分位数(QU)位置 = 4
4 - 23
经济、管理类 基础课程
顺序数据的四分位数
(算例)
统计学
【例4.4】根据第三章表3-2中的数据,计算甲城市家庭对住房 满意状况评价的四分位数
表3-2 甲城市家庭对住房状况评价的频数分布 解:下四分位数(QL)的位置为: QL位置=(300)/4=75 上四分位数(QL)的位置为: QU位置=(3×300)/4=225 从累计频数看, QL在“不满意 ”这一组别中; QU在“一般” 这一组别中。因此 QL =不满意 QU =一般
偏 态
均 值
4-3
异众比率 四分位差 方差和标准差 离散系数
峰 度
经济、管理类 基础课程
统计学
第一节 集中趋势的测度
一、集中趋势的含义 二、众数 三、中位数 四、均值 五、众数、中位数和均值的比较
4-4
经济、管理类 基础课程
一、集中趋势
(Central tendency)
统计学
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
中位数
(位置的确定)
统计学
N 顺序数据与分组 中位数位置 2 数据: N 1 未分组数据: 中位数位置 2
4 - 15
经济、管理类 基础课程
顺序数据的中位数
(算例)
统计学
【例4.2】根据第三章表3-2中的数 据,计算甲城市家庭对住房满意状 况评价的中位数
表3-2 甲城市家庭对住房状况评价的频数分布
X 1 F1 X 2 F2 X N FN X F1 F2 FN
第四章 数据分布特征的测度
![第四章 数据分布特征的测度](https://img.taocdn.com/s3/m/082a5556de80d4d8d15a4fca.png)
第四章数据分布特征的测度【教学要求】了解绝对数和相对数的概念及作用,掌握绝对数的种类、相对数的种类及应用;掌握集中趋势的测度方法,掌握算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;掌握离散程度的测度方法,理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用;了解偏态与峰度的测度方法。
【知识点】绝对数、相对数、术平均数、调和平均数、几何平均数、众数、中位数、全距、四分位差、异众比率、平均差、标准差、离散系数【本章重点】相对数的种类及应用;算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。
【本章难点】算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。
【教学内容】第一节绝对数和相对数统计指标就其具体内容来讲非常多,可谓成千上万,但从其基本形式看,则不外乎总量指标、相对指标和平均指标三种类型,统称统计综合指标。
一、绝对数(一)绝对数的概念和种类1、绝对数的作用主要表现在:(1)绝对数可以反映一个国家、地区、部门或单位的基本情况(2)绝对数是制定政策、编制计划以及进行科学管理的重要依据(3)绝对数是计算相对数和平均数的基础相对数和平均数是由两个有联系的总量指标对比计算出来的统计综合指标,无论是相对指标还是平均指标,都是总量指标的派生指标,没有总量指标就不会有相对指标和平均指标。
例如,职工劳动生产率、职工平均工资、宏观经济增长速度、国民经济发展的重要比例关系、农作物单位面积产量等都是在总量指标的基础上计算出来的。
(二)绝对数的种类1、按反映总体内容不同分为总体单位总量和总体标志总量。
例、某业企业职工人数1,000人,工资总额1980,000元。
统计学习题第四章数据分布特征的描述习题答案
![统计学习题第四章数据分布特征的描述习题答案](https://img.taocdn.com/s3/m/bc337ca9cc22bcd126ff0cfa.png)
第四章 静态指标分析法(一)一、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和用于测度品质数据集中趋势的分布特征,用于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、几何平均数是计算和的比较适用的一种方法。
4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当一组工人的月平均工资悬殊较大时,用他们工资的比其算术平均数更能代表全部工人工资的总体水平。
二.选择题单选题:1.反映的时间状况不同,总量指标可分为( )A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )A 接近标志值小的一方B 接近标志值大的一方C 接近次数少的一方D 接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( )A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( )A 提高B 不变C 降低D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( )A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越高C 说明变量值越分散,平均数代表性越高D 说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:07.7,70==甲甲σX ;乙数列:41.3,7==乙乙σX 根据以上资料可直接判断( )A 甲数列的平均数代表性大B 乙数列的平均数代表性大C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百人手机拥有量为90部,这个指标是 ( )A 、比例相对指标B 、比较相对指标C 、结构相对指标D 、强度相对指标 9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为 ( ) A 、左偏分布 B 、右偏分布 C 、对称分布 D 、无法判断10、加权算术平均数的大小 ( )A 主要受各组标志值大小的影响,与各组次数多少无关;B 主要受各组次数多少的影响,与各组标志值大小无关;C 既与各组标志值大小无关,也与各组次数多少无关;D 既与各组标志值大小有关,也受各组次数多少的影响11、已知一分配数列,最小组限为30元,最大组限为200元,不可能是平均数的为 ( ) A 、50元 B 、80元 C 、120元 D 、210元12、比较两个单位的资料,甲的标准差小于乙的标准差,则 ( ) A 两个单位的平均数代表性相同 B 甲单位平均数代表性大于乙单位C 乙单位平均数代表性大于甲单位D 不能确定哪个单位的平均数代表性大 13、若单项数列的所有标志值都增加常数9,而次数都减少三分之一,则其算术平均数 ( ) A 、增加9 B 、增加6C 、减少三分之一 D 、增加三分之二 14、如果数据分布很不均匀,则应编制( )A 开口组B 闭口组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( ) A 总体性B 全面性C 同质性D 可比性16、某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为()A1500元 B 1600元 C 1750元D 2000元 17、统计分组的首要问题是( )A 选择分组变量和确定组限B 按品质标志分组C 运用多个标志进行分组,形成一个分组体系D 善于运用复合分组18、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开支情况,最合适的调查方式是:() A 普查B 抽样调查C 典型调查D 重点调查21、已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为 ( )A 甲大于乙B 乙大于甲C 一样的D 无法判断 22、加权算术平均数的大小取决于( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变.那么算术平均数( ) A 不变 B 扩大到5倍 C 减少为原来的1/5 D 不能预测其变化 24、 计算平均比率最好用 ( )A 算术平均数B 调和平均数C 几何平均数D 中位数25、若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用() A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布B正态分布 C 右偏分布DU型分布28、一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
楼市价格下降?
❖ 《2010年3月广州市十区房地产交易登记情 况通报》,数据显示,广州十区3月的一手住 宅成交量环比回升两成,达到62.35万平方米, 成交量接近去年3月“小阳春”。
❖ 今年3月楼市成交回暖是否也是楼价低的因素? 因为广州3月楼价环比下降了9.2%。
❖ 表面看来是如此。
集中趋势的概念 与测度指标
2、分组数据例-经过分组整理的数据
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
某地 区农 民家 庭年 人均 收入 资料
平均数的种类
位置平均数
数值平均数
众数
算术平均数
中位数
调和平均数
几何平均数
众数
定义 确定方法 特点 总结
众数的引例
❖ 一个班30名同学参加英语考试,成绩如下:
❖ 2名同学——60分
❖ 10名同学——72分
❖ 15名同学——80分 ❖ 3名同学——85分
众数
❖ 5名同学——90分
众 数 (Mode)
合计
300
100
—
—
—
—
众数:不满意
2、分组数据例-单项式分组
某200名手机使用者目前已更换手机数量频 数分布表
更换手机数量
0 1 2 3及以上 合计
人数(人)
6 82 76 36 200
频率(%)
3 41 38 18 100
众数:1
2、分组数据例-组距分组
某地 区农 民家 庭年 人均 收入 资料
❖统计学中是用一个或几个数据测度(刻画) 数据总体的分布特征。
❖统计学中刻划数据分布特征的最主要的代表 有数据分布的集中趋势、离散程度和分布形态。描述统计统计数据 源自收集统计数据统计数据
的整理与显示 分布特征的测度
第四章 数据分布特征的测度
主要内容和学习目标
集中趋势的测度(重点掌握) 离散程度的测度(重点掌握) ——均从未分组和分组两角度进行介绍 偏度与峰度的测度(了解)
集中趋势的概念:是指一组数据向某一中心值靠拢
的倾向,它反映了数据聚集的中心所在 。
集中趋势的测度:是指寻找数据(总体)一般水平
的代表值或中心值
集中趋势的测度指标:称之为平均指标(平均 数)——众数、中位数、算术平均数、调和平 均数、几何平均数。
集中趋势测度的作用: 可以用一个数值说明总体的一般水平。
按年人均收入 分组(元)
农民家庭数 (户)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
240 480 1050 600 270 210 120 30
合计
3000
M
o
1400
(1050
1050 480 480) (1050
未分组和分组数据辨析
1、未分组数据——未经过分组整理的数据
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
=1511.8(元)
众数的确定方法总结
1、未分组数据的众数 MO=频(次)数最多的数据值(变量值、标志值)
2、分组数据的众数
(1) 品质数据和单项式分组的数值型数据 MO =频数最多组的数据值(变量值、标志值)
众数:122
2、分组数据例-品质型分组
某城市居民关注广告类型的频数分布
广告类型
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
人数(人)
112 51 9 16 10 2
频率(%)
56.0 25.5 4.5 8.0 5.0 1.0
合计
200
100.0
众数:商品广告
甲城市家庭对住房状况满意程度的频数分布
定义:是指一组数据中出现次数最多的变量值, 用MO表示。
实际应用:当更感兴趣的是最普遍的尺寸而不是平均
尺寸的大小时众数是一个合适的集中趋势代表值。
众数的确定方法
1. 未分组数据 2. 分组数据
3. -品质型分组 -数值型分组
1、未分组数据例
某生产车间50名工人日加工零件数原始资料(单位:个) 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
满意 户数 程度 (户)
非常 不满意
24
百分比 (%)
向上累积
户数 百分比 (户) (%)
8
24
8.0
向下累积
户数(户)
百分比 (%)
300 100
不满意 108
36
132
44.0
276 92
一般
93
31
225
75.0
168 56
满意
45
15
270
90.0
非常 满意
30
10
300 100.0
75 25 30 10
按年人均收入 分组(元)
1000~1200 1200~1400 1400~1600 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600
合计
农民家庭数 (户)
240 480 1050 600 270 210 120 30
3000
一、集中趋势的测度
概念与测度指标 众 数(掌握) 中位数(掌握) 算术平均数(重点掌握) 调和平均数 几何平均数(掌握)
600)
200
1511.(8 元)
解:从表中的资料可以看出,出现频数最多的是1050, 即众数组为1400~1600,且
L=1400 fm 1050 fm1 480 fm1 600 d 200
根据众数公式可得:
Mo
1400
1050 480
200
(1050 480) (1050 600)