第四章、统计数据分布特征的描述
统计学第4章数据特征的描述
![统计学第4章数据特征的描述](https://img.taocdn.com/s3/m/12bb4a5e6fdb6f1aff00bed5b9f3f90f76c64d84.png)
极差计算简单,但容易受到极端值的影响,不能全面 反映数据的离散程度。
四分位差
定义
四分位差是第三四分位数与第 一四分位数之差,用于反映中
间50%数据的离散程度。
计算方法
四分位差 = 第三四分位数 第一四分位数
优缺点
四分位差能够避免极端值的影 响,更稳健地反映数据的离散
程度,但计算相对复杂。
方差与标准差
统计学第4章数据特征 的描述
https://
REPORTING
• 数据特征描述概述 • 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量 • 数据特征描述在统计分析中的应用 • 数据特征描述的注意事项
目录
PART 01
数据特征描述概述
REPORTING
WENKU DESIGN
数据特征描述在推断性统计中的应用
参数估计 假设检验 方差分析 相关与回归分析
基于样本数据特征,对总体参数进行估计,如点估计和区间估 计。
通过比较样本数据与理论分布或两组样本数据之间的差异,对 总体分布或总体参数进行假设检验。
研究不同因素对总体变异的影响程度,通过比较不同组间的差 异,分析因素对总体变异的贡献。
定义
方差是每个数据与全体数据平均数之方根,用于衡量数据的波动大小。
计算方法
方差 = Σ(xi - x̄)² / n,标准差 = √方差
优缺点
方差和标准差能够全面反映数据的离散程度,且计算相对简单,但容易受到极端值的影响。同时,方差 和标准差都是基于均值的度量,对于非对称分布的数据可能不够准确。
适用范围
适用于数值型数据,且数据之间可能 存在极端异常值的情况。
特点
中位数不受极端值影响,对于存在极 端异常值的数据集,中位数能够更好 地反映数据的集中趋势。
数据分布特征的描述
![数据分布特征的描述](https://img.taocdn.com/s3/m/620b2cabf524ccbff1218425.png)
K
x
xi fi
i 1 K
fi
3060 76.5 40
i 1
权数(fi ,也称权重)
权数——指在计算总体平均数或综合水平的过程中对各个 数据起着权衡轻重作用的变量。
可以是绝对数形式,也可以是比重形式(如频率)表示。
x x f f
事实上比重权数更能够直接表明权数权衡轻重作用的实质
当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就
1、结构相对指标 计算各组总量占总体或样本总量的比重,用以
反映总体或样本结构状况的综合指标。
结构相对数
各组总量 总体(样本)总量
100 %
1、结构相对指标
①可以反映总体内部结构的特征。 ②通过不同时期相对数的变动,可以看 出事物的变化过程及其发展趋势。 ③结构相对数一般用百分数表示。 ④各组结构相对数之和等于100%或1。
算术平均数
变量值总和 变量值个数
注:平均指标和强度相对数的区别 分子和分母在经济内容上有从属关系,即分子数值是各 分母单位特征的总和,两者在总体范围上是一致的。
(一)简单算术平均数
把每项数据直接加总后除以它们的项数 通常用于对未分组的数据计算算术平均数 计算公式:
n
x
x1 x2 ... xn
相对数。相对数由两个互相联系的数值对比 求得。常用的相对数包括:结构相对数、动 态相对数、比较相对数、强度相对数、利用 程度相对数、计划完成相对数等。
平均数。平均数反映现象总体的一般水平或 分布的集中趋势。
第一节 总量指标和相对指标
一、总量指标 (一)总量指标的概念和作用 总量指标是反映现象在具体时间、地点、 条件下的总规模或总水平的统计指标。 总量指标也称为绝对指标或绝对数。
统计学-数据分布特征
![统计学-数据分布特征](https://img.taocdn.com/s3/m/c9a47c1ab52acfc789ebc97b.png)
2
描述集中趋势的统计
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响
14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68
对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:
1分布特征描述类
![1分布特征描述类](https://img.taocdn.com/s3/m/cf5bda4991c69ec3d5bbfd0a79563c1ec4dad763.png)
1分布特征描述类分布特征是指在一定范围内,不同数值或对象的分布情况。
通过对分布特征的描述和分析,可以更好地理解数据的规律和特点,有助于数据的统计分析和决策支持。
在统计学和数据分析领域,分布特征描述是非常重要的一部分,可以帮助我们揭示数据的本质,并为后续的研究和应用提供依据。
分布特征描述主要包括对数据的中心趋势、离散程度、形状和对称性等方面的描述。
其中,数据的中心趋势反映了数据的集中程度,通常用均值、中位数和众数等来描述;数据的离散程度则反映了数据的分散程度,通常用方差、标准差和极差等来描述;数据的形状和对称性反映了数据的分布形态,通常用偏度和峰度来描述。
这些描述指标可以帮助我们全面地认识数据的特点,为数据分析和决策提供依据。
在描述分布特征时,我们通常会用图表和统计指标相结合的方法,来展示数据的分布情况。
常见的图表包括直方图、箱线图、饼图和散点图等,这些图表可以直观地展示数据的分布情况,帮助我们找出数据的规律和特点。
而统计指标则可以量化地描述数据的分布特征,提供客观的数据支持。
在实际应用中,分布特征描述可以帮助我们进行数据探索和分析,找出数据中的异常情况和规律性,为后续的数据处理和分析提供基础。
比如,在市场调研中,我们可以通过对销售数据的分布特征描述,找出最畅销的产品和销售状况,为产品的推广和销售提供决策支持;在金融风险管理中,我们可以通过对资产收益率的分布特征描述,找出潜在的风险源和赚钱机会,为投资决策提供指导。
总的来说,分布特征描述是数据分析的重要一环,可以帮助我们更好地理解数据的特点和规律,为数据处理和决策提供依据。
通过对数据的中心趋势、离散程度、形状和对称性等方面的描述,我们可以全面地认识数据,并更好地利用数据为我们的工作和生活带来更多的价值。
因此,分布特征描述不仅在统计学和数据分析领域具有重要意义,而且在各个行业和领域都有着广泛的应用前景。
统计学原理第4章:数据特征的描述
![统计学原理第4章:数据特征的描述](https://img.taocdn.com/s3/m/69b3ae7f302b3169a45177232f60ddccda38e6d7.png)
第四章 数据特征的描述
某公司400名职工平均工资计算表 单位:元
按月工资 组中值 职工
分组
x
人数
f
x f
比重(%)
f
f
①
②
③ ④=②×③ ⑤=③÷ 400
1100以下 1000
60
60000
15
1100-1300 1200 100 120000
25
1300-1500 1400 140 196000
35
分组
职工 人数
f
x f
①
1100以下 1100-1300 1300-1500 1500-1700 1700以上
②
1000 1200 1400 1600 1800
③ ④=②×③
60
60000
100 120000
140 196000
60
96000
40
72000
人数为权数
x x f f
544000 400
算术平均数、调和平均数、中位数、众数、几何平均数
3. 各种平均数的Excel操作
24/77
1. 集中趋势的含义
第四章 数据特征的描述
集中趋势是一组数据向其中心值靠
拢的倾向和程度
测度集中趋势就是寻找数据一般水
平的代表值或中心值
中心值 即:平均水平
▲
25/77
2. 集中趋势的度量方法
第四章 数据特征的描述
第四章 数据特征的描述
《统计学原理》(第3版)
第四章 数据特征的描述
学习目标
第一节 总量与相对量的测度 第二节 集中趋势的测度 第三节 离散程度的测度
2/77
第一节 总量与相对量的测度
社会统计学(第4章 数据的统计量描述)
![社会统计学(第4章 数据的统计量描述)](https://img.taocdn.com/s3/m/540ef80e79563c1ec5da71bc.png)
三、离散性描述指标的比较
全距(四分位数) 全距(四分位数)
粗略、快捷,不稳定, 粗略、快捷,不稳定,不能用于有样本推论总体 用于定序、定距、 用于定序、定距、定比变量
标准差(方差) 标准差(方差)
精准、相对稳定, 精准、相对稳定,可以用于由样本推论总体 用于定距、 用于定距、定比变量
全距与标准差的关系
SS Σ(X − X ) 2 S = = N N
2
方差可以描述数值偏离平均值的程度。 方差可以描述数值偏离平均值的程度。 平方处理解决了绝对值的问题。 平方处理解决了绝对值的问题。 平方处理后对偏离均值的程度更加敏感。 平方处理后对偏离均值的程度更加敏感。
二、离散性的描述指标
4.标准差: 4.标准差:将方差开平方得到的数值 标准差
二、离散性的描述指标
5.分析下列4 5.分析下列4组数据的离散性 分析下列 6]、 a[6 6 6 6 6 6 6]、b[5 5 6 6 6 7 7 ] 9]、 c[3 3 4 6 8 9 9]、d[3 3 3 6 9 9 9 ]
全距=? 全距=? 四分位数=? 四分位数=? 平均离均差= 平均离均差=? 方差=? 方差=? 标准差=? 标准差=?
三、集中性描述指标的比较
1.描述不同测量等级的变量 1.描述不同测量等级的变量
定类、定序、定距、 众 数:定类、定序、定距、定比变量的描述 中位数:定序、定距、 中位数:定序、定距、定比变量的描述 平均数:定距、 平均数:定距、定比变量的描述
三、集中性描述指标的比较
2.数据的分布形状 2.数据的分布形状 中心重合
第二节 集中性的描述指标
一、数据分布的集中性 二、集中性的描述指标 三、集中性描述指标的比较
一、数据分布的集中性
统计学习题第四章数据分布特征的描述习题答案
![统计学习题第四章数据分布特征的描述习题答案](https://img.taocdn.com/s3/m/bc337ca9cc22bcd126ff0cfa.png)
第四章 静态指标分析法(一)一、填空题1、数据分布集中趋势的测度值(指标)主要有、和。
其中和用于测度品质数据集中趋势的分布特征,用于测度数值型数据集中趋势的分布特征。
2、标准差是反映的最主要指标(测度值)。
3、几何平均数是计算和的比较适用的一种方法。
4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算。
5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈分布。
6、当一组工人的月平均工资悬殊较大时,用他们工资的比其算术平均数更能代表全部工人工资的总体水平。
二.选择题单选题:1.反映的时间状况不同,总量指标可分为( )A 总量指标和时点总量指标B 时点总量指标和时期总量指标C 时期总量指标和时间指标D 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( )A 5.5%B 5%C 115.5%D 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )A 接近标志值小的一方B 接近标志值大的一方C 接近次数少的一方D 接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( )A 可变的B 总是各组单位数C 总是各组标志总量D 总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( )A 提高B 不变C 降低D 不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( )A 说明变量值越分散,平均数代表性越低B 说明变量值越集中,平均数代表性越高C 说明变量值越分散,平均数代表性越高D 说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲数列:07.7,70==甲甲σX ;乙数列:41.3,7==乙乙σX 根据以上资料可直接判断( )A 甲数列的平均数代表性大B 乙数列的平均数代表性大C 两数列的平均数代表性相同D 不能直接判别8、杭州地区每百人手机拥有量为90部,这个指标是 ( )A 、比例相对指标B 、比较相对指标C 、结构相对指标D 、强度相对指标 9、某组数据呈正态分布,计算出算术平均数为5,中位数为7,则该数据分布为 ( ) A 、左偏分布 B 、右偏分布 C 、对称分布 D 、无法判断10、加权算术平均数的大小 ( )A 主要受各组标志值大小的影响,与各组次数多少无关;B 主要受各组次数多少的影响,与各组标志值大小无关;C 既与各组标志值大小无关,也与各组次数多少无关;D 既与各组标志值大小有关,也受各组次数多少的影响11、已知一分配数列,最小组限为30元,最大组限为200元,不可能是平均数的为 ( ) A 、50元 B 、80元 C 、120元 D 、210元12、比较两个单位的资料,甲的标准差小于乙的标准差,则 ( ) A 两个单位的平均数代表性相同 B 甲单位平均数代表性大于乙单位C 乙单位平均数代表性大于甲单位D 不能确定哪个单位的平均数代表性大 13、若单项数列的所有标志值都增加常数9,而次数都减少三分之一,则其算术平均数 ( ) A 、增加9 B 、增加6C 、减少三分之一 D 、增加三分之二 14、如果数据分布很不均匀,则应编制( )A 开口组B 闭口组C 等距数列D 异距数列 15、计算总量指标的基本原则是:( ) A 总体性B 全面性C 同质性D 可比性16、某企业的职工工资分为四组:800元以下;800-1000元;1000—1500元;1500以上,则1500元以上这组组中值应近似为()A1500元 B 1600元 C 1750元D 2000元 17、统计分组的首要问题是( )A 选择分组变量和确定组限B 按品质标志分组C 运用多个标志进行分组,形成一个分组体系D 善于运用复合分组18、某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )A 230B 260C 185D 215 19、分配数列中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( )A 钟型分布B U 型分布C J 型分布D 倒J 型分布 20、要了解上海市居民家庭的开支情况,最合适的调查方式是:() A 普查B 抽样调查C 典型调查D 重点调查21、已知两个同类企业的职工平均工资的标准差分别为5元和6元,而平均工资分别为3000元,3500元则两企业的工资离散程度为 ( )A 甲大于乙B 乙大于甲C 一样的D 无法判断 22、加权算术平均数的大小取决于( )A 变量值B 频数C 变量值和频数D 频率23、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变.那么算术平均数( ) A 不变 B 扩大到5倍 C 减少为原来的1/5 D 不能预测其变化 24、 计算平均比率最好用 ( )A 算术平均数B 调和平均数C 几何平均数D 中位数25、若两数列的标准差相等而平均数不同,在比较两数列的离散程度大小时,应采用() A 全距 B 平均差 C 标准差 D 标准差系数26、若n=20,∑∑==2080,2002x x ,标准差为( )A 2B 4C 1.5D 327、已知某总体3215,3256==eMM,则数据的分布形态为( )A左偏分布B正态分布 C 右偏分布DU型分布28、一次小型出口商品洽谈会,所有厂商的平均成交额的方差为156.25万元,标准差系数为14.2%,则平均成交额为( )万元A11 B 177.5 C 22.19 D 8826、欲粗略了解我国钢铁生产的基本情况,调查了上钢、鞍钢等十几个大型的钢铁企业,这是()A普查B重点调查C典型调查D抽样调查多选题:1.某企业计划2000年成本降低率为8%,实际降低了10%。
统计学课件 第四章 统计分布的数值特征
![统计学课件 第四章 统计分布的数值特征](https://img.taocdn.com/s3/m/d97194eaba0d4a7302763abe.png)
组距数列中位数的确定—例
年人均纯 收入 (千元) 5以下 5—6 农户数 (户) 240 480 向上累 计频数 240 720 (1)计算累计频数
(2)确定中位数组(6—7)
f 1 3001 1500.5
2 2
6—7
7—8 8—9 9以上 合计
1100
700 320 160 3000
设总体各单位某数量标志值为:
x1 ,x2 ,„ ,xn
简单算数平均数
x1 x2 ... xn x n
x
i 1
n
i
n
1)简单算术平均数
计算公式: x x1 x2 ... xn
x
i 1
n
i
n
n
应用条件:未分组的原始资料,或各组出现的次 数都是1的数据资料。
25%
QL
25%
QM
25%
25%Βιβλιοθήκη QU不受极端值的影响。 主要用于顺序数据,也可用于数值型数据,但不能 用于分类数据。
四分位数—位置的确定
原始数据
n 1 QL 位置 4 Q 位置 3(n 1) U 4 n QL 位置 4 Q 位置 3n U 4
特大值或特小值的情况下,采用中位数较适宜。
[例]:在工业产品的质量检验或分析时间序列的季
节变动时,常常要用到中位数。
四分位数
能够将全部总体单位按标志值大小等分为四部分的三个数值。 第一个四分位数叫做“1/4分位数”或“下分位数”;
第二个就是中位数;
第三个叫“3/4分位数”或“上分位数”。 排序后处于25%、50%和75%位置上的值。
一、分布的集中趋势
第四章 数据分布特征的测度讲解
![第四章 数据分布特征的测度讲解](https://img.taocdn.com/s3/m/71ca791a90c69ec3d5bb7592.png)
第四章数据分布特征的测度学习目的和要求:通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。
难点释疑:(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。
(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。
在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。
(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。
掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。
(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。
全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。
标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。
标准差是实际中应用最广泛的离散程度测度值。
(五)标准差系数的应用。
为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。
它是标志变异的相对指标。
它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。
练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.平均指标反映了()。
①总体变量值分布的集中趋势②总体分布的离散特征③总体单位的集中趋势④总体变动趋势2.加权算术平均数的大小( )。
①受各组标志值的影响最大 ②受各组次数的影响最大③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。
《管理统计学》习题及答案
![《管理统计学》习题及答案](https://img.taocdn.com/s3/m/380addb3524de518974b7d27.png)
《管理统计学》作业集习题集及答案第一章导论*1-1 对50名职工的工资收入情况进行调查,则总体单位是(单选)( 3 )(1)50名职工(2)50名职工的工资总额(3)每一名职工(4)每一名职工的工资*1-2 一个统计总体(单选)( 4 )(1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标*1-3 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是(单选)( 4 )(1)指标(2)标志(3)变量(4)标志值第二章统计数据的调查与收集*2-1 非全面调查包括(多项选择题)( 12 4 )(1)重点调查(2)抽样调查(3)快速普查(4)典型调查(5)统计年报*2-2 统计调查按搜集资料的方法不同,可以分为(多项选择题)( 12 3 ) (1)采访法(2)抽样调查法(3)直接观察法(4)典型调查法(5)报告法*2-3 某市进行工业企业生产设备状况普查,要求在7月1日至7月5日全部调查完毕。
则规定的这一时间是(单项选择题)(2)(1) 调查时间 (2) 调查期限 (3) 标准时间 (4) 登记期限*2-4 某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是(单项选择题)(4)(1) 普查 (2) 典型调查 (3) 抽样调查 (4) 重点调查*2-5 下列判断中,不正确的有(多项选择题)(23 4 )(1)重点调查是一种非全面调查,既可用于经常性调查,也可用于一次性调查;(2)抽样调查是非全面调查中最科学的方法,因此它适用于完成任何调查任务;(3)在非全面调查中,抽样调查最重要,重点调查次之,典型调查最不重要;(4)如果典型调查的目的是为了近似地估计总体的数值,则可以选择若干中等的典型单位进行调查;(5)普查是取得全面统计资料的主要调查方法。
*2-6 下列属于品质标志的是(单项选择题)( 2 )(1)工人年龄(2)工人性别(3)工人体重(4)工人工资*2-7 下列标志中,属于数量标志的有(多项选择题)(3)(1)性别(2)工种(3)工资(4)民族(5)年龄*2-8 下列指标中属于质量指标的有(多项选择题)(13 4 )(1)劳动生产率(2)废品量(3)单位产品成本(1)资金利润率(5)上缴税利额第三章统计数据的整理*3-1 区分下列几组基本概念:(1)频数和频率;答:A、频数:在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测量值的数目。
第四章 统计学(分散趋势 )
![第四章 统计学(分散趋势 )](https://img.taocdn.com/s3/m/ae38fcd533d4b14e852468b2.png)
第二节 数据分布离散程度的测定
第二节 数据分布离散程度的测定
一、标志变异指标的概念和作用 (一)标志变异指标概念 变异指标又称标志变动度,是说明总体 单位标志值的差异大小程度的指标。
(二)标志变异指标的作用 1.变异指标可用来刻划总体分布的变异 状况或离散程度 2.变异指标可用来反映平均指标的代表 性程度 3.可以用来说明现象或过程的均衡程度 与稳定程度
3
【例4.18】 某集团下属30个企业2007 年3月份销售额统计资料如表4-11所示, 计算该变量数列的偏斜程度
表4-11 偏斜系数计算示例表
销售额 (万元) 10—30 30—50 50—70 70—90 合 计 企业数 组中值 f x 2 10 13 5 30 20 40 60 80 —
i 1
n
2
n 1
分组数据:
( x x) fi
2
k
S n 1=
i 1
i 1
k
fi 1
方差和标准差是根据全部数据计算的, 它反映了每个数据与其均值相比平均相 差的数值,因此它能准确地反映出数据 的离散程度。与平均差相比,方差和标 准差在数学处理上是通过平方消去离差 的正负号,更便于数学上的处理。因此, 方差和标准差是实际中应用最广泛的离 散程度测度值。
【例4.13】 计算5、11、7、8、9的平 均差。 解:先计算其算术平均数为8,然后将其 代入公式得:
A.D. 5 8 11 8 7 8 8 8 9 8 5 1 .6
【例4.14】 某公司100名工人的每周工 资资料如表4-8所示,计算其平均差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章、统计数据分布特征的描述
一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)
1. 调和平均数是()。
A. 总体标志总量指标与总体单位总量指标的比值
B. 总体各单位变量值倒数的算术平均数
C. 总体各单位变量值倒数算术平均数的倒数
D. 总体各单位变量值连乘积的平方根
2. 在分组的情况下,总体平均指标数值的大小()。
A. 只受各组变量值水平的影响,与各组单位数无关
B. 只受各组单位数的影响,与各组变量值水平无关
C. 既受各组变量值水平的影响,又与各组次数有关
D. 既不受各组变量值水平的影响,也部受各组次数的影响
3. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是()。
A. 各组次数必须相等
B. 各组必须是闭口组
C. 总体各单位变量值水平相等
D. 总体各单位变量值水平在各组内呈均匀分布
4. 标志变异指标反映了总体各单位变量值分布的().
A. 集中趋势
B. 离散趋势
C. 变动趋势
D. 长期趋势
5. 下列变异指标中,受极端数值影响最大的是()。
A. 全距
B. 平均差
C. 标准差
D. 变异系数
6. 算术平均数与总体单位数的乘积等于()。
A. 总体各单位变量值的总和
B. 总体各单位变量值的连乘积
C. 总体各单位变量值与平均数的离差
D. 总体各单位变量值与平均数离差的平方
7. 权数对算术平均数的影响作用,实质上取决于()。
A. 作为权数的各组单位数占总体单位数比重的大小
B. 各组变量值占总体标志总量比重的大小
C. 变量值本身的大小
D. 变量值数量的多少
8.平均指标反映了总体分布的()。
A. 集中趋势
B. 离散趋势
C. 变动趋势
D. 长期趋势
9.数据观察值与均值之差的和()。
A.等于零
B.大于1
C.为最大
D.为最小
10.如果一组数据是右偏分布,则 X、Me、Mo三者之间的关系表现为()
A.X=Me=Mo
B. X>Me>Mo c. X<Me<Mo D. X>Mo>Me
11.若男青年组体重均值为55公斤,标准差为4.2公斤,离散系数为7.6%;女青年组体重均值为48公斤,标准差为3.9公斤,离散系数为8.1%,则()。
A.男青年组体重差异大于女青年组
B.男青年组体重差异小于女青年组
C.男青年组体重差异与女青年组相同
D.男女青年组体重差异无法确定
12.算术平均数(均值)的数学性质()
A. B.
C. D.
13.如果一组数据是左偏分布,则、、三者之间的关系表现为()
A.==
B.>>
C.<<
D.<<
14.有下列资料:75、78、80、82、87、90、91、92,中位数是()
A.82
B.84.5
C.87
D.90
二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)
1. 数值平均数的计算方法有()。
A. 算术平均法
B. 众数法
C. 中位数法
D. 调和平均法
E. 几何平均数
2.位置平均数的计算方法有()。
A. 算术平均法
B. 众数法
C. 中位数法
D. 调和平均法
E. 几何平均数
3. 在下列条件下,加权算术平均数和简单算术平均数相等()。
A. 各组次数相等
B. 各组变量值不等
C. 变量数列为组距数列
D. 各组次数都为1
E. 各组次数占总次数的比重相等
4. 数据集中趋势的测度值主要有()
A.众数
B.中位数
C.均值
D. 调和平均数
E.几何平均数
5.众数()
A.是一组数据中出现次数最多的变量值
B.从分布的角度看,是一组数据分布的最高峰点所对应的数值
C.是位置平均数
D.不受数据中极端值的影响
E.不一定存在,若存在也不一定是唯一的
6.在一个正态分布下,中位数()
A. 等于算术平均数
B. 小于算术平均数
C. 等于众数
D. 大于众数
E. 无法判断
7. 加权算术平均数的大小()
A. 受各组次数多少的影响
B. 受各组标志值大小的影响
C. 受各组标志值和次数的影响
D. 不受标志值的影响
E. 与各组次数分布无关
三、判断题(正确的打“√”,错误的打“×”)
1. 根据组距数列计算的平均指标是一个近似值。
2. 众数是变量数列中最大的次数。
3. 平均指标反映了现象的一般水平,但掩盖了总体各单位的差异,因此仅通过这个指标不能全面反映总体的特征。
4. 所有冠以“平均”一词的统计指标都是平均指标。
5. 变量的变异程度越高,其平均指标的代表性就越高;反之就越低。
6. 比较不同总体变异程度的高低,既可以用变异系数,也可以用标准差或其他变异指标。
7. 用加权平均数法计算标准差,既适用于分组资料,也适用于未分组资料。
8. 平均指标必须而且只能在同质总体中计算。
9. 根据组距数列计算中位数,其假定条件是变量值在中位数组分布均匀。
10. 根据组距数列计算众数时,如果众数组前一组次数等于其后一组次数,则众数等于众数组的组中值。
11.根据组距数列计算的平均指标是不精确的。
12. 众数在统计分布中不一定存在,若存在也不一定是唯一的。
13. 标准差和标准差变异(离散)系数都是反映变量离散的绝对水平的。
14. 中位数是指总体中出现次数最多的变量值。
15. 变量值与中位数之差的绝对值之和小于变量值与均值之差的绝对值之和。
四、问答题
1.算术平均数如何计算?有什么数学性质?
2. 什么是标准差?如何计算?
3. 数据集中趋势的测度值有哪些?其中最主要的测度值是哪个?它有哪些
重要的数学性质?。