第四章数据分布特征的度量(精品文档)
数据分布特征的描述专项文档
主要用于顺序数据,也可 用数值型数据,
但不能用于分类数据
各变量值与中位数的离差绝对值之和最小,即
n
xi Me min
i1
①顺序数据的中位数 (例题分析)
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 累计频数
非常不满意
24
24
不满意
108
132
一般
93
225
满意
13.25
83
438 2 310
众数的计算方法总结:
1、观察法(①②例 题分析)
2、插值法P76(③ 例题分析)
所谓插值法就是先 找到众数所在的组, 然后按该组次数与 前后相邻两组分布 次数之差所占的比 重推算众数值。
M0
L
1 12
d
M0
U 1 12
d
例3.1 某车间实行计件工资,2005年10月 120名工人的月工资资料如下表所示:
解:从上表中我们可以看出,月工资变量值中最 大的字数为48人,即众数组为1000-1200这 一组。根据公式,可得:
M0
L
1 12
d
1000 4825 2001090.20(元 ) (4825)(4820)
M0
U 1 12
d
1200 4820 2001090.20(元 ) (4825)(4820)
45
270
非常满意
30
300
合计
300
—
解:中位数的位置为 300/2=150
从累计频数看,
中位数在“一般”这 一组别中
中位数为
Me=一般
②未分组数值型数据的中位数(奇数
统计学-数据的描述统计量
图4-1 150名“网约车”司机日营业额的直方图
19
“位置”的度量——众数
20
“位置”的度量
• 均值、中位数和众数是描述数据“中心位置”的三个主要统计量。 • 由于均值利用了最多的原始数据信息,且容易理解,在日常生活中最
为常用。 • 但作为“重心”的均值,容易受到数据分布形状的影响,如果数据存
在较为严重的偏斜程度(即存在极端值),均值对一组数据平均水平 的代表性较差,此时计算中位数可能是更好的选择。 • 而对于无序类别数据,使用众数则是一种必然。
21
第 4 章 数据的描述统计量
4.2 离散程度的度量
22
离散程度的度量——极差
• 极差(range)是一组数据的最大值和最小值的差值,也称全距,通 常用R表示。
• 极差计算简单,反映了一组数据取值的波动范围。 • 但极差只利用了最大值和最小值两个数值的信息,对极端值十分敏感,
对数据内部的具体变动情况揭示不够完整。
• 将一组数据由小到大排序后,百分位数的位置为: k%分位数位置=(n+1)×k%
• 如果根据公式计算得到的位置是整数,k%分位数就是该位置对应的 数值,否则就要对该位置左右两个数值进行相应的线性插值。
14
“位置”的度量——百分位数
【例4.4】沿用例4.3的数据,试计算十位企业家财富数据中哪个数值出现的次数最多,却掩盖
了所有数据的具体取值。
16
“位置”的度量——众数
统计学第4章数据特征的描述
极差计算简单,但容易受到极端值的影响,不能全面 反映数据的离散程度。
四分位差
定义
四分位差是第三四分位数与第 一四分位数之差,用于反映中
间50%数据的离散程度。
计算方法
四分位差 = 第三四分位数 第一四分位数
优缺点
四分位差能够避免极端值的影 响,更稳健地反映数据的离散
程度,但计算相对复杂。
方差与标准差
统计学第4章数据特征 的描述
https://
REPORTING
• 数据特征描述概述 • 集中趋势的度量 • 离散程度的度量 • 偏态与峰态的度量 • 数据特征描述在统计分析中的应用 • 数据特征描述的注意事项
目录
PART 01
数据特征描述概述
REPORTING
WENKU DESIGN
数据特征描述在推断性统计中的应用
参数估计 假设检验 方差分析 相关与回归分析
基于样本数据特征,对总体参数进行估计,如点估计和区间估 计。
通过比较样本数据与理论分布或两组样本数据之间的差异,对 总体分布或总体参数进行假设检验。
研究不同因素对总体变异的影响程度,通过比较不同组间的差 异,分析因素对总体变异的贡献。
定义
方差是每个数据与全体数据平均数之方根,用于衡量数据的波动大小。
计算方法
方差 = Σ(xi - x̄)² / n,标准差 = √方差
优缺点
方差和标准差能够全面反映数据的离散程度,且计算相对简单,但容易受到极端值的影响。同时,方差 和标准差都是基于均值的度量,对于非对称分布的数据可能不够准确。
适用范围
适用于数值型数据,且数据之间可能 存在极端异常值的情况。
特点
中位数不受极端值影响,对于存在极 端异常值的数据集,中位数能够更好 地反映数据的集中趋势。
统计习题——第四章-数据特征的度量知识分享
统计习题——第四章-数据特征的度量第四章数据特征的度量练习题:1.某城市土地面积和人口资料如下表所示:要求:根据上述资料计算出所有可能计算的相对指标,并指出分别属于哪一种相对指标。
答:可以计算结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标。
2.某企业2007年产值计划比2006年增加8%,实际比2006年增加10%,试问该企业的产值计划完成程度相对指标是多少?若该企业2007年单位产品成本计划比2006年的699元降低12元,实际单位产品成本为672元,该企业单位产品成本的计划完成程度是多少?解:3.某车间工人操作机床台数的资料如下表所示,试计算该车间工人平均操作机床台数。
解:=510%+660%+730%=6.2fx x f=⋅⨯⨯⨯∑∑(台)4.某集团公司所属的20家企业资金利润资料如下表所示,试计算该集团20家企业的平均利润率。
解:5.某公司三个企业利润计划及执行情况如下表所示:要求:分别根据上面的两个表计算该公司的利润平均计划完成程度相对指标,并比较两种方法有什么不同。
解:(1)(2)6.某投资银行的年利率按复利计算,10年的年利率分别是:第1年3%,第2-4年4%,第5-8年5%,第9-10年6%。
试计算平均年利率是多少? 解:设10年的平均本利率为Gx ,则7.某企业2007年12月份职工工资资料如下表所示:试计算职工平均工资、工资的中位数和众数,并根据三者的关系说明工资分布的特征。
解:平均工资: 中位数: 中位数的位置:192022kii f==∑=460众数:x Me Mo >>因为,所以工资分布呈右偏分布,即多于一半的职工工资低于平均工资。
8.某农作物的两种不同品种在生产条件基本相同的五个地块上试种,结果如下表所示:试计算这两种不同品种的农作物哪一个具有较大的稳定性,值得推广。
解:因为甲品种的变异系数小于乙品种的变异系数,所以甲品种具有较大的稳定性。
第四章 数据分布特征度量
220-230 230-240 合计
4 5 120
115 120 -
9 5 -
二、定序数据:中位数/四分位数
2. 四分位数(Quartile) 一组数据排序后处于25%、75%位臵上的变量值
25% 25% 25% 25%
QL
QM
QU
四分位数的计算 数据排序 确定四分位数位臵(n/4、 3n/4 ) 确定该位臵上的数值(QL、QU)
1. 极差(全距) 一组数据的最大值与最小值之差 特点 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布
7 8 9 10
计算公式: R = max(xi) - min(xi)
7 8 9 10
2. 平均差(平均绝对离差 ) 各变量值与其平均数离差绝对值的平均数 计算公式 n xi x 简单平均差
可看作是均值的一种变形
X
i 1
n i 1
n
i
1 lg G (lg x1 lg x2 lg xn ) n
lg x
n
i
几何平均法的含义 从最初水平 a0 出发,每期按平均发展速度发展, 经过 n 期后将达到最末期水平 an 只与序列的最初观察值 a0 和最末观察值 an 有关
§4.2
离散趋势的度量
离散趋势 不同类型的数据有不同的 离散程度测度指标 常用测度指标: 异众比率 四分位差 方差和标准差 离散系数
§4.2 离散趋势的度量
一、定类数据:异众比率
非众数组的频数占总频数的比例 特点 用来衡量众数对一组数据的代表程度 主要用于定类数据 计算公式 k fi f m f Vr i 1 k 1 k m fi fi
数据分布特征的描述
数据分布特征的描述原⽂链接:知识点:数据分布特征的描述1、变量集中趋势的测定变量在不同个体或不同时间条件下具体表现出来的数据是不同的,不过众多个体的数据常常会呈现出在⼀定范围内围绕某个中⼼⽽波动的分布特征。
衡量数据集中趋势的指标有两类:⼀类是数值平均数,包括算数平均数、调和平均数、⼏何平均数;另⼀类是位置代表值,根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。
测定集中趋势指标的作⽤主要是:1)反映变量分布的集中趋势和⼀般⽔平;2)可⽤来⽐较同⼀现象在不同空间或不同阶段的发展⽔平;3)可⽤来分析现象之间的依存关系。
1)数值平均数a、算术平均数(arithmeticmean),即均值(mean):将⼀组数据的总和除以这组数据的项数所得的结果。
2)位置平均数a、众数(mode)是⼀组数据中出现频数最多、频率最⾼的变量值。
众数代表的是最常见的、最普遍的状况,是对现象集中趋势的度量。
众数既可度量定量变量(数值型数据)的集中趋势,也可⽤来测度定性变量(⾮数值型数据)的集中趋势。
b、中位数(median)是将数据从⼩到⼤排序后位置居中的数值,奇数取中间,偶数取中间两个数值的平均数。
总结:算术平均数是数值平均数,和中位数⼀样在任何⼀组数据中都存在且是唯⼀的。
算术平均数受数据中极端值的影响,⽽众数和中位数则不受极端值的影响。
算术平均和众数、中位数三者之间的数量关系取决于数据分布的偏斜(⾮对称)程度:对于呈现单峰分布特征的数据,如果分布是对称,则三者相等;如分布是左偏(负偏),数据中的极⼩值会使算术平均数偏向较⼩的⼀⽅,极⼩值⼤⼩不影响中位数,但其所占项数会影响数据的中间位置从⽽略使中位数偏⼩,众数则完全不受极⼩值⼤⼩和位置的影响,所以是众数⼤于中位数⼤于算术平均数;如果分布式右偏(正偏),则反之。
2、变量离散程度的测定数据的集中趋势和离散程度是数据分布最基本的两⼤特征。
集中趋势反映了数据聚集的中⼼所在,数据的离散程度说明数据之间差异程度的⼤⼩。
统计学-数据分布特征
2
描述集中趋势的统计
一、平均数
平均数:
集中趋势的测度值之一
最常用的测度值
一组数据的均衡点所在 易受极端值的影响
用于数值型数据,不能用于品质型数据
4
一、平均数
5
平均数的计算公式
6
二、中位数和分位数
(一)中位数 集中趋势的测度值之一 排序后处于中间位置上的值 不受极端值的影响
14
15
例:某城市居民关注广告类型的频数分布
16
例:甲城市家庭对住房状况评价的分布频数
17
四、各度量值的比较
18
四、各度量值的比较
19
四、各度量值的比较
20
各度量值适用的数据类型
21
4.2离散程度的度量
22
4.2离散程度的度量
离散程度 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离 中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值
50
51
一、偏态及其测度
52
二、峰态及其测度
53
例:
54
55
56
57
用Excel计算描述统计量
58
用Excel计算描述统计量 72页习题2
59
60
61
62
63
作业1:
64
65
作业2:
66
答案:
67
68
对某一个值在一组数据中相对位置的度量 可用于判断一组数据是否有离群点 用于对变量的标准化处理
40
标准分数的性质
41
例:
数据分布特征的描述讲解
数据分布特征的描述讲解数据分布特征描述是统计学中对一组数据进行概括和描述的过程。
我们通常使用中心趋势和离散程度来描述数据分布的特征。
中心趋势是指数据集中的一个值,代表数据的代表性,常用的中心趋势措施包括均值、中位数和众数。
离散程度则是指数据的变异程度,包括范围、方差、标准差和四分位距等。
首先,均值是一组数据的中心趋势的一个常用度量。
它是所有数据值的总和除以数据的个数。
均值具有很强的代表性,尤其对于正态分布的数据而言。
均值的计算公式为:mean = (x1 + x2 + ... + xn) / n。
其次,中位数是数据集中的一个特殊值,将数据按照大小排列后,处于中间位置的数即为中位数。
中位数不受极端值的影响,能够更好地反映数据的集中趋势。
对于偶数个数据,中位数为中间两个数的平均值;对于奇数个数据,中位数为中间一个数。
中位数的计算可以通过将数据按照大小排列,然后找到中间位置的数来得出。
此外,众数是数据集中出现频率最高的值,可以是一个或多个。
众数对于描述数据的集中趋势也具有一定的代表性。
众数的计算可以通过建立频数分布表,然后找到出现次数最多的数来得出。
除了中心趋势,离散程度也是描述数据分布特征的重要度量。
范围是测量数据分布范围的最简单方式,它是一组数据中的最大值减去最小值。
范围对于描述数据的离散程度有一定的指示作用,但它受极端值的影响较大,不能完全反映整体数据的变异程度。
方差是衡量数据分布离散程度的一种指标,它表示数据偏离均值的程度。
方差的计算公式为:variance = Σ(xi - mean)² / n,其中xi为每个数据值,mean为均值,n为数据个数。
方差越大,数据的离散程度也越大。
标准差是方差的正平方根,它具有和原始数据单位一致的度量标准,常用于度量数据的波动性。
标准差的计算公式为:standard deviation = √variance。
四分位距是一种度量数据分布离散程度的方法,它是数据按从小到大排列后,第25%分位数和第75%分位数之间的差值。
统计学习题集(附答案)
统计学习题集(附答案)统计学习题集⽬录第⼀章导论..................................................................................... 1第⼆章数据的搜集......................................................................... 6第三章数据的整理与显⽰........................................................... 9第四章数据分布特征的测度................................................... 14第五章概率与概率分布 ......................................................... 24第六章抽样与参数估计 ......................................................... 28第七章假设检验 ..................................................................... 33第⼋章相关与回归分析 ......................................................... 37第九章时间序列分析和预测 ................................................. 45第⼗章指数 ............................................................................. 55第⼀章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究⽅法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。
统计学基础复习提纲复习内容统计数据数据搜集
统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。
重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。
(3)统计中的基本概念:总体与样本;参数与统计量;变量。
第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。
(5)总体均值的检验:大样本检验方法;小样本检验方法。
第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。
(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。
(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测平均数:x 二2 4 10 11| 14 151096 9.610(2-9.6)2(4-9.6)2 川(15-9.6)2n -110-12、一家公司在招收职员时,首先要进行两项能力测试。
在A 测试中,其平均分数是100分, 标准差是15分;在B 项测试中,其平均数是 400分,标准分数是50分。
第4章 数据的概括性度量
5
利用图表展示数据,只是对数据分布的形状和特征给出一个粗略的了解,如要全 面把握数据分布的特征,还需要找到反映数据分布特征的各个代表值。 数据分布特征的测度和描述可以分解为三个方面:分布的集中趋势,反映各数据 向中心值靠拢或聚集的程度;离散程度,反映各数据远离其中心值的程度;分布 的形状,反映数据分布的偏态与峰态。
解:这里的数据为顺序数据。变 量为“回答类别” 甲城市中对住房表示不满 意的户数最多,为 108 户,因此 众数为“不满意”这一类别,即
户数 (户)
24 108 93 45 30 300
百分比 (%)
8 36 31 15 10 100.0
Mo=不满意
12
70
顺序数据:中位数和分位数
在一组数据中,可以找出处在某个位置上的数据,称为分位数。 常用的分位数主要有中位数和四分位数。
中位数(median)
13
i 1
n
xi M e min
70
中位数(位置和数值的确定)
位置确定 中位数位置 n 1
2
n为数据个数
设一组数据按从小到大的顺序排序成x(1),x(2),…,x(n), 则中位数
x n 1 2 数值确定 M e 1 x n x n 1 2 2 2
果汁 矿泉水 绿茶 其他 碳酸饮料 合计
6 10 11 8 15 50
0.12 0.20 0.22 0.16 0.30 1
12 20 22 16 30 100
Mo=碳酸饮料
11
70
顺序数据的众数(例题分析)
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 甲城市
第4章 综合指标分析法(二)
单项分布数列:求20名工人日产量的中位数
日 产量 (件) 14 x
15
16
17
18
合计
工 人人数 (人)
2f
4
8
5
1
20
向上累计 向下累计
人数
人数
2
20
6
18
14
14
19
6
20
1
-
-
排序:向上累计人数或向 下累计人数;
确定中间位置:(20+1)/2 =10.5位
确定中位数:第10.5位在 第三组,故他们日产量的 中位数是16件。
1.排序 2.计算中间位置(n+1)/2 3.确定中间位置的变量值--中位数 。
顺序数据的中位数
(例题分析)
甲城市家庭对住房状况评价的频数分布 解:这里的数据为
满意程度
甲城市
顺序数据。变量为
户数 (户) 百分比 (%) “满意程度”
非常不满意
24
不满意
108
一般
93
满意
45
非常满意
30
8
该城市中对住
不受极端值影响 具有不唯一性 据分布偏斜程度较大时应用
中位数 不受极端值影响
数据分布偏斜程度较大时应用
均值
易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用
众数、中位数和均值的关系
均值<中位数<众数 均值 = 中位数 = 众数
众数< 中位数< 均值
左偏分布
对称分布
右偏分布
小结:集中趋势的度量
由组距数列计算算术平均数:
某企业60个工人的月工资分组资料如下:
月工资 (元)
数据的分布特征知识点
数据的分布特征知识点数据的分布特征是统计学中非常重要的概念,它描述了数据集中各个数据值在整个数据集中的分布情况。
通过了解数据的分布特征,我们可以更好地理解数据的组织形式,并从中获取有关数据的相关信息。
本文将介绍数据的分布特征的几个重要知识点,包括均值、中位数、众数、标准差以及偏度和峰度。
1. 均值均值是数据集中所有数据值的平均数。
计算均值的方法是将所有数据值相加,然后除以数据的总个数。
均值可以反映数据集中数据值的集中趋势,当数据集中的数据值比较平均分布时,均值对数据的代表性较好。
2. 中位数中位数是将数据集中的所有数据值按照大小排列后的中间值。
如果数据个数为奇数,则中位数是中间的那个数;如果数据个数为偶数,则中位数是中间两个数的平均值。
中位数不受异常值的影响,更能反映数据的中心位置。
3. 众数众数是数据集中出现次数最多的数值。
一个数据集可以有一个或多个众数,或者没有众数。
众数可以用来表示数据集中的典型值,特别适用于表示分类数据。
4. 标准差标准差是用来衡量数据离均值的距离。
标准差越大,数据分布越分散;标准差越小,数据分布越集中。
标准差可以反映数据的离散程度,对于比较不同数据集之间的离散程度也非常有用。
5. 偏度和峰度偏度和峰度用来描述数据分布的形态。
偏度衡量了数据分布的对称性,正偏度表示数据分布偏向右侧,负偏度表示数据分布偏向左侧,而零偏度表示数据分布接近对称。
峰度衡量了数据分布的尖锐程度,正峰度表示数据分布较尖锐,负峰度表示数据分布较平坦,而零峰度表示数据分布接近正态分布。
总结:数据的分布特征对于理解和分析数据至关重要。
通过了解数据的均值、中位数、众数、标准差、偏度和峰度等知识点,我们可以更好地描述和解读数据。
这些分布特征可以帮助我们揭示数据背后的规律,并为数据分析和决策提供依据。
在实际应用中,我们可以根据数据的特点选择适当的描述方法,进而更好地分析和利用数据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章思考与习题
一、思考题
1.什么是集中趋势?测度集中趋势常用指标有哪些?
2.算术均值.众数和中位数有何关系?
3.什么是几何平均数?其适用场合是什么?
4.什么叫离散趋势?测度离散趋势常用指标有哪些?
5.为什么要计算离散系数?
二、练习题
(一)填空题
1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势离散程度偏斜和峰度__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。
2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080.750.1080.850.960.2000.1050.1080.760.1080.950.1080.660,则其众数为,中位数为。
3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。
4.简单算术均值是__________的特例。
4.几何均值主要用于计算__________的平均。
5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。
6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。
7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。
8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。
(二)判断题
1.众数的大小只取决于众数组与相邻组次数的多少。
()
2.当总体单位数n为奇数时,中位数=(n+1)/2。
()
3.根据组距分组数据计算的均值是一个近似值。
()
4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。
()
5.标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据在该组数据中的位置,只是使该组数据的均值为0,标准差为1。
()
6.已知一组数列的方差为9,离散系数为30%,则其均值等于30()。
7.投资者连续三年股票投资收益率为4%.2%和5%,则该投资者三年内平均收益率为3.66%。
()
8.离散系数最适合用于对不同性质或不同水平数据的算术均值代表性的比较。
()
9.当偏态系数sk>0时,表明数据分布属于对称分布。
()
10.当峰度系数k<0时,表明数据分布属于正态分布。
()
(三)单项选择题
1.由组距分组数据确定众数时,如果众数组相邻两组的次数相等,则()。
A.众数为零B.众数组的组中值就是众数
C.众数不能确定D.众数组的组限就是众数
2.某寝室11名同学的英语成绩分别为70.71.76.78.8
3.86.85.81.90.93.97,则英语成绩的上四分位数为()
A.86 B.74.75 C.90 D.81
3.受极端数值影响最小的集中趋势值是()。
A.算术均值 B.众数和中位数 C.几何均值 D.调和均值
4.加权算术均值中的权数为()。
A.变量值 B.次数的总和 C.变量值的总和 D.次数比重
5.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图
3026785
5654
则该产品销售量的中位数为( )。
A .5 B .45 C .56.5 D .7.5 6.某车间三个班生产同种产品,6月份劳动生产率分别为2.3.4(件/工日),产量分别为400.500.600件,则该车间平均劳动生产率计算式应为( )。
A .33432=++
B .13.31500600
450034002=⨯+⨯+⨯
C .88.24323
=⨯⨯ D .9
.24600
350024001500
=++
7.若两个变量的平均水平接近,标准差越大的变量,其( ) A .平均值的代表性越好 B .离散程度越大 C .稳定性越高 D .上述三种都不对
8.若某总体次数分布呈轻微左偏分布,则下列关系式成立的有( ) A.x > e m >0m B.x <e m <0m C.x >0m >e m D.x <0m <e m
9.标准差系数抽象了( )。
A .总体单位数多少的影响
B .算术均值高低的影响
C .总体指标数值大小的影响
D .标志变异程度的影响
10.某公司职工年薪4万元的人最多,平均收入为4万元,则职工年薪的分布( )。
A .正偏
B .负偏
C .对称
D .不能作出结论
11.对几组平均水平相同的数据进行离散程度的比较时,通常使用的统计量是( )。
A .极差
B .平均差
C .标准差
D .离散系数
12.比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断( ) A .乙组x 的代表性高于甲组 B .甲组x 的代表性高于乙组 C .甲.乙组的工作均衡性相同 D .无法确定 13.离散程度的测度值愈大,则( )
A.反映变量值愈分散,算术均值代表性愈差
B.反映变量值愈集中,算术均值代表性愈差
C.反映变量值愈分散,算术均值代表性愈好
D.反映变量值愈集中,算术均值代表性愈好
14.若各个标志值都扩大2倍,而频数都减少为原来的1/3,则均值()
A.扩大2倍B.减少到1/3 C.扩大2/3 D.不变(四)多项选择题
1.加权算术均值的大小受下列因素的影响()。
A.各组变量值大小的影响B.各组频数多少的影响
C.与各组变量值大小无关D.与各组频数多少无关
E.各组变量值和频数共同影响
2.测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有()
A.算术均值 B.标准差
C.几何均值 D.四分位差 E.离散系数
3.对于数值型数据,描述集中趋势可选用的度量值有()。
A.众数 B.中位数 C.算术均值
D.四分位数 E.全距
4.比较两组工作成绩:算术均值甲组小于乙组,标准差甲组大于乙组,则()。
A.乙组算术均值代表性高于甲组B.甲组算术均值代表性高于乙组
C.乙组工作的均衡性好于甲组 D.甲组工作的均衡性好于乙组
E.甲组离散程度大于乙组
5.将所有变量值都减去10,那么其()。
A.算术均值不变 B.算术均值减去10
C.方差不变 D.标准差不变 E.标准差系数不变
(五)计算题
1.某百货公司6月份各天的销售额数据如下(单位:万元):
257 276 297 252 238 310 240 236 265 278
271 292 261 281 301 274 267 280 291 258
272 284 268 303 273 263 322 249 269 295
(1)计算该百货公司日销售额的均值.中位数和四分位数;
(2)计算日销售额的标准差。
2.工人日生产零件分组资料如下,要求:(1)计算算术均值.众数和中位数;(2)说明数列的分布特征。
质品率资料如下,要求计算:(1)该公司产量计划完成百分比;(2)该公司实际的优质品率。
5.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。
请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?
(2)以磅为单位(1公斤=2.2磅),求体重的均值和标准差。
(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?
(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?
6.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:
成年组166 169 172 177 180 170 172 174 168 173
幼儿组68 69 68 70 71 73 72 73 74 75
(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?
(2)比较分析哪一组的身高差异大?。