第2章统计数据的描述

合集下载

医学统计学-第二章 统计描述

医学统计学-第二章 统计描述
变异系数(Coefficient of variation,CV)
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。

统计学 第2章 统计数据的描述

统计学 第2章 统计数据的描述

第2章统计数据的描述练习:2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。

2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

2.3某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

统计学第二章

统计学第二章

按性别分组 男生 女生 合计
人数 30 20 50
百分比 % 60 40 100

三、按数量标志分组
按照数量或数值等定量指标分组,称为按数量 标志分组。
(1)单变量分组:一个变量值为一组,适合离散 变量,且变量值较少。步骤是先排序再分组。 (2)组距分组:
将全部变量值划分为若干区间,并将这一区间的变量值 作为一组,适用于连续变量或变量值较多的情况。 需要遵循“不重不漏”的原则,可采用等距分组,也可 采用不等距分组。
2.1 统计数据的整理
2.1.0 2.1.1 2.1.2 2.1.3 2.1.4 数据的预处理 统计数据的分组 次数分配 次数分配直方图 洛伦茨曲线
2.1.0 数据的预处理
一、数据的审核 对原始数据,审核完整性和准确性。前者指 调查单位是否遗漏、项目是否齐全等;后者 指数据是否真实、是否错误等。方法是逻辑 检查和计算检查。 对二手数据审核完整性和准确性外,着重审 核数据的适用性和时效性。前者应清楚数据 的来源、口径和背景,后者应注意数据的时 间,使用最新的数据。
当f-1=f+1时如图(a),当f-1>f+1时如图(b), 当f-1<f+1时如图(c)。
(a)
(b)
(c)
②公式计算:
上限公式
f f 1 M0 U ( f f 1) ( f f f f 1 M0 L ( f f 1) ( f f
1
2.1.2 次数分配
对于例2-1采用组距分组,计算组数K=1+1g30/ 1g2=5(组),组距 =(128-84)/ 5=8.8,组距取10件,整理成频数分布表2-3。

统计学习题1

统计学习题1

第2章统计数据的描述练习:2.1为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。

2.2某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。

2.3在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200~300 19300~400 30400~500 42500~600 18600以上11合计120计算120家企业利润额的均值和标准差。

第2章统计数据的描述

第2章统计数据的描述

第二章统计数据的描述一、单项选择题1.下列中,最粗略、计量层次最低的计量尺度是()A.间隔尺度B.顺序尺度C.比例尺度D.列名尺度2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是()A.比例尺度B.列名尺度C.间隔尺度D.顺序尺度3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是()A.列名尺度B.间隔尺度C.顺序尺度D.比例尺度4.下列中,计量层次的最高、最精确的计量尺度是()A.比例尺度B.间隔尺度C.顺序尺度D.列名尺度5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是()A.抽样调查B.重点调查和典型调查C.统计报表D.普查6.实际中应用最为广泛的一种调查方式是()A.重点调查B.统计报表C.普查D.抽样调查7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.抽样调查B.典型调查C.重点调查D.普查8.一次性调查是指()A.只做过一次的调查B.调查一次以后不再调查C.间隔一段时间在进行一次调查D.只隔一年就进行一次的调查9.在统计分析中,对累积的次数分配用得最直接的是()A.供给曲线B.需求曲线C.洛伦茨曲线D.边际需求曲线10.专门用来衡量和反映收入分配平均程度的统计指标是()A.基尼系数B.可决系数C.相关系数D.离散系数11.一般认为,基尼系数在()之间是比较恰当的。

A.0.1—0.2B.0.2—0.4C.0.4—0.6D.0.6—0..812.一般认为,基尼系数等于()是收入分配不公平的警戒线。

A.0.2B.0.6C.0.4D.0.813.利用公式计算众数的基本假定之一是众数组的频数在该组内呈()A.正态分布B.t分布C.均匀分布D.偏态分布14.计算中位数时,假定中位数所在组的频数在该组内呈()A.左偏分布B.正态分布C.右偏分布D.均匀分布15.反映数据分布集中趋势的最主要的测度值是()A.众数B.中位数C.均值D.几何平均数16.各个变量值与均值的离差之和()A.大于0B.小于0C.等于0D.等于一个不为0的常数17.各个变量值与均值的离差平方和()A.为最大B.为最小C.为0D.为一个不为0的常数18.下列中,专门用来衡量众数代表性大小的离散程度测度值是()A.异众比率B.四分位差C.方差或标准差D.极差19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是()A.方差和标准差B.内距C.异众比率D.平均差20.下列中,适用于列名数据的集中趋势测度值是( )A.众数B.中位数C.均值D.几何均值21.描述数据离散程度最简单的测度值是( )A.平均差B.方差和标准差C.极差D.四分位差22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。

统计学第2章 统计数据的描述(1)

统计学第2章 统计数据的描述(1)

(4)组中值:上下限之间中点的值。
组中值=(上限+下限)/2=上限-组距/2 =下限+组距/2
“××以上”、“××以下”这样的组叫开口组。一般假 定开口组的组距与其相邻组的组距相等。其组中值计算如下: 缺下限最小组的组中值=上限-相邻组组距/2 缺上限最大组的组中值=下限+相邻组组距/2 见第37页的表2.15
第三节 统计整理
一、统计整理的概念和步骤
概念:统计整理是根据统计研究的目的和要求,把统计调查 从而得到反映事物总体特征资料的过程。
步骤: 第一,统计资料审核。包括及时性(整个工作期限、搜 集资料的时间、资料所属的时间);准确性(事实求地反映 实际情况、计算正确);完整性(规定应调查的总体单位、 每个调查单位应调查的内容)等方面的审核。 第二,统计分组 第三,统计汇总 第四,编制统计表或绘制统计图
提供统计数据的部分政府网站
美国政府机构 人口普查局 联邦储备局 预算编制办公室 商务部 网 址 数据内容
人口和家庭等 http://www.bog.frb.fed. 货币供应、信誉、 us 汇率等 http://www.whitehouse. 财政收入、支出、 gov/omb 债券等 商业、工业等
统计数据的来源主要有两个: 一是直接来源,即来源于直接的调查和科学试验, 得到第一手数据。 二是间接来源,即来源于别人调查或试验的数 据,得到第二手数据。
见第8-9页
一、统计数据的直接来源 1、普查
(1)概念 为了某一特定目的而专门组织的一次性全面调查。 (2)特点 ①具有一次性和周期性。
“一次性”是指调查现象在某一时点上的数据。
(1)对称分布:以变量值的中点为对称轴的对称分布。
(2)偏态分布:

统计数据的描述 PPT课件

统计数据的描述 PPT课件
6000 5000 4000 2000 1000 0 东部 中部 西部
2)计算各类别的频数(频率) 3000 3)制作频数(频率)分布表 4)用图形显示数据
定类数据整理—频数分布表(实例)
【例】 为研究广告市
场的状况,一家广告公 司在某城市随机抽取 200 人就广告问题做了 邮寄问卷调查,其中的 一个问题是“您比较关 心下列哪一类广告?” 1.商品广告; 2.服务广告;3.金融 广告; 4 .房地产广告; 5.招生招聘广告; 6.其他广告。
针对原始数据
1、数据的审核与筛选
数据的审核:从数据的完整性、准确性、 适用性、时效性几个方面发现数据的错误
针对二手数据
数据的筛选:找出符合条件的数据,对于 错误的或不符合条件的数据予以剔除
2、数据的排序
数据的排序
按一定顺序将数据排列,以发现一 些明显的特征或趋势,找到解决问题的 线索,排序还有助于对数据检查纠错, 以及为重新归类或分组等提供依据
定序数据的显示—累计频数分布图 (由 Excel 绘制的累计频数分布图)
累 积 300 户 数 200 (户) 100 0 24 132
400 270 300
225
累 积 300 300 户 数 200 (户) 100 0
400
276 168 75 30 非常 满意
非常 不满意 一般 不满意
满意
(a)向上累积
圆形图(饼图) 主要用于表示总体中各组成部分所占的比例, 对于研究结构性问题十分有用。在绘制圆形 图时,总体中各部分所占的百分比用圆内的 各个扇形面积表示。
招生招聘广告 其他广告 1.0% 5.8% 8.0%
房地产广告 金融广告 4.5%
服务广告 25.5%

《医学统计学》第二章定量数据的统计描述

《医学统计学》第二章定量数据的统计描述
630
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630

累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)

统计学(第四版)袁卫 庞皓 贾俊平 杨灿 (02)第2章 统计数据的描述(袁卫)

统计学(第四版)袁卫 庞皓 贾俊平 杨灿 (02)第2章 统计数据的描述(袁卫)
i 1 n i
n
2. 各变量值与平均数的离差平方和最小
(x
i 1
5 - 36
i
x ) min
2
统计学
STATISTICS
几何平均数
统计学
STATISTICS
几何平均数
(geometric mean)
n 个变量值乘积的 n 次方根 2. 适用于对比率数据的平均 3. 主要用于计算平均增长率 4. 计算公式为
QM
25%
QU
2. 不受极端值的影响 3. 主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
5 - 27
统计学
STATISTICS
四分位数
(位置的确定)
n 1 QL 位置 4 Q 位置 3(n 1) U 4 n QL 位置 4 Q 位置 3n U 4
去掉大小两端的若干数值后计算中间数 据的均值 2. 在电视大奖赛、体育比赛及需要人们进行 综合评价的比赛项目中已得到广泛应用 3. 计算公式为
1.
x
5 - 41
x( n 1) x( n 2) x( n n ) n 2 n
1 2
n 表示观察值的个数;α表示切尾系数,0
f
i
i i
样本平均数
5 - 34
f
i 1
i
统计学
STATISTICS
加权平均数 (例题分析)
x
x f
i 1 k
k
i i
f
i 1
i
3110 103.67 (件) 30
5 - 35
统计学
STATISTICS
平均数

统计学第三版书后答案第二章

统计学第三版书后答案第二章

第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。

解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)x=xn∑=822330=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e=2722732+=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:Q L=261+2732724-=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:Q U=291-2732724-=290.75(万元)。

(2)未分组数据的标准差计算公式为:s =302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。

手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。

(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。

第二章统计描述

第二章统计描述

G ' lg1(
fi lg Xi ) lg1(
1 0.6021 4 0.9031
1 2.709Байду номын сангаас )
fi
40
lg1(67.1282) 48 40
G 1: 48
中位数(median, M)
适合于表达偏态资料、或分布不明的资料的平 均水平,尤其适合于表达只知数据的个数、但 部分较大或较小数据的具体数值未准确知道的 资料的平均水平。
血清总胆固醇 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~
7.0~7.5 合计
频数f 1 8 9 23 25 17 9 6 2 1
101
fx 2.75 26 33.75 97.75 118.75 89.25 51.75 37.5 13.5 7.25 478.25
13
174
单侧正常值范围的上限为 1.81
14
188
(mol/L)。
1.69~
4
192
1.93~
4
196
2.17~
1
197
2.42~
2
199
2.66~
0
199
2.90~3.14
1
200
3.四分位数间距(quartile interval, Q)
Q=P75-P25
Q=QU-QL
优缺点:用四分位数间距作为描述数据分布离散 程度的指标,比极差稳定,但仍未考虑到每个数 据的大小,常用于描述偏态频数分布以及分布的 一端或两端无确切数值资料的离散程度。
第1四分位数记作Q1,第2、第3四分位数,分别记作 Q2、Q3;第1百分位数,记作P1。同理,还有第2、第 3、 ···、第99百分位数,分别记作P2、P3、 ···、P99。

统计学第2章 数据分布特征的描述(2)

统计学第2章 数据分布特征的描述(2)
①对于未分组资料
N ②对于分组数据(组距式变量数列要先计算出各组组中
值来作为各组的变量值 X )
σ
2
σ2
X X
2
X X F
2
F
(2)总体标准差(σ)
①对于未分组资料:
σ
X X
N
2
②对于分组数据: σ
X X F F
2
2、样本方差( S
1、单项式变量数列
标志值 x x1 x2 x3
. . . .
次数 f f1 f2 f3
. . . .
标志总量 xf x1f1 x2f2 x3f3
. . . .
比重 f/ ∑f f1/ ∑f f2/ ∑f f3/ ∑f
. . . .
xn 合 计
fn
∑f
xn fn
∑xf
fn/ ∑f 1
f xf x x f f
3 n 1 Q3是第 位置上的数值; Q4是最大值。 4
注意:
1、如果数据个数不能被4除尽时,还是按这个规则来确定分位 数的位置;2、有时可能出现分位数在两个数之间的情况,这时
如果分位数刚好在这两个数的正中间时,分位数就是这两个数相 加除以2。但有时不是刚好在这两个数的正中间时,要用其中比较 小的数加上按比例分摊的这两个数之间的距离。
见第33页的例题
三、方差和标准差
(一)概念
各变量值与其算术平均数离差平方的算术平均数叫方差; 方差的方根就是标准差。 注意:由于标准差与变量值的单位相同,其实际意义要比方 差清楚,因此在对社会经济现象进行分析时,更多使用标准差。
(二)计算
1、总体方差(σ2)和总体标准差(σ)
(1)总体方差(σ2)

第2章-统计数据的收集整理与显示

第2章-统计数据的收集整理与显示

C、1750元
2、某连续数列变量,首组为60分以下,其邻组的组中值
为75,则首组的组中值为( )。
A、30 B、35 C、40 D、45
2.5.3 累计频数和累计频率 1.累计频数(cumulative frequencies) 累计频数就是将各有序类别或组的频数逐级累加起来。 2.累计频率或百分比(cumulative percentages) 累计频率就是将各有序类别或组的频率逐级累加起来。
全国总人口为1370536875人。其中: 普查登记的大陆31个省、自治区、直辖市和 现役军人的人口共1339724852人。 香港特别行政区人口为7097600人。 澳门特别行政区人口为552300人。 台湾地区人口为23162123人。
大陆31个省、自治区、直辖市和现役军人的 人口中, 男性人口为686852572人,占51.27%; 女性人口为652872280人,占48.73%。 总人口性别比(以女性为100,男性对女性 的比例)由2000年第五次全国人口普查的 106.74下降为105.20。
§2.1 统计调查的概念和方案的设 计
统计调查:按照 研究目的及要求 ,运用 科学的统计调查方法,有计划、有组织地 向调查对象 搜集 原始资料和次级资料的过 程
广州广播听众调查问卷
目的:了解我市听众收听广州人民广播电台节目的一些 基本情况,为提高节目质量、推出优秀节目提供
科学依据。
对象和单位:广州市市民 调查项目和调查表: 调查什么 调查项目:听众收听广州人民广播电台节目的 一些基本情况 调查表:调查项目以表格的形式来表现。
2. 普查是为了某种特点的目的而进行的( A、专门组织的一次性的全面调查 B、专门组织的经常性的全面调查 C、非专门组织的一次性的全面调查

统计学简答题参考答案

统计学简答题参考答案

统计学简答题参考答案第一章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。

统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。

2.简要说明统计数据的来源。

答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。

间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。

3.简要说明抽样误差和非抽样误差。

答:统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

4.解释描述统计和推断统计的概念?(P5)答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。

推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。

第二章统计数据的描述1描述次数分配表的编制过程。

答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。

按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。

按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。

统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。

2. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。

常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

3.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章统计数据的描述一、单项选择题1.下列中,最粗略、计量层次最低的计量尺度是()A.间隔尺度B.顺序尺度C.比例尺度D.列名尺度2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是()A.比例尺度B.列名尺度C.间隔尺度D.顺序尺度3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是()A.列名尺度B.间隔尺度C.顺序尺度D.比例尺度4.下列中,计量层次的最高、最精确的计量尺度是()A.比例尺度B.间隔尺度C.顺序尺度D.列名尺度5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是()A.抽样调查B.重点调查和典型调查C.统计报表D.普查6.实际中应用最为广泛的一种调查方式是()A.重点调查B.统计报表C.普查D.抽样调查7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.抽样调查B.典型调查C.重点调查D.普查8.一次性调查是指()A.只做过一次的调查B.调查一次以后不再调查C.间隔一段时间在进行一次调查D.只隔一年就进行一次的调查9.在统计分析中,对累积的次数分配用得最直接的是()A.供给曲线B.需求曲线C.洛伦茨曲线D.边际需求曲线10.专门用来衡量和反映收入分配平均程度的统计指标是()A.基尼系数B.可决系数C.相关系数D.离散系数11.一般认为,基尼系数在()之间是比较恰当的。

A.0.1— —0.4 C.— —0..812.一般认为,基尼系数等于( )是收入分配不公平的警戒线。

A.0.2B.0.6C. 利用公式计算众数的基本假定之一是众数组的频数在该组内呈( )A.正态分布 分布 C.均匀分布 D.偏态分布14.计算中位数时,假定中位数所在组的频数在该组内呈( )A.左偏分布B.正态分布C.右偏分布D.均匀分布15.反映数据分布集中趋势的最主要的测度值是( )A.众数B.中位数C.均值D.几何平均数16.各个变量值与均值的离差之和( )A.大于0B.小于0C.等于0D.等于一个不为0的常数17.各个变量值与均值的离差平方和( )A.为最大B.为最小C.为0D.为一个不为0的常数18.下列中,专门用来衡量众数代表性大小的离散程度测度值是( )A.异众比率B.四分位差C.方差或标准差D.极差19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是( )A.方差和标准差B.内距C.异众比率D.平均差20.下列中,适用于列名数据的集中趋势测度值是( )A.众数B.中位数C.均值D.几何均值21.描述数据离散程度最简单的测度值是( )A.平均差B.方差和标准差C.极差D.四分位差22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。

A.σ±X B.σ2±X C.σ3±X D.σ4±X23.用来对两组数据的差异程度进行比较的统计分析指标是( )A.基尼系数B.标准差系数C.相关系数D.可决系数24.测定数据分布偏斜程度需要计算( )A.标准差系数B.峰度系数C.基尼系数D.偏态系数25.一组数据的偏态系数SK=0,可以判断该组数据呈()A.正态分布B.对称分布分布 D.均匀分布26.一组数据的偏态系数SK>0,可以判断该组数据呈()A.对称分布B.右偏分布C.扁平分布D.左偏分布27.一组数据的偏态系数SK<0,可以判断该组数据呈()A.对称分布B.右偏分布C.扁平分布D.左偏分布二、多项选择题1. 计量结果表现为类别,不能进行加减乘除运算的计量尺度为()A.间隔尺度 B.比例尺度 C.列名尺度 D.顺序尺度 E.以上答案都不正确2.抽样调查()A.是一种全面调查B.是一种经常性调查C.是一种非全面调查D.是一种一次性调查E.利用随机样本对总体数量特征进行推断3.普查()A.是一种非全面调查B.是一种非全面调查C.是一种经常性调查D.是一种一次性调查E.需要规定统一的标准调查时间4.抽样调查具有()等特点。

A.经济性强B.调查工作量大C.时效性高D.适应面广E.、准确性高5.下列中,属于登记性误差的是()A.调查中不回答产生的误差B.违背随机原则产生的系统误差C.不完整的抽样框导致的误差D.由于样本的代表性产生的误差E.调查方案中有关规定或解释不明确所导致的填报、抄录、汇总等错误6.单变量值分组主要是用于()等场合。

A.离散变量B.连续变量C.数据较少且重复次数多D.数据较多且重复次数少E.以上答案均正确7.实际工作中,为了便于计算,组距()A.宜取5或10的倍数B.第一组的下限值要大于最小的变量值C.第一组的下限值要小于最小变量值D.最后一组的上限值要小于最大变量值E.最后一组的上限值要大于最大变量值8.数据的预处理主要包括()A.数据的搜集B.数据的审核C.数据的分组D.数据的筛选E.数据的排序9.下列中属于位置平均数的是()A.几何均值B.众数C.算术均值D.调和均值E.中位数10.下列中属于静态平均数的是()A.算术均值B.序时均值C.众数和中位数D.几何均值E.调和均值11.下列说法中正确的是()A.众数是一组数据中出现次数最多的那个数据B. 众数易受极端值影响C.众数不受极端值影响D.一组数据可以有一个或多个众数,也可以没有众数E.众数属于位置平均数,即适用于品质数据,也适用于数量数据12. 中位数具有()等特点。

A.均衡性B.稳健性C.差异性D.客观性E.各个数据与中位数的离差绝对值之和最小13.下列中,属于离散程度测度值的是()A.异众比率和四分位差B.可决系数C.方差和标准差D.相关系数E.离散系数14.下列中,可以用来衡量均值代表性大小的离散程度测度值有()A.异众比率B.平均差C.内距(四分位差)D.方差和标准差E.极差15.极差()A.是一组数据最大值和最小值之差B.是离散程度最简单的测度值C.不受极端值影响D.易受极端值影响E.未考虑数据的分布16.下列中,适用于顺序数据的集中趋势测度值是()A.均值B.众数C.调和均值D.中位数E.四分位数17.下列中,适用于间隔数据的集中趋势测度值是()A.众数B.中位数C.调和均值D.均值E.四分位数18.下列中,适用于比例数据的集中趋势测度值是()A.几何均值B.调和均值C.均值D.中位数和四分位数E.众数19.下列中,反映数据分散绝对程度的离散程度测度值是()A.方差和标准差B.极差C.离散系数D.平均差E.四分位差(内距)20.下列中,适用于顺序数据的离散程度测度值有()A.方差和标准差B.四分位差C.极差和平均差D.异众比率E.离散系数21.标准分数()A.也称为标准化值B.对某一个值在一组数据中相对位置的度量C.可用于判断一组数据是否有离群点D.用于对变量的标准化处理E.计算公式为s xx z i i -=22.箱线图由一组数据的()等特征值绘制而成。

A.最大值B.均值C.中位数D.最小值E.四分位差(内距)23.从形式上看,统计表主要由()等部分构成。

A.总标题B.行标题C.列标题D.数字部分E.表外附注24.设计统计表的总的要求是()A.客观B.科学C.实用D.简练E.美观三、填空题1. 列名尺度是按照某种属性对事物进行的________________。

2.分类的原则是类别__________和______________。

3.顺序尺度不但对事物进行____________,而且还进行___________。

4.顺序尺度计量得到的数据表现为_________,但只能___________,不能进行___________。

5.统计数据的来源,一是_____________,二是___________________。

一般地,前一种来源得到的数据又称之为_______________,后一种来源得到的数据又称之为_____________。

6.统计分组的结果要最大限度地显示“________________”和“_________________”。

7.统计分组对于全部数据来说它是________,而对于单个的数据来说它是____________。

8.统计分组的标志包括_____________和_____________。

9.组距分组一定要遵循“___________”和“_____________”原则。

10.组距=(_________________—_______________ )÷组数11.对原始数据的审核,主要审核___________和__________两个方面。

12.对二手数据的审核,主要审核___________和___________两个方面。

13.品质数据的审核方法主要是_____________;数量数据审核的方法主要是___________。

14.变量值在各组出现的次数,称之为___________;各组变量值出现次数在变量值总个数中的比重,称之为____________。

15.数量数据的分组方法有_______________和_________________。

16.组距分组可以分为_______________和_______________两种。

17.组距分组时,组数的确定应以_________________________________为目的。

18.组中值是下限和上限之间的____________,它的文字计算公式为____________________。

19.环形图主要用于展示_____________数据。

20.缺下限开口组(××以下)的组中值的文字计算公式为___________________;缺上限开口组(××以上)的组中值的文字计算公式为:21.等距分组的各组频数的分布不受________的影响,可直接根据_________来观察频数分布的特征。

22.不等距分组的各组频数的分布受___________的影响,需要用___________来反映频数分布的实际状况。

23.直方图是用____________________来表示频数分布的图形,直方图下的总面积=_____,它主要用来展示____________数据。

24.频数密度是指单位组距中所包含的频数多少,即频数密度=___________÷_________。

25.正态分布是一种________________分布,它成____________________形状。

26.集中趋势是指一组数据向______________靠拢的倾向,测定集中趋势目的就是要寻找______________的代表值或中心值。

相关文档
最新文档