4-1统计学

合集下载

统计学1-4章

统计学1-4章

1-4章共165题一、判断题题库答案(第一章)1.参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。

() +2.身高和体重都属于离散变量。

() -3.学生人数、企业数和产品产量属于离散变量。

() +4.对有限总体可进行全面调查或非全面调查,对无限总体只能进行非全面调查。

() +5.总体分为有限总体和无线总体主要是为了判别在抽样中每次抽取是否独立。

() +6.样本是包含所研究的全部个体(数据)的集合,通常由所研究的一些个体组成。

() -7.总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。

() +8.截面数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。

() -9.统计学是一门应用性很强的方法论性质的学科。

() +10在检查灯泡的使用寿命时采用普查方式。

() -11.在调查某班人数时,人数是离散变量。

() +12.变量是说明现象某种特征的概念,特点是从一次观察到下一次观察结果会呈现出差别或变化。

() +13.某公司每月的销售利润是变量。

() +14. 年龄是数量标志。

() +15. 性别是数量标志。

() -16. 人口普查和工业普查是典型的普查类型。

() +17.离散变量是任意两个变量之间取值是无限的。

() -18.连续变量任意两个变量之间取值是有限的。

() -19.指标体系是由一系列反映社会经济现象数量特征的相对独立又相互联系的统计指标构成的整体。

() +(第二章)1.所有统计数据追踪其初始开源,都是来自调查或实验。

() +3.相对来说,一手数据搜集比较容易、采集成本低、搜集速度快。

() -4.实验大多是对自然现象而言的。

() +5.调查通常是对社会现象而言的。

() +6.搜集二手资料是研究生首先考虑并采用的,分析也应该首先从对二手数据的分析开始。

()+7.概率抽样不是根据随机原则抽样的。

()-8.简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。

统计学-第4章 学习指导

统计学-第4章 学习指导

第4章(数据的概括性度量)学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

掌握计算、特点及其应用场合。

主要内容学习要点2.1 集中趋势的度量众数▶概念:众数。

▶众数的特点。

中位数和分位数▶概念:中位数,四分位数。

▶中位数和四分位数的特点。

▶中位数和四分位数的计算。

平均数▶概念:平均数,简单平均数,加权平均数,调和平均数,几何平均数。

▶简单平均数和加权平均数的计算。

▶用Excel中的统计函数计算平均数。

▶几何平均数的计算和应用场合。

众数、中位数和平均数的比较▶众数、中位数和平均数在分布上的关系。

▶众数、中位数和平均数的特点及应用场合。

异众比率▶概念:异众比率异众比率的计算和应用场合。

2.2离散程度的度量四分位差(内距)概念:四分位差。

四分位差的计算。

用Excel中的统计函数计算四分位差。

方差和标准差概念:极差,平均差,方差,标准差。

样本方差和标准差的计算。

用Excel计算标准差。

离散系数概念:离散系数。

离散系数的计算。

离散系数的用途。

2.3偏态与峰态的度量偏态及其测度概念:偏态,偏态系数。

用Excel计算偏态系数。

偏态系数数值的意义。

峰态及其测度概念:峰态,峰态系数。

用Excel计算峰态系数。

峰态系数数值的意义。

Excel统计函数的应用。

一)判断题1,各变量值与其平均数的离差之和为最小值。

( )2.当各组的变量值所出现的频率相等时,加权算术平均数中的权数就失去作用,因而,加权算术平均数也就等于简单算术平均数( )3.比较两总体的平均数的代表性,离散系数较小的总体,平均数代表性亦小。

( )4,平均数与次数和的乘积等于各变量值与次数乘积的和。

( )5.若两总体的平均数不同,而标准差相同,则离散系数也相同。

( )6.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。

统计学第四版--习题集及答案

统计学第四版--习题集及答案

答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。

【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。

思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。

练习题一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。

这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。

统计学-4

统计学-4
众数 不受极端值影响 具有不唯一性 数据分布偏斜程度较大时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用 举例:竞赛中的评分规则 举例 竞赛中的评分规则
26
数据类型与集中趋势测度值
数据类型和所适用的集中趋势测度值
数据类型 适 用 的 测 度 值 分类数据 众数 — — — — 顺序数据 中位数 四分位数 众数 — — 间隔数据 均值 众数 中位数 四分位数 — 比率数据 均值 几何平均数 中位数 四分位数 众数
3
平均指标的分类: 平均指标的分类:
数值平均数 算术平均数 位置平均数 中位数 众数 分位数
4
调和平均数
几何平均数
1、算术平均数: 、算术平均数:
总体标志总量 算术平均数= 算术平均数= 总体单位总量
n
x=
∑x
i =1
i
n
Xi代表总体各单位的标志值
5
∑x f =∑x f 加权算术平均数: 加权算术平均数:x = ∑f ∑f
Me=一般 一般
18
中位数
对组距数列: 对组距数列: /2确定中位数组, 确定中位数组 按n/2确定中位数组,再按下列公式求中位数
n −F i −1 2 M e = U i −1 + × ( U i − U i −1 ) Fi − Fi − 1
实例: 例 实例:[例4-11]
19
5、众数: 众数: 众数是指总体中最常见的标志值, 众数是指总体中最常见的标志值, 是指总体中最常见的标志值 亦即在研究和考察某种社会经济现象 重复次数最多的标志值。 时,重复次数最多的标志值。
i i i i i

心理统计学-课程讲义4

心理统计学-课程讲义4

【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。

【学习方法】了解、理解、计算与应用。

【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。

【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。

但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。

描述一组数据波动情况的量数成为差异量数。

差异量数常用来衡量集中量数的代表性程度。

差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。

差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。

第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。

标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。

(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。

即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。

二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。

例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。

试比较两个班的成绩。

4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。

4-1数理统计的基础知识

4-1数理统计的基础知识

T6
1 2
(
X
2 1
X
2 2
X
2 3
).
不是
2. 常用统计量
设( X1, X2 , , Xn它)反是映来了自总总体体均值X的一个样本, ( x1, x2 , , xn )是这一样 的信本息的样本值.
(1)样本平均值
1 n
X n i1 Xi ;
其观察它的值反信映息了x 总 体n1 方in1差xi .
数理统计是研究统计工作一般原理和方法的科学,它主要阐
述搜集、整理、分析统计数据,并据以对研究对象进行统计
推断的理论和方法,是统计学的核心和基础。
数理统计的任务就是在概率论的基础上研究怎样以 有效的方式收集、整理和分析可获得的有限的, 带有 随机性的数据资料,对所考察问题的统计规律性尽可 能作出精确而可靠的推断或预测,为采取一定的决 策和行动提供依据和建议.
n维r.v.(抽样具有随机性)
样本容量:样本中所含的个体的数目n.
样本值:样本的一次观察值或实现值 ( x1, x2 , xn ).
(2) 简单随机样本 1. 代表性: X1,X2,…, Xn中每一个与所考察的总体X 有相同的分布.
2. 独立性: X1,X2,…, Xn是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本. 注:以后所考虑的样本均为简单随机样本, 并简称为样本.
样本矩具有下列性质:
性质 设总体X的期望E( X ) ,方差D( X ) 2 ,
( X1, X2 , , Xn )为来自总体X的样本,则有 :
(1) E( X ) ;
(2)
D( X )
1 n
2;
(3)
E( S02 )
n1 n

统计学(第4章)

统计学(第4章)

连续变动结果的总量指标,时期指标是
一个流量。
时间维度上
时期指标的三个特点 具有可加性
时期指标可以累计
时期指标数值大小与时期长短有直接关系
时期指标的数值一般为连续登记
2019/6/15
第四章 描述统计
5
统计学
2、时点指标
时点指标又叫存量指标,是指反映社 会经济现象在某一时点上的总量指标,
四 季度
1 500
计划完成百分数=
1400+1420+1470+1500 5000
=115.8%
注:2010年第一季度前的四个季度的累计量已达5000,说明五年计 划提前三个季度完成。
2019/6/15
第四章 描述统计
33
统计学
(2)累计法
如何确定提前 完成时间?
计算公式:
计划完成相对指标 长期计划期间实际累计完成数 长期计划规定的累计数
时点指标是一个存量。
时间维度上
时点指标的三个特点
不具可加性
不同时点指标数值是不能累加
时点指标数值大小与时点间隔长短无直 接关系
时点指标一般为间断统计
2019/6/15
第四章 描述统计
6
统计学
三、总量指标的计量单位
1、实物量单位(包括度量衡单位) 2、价值量单位 3、劳动量单位(工时和工日)
5 000 1 250 1 340 1 280
102.4
52.4
4 000 1 000 1 030 1 215
121.5
56.1
2 000 500 600 400
80.0
50.0
11 000 2 750 2 970 2 895 105.33

统计学第四章

统计学第四章


第三种情况:相对数为提高率或降低率时,应根据以下两种
情况处理:

⊙ 以提高率相对数形式出现时:

1+实际提高率
计划完成程度=

1+计划提高率

例8,某工业企业2019年度计划劳动生产率比上年提高10%,
实际提高了15%,则:

100%+15%
劳动生产率计划完成程度=
=104.5%
(4)该指标的数值一般用复合计量单位表示或为无名数。

医疗床位数/千人 ;人口死亡率
5.动态相对数。一般指发展速度指标。是同类指 标在不同时间上的对比,借以反映同一现象在不同 时间上的发展变化情况。
某现象报告期数值 动态相对数=
同一现象基期数值
例5,某企业2019年产值为500万元,2019年为450 万元,则:
(3)在对长期计划完成情况进行检查时,需 要运用以下两种方法:
⊙计划数为计划期内应完成的累计总任务时, 计算计划完成程度指标时,可运用“累计法”进 行,即:

计划期内实际完成的累计数
计划完成程度=

计划期内计划完成的累计数
例9,某地区某五年计划规定的固定资产投资额为 3850万元,各年实际完成情况如下表:
某种现象总量指标 强度相对数=
另一有联系而性质不同的现象总量指标
例4,某年我国国民收入为5485亿元,年 平均人口为103049.5万人,则:

5485
人均国民收入=
=532.3(元/人)

103049.5
商业网点、金融机构、医疗单位、人口等密度 资金利税率 商品流通费用率 人口出生、死亡率 人均国民收入

《应用统计学》(04)第4章 用样本推断总体

《应用统计学》(04)第4章 用样本推断总体

1500 1520 1510 1470
*
应用统计学
Applied Statistics
一个总体均值的区间估计
(例题分析—小样本)
解:已知X~N(,2),n=16, 1- = 95%,t/2=2.131 根据样本数据计算得:x 1490 , s 24.77 总体均值在1-置信水平下的置信区间为
资 料 来 源 : GUDMUND R.IVERSEN 和 MARY GERGRN著,《统计学—基本概念和方法》
4-5
*
应用统计学
Applied Statistics
统计应用
小儿麻痹症实验

1954年,为了检验沙克疫苗对小儿麻痹症预防的有效 性而进行了一项实验。大约有20万名儿童注射了无效 的盐水,而另外20万名儿童注射了疫苗 这项实验是“双盲的”,因为接受注射的儿童不知道 是被注射了疫苗还是安慰剂,进行注射并评价结果的 医生也不知道 在20万名注射疫苗的儿童中,只有33人后来患了小儿 麻痹症,而注射了盐水的 20万名儿童中后来有 115 人 患了小儿麻痹症。根据这些结果和其他一些结果的统 计分析得出结论,沙克疫苗在预防小儿麻痹症方面确 实是有效的
4 - 20
应用统计学
Applied Statistics
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
P(ˆ ) 无偏 有偏Biblioteka A4 - 21
B
ˆ
*
应用统计学
Applied Statistics
有效性
(efficiency)
量,有更小标准差的估计量更有效
怎样解决下面的问题?
一个水库里有多少鱼? 一片原始森林里的木材储蓄量有多少?

统计学(第四版)袁卫庞皓贾俊平杨灿(04)第4章参数估计(贾俊平)

统计学(第四版)袁卫庞皓贾俊平杨灿(04)第4章参数估计(贾俊平)

4 -2
统计学
STATISTICS
4.1 参数估计的一般问题
一、估计量与估计值 二、点估计与区间估计 三、评价估计量的标准
统计学
STATISTICS
估计量与估计值
统计学
估计量与估计值
STATISTICS (estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量
P(ˆ ) 较大的样本容量
B
较小的样本容量
A
4 - 16
ˆ
统计学 4.2 一个总体参数的区间估计
STATISTICS
一、总体均值的区间估计 二、总体比率的区间估计 三、总体方差的区间估计
统计学
STATISTICS
一个总体参数的区间估计
总体参数 均值 比率 方差
4 - 18
符号表示 样本统计量
x
p
4 - 11
统计学
STATISTICS
影响区间宽度的因素
1. 总体数据的离散程度,用 来测度
2.
样本容量, x
n
3. 3. 置信水平 (1 - ),影响 z 的大小
4 - 12
统计学
STATISTICS
评价估计量的标准
统计学
STATISTICS
无偏性
(unbiasedness)
无偏性:估计量抽样分布的数学期望等于被 估计的总体参数
(point estimate)
1. 用样本的估计量直接作为总体参数的估计值
▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用两个样本均值之差直接作为总体均值
之差的估计
2. 没有给出估计值接近总体参数程度的信息

统计学检测题1-4参考答案及补充计算题

统计学检测题1-4参考答案及补充计算题

《统计学》测验(一)参考答案一、判断题(把正确的符号“√”或错误的符号“×”。

每小题1分,共6分)1、社会经济统计的研究对象是社会经济现象总体的各个方面。

(×)2、总体单位是标志的承担者,标志是依附于单位的。

(√)3、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。

(×)4、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的。

(×)5、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。

这种调查属于非全面调查。

(√)6、为了保证总体中每一个单位在分组时不被遗漏,分组时应满足最小组的下限低于最小变量值、最大组的上限高于最大变量值这个条件。

( √ )二、单项选择题(每小题1分,共14分)1、对某市工业企业先按产品类别分组,再在此基础上按企业规模分组,这种分组形式叫做( D )。

A.简单分组 B.平行分组 C.再分组 D.复合分组2、某城市工业企业未安装设备普查,总体单位是(B )。

A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此( C )。

A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、某地区农民家庭年人均纯收入最高为2600元,最低为1000元,据此分为八组形成闭式等距数列,各组的组距为(B )。

A.300 B.200 C.1600 D.1005、指标是说明总体特征的,标志是说明总体单位特征的,所以( B )A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示6、连续调查与不连续调查的划分依据是(B )A、调查的组织形式B、调查登记的时间是否连续C、调查单位包括的范围是否全面D、调查资料的来源7、某市工业企业2005年生产经营成果年报呈报时间规定在2006年1月31日,则调查期限为(B )。

统计学词汇及符号 第1部分

统计学词汇及符号 第1部分

统计学词汇及符号第1部分(原创版)目录1.统计学概述2.统计学基本概念3.描述性统计4.推断性统计5.统计学符号与术语正文一、统计学概述统计学是一门研究收集、整理、分析、解释、展示数据的方法和技巧的科学。

统计学的应用广泛,涉及自然科学、社会科学和商业等多个领域。

统计学的主要目的是从数据中获取有关现象和事物的信息,以便对未来事件进行预测和决策。

二、统计学基本概念1.数据:数据是统计学的基础,是对观察到的事物或现象的记录。

数据可以是数字、文字或图像等形式。

2.样本:样本是从总体中抽取的一部分数据。

通过对样本的研究,可以推断总体的性质和规律。

3.总体:总体是指研究对象的全体。

总体可以分为参数和统计量。

4.参数:参数是描述总体性质的数值,如总体均值、方差等。

5.统计量:统计量是根据样本数据计算的用于描述总体的数值,如样本均值、样本方差等。

三、描述性统计描述性统计是通过计算各种统计量,对数据进行概括和描述的方法。

常用的描述性统计方法有:1.均值:均值是数据的平均数,用于衡量数据的中心位置。

2.中位数:中位数是将数据从小到大排序后,位于中间位置的数值。

3.众数:众数是数据中出现次数最多的数值。

4.方差:方差是数据与其均值之差的平方的平均数,用于衡量数据的离散程度。

5.标准差:标准差是方差的平方根,用于衡量数据的离散程度。

四、推断性统计推断性统计是通过样本数据,对总体参数进行估计和推断的方法。

常用的推断性统计方法有:1.假设检验:假设检验是通过比较样本统计量与总体参数的差异,对原假设进行检验的方法。

2.置信区间:置信区间是对总体参数的区间估计,表示我们对总体参数的精确度有一定的把握。

3.回归分析:回归分析是研究两个或多个变量之间关系的方法,包括线性回归、多元回归等。

五、统计学符号与术语1.符号:统计学中使用特定的符号表示各种统计量和概念,如σ表示标准差,μ表示均值等。

2.术语:统计学中使用专业的术语描述各种概念和方法,如误差、偏差、峰度等。

第四版统计学课后习题答案

第四版统计学课后习题答案
3.5绘制线图应注意问题
时间在横轴,观测值绘在纵轴。一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同
饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
4.9测度数据分布形状的统计量有哪些?
对分布形状的测度有偏态和峰态,测度偏态的统计量是偏态系数,测度峰态的统计量是峰态系数。
第五章 概率与概率分布
5.1频率与概率有什么关系?
在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。
1.4解释分类数据,顺序数据和数值型数据
答案同1.3
1.5举例说明总体,样本,参数,统计量,变量这几个概念
对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
《统计学》第四版
统计课后思考题答案
第一章思考题

大学统计学考试练习题及答案431

大学统计学考试练习题及答案431

大学统计学考试练习题及答案41.[单选题]回归平方和SSR反映了y的总变差中( )。

A)由于x与y之间的线性关系引起的y的变化部分B)除了x对y的线性影响之外的其他因素对y的变差的影响C)由于x与y之间的非线性关系引起的y的变化部分D)由于x与y之间的函数关系引起的y的变化部分答案:A解析:2.[单选题]根据各季度商品销售额数据计算的季节指数分别为:一季度 125%,二季度70%,三季度100%,四季度105%。

受季节因素影响最大的是()A)一季度B)二季度C)三季度D)四季度答案:B解析:3.[单选题]抽样平均误差反映了样本指标与总体指标之间的( )A)实际误差B)实际误差的绝对值C)平均误差程度D)可能误差范围答案:C解析:4.[单选题]标志是( )A)说明总体特征的名称B)说明总体单位特征的名称C)说明总体单位数量特征的名称D)说明总体单位品质特征的名称答案:B解析:5.[单选题]统计对总体数量的认识是A)从总体到单位B)从单位到总体C)从定量到定性解析:6.[单选题]在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为。

( )A)8B)0.32C)2D)12.5答案:C解析:7.[单选题][]假如学生测验成绩记录为优、良、及格和不及格,为了说明全班同学测验成绩的水平高低,其集中趋势的测度:A)可以采用算数平均数B)可以采用众数或中位数C)只能采用众数D)只能采用四分位数答案:B解析:8.[单选题]简单分组与复合分组的区别在于()。

A)总体的复杂程度不同B)组数多少不同C)选择分组标志的性质不同D)选择的分组标志的数量不同答案:D解析:9.[单选题]某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。

第一组和第四组的组中值分别为( )A)750和2500B)800和2250C)800和2500D)750和2250答案:D解析:10.[单选题]在全市200万个家庭中抽取2000个家庭为样本,以推断该城市所有职工家庭的人均收入。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

统计学第四章重点知识点

统计学第四章重点知识点

第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。

数据的分布特征不仅有集中趋势,还有离中趋势。

以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。

两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。

【如】:比较以下两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。

即A 组较集中,B 组较分散。

因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。

差异量:表示一组数据的离中趋势或变异程度的量称为差异量。

常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。

第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。

优点:意义明确,计算方便。

缺点:反响不灵敏,易受极端值影响。

二、四分位距〔一〕四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。

QD :表示四分位距; Q 3:表示第三四分位数; Q 1:表示第一四分位数。

所以:四分位距的公式又为: 〔二〕四分位数的计算方法 1、原始数据计算法〔1〕将数据由小到大进行排列;〔2〕分别求出三位四分位数〔点〕;〔3〕代入公式计算。

【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:〔1〕先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q1=18 Md=27 Q3=34〔2〕求出Q1、Md、Q3;〔3〕将Q1、Md、Q3的得数代入公式〔4.1〕。

2、频数分布表计算法利用频数分布表计算公式为:关键是分别计算P75和P25,百分位数计算方法掌握了,这里的计算就不会有什么问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第 1 页 共 2 页

生答题不得过此··················密
····························封
·························线
···························· 专



班级 姓名
学号 ··················装
····························订·························线···························· 1、17世纪中叶的政治算术学派被看作是统计学派的开端,其主要代表人物是( )。

A .威廉.配第 B.恩格尔 C. 约翰.格朗特 D. 凯特勒 2、在测度集中趋势时,受极端值影响最大的测度值是( ) A .平均数 B.众数 C .中位数 D .都相同 3、比较不同总体或样本数据的离散程度,最适合的测度值是( ) A .异众比例 B. 四分位差 C. 方差 D .变异系数 4、下列各项中属于时期指标的是( ) A.职工人数 B.工资总额 C.产品库存量 D.设备台数 5、从产品生产线上每隔10分钟抽取一件产品进行质量检验。

推断全天产品的合格率时,其抽样方式可看作( ) A .简单随机抽样 B .整群抽样 C.分层抽样 D.等距抽样 6、若某单位3-6月月末的职工人数分别为:600、615、630、660人,则其二季度的平均人数为( )。

A .625 B.626 C.635 D.630 7、若今年比去年的环比发展速度为112%,去年比前年的环比发展速度为103%,那么今年比前年的平均发展速度为 ( ) A .109.0% B .107.4% C.108.9% D.115.4% 8、一组数据中,出现次数最多的那个测度值是( ) A .众数 B .中位数 C .算术平均数 D .几何平均数 9、某连续变量数列,其末组为500以上,又知其邻组的组中值为480,则末组的组中值为( ) A.520 B.510 C.530 D.540 10、如果一组数据其众数M 0、中位数M e 和均值x 之间的数量关系为:x <M e <M 0,那么对此组数据分布的分析,下面哪个结论正确( )
A .对称分布
B .左偏分布
C .右偏分布
D .尖峰分布 11、数值型数据分组时,若某标志值刚好等于相邻两组上下限数值时( ) A .将此数值归入上限所在组 B.将此数值归入下限所在组 C. 归入这两组中任意一组均可 D.另立一组 12、对占全国钢产量80%以上的几个大型钢企业进行钢产量调查,这种调查方法是( ) A 、抽样调查 B 、典型调查 C 、重点调查 D 、普查 13、两变量之间的相关系数r=0.90,通常情况下,根据经验知两变量之间的线性关系为( ) A .高度正相关 B .高度负相关 C .不相关 D .低度正相关 14、假设检验中,第二类错误的概率 表示( )。

A.原假设为真时接受原假设的概率 B.原假设为真时拒绝原假设的概率 C.原假设不真时接受原假设的概率 D.原假设不真时拒绝原假设的概率 15、第五次人口普查结果表明,我国人口男女比例为106:100,该指标属于( ) A. 结构相对数 B.比较相对数 C. 比例相对数 D.强度相对数 二、多项选择题(每小题2分,共10分) 1、下列关系中,存在负相关关系有( ) A. 机床使用年限和维修费用 B.人均储蓄额与人均消费额 C. 商品价格与销售量 D.人均消费额与人均可支配收入 E. 货币购买力指数与居民消费价格指数 2、统计指标体系设计的原则是 ( )
A .科学性 B.目的性 C. 整体性 D.统一性 E.可比性
3、评价估计量是否优良的常用标准有( )。

A.无偏性
B.有效性
C.准确性
D.一致性
E.随机性 4、“统计”一词的涵义包括( )
A .统计设计
B .统计科学
C .统计资料
D .统计工作
E .统计组织
5、影响抽样误差的因素有( ) A.样本单位数 B.抽样方法 C.抽样组织形式
D.总体单位标志值变异程度
E.调查误差。

相关文档
最新文档