统计学(第六版)贾俊平——-课后习题答案

合集下载

贾俊平《统计学》课后习题及详解(方差分析)【圣才出品】

贾俊平《统计学》课后习题及详解(方差分析)【圣才出品】

第10章方差分析一、思考题1.什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响,例如,变量之间有没有关系、关系的强度如何等。

2.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?答:方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的t检验。

随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。

而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

3.方差分析包括哪些类型?它们有何区别?答:(1)根据所分析的分类自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。

(2)区别:①单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响;②双因素方差分析研究的是两个分类变量对数值型因变量的影响。

4.方差分析中有哪些基本假定?答:方差分析中有三个基本假定:(1)每个总体都应服从正态分布。

也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。

(2)各个总体的方差σ2必须相同。

也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。

(3)观测值是独立的。

5.简述方差分析的基本思想。

答:方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

6.解释因子和处理的含义。

答:在方差分析中,所要检验的对象称为因素或因子;因素的不同表现称为水平或处理。

例如:要分析行业(零售业、旅游业、航空公司、家电制造业)对投诉次数是否有显著影响,则这里的“行业”是要检验的对象,称其为“因素”或“因子”;零售业、旅游业、航空公司、家电制造业是“行业”这一因素的不同表现,称其为“水平”或“处理”。

贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。

次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算2χ统计量的步骤。

答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。

统计学第四章习题答案 贾俊平

统计学第四章习题答案 贾俊平

第四章 统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数与平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics汽车销售数量 10 Missing0 Mean 9、60 Median 10、00Mode10 Std 、 Deviation 4、169 Percentiles25 6、25 50 10、00 75单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 3117 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布与累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6、25,因此Q1=19,Q3位置=3×25/4=18、75,因此Q3=27,或者,由于25与27都只有一个,因此Q3也可等于25+0、75×2=26、5。

(3)计算平均数与标准差;Mean=24、00;Std、Deviation=6、652(4)计算偏态系数与峰态系数:Skewness=1、080;Kurtosis=0、773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6、652、呈右偏分布。

如需瞧清楚分布形态,需要进行分组。

1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4、3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种就是所有颐客都进入一个等待队列:另—种就是顾客在三千业务窗口处列队3排等待。

贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】

贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】

第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。

(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。

为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。

(3)统计量是样本的一个函数。

由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。

2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。

3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。

4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。

统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。

5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。

2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。

推断统计:研究的是如何利用样本数据来推断总体特征。

3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。

分类数据:只能归于某一类别的,非数字型数据。

顺序数据:只能归于某一有序类别的,非数字型数据。

数值型数据:按数字尺度测量的观察值,结果表现为数值。

按收集方法不同。

分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。

按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。

时间序列数据:在不同时间收集的数据。

4、举例说明总体、样本、参数、统计量、变量这几个概念。

总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。

参数:用来描述总体特征的概括性数字度量。

(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。

(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。

(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。

顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。

变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。

统计学贾俊平第三章课后答案

统计学贾俊平第三章课后答案

一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。

3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。

顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。

3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。

在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。

数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。

3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。

直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。

统计学习题答案-贾俊平

统计学习题答案-贾俊平

第四章统计数据的概括性度量4. 1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1) 计算汽车销售量的众数、中位数和平均数。

(2) 根据定义公式计算四分位数。

(3) 计算销售量的标准差。

(4) 说明汽车销售量分布的特征。

解:汽车销售数量StatisticsNValid 10Missing0 Mean9.60Median10.00Mode10Std. Deviation4.169 Percentiles25 6.255010.007512.504. 2随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23要求;(1) 计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:LI2.557.5 10汽车销售数量12.5 15Mean =9.6Std. Dev. =4.169N =10Histogram32网络用尸的年龄FrequencyPercent Cumulative FrequencyCumulative PercentValid15 14.0 14.016 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7 28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 233 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25100.0Total25100.0从频数看出,众数 Mo 有两个:19、23;从累计频数看,中位数 Me=23。

统计学第四章习题答案-贾俊平

统计学第四章习题答案-贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数.(3)计算销售量的标准差.(4)说明汽车销售量分布的特征。

解:Statistics10Missing0Mean9.60Median10.00Mode10Std。

Deviation4。

169Percentiles25 6.255010.0075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数.Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18。

75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0。

75×2=26。

5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1。

080;Kurtosis=0。

773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 — 最小值)÷ 组数=(41—15)÷6=4。

3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图::一种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待.为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客.得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟.第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。

统计学(第六版)课后习题答案

统计学(第六版)课后习题答案

23
47
23
28
28
35
51
39
18
46
18
26
50
29
33
21
46
41
52
28
21
43
19
42
20
答:茎叶图
Frequency Stem & Leaf
3.00
1 . 889
5.0
2 . 6888999
2.00
3 . 13
3.00
3 . 569
3.00
4 . 123
编辑版 word
进行分组。
频数
频率%
向上累计频数
向上累计频率%
先进企业
10
25
10
25
良好企业
12
30
22
55
一般企业
9
22.5
31
77.5
落后企业
9
22.5
40
100
合计
40
100


3.3 某百货公司连续 40 天的商品销售额如下:
单位:万元
41
25
29
47
38
34
30
38
43
40
46
36
45
37
37
36
45
43
49 - 52
19
19
55
55
52 -55
24
24
79
79
55 - 58
14
14
93
93
58 以上
7
7
100
100

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】

2.指出下面的变量哪一个属于顺序变量?( ) A.年龄 B.工资 C.汽车产量 D.员工对企业某项改革措施的态度(赞成、中立、反对) 【答案】D 【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。C 项员 工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变
4.某研究部门准备在全市 200 万个家庭中抽取 2000 个家庭,推断该城市所有职工家 庭的年人均收入。这项研究的总体是( )。
A.2000 个家庭 B.200 万个家庭 C.2000 个家庭的人均收入 D.200 万个家庭的总收入 【答案】B 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为 200 万个家庭。
何利用样本数据来推断总体特征的统计学方法。由此可知 A 项属于推断统计学方法。
12.某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他 调查了 200 名学生,发现他们每月平均生活费支出是 500 元。该研究人员感兴趣的总体是 ( )。
A.该大学的所有学生 B.该校所有大学生的总生活费支出 C.该大学所有的在校本科生 D.所调查的 200 名学生 【答案】C 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。因此题中的总体是“该大学所有的在校本科生”。
8.一家研究机构从 IT 从业者中随机抽取 500 人作为样本进行调查,其中 60%回答他们 的月收人在 5000 元以上,50%回答他们的消费支付方式是用信用卡。这里的总体是( )。
A.IT 业的全部从业者 B.500 个 IT 从业者 C.IT 从业者的总收入 D.IT 从业者的消费支付方式 【答案】A 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为“所有 IT 从业者”。

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

统计学贾俊平课后答案目前最全

统计学贾俊平课后答案目前最全

8.2 一种元件,要求其使用寿命不得低于700小时。

现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。

已知该元件寿命服从正态分布,=60小时,试在显著性水平0.05下确定这批元件是否合格。

解:H0:μ≥700;H1:μ<700已知:=680 =60由于n=36>30,大样本,因此检验统计量:==-2当α=0。

05,查表得=1。

645。

因为z<—,故拒绝原假设,接受备择假设,说明这批产品不合格。

8。

38.4 糖厂用自动打包机打包,每包标准重量是100千克。

每天开工后需要检验一次打包机工作是否正常.某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a=0.05)?解:H0:μ=100;H1:μ≠100经计算得:=99。

9778 S=1。

21221检验统计量:==—0。

055当α=0.05,自由度n-1=9时,查表得=2。

262。

因为<,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。

今从一批该食品中任意抽取50袋,发现有6袋低于250克.若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a=0.05)?解:解:H0:π≤0。

05;H1:π>0.05已知:p=6/50=0.12检验统计量:==2。

271当α=0.05,查表得=1.645。

因为>,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。

8.68.7 某种电子元件的寿命x(单位:小时)服从正态分布。

现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)?解:H0:μ≤225;H1:μ>225经计算知:=241。

统计学第四章习题答案解析贾俊平

统计学第四章习题答案解析贾俊平

第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。

(4)说明汽车销售量分布的特征。

解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。

(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。

如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章导论1.1.1(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。

1.3(1)总体是所有IT从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4(1)总体是所有在网上购物的消费者的集合。

(2)分类变量。

(3)参数是所有在网上购物者的月平均花费。

(4)参数(5)推断统计方法。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。

使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手资料时,要注明数据来源。

2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

概率抽样是指抽样时按一定概率以随机原则抽取样本。

每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。

如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。

它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。

非概率抽样也适合市场调查中的概念测试。

3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。

4. 自填式、面方式、电话式调查个有什么利弊?自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。

缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。

面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。

缺点:成本比较高,对调查过程的质量控制有一定难度。

对于敏感问题,被访者会有压力。

电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。

5.请举出(或设计)几个实验数据的例子。

不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。

6.你认为应当如何控制调查中的回答误差?对于理解误差,要注意表述中的措辞,学习一定的心里学知识。

对于记忆误差,尽量缩短所涉及问题的时间范围。

对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。

7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。

对于随机误差,可以通过增加样本容量来控制。

对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。

无回答出现后,分析武回答产生的原因,采取补救措施。

比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。

第三章数据的图表搜集一、思考题3.1数据的预处理包括哪些内容?答:审核、筛选、排序等。

3.2分类数据和顺序数据的整理和显示方法各有哪些?答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,如果是两个或两个以上变量可以制作交叉表。

对于分类数据可以绘制条形图、帕累托图、饼图、环形图等。

根据不同的资料或者目的选择不同的图。

对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。

可根据需要绘制条形图、饼图、环形图等。

3.3数值型数据的分组方法有哪些?简述组距分组的步骤。

答:单变量值分组和组距分组。

其中组距分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般5~15组;第二步,确定各组组距,宜取5或10的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。

3.4直方图和条形图有何区别?答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。

3.5绘制线图应注意问题?答:时间在横轴,观测值绘在纵轴。

一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。

3.6饼图和环形图的不同?答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。

3.7茎叶图比直方图的优势,他们各自的应用场合?答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。

在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。

3.8鉴别图标优劣的准则?答:P65明确有答案,我就不写了。

3.9制作统计表应注意的问题?答:1,合理安排统计表结构;2表头一般包括表号,总标题和表中数据的单位等内容;3表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格;4在使用统计表时,必要时可在下方加注释,注明数据来源。

二、练习题3.1答:(1)表中数据属于顺序数据。

(2)用Excel制作一张频数分布表。

(3)绘制一张条形图,反映评价等级的分布。

(4)绘制评价等级的帕累托图。

3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

1、确定组数:()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取103、分组频数表(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

3.3 某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

答 :1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5 3、分组频数表(根据实际资料,调整成分5个组)4、直方图3.4 利用下面的数据构建茎叶图和箱线图。

57 29 29 36 3123 47 23 28 2835 51 39 18 4618 26 50 29 3321 46 41 52 2821 43 19 42 20 答:茎叶图Frequency Stem & Leaf3.00 1 . 8895.00 2 . 011337.00 2 . 68889992.00 3 . 133.00 3 . 5693.00 4 . 1233.00 4 . 6673.00 5 . 0121.00 5 . 7箱线图3.5答 :频数分布表直方图从直方图看,数据的分布呈左偏分布。

3.6答 :频数分布表()lg 100lg()2111 6.64lg(2)lg 20.30103n K =+=+=+=,取k=72、确定组距:组距=( 最大值 - 最小值)÷组数=(61-40)÷7=3,取3 3、分组频数表(根据实际资料,调整成分5个组)从直方图看,数据的分布呈双峰分布。

3.7频数分布表从直方图看,数据的分布呈左偏分布 3.8(1)数值型数据 (2)频数分布表()lg 60lg() 1.77815111 6.91lg(2)lg 20.30103n K =+=+=+=,取k=72、确定组距:组距=( 最大值 - 最小值)÷ 组数=(9+25)÷7=4.86,取5从直方图看,数据的分布呈左偏分布。

3.9自学考试人员年龄分布集中在20-24之间,分布图呈右偏。

3.103.113.12 (1)复式条形图(2)甲班成绩分布图近似正态分布,分布较均衡;乙班成绩分布图右偏。

(3)根据雷达图,两班成绩分布不相似。

3.133.14第四章习题答案4.1数据排列:2,4,7,10,10,10,12,12,14,15(1)众数:10;中位数:10平均数:9.6(2)四分位数:QL 位置=410=2.5.所以QL=274+=5.5Q U 位置=30=7.5,所以QU=21412+=13(3)标准差:4.17(4)峰度—0.25,偏度—0.694.2(1)众数:19;23中位数:23 平均数:24(2)四分位数:Q L 位置=425=6.25.所以Q L =19+0.25^0=19 Q U 位置=475=18.75,所以Q U =25+2^0.75=26.5(3)标准差:6.65 (4)峰度0.77,偏度1.08 4.3(1)茎叶图略(2) 平均数:7,标准差0.71 (3)第一种方式的离散系数x s v s ==2.797.1=0.28 第二种方式的离散系数xsv s ==771.0=0.10 所以,第二种排队方式等待时间更集中。

(4)选择第二种,因为平均等待的时间短,而且等待时间的集中程度高 4.4 (1)平均数:274.1,中位数:272.5(2)Q L 位置=30=7.5.所以Q L =258+0.25^3=258.75 Q U 位置=490=22.5,所以Q U =284+7^0.75=289.25 (3)日销售额的标准差:21.17 4.5.甲企业总平均成本nf Mx ki ii∑==1=3406600=19.41(元)乙企业总平均成本nf Mx ki ii∑==1=(元)29.183426255= 所以甲企业的总平均成本比乙企业的高,原因是甲企业高成本的产品B 生产的产量比乙企业多,所以把总平均成本提高了。

相关文档
最新文档