统计学 第四版 第七章答案

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学课后习题答案_(第四版)4.5.7.8章

统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

第四版统计学课后习题答案

第四版统计学课后习题答案

第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学第四版课后答案

统计学第四版课后答案

统计课后思考题答案第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

解释分类数据,顺序数据和数值型数据答案同举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计应用实例人口普查,商场的名意调查等。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3. 怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表现。

这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为与置信水平成正比,在其他条件不变的情况下,置信水平越大,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

统计学第四版课后答案

统计学第四版课后答案

统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学贾俊平_第四版课后习题答案第七章

统计学贾俊平_第四版课后习题答案第七章

7.11 (1) 解:已知n=50,1a -=0.9522,ss x z xz nn a aæö-×+×ç÷èø=81.822981.8229101.491.966,101.491.9665050æö-´+´ç÷èø= (100.89,101.91)(2)解:已知n=50,1a -=0.95,2z a =00.0225z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:()()2211,p p p p p zp z nna aæö--ç÷-×+×ç÷èø=()()0.910.90.910.90.9 1.91.966,0.9 1.91.9665050æö---´+´ç÷èø=(0.8168,0.9832)7.22 (1)由题知,该题为大样本,方差已知,则有21m m -的95%的置信区间为:176.12100201001696.1)2325()(2221212/21±=+´±-=+±-n s n s z x x a即(0.824,3.176)(2m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n ntxxpa 即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为()()713128524211212222112==-+-+-=n n s n s n s p 则有21m m -的95%的置信区间为:()()02.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.02,6.02) ,2z a =00.0225z =1.96。

统计学答案第七章

统计学答案第七章

1 估计量的含义是指()。

A。

用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C。

总体参数的名称D。

总体参数的具体数值2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。

这种评价标准称为().A。

无偏性B。

有效性C。

一致性 D.充分性3 根据一个具体的样本求出的总体均值的95%的置信区间().A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D。

要么包含总体均值,要么不包含总体均值4 无偏估计是指().A.样本统计量的值恰好等于待估的总体参数B。

所有可能样本估计值的数学期望等于待估总体参数C。

样本估计值围绕待估总体参数使其误差最小D。

样本量扩大到和总体单元相等时与总体参数一致5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。

A.样本均值的抽样标准差B。

样本标准差C.样本方差D。

总体标准差6 当样本量一定时,置信区间的宽度()。

A。

随着置信系数的增大而减小B。

随着置信系数的增大而增大C。

与置信系数的大小无关D.与置信系数的平方成反比7 当置信水平一定时,置信区间的宽度().A。

随着样本量的增大而减小B.随着样本量的增大而增大C。

与样本量的大小无关D。

与样本量的平方根成正比8 一个95%的置信区间是指()。

A。

总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C。

在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9 95%的置信水平是指()。

A.总体参数落在一个特定的样本所构造的区间内的概率为95%B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%C.总体参数落在一个特定的样本所构造的区间内的概率为5%D。

在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%10 一个估计量的有效性是指()。

统计学原理 第七章课后习题及答案

统计学原理 第七章课后习题及答案

第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。

(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。

(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。

(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。

(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。

(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。

(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。

(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。

(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。

(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。

(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。

统计学第四版第七章课后题最全答案

统计学第四版第七章课后题最全答案
7.23下表就是由4对观察值组成得随机样本。
配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:

统计学第四版第七章答案

统计学第四版第七章答案
方式1
6.5
6.6
6.7
6.8
7.1
7.3
7.4
7.7
7.7
7.7
方式2
4.2
5.4
5.8
6.2
6.7
7.7
7.7
8.5
9.3
10
要求:
(1)构建第一种排队方式等待时间标准差的95%的置信区间。
解:估计统计量
经计算得样本标准差 =3.318
置信区间:
=0.95,n=10, = =19.02, = =2.7
7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下:
每包重量(g)
包数
96~98
98~100
100~102
102~104
104~106
2
3
34
7
4
合计
50
已知食品包重量服从正态分布,要求:
(1)确定该种食品平均重量的95%的置信区间。
(2)抽样平均误差:
重复抽样: = =1.61/6=0.268
不重复抽样: = =
=0.268× =0.268×0.998=0.267
(3)置信水平下的概率度:
=0.9,t= = =1.645
=0.95,t= = =1.96
=0.99,t= = =2.576
(4)边际误差(极限误差):
=0.9, =
第四章抽样分布与参数估计
7.2某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。

统计学第七章课后题及答案解析

统计学第七章课后题及答案解析

第七章 一、单项选择题1.按指数所包括的范围不同, 可以把它分为( )A.个体指数和总指数 B .数量指标指数和质量指标指数C.综合指数和平均指数 D.定基指数和环比指数2. 某集团公司为了反映所属各企业劳动生产率水平的提高情况 ,需要编制(A.质量指标综合指数B.数量指标综合指数C.可变构成指数D.固定构成指数3.在一般情况下,商品销售量指数和工资水平指数的同度量因素分别为( 商品销售量、平均工资水平 单位商品销售价格、职工人数 下列指数中属于数量指标指数的是 产品价格指数 产量指数 下面属于价格指数的是(B .商品销售量、职工人数D.单位商品销售价格、平均工资水平 )B .单位成本指数 D.劳动生产率指数5. A.工RQ 1 氓Q 1B -F 1Q 1ZFO Q OC.QZP0QoD E pQ oZP0Q O6. A.7. 某商品价格发生变化,现在的10%B. 90% 固定构成指数的公式是(100元只值原来的 C. 110%)90元,则价格指数为(D. 111%A. C.1. A. D.2. A. C. E.3. A. D.4.A. C. ZX i F i ZF iZX 1F 1ZF I... ZX P F O 1F0 D. ZX O F^ IXo F oIX 0F 1ZF iZFoIX 1F 0ZF O、多项选择题下列属于数量指标指数的有( 产量指数单位产品成本指数 下列表述正确的是( 综合指数是先综合后对比 平均数指数必须使用全面资料 固定构成指数受总体结构影响 同度量因素的作用有( 同度量作用 B.比较作用E. )B.销售量指数E.职工人数指数C.价格指数B .平均数指数是先对比后综合 D.平均数指数可以使用固定权数联系作用平衡作用c.权数作用对某商店某时期商品销售额的变动情况进行分析,其指数体系包括( 销售量指数B.销售价格指数总平均价格指数 D.销售额指数 E.个体指数若用某企业职工人数和劳动生产率的分组资料来进行分析时,该企业总的劳动生产率的A.C.4.A.C.变动主要受到()A.企业全部职工人数变动的影响B.企业劳动生产率变动的影响C.企业各类职工人数在全部职工人数中所占比重的变动影响D.企业各类工人劳动生产率的变动影响E.受各组职工人数和相应劳动生产率两因素的影响6.下列指数中,属于拉氏指数的有()' Q1P01 0 1 01 1 1 1P0Q0 P0Q1 C X Q0 P0 P0Q1 Q0 P1 7.某企业产品总成本报告期为183150元,比基期增长10%单位成本综合指数为104%则()A.总成本指数110%B.产量增长了5.77%C.基期总成本为166500元D.单位成本上升使总成本增加了7044元E.产量增产使总成本增加了9606元三、判断题1.综合指数的编制方法是先综合后对比。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

2.统计学复习笔记第七章参数估计解释估计量和估计值在参数佔汁中,用来估计总体参数的统计量称为估计量。

佔汁量也是随机变 量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本汁算出来的佔计量的数值称为齟值。

简述评价估计量好坏的标准(1) 无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2) 有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估 计ft ,有更小方差的佔计量更有效。

(3)-致性.是指随着样本量的增大,点佔计量的值越来越接近被估总体 的参数。

怎样理解置信区间在区间估计中,山样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是山区间和置信度两部分组成。

有些新闻媒体报道一些调查结果 只给出白分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负贵的表现。

因为降低置信度可以使置信区间变窄(显得〃精确”),有误 导读者之嫌。

在公布调査结果时给出被调査人数是负责任的表现。

这样则可以山 此推算出置信度(山后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置倍区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体 参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间) 包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区 间以的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本fin 为 心呼!其中:EfJ样本量n 与置信水平1-a 、总体方差夕、佔计误差f 之间的关系为1. 2. 3. a 、与置信水平成正比,在其他条件不变的悄况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与佔汁误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

练习题从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40 1.的样本,样本均值为25。

统计学第四版课后答案

统计学第四版课后答案

>统计课后思考题答案第一章思考题什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

统计学的类型和不同类型的特点、统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;[截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

解释分类数据,顺序数据和数值型数据答案同举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

变量的分类变量可以分为分类变量,顺序变量,数值型变量。

.变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计应用实例人口普查,商场的名意调查等。

第四版统计学课后习题答案

第四版统计学课后习题答案
3.5绘制线图应注意问题
时间在横轴,观测值绘在纵轴。一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同
饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
4.9测度数据分布形状的统计量有哪些?
对分布形状的测度有偏态和峰态,测度偏态的统计量是偏态系数,测度峰态的统计量是峰态系数。
第五章 概率与概率分布
5.1频率与概率有什么关系?
在相同条件下随机试验n次,某事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数p波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率。
1.4解释分类数据,顺序数据和数值型数据
答案同1.3
1.5举例说明总体,样本,参数,统计量,变量这几个概念
对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
《统计学》第四版
统计课后思考题答案
第一章思考题

统计学第四版第七章答案

统计学第四版第七章答案

第四章抽样分布与参数估计7.2某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

15=2.143xn49(2)在95%的置信水平下,求边际误差。

xt x,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z2 因此,x txz2xz0.025x=1.96×2.143=4.2(3)如果样本均值为120元,求总体均值的95%的置信区间。

置信区间为:x,x=1204.2,1204.2=(115.8,124.2)xx7.4从总体中抽取一个n=100的简单随机样本,得到x=81,s=12。

要求:大样本,样本均值服从正态分布:xN,2n或xN,2sn置信区间为:ssxz2,xz2nn,sn=12100=1.2(1)构建的90%的置信区间。

z=2 z=1.645,置信区间为:811.6451.2,811.6451.2=(79.03,82.97)0.5(2)构建的95%的置信区间。

z=z0.025=1.96,置信区间为:811.961.2,811.961.2=(78.65,83.35)2(3)构建的99%的置信区间。

z=z0.005=2.576,置信区间为:812.5761.2,812.5761.2=(77.91,84.09)27.7某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。

解:(1)样本均值x=3.32,样本标准差s=1.61;(2)抽样平均误差:s重复抽样:x==1.61/6=0.268nn不重复抽样:x=NnsNnn1nN1N=7.37500363675001=0.268×0.995=0.268×0.998=0.267 (3)置信水平下的概率度:1=0.9,t= z=2 z=1.645 7.51=0.95,t= z=2 z=1.96 0.61=0.99,t= z=2 z=2.576 7.8(4)边际误差(极限误差):xtxzx21=0.9,x txz x=2 z3.4x重复抽样:x zx=z0.05x=1.645×0.268=0.4412不重复抽样:x zx= 2 z=1.645×0.267=0.4394.5x1=0.95,xtxz2x= z2.2x重复抽样:x zx= 2 z=1.96×0.268=0.5254.8x不重复抽样:x zx=z0.025x=1.96×0.267=0.52321=0.99,x txz x=z0.005x2重复抽样:x zx= 2 z=2.576×0.268=0.690.5x不重复抽样:xz2x= z=2.576×0.267=0.6880.5x(5)置信区间:x,xxx1=0.9,重复抽样:x,x=3.320.441,3.320.441=(2.88,3.76)xx不重复抽样:x,x=3.320.439,3.320.439=(2.88,3.76)xx 1=0.95,重复抽样:x,x=3.320.525,3.320.525=(2.79,3.85)xx 不重复抽样:x,x=3.320.441,3.320.441=(2.80,3.84)xx 1=0.99,重复抽样:x,x=3.320.69,3.320.69=(2.63,4.01)xx 不重复抽样:x,x=3.320.688,3.320.688=(2.63,4.01)xx7.4某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 103148691211751015916132假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 抽样分布与参数估计7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ===2.143 (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2)7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:22x z x z αα⎛-+ ⎝(1)构建μ的90%的置信区间。

2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。

2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。

2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09)7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36解:(1)样本均值x =3.32,样本标准差s=1.61; (2)抽样平均误差: 重复抽样:x σ≈不重复抽样:x σ≈=0.268×0.998=0.267(3)置信水平下的概率度: 1α-=0.9,t=2z α=0.05z =1.645 1α-=0.95,t=2z α=0.025z =1.96 1α-=0.99,t=2z α=0.005z =2.576 (4)边际误差(极限误差): 2x x x t z ασσ∆=⋅=⋅1α-=0.9,2x x x t z ασσ∆=⋅=⋅=0.05x z σ⋅重复抽样:2x x z ασ∆=⋅=0.05x z σ⋅=1.645×0.268=0.441 不重复抽样:2x x z ασ∆=⋅=0.05x z σ⋅=1.645×0.267=0.4391α-=0.95,2x x x t z ασσ∆=⋅=⋅=0.025x z σ⋅重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=1.96×0.268=0.525 不重复抽样:2x x z ασ∆=⋅=0.025x z σ⋅=1.96×0.267=0.5231α-=0.99,2x x x t z ασσ∆=⋅=⋅=0.005x z σ⋅重复抽样:2x x z ασ∆=⋅=0.005x z σ⋅=2.576×0.268=0.69 不重复抽样:2x x z ασ∆=⋅=0.005x z σ⋅=2.576×0.267=0.688(5)置信区间:(),x x x x -∆+∆1α-=0.9,重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(2.88,3.76)不重复抽样:(),x x x x -∆+∆=()3.320.439,3.320.439-+=(2.88,3.76)1α-=0.95,重复抽样:(),x x x x -∆+∆=()3.320.525,3.320.525-+=(2.79,3.85) 不重复抽样:(),x x x x -∆+∆=()3.320.441,3.320.441-+=(2.80,3.84)1α-=0.99,重复抽样:(),x x x x -∆+∆=()3.320.69,3.320.69-+=(2.63,4.01) 不重复抽样:(),x x x x -∆+∆=()3.320.688,3.320.688-+=(2.63,4.01)7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本,总体方差未知,用t 统计量x t =()1t n -均值=9.375,样本标准差s=4.11 置信区间:()()211x t n x t n αα⎛--+- ⎝1α-=0.95,n=16,()21t n α-=()0.02515t =2.13()()211x t n x t n αα⎛--+- ⎝=9.375 2.13 2.13⎛-+ ⎝=(7.18,11.57)7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。

现从某天生产已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的95%的置信区间。

解:大样本,总体方差未知,用z 统计量x z =()0,1N样本均值=101.4,样本标准差s=1.829 置信区间:22x z x z αα⎛-+ ⎝1α-=0.95,z α=0.025z=1.9622x z x z αα⎛-+ ⎝=101.4 1.96 1.96⎛-+ ⎝=(100.89,101.91) (2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计大样本,总体方差未知,用z 统计量z =()0,1N样本比率=(50-5)/50=0.9 置信区间:22p z p z αα⎛ -+ ⎝ 1α-=0.95,z α=0.025z=1.9622p z p z αα⎛ -+ ⎝=0.9 1.96 1.96⎛ -+ ⎝=(0.8168,0.9832)7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了假定员工每周加班的时间服从正态分布。

估计网络公司员工平均每周加班时间的90%的置信区间。

解:小样本,总体方差未知,用t 统计量x t =()1t n -均值=13.56,样本标准差s=7.801 置信区间:()()211x t n x t n αα⎛--+- ⎝1α-=0.90,n=18,()21t n α-=()0.0517t =1.7369()()211x t n x t n αα⎛--+- ⎝=13.56 1.7369 1.7369⎛-+ ⎝=(10.36,16.75)7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。

其中拥有该品牌电视机的家庭占23%。

求总体比例的置信区间,置信水平分别为90%和95%。

解:总体比率的估计大样本,总体方差未知,用z 统计量z =()0,1N样本比率=0.23 置信区间:22p z p z αα⎛ -+ ⎝ 1α-=0.90,z α=0.025z=1.64522p z p z αα⎛ -+ ⎝=0.23 1.645 1.645⎛ -+ ⎝ =(0.1811,0.2789)1α-=0.95,z α=0.025z =1.9622p z p z αα⎛ -+ ⎝=0.23 1.96 1.96⎛ -+ ⎝=(0.1717,0.2883)7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。

为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。

为比较哪种排队方式使顾客等待的时间)如下:(1)构建第一种排队方式等待时间标准差的95%的置信区间。

解:估计统计量()()2221~1n S n χσ-- 经计算得样本标准差22s =3.318 置信区间:()()()()222222121111n S n S n n αασχχ---≤≤--1α-=0.95,n=10,()21n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7()()()()222221211,11n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭=90.227290.2272,19.02 2.7⨯⨯⎛⎫ ⎪⎝⎭=(0.1075,0.7574) 因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的95%的置信区间。

解:估计统计量()()2221~1n S n χσ-- 经计算得样本标准差21s =0.2272 置信区间:()()()()222222121111n S n S n n αασχχ---≤≤--1α-=0.95,n=10,()21n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7()()()()222221211,11n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭=9 3.3189 3.318,19.022.7⨯⨯⎛⎫ ⎪⎝⎭=(1.57,11.06) 因此,标准差的置信区间为(1.25,3.33) (3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小!(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。

d =1.75,d s =2.62996(2)设12μμ和分别为总体A 和总体B 的均值,构造12d μμμ=-的95%的置信区间。

解:小样本,配对样本,总体方差未知,用t 统计量d d t =()1t n -均值=1.75,样本标准差s=2.62996 置信区间:()()211d tn d t n αα⎛--+- ⎝1α-=0.95,n=4,()21t n α-=()0.0253t=3.182 ()()211d t n d t n αα⎛--+- ⎝=1.75 3.182 3.182⎛-+ ⎝=(-2.43,5.93)7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1p =40%,来自总体2的样本比例为2p =30%。

要求:(1)构造12ππ-的90%的置信区间。

(2)构造12ππ-的95%的置信区间。

解:总体比率差的估计大样本,总体方差未知,用z 统计量p p z ππ---=()0,1N样本比率p1=0.4,p2=0.3置信区间:122122p p z p p z αα⎛ ---+ ⎝1α-=0.90,z α=0.025z =1.645122122p p z p p z αα⎛ ---+⎝=0.1 1.645 1.645⎛ -+ ⎝ =(3.02%,16.98%)1α-=0.95,z α=0.025z =1.96122122p p z p p z αα⎛ ---+⎝=0.1 1.96 1.96⎛ -+ ⎝ =(1.68%,18.32%)7.26 生产工序的方差是工序质量的一个重要度量。

相关文档
最新文档