大学统计学第七章练习题及答案概要

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学第七版课后答案

统计学第七版课后答案

统计学第七版课后答案【篇一:大学统计学第七章练习题及答案】练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1)样本均值的抽样标准差?等于多少?(2)在95%的置信水平下,边际误差是多少?解:⑴已知??5,n?40,?25样本均值的抽样标准差???n?540??0.79 4⑵已知??5,n?40,?25,??,1???95% 4?z?2?z0.025?1.96边际误差7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差;(2)在95%的置信水平下,求边际误差;(3)如果样本均值为120元,求总体均值?的95%的置信区间。

解.已知.根据查表得z?/2=1.96(1)标准误差:e?z??n?1.96*?1.55 4???n?1549?2.14(2).已知z?/2=1.96所以边际误差=z?/2*sn?1.96*1549=4.2(3)置信区间:?z?2sn?120?1549?1.96??115.8,124.2?7.3 从一个总体中随机抽取n?100的随机样本,得到?104560,假定总体标准差??85414,构建总体均值?的95%的置信区间。

z??1.96z??96*85414n?1.?16741.144?z.?104560?16741.144?87818.856n??z?.?104560?16741.144?121301.144n置信区间:(87818.856,121301.144)7.4 从总体中抽取一个n?100的简单随机样本,得到?81,s?12。

(1)构建?的90%的置信区间。

(2)构建?的95%的置信区间。

(3)构建?的99%的置信区间。

解;由题意知n?100, ?81,s?12.(1)置信水平为1???90%,则z??1.645. 2由公式?zs??81?1.645?122n??81?1.974即81?1.974??79.026,82.974?,则?的90%的置信区间为79.026~82.974(2)置信水平为1???95%, z??1.96 2由公式得?z??s2n=81?1.96?12100?81?2.352即81?2.352=(78.648,83.352),则?的95%的置信区间为78.648~83.352(3)置信水平为1???99%,则z??2.576.2s12由公式?z??=?81?2.576?0962n?81?3.即81?3.1则?的99%的置信区间为7.5 利用下面的信息,构建总体均值的置信区间。

人大版统计学 习题加答案第七章 时间序列分析

人大版统计学 习题加答案第七章 时间序列分析

第七章时间序列分析一、填空1、下表为两个地区的财政收入数据:则A地区财政收入的增长速度是,B地区财政收入的增长速度是,A 地区财政收入的增长1%的绝对值为,B地区财政收入的增长1%的绝对值为。

2、已知环比增长速度为7.1%、3.4%、3.6%、5.3%,则定基增长速度是。

3、年劳动生产率r(千元和职工工资y (元之间的回归方程为110x=,这意味着120y+年劳动生产率每提高1千元时,职工工资平均。

4、拉氏价格或销售量指数的同度量因素都是选期,而派许指数的同度量因素则选期。

5、动态数列的变动一般可以分解为四部分,即趋势变动、变动、变动和不规则变动。

二、选择题1.反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。

A长期趋势因素B季节变动因素C周期变动因素D不规则变动因素2.是经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。

A长期趋势因素B季节变动因素C周期变动因素D不规则变动因素3、时间序列在一年内重复出现的周期性波动称为(A、趋势B、季节性C、周期性D、随机性4、在使用指数平滑法进行预测时,如果时间序列比较平稳,则平滑系数α的取值(A、应该小些B、应该大些C、等于0D、等于15、某银行投资额2004年比2003年增长了10%,2005年比2003年增长了15%,2005年比2004年增长了(A、15%÷10%B、115%÷110%C、(110%×115%+1D、(115%÷110%-1三、判断1、若1998年的产值比1997年上涨10%,1999年比1998年下降10%,则1999年的产值比1997年的产值低。

(2、若三期的环比增长速度分别为9%、8%、10%,则三期的平均增长速度为9% (。

3、去年物价下降10%,今年物价上涨10%,今年的1元钱比前年更值钱。

(。

4、若平均发展速度大于100%,则环比发展速度也大于100%。

大学统计学第七章练习题及标准答案

大学统计学第七章练习题及标准答案

第7章 参数估计练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ样本均值的抽样标准差79.0410405≈===nx σσ ⑵已知5=σ,40=n ,25=x ,410=x σ,%951=-α 96.1025.02==∴Z Z α边际误差55.1410*96.12≈==nZ E σα 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

解.已知.根据查表得2/αz =1.96 (1)标准误差:14.24915===nX σσ(2).已知2/αz =1.96所以边际误差=2/αz *=ns 1.96*4915=4.2(3)置信区间:)(2.124,8.11596.149151202=*±=±ns Z x α7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。

96.12=∂Z144.1674110085414*96.12==⋅∂nZ σ856.87818144.16741104560.2=-=-∂nZ x σ144.121301144.16741104560.2=+=+∂nZ x σ置信区间:(87818.856,121301.144)7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。

(1) 构建μ的90%的置信区间。

(2) 构建μ的95%的置信区间。

(3) 构建μ的99%的置信区间。

统计学答案第七章

统计学答案第七章

1 估计量的含义是指()。

A。

用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C。

总体参数的名称D。

总体参数的具体数值2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。

这种评价标准称为().A。

无偏性B。

有效性C。

一致性 D.充分性3 根据一个具体的样本求出的总体均值的95%的置信区间().A.以95%的概率包含总体均值B.有5%的可能性包含总体均值C.一定包含总体均值D。

要么包含总体均值,要么不包含总体均值4 无偏估计是指().A.样本统计量的值恰好等于待估的总体参数B。

所有可能样本估计值的数学期望等于待估总体参数C。

样本估计值围绕待估总体参数使其误差最小D。

样本量扩大到和总体单元相等时与总体参数一致5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。

A.样本均值的抽样标准差B。

样本标准差C.样本方差D。

总体标准差6 当样本量一定时,置信区间的宽度()。

A。

随着置信系数的增大而减小B。

随着置信系数的增大而增大C。

与置信系数的大小无关D.与置信系数的平方成反比7 当置信水平一定时,置信区间的宽度().A。

随着样本量的增大而减小B.随着样本量的增大而增大C。

与样本量的大小无关D。

与样本量的平方根成正比8 一个95%的置信区间是指()。

A。

总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C。

在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9 95%的置信水平是指()。

A.总体参数落在一个特定的样本所构造的区间内的概率为95%B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%C.总体参数落在一个特定的样本所构造的区间内的概率为5%D。

在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%10 一个估计量的有效性是指()。

统计学贾俊平第四版第七章课后答案目前最全

统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。

7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。

2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。

2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。

统计学第四版第七章课后题最全答案

统计学第四版第七章课后题最全答案
7.23下表就是由4对观察值组成得随机样本。
配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:

统计学第七章习题答案

统计学第七章习题答案

第7章 相关与回归分析二 单项选择题1-5 BCBAC 6-10 CCABA 11-15 BCCAA 16-20 CCBDB 21-25 CBBAA 26_30 BCBBA 31_35 CBABA 36_40 BAAAA三计算分析题7.1(1)散点图如下:从散点图可以看出,销售收入与广告费用之间为正的线性相关关系。

(2)利用Excel 的“CORREL”函数计算的相关系数为947663.0=r 。

(3)首先提出如下假设:0:0=ρH ,0:1≠ρH 。

计算检验的统计量 272.7947663.0128947663.01222=--=--=r n rt 当05.0=α时,9687.2)28(205.0=-t 。

由于检验统计量9687.2272.72=>=αt t ,拒绝原假设。

表明产量与生产费用之间的线性关系显著。

7.2 (1)散点图如下:从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。

(2)利用Excel 的“CORREL”函数计算的相关系数为8621.0=r 。

相关系数8.0>r ,表明复习时间与考试分数之间有较强的正线性相关关系。

7.3 (1)散点图如下:7.3利用Excel 的“CORREL”函数计算的相关系数为9489.0=r 。

由Excel 输出的回归结果如下表:得到的回归方程为:x y 003585.0118129.0ˆ+=回归系数003585.0ˆ1=β表示运送距离每增加1公里,运送时间平均增加0.003585天。

7.4 (1) 散点图如下:Multiple R 0.868643 R Square 0.75454 Adjusted RSquare 0.723858标准误差 18.88722 观测值 10方差分析df SS MS FSignificanceF回归分析 1 8772.584 8772.584 24.59187 0.001108 残差 8 2853.816 356.727 总计 9 11626.4Coefficients 标准误差t Stat P-valueIntercept 430.1892 72.15483 5.962029 0.000337 X Variable 1-4.70062 0.947894 -4.95902 0.001108得到的回归方程为:x y 7.41892.430ˆ-=。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学复习笔记之马矢奏春创作第七章第八章一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的尺度(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报导一些调查结果只给出百分比和误差(即置信区间),其实不说明置信度,也不给出被调查的人数,这是不负责的表示。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查人数是负责任的表示。

这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为▪与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪与总体方差成正比,总体的差别越大,所要求的样本量也越大;▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

其中:2222)(E z n σα=nz E σα2=二、 练习题1. 从一个尺度差为5的总体中采取重复抽样方法抽出一个样本量为40的样本,样本均值为25。

统计学第七章课后题及答案解析

统计学第七章课后题及答案解析

第七章 一、单项选择题1.按指数所包括的范围不同, 可以把它分为( )A.个体指数和总指数 B .数量指标指数和质量指标指数C.综合指数和平均指数 D.定基指数和环比指数2. 某集团公司为了反映所属各企业劳动生产率水平的提高情况 ,需要编制(A.质量指标综合指数B.数量指标综合指数C.可变构成指数D.固定构成指数3.在一般情况下,商品销售量指数和工资水平指数的同度量因素分别为( 商品销售量、平均工资水平 单位商品销售价格、职工人数 下列指数中属于数量指标指数的是 产品价格指数 产量指数 下面属于价格指数的是(B .商品销售量、职工人数D.单位商品销售价格、平均工资水平 )B .单位成本指数 D.劳动生产率指数5. A.工RQ 1 氓Q 1B -F 1Q 1ZFO Q OC.QZP0QoD E pQ oZP0Q O6. A.7. 某商品价格发生变化,现在的10%B. 90% 固定构成指数的公式是(100元只值原来的 C. 110%)90元,则价格指数为(D. 111%A. C.1. A. D.2. A. C. E.3. A. D.4.A. C. ZX i F i ZF iZX 1F 1ZF I... ZX P F O 1F0 D. ZX O F^ IXo F oIX 0F 1ZF iZFoIX 1F 0ZF O、多项选择题下列属于数量指标指数的有( 产量指数单位产品成本指数 下列表述正确的是( 综合指数是先综合后对比 平均数指数必须使用全面资料 固定构成指数受总体结构影响 同度量因素的作用有( 同度量作用 B.比较作用E. )B.销售量指数E.职工人数指数C.价格指数B .平均数指数是先对比后综合 D.平均数指数可以使用固定权数联系作用平衡作用c.权数作用对某商店某时期商品销售额的变动情况进行分析,其指数体系包括( 销售量指数B.销售价格指数总平均价格指数 D.销售额指数 E.个体指数若用某企业职工人数和劳动生产率的分组资料来进行分析时,该企业总的劳动生产率的A.C.4.A.C.变动主要受到()A.企业全部职工人数变动的影响B.企业劳动生产率变动的影响C.企业各类职工人数在全部职工人数中所占比重的变动影响D.企业各类工人劳动生产率的变动影响E.受各组职工人数和相应劳动生产率两因素的影响6.下列指数中,属于拉氏指数的有()' Q1P01 0 1 01 1 1 1P0Q0 P0Q1 C X Q0 P0 P0Q1 Q0 P1 7.某企业产品总成本报告期为183150元,比基期增长10%单位成本综合指数为104%则()A.总成本指数110%B.产量增长了5.77%C.基期总成本为166500元D.单位成本上升使总成本增加了7044元E.产量增产使总成本增加了9606元三、判断题1.综合指数的编制方法是先综合后对比。

统计学相关-概率论与数理统计第七章参考答案

统计学相关-概率论与数理统计第七章参考答案

2 00.05 , n Nhomakorabea9

2
(n
1)
2 0.95
(8)
2.733
拒绝域为: 2 2.733
又由题知: s2 0.00862
2 0
0.012
2
(n 1)s 2
2 0
8 0.0086 2 0.012
5.9186
2.733
2 未落入拒绝域,故接受 H 0 ,认为 0.01
10、(1)检验假设: H 0 : 3315 , H1 : 3315 这是 2 未知关于 的左边检验
拒绝 H 0 ,即认为 3315 (2) 检验假设: H 0 : 525 , H1 : 525 这是 未知,关于 2 的右边检验,则
检验统计量为: 2 (n 1)s 2
2 0
0.05 , n
30

2
(n
1)
2 0.05
(29)
42.557
拒绝域为: 2 42.557
又由题知: s2 4882
0.05 , n1 9 , n2 4 , t0.05 (n1 n2 2) t0.05 (11) 1.7959
拒绝域为: t
xy
sw
11 94
t 0.05
(11)
1.7959
由题,A 班、B 班考试成绩的样本均值和样本方差分别为:
x 80 , s12 110.25
y 65 , s22 174
s 27.28
0 200
t X 0 210.2 200 1.1217 1.8331
s / n 27.28 / 9
接受 H 0 ,即认为 200 。
6、检验假设: H 0 : 2 5000 , H1 : 2 5000 解:这是 未知,关于 2 的双边检验

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

2.统计学复习笔记第七章参数估计解释估计量和估计值在参数佔汁中,用来估计总体参数的统计量称为估计量。

佔汁量也是随机变 量。

如样本均值,样本比例、样本方差等。

根据一个具体的样本汁算出来的佔计量的数值称为齟值。

简述评价估计量好坏的标准(1) 无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2) 有效性:是指估计量的方差尽可能小。

对同一总体参数的两个无偏估 计ft ,有更小方差的佔计量更有效。

(3)-致性.是指随着样本量的增大,点佔计量的值越来越接近被估总体 的参数。

怎样理解置信区间在区间估计中,山样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是山区间和置信度两部分组成。

有些新闻媒体报道一些调查结果 只给出白分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负贵的表现。

因为降低置信度可以使置信区间变窄(显得〃精确”),有误 导读者之嫌。

在公布调査结果时给出被调査人数是负责任的表现。

这样则可以山 此推算出置信度(山后面给出的公式),反之亦然。

4. 解释95%的置信区间的含义是什么置倍区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体 参数的概率。

也就是说,无穷次重复抽样所得到的所有区间中有95% (的区间) 包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区 间以的概率覆盖总体参数。

5. 简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本fin 为 心呼!其中:EfJ样本量n 与置信水平1-a 、总体方差夕、佔计误差f 之间的关系为1. 2. 3. a 、与置信水平成正比,在其他条件不变的悄况下,置信水平越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与佔汁误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。

练习题从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40 1.的样本,样本均值为25。

统计学原理 第七章课后习题及答案

统计学原理 第七章课后习题及答案

第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。

(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。

(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。

(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。

(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。

(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。

(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。

(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。

(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。

(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。

(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析

第七章相关分析与回归分析一、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.自变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪一个属于相关关系A.播种量与粮食收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆面积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化方向相反B.两个变量一增一减C.两个变量之间的变化方向一致D.两个变量一减一增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存在着A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要方法是A.对现象进行定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.自变量不是随机的,因变量是随机的B.两个变量均不是随机的C.自变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适用于直线相关,又适用于曲线相关B.只适用于直线相关C.既不适用于直线相关,又不适用于曲线相关D.只适用于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是≤r≤1 ≤r≤0≤r≤1 D. r=014.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈大于1D.愈小于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全无关B.相关程度较小B.现象之间完全相关 D.无直线相关关系18.假设产品产量与产品单位成本之间的相关系数为,则说明这两个变量之间存在A.高度相关B.中度相关C.低度相关D.显着相关19.从变量之间相关的方向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和无相关21.物价上涨,销售量下降,则物价与销售量之间属于A.无相关B.负相关C.正相关D.无法判断22.配合回归直线最合理的方法是A.随手画线法B.半数平均法C.最小平方法D.指数平滑法23.在回归直线方程y=a+bx中b表示A.当x增加一个单位时,y增加a的数量B.当y增加一个单位时,x增加b的数量C.当x增加一个单位时,y的平均增加量D.当y增加一个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动生产率(千元)和工人工资(元)之间存在回归方程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:=6+ =6000+24x=24000+6x =24+6000x29.用来反映因变量估计值代表性高低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差二、多项选择题1.下列现象之间属于相关关系的有A.家庭收入与消费支出之间的关系B.农作物收获量与施肥量之间的关系C.圆的面积与圆的半径之间的关系D.身高与体重之间的关系E.年龄与血压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有一个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的一元线性回归方程为y=,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加元D.产量为1千件时,单位成本为元E.产量每增加1千件,单位成本平均减少元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.非线性相关7.判断现象之间有无相关关系的方法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差8.当现象之间完全相关的,相关系数为B.-1 E.-9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.高度曲线相关10.下列现象属于正相关的有A.家庭收入愈多,其消费支出也愈多B.流通费用率随商品销售额的增加而减少C.产量随生产用固定资产价值减少而减少D.生产单位产品耗用工时,随劳动生产率的提高而减少E.工人劳动生产率越高,则创造的产值就越多11.直线回归分析的特点有A.存在两个回归方程B.回归系数有正负值C.两个变量不对等关系D.自变量是给定的,因变量是随机的E.利用一个回归方程,两个变量可以相互计算12.直线回归方程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是自变量,哪个是因变量D.一个是随机变量,另一个是给定变量E.一个是自变量,另一个是因变量13.从现象间相互关系的方向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈小,表明估计值愈可靠E.指标值愈大,表明估计值愈可靠15.下列公式哪些是计算相关系数的公式16.用最小平方法配合的回归直线,必须满足以下条件A.?(y-y c )=最小值B.?(y-y c )=0C.?(y-y c )2=最小值D.?(y-y c )2=0E.?(y-y c )2=最大值17.方程y c =a+bx222222)()(.)()())((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy yx ∑-∑⋅∑-∑∑⋅∑-∑=-∑⋅-∑--∑===--∑=σσA.这是一个直线回归方程B.这是一个以X为自变量的回归方程C.其中a是估计的初始值D.其中b是回归系数是估计值18.直线回归方程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动方向D.其数值大小不受计量单位的影响E. 其数值大小受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数大于零则相关系数大于零B.回归系数小于零则相关系数小于零C.回归系数等于零则相关系数等于零D.回归系数大于零则相关系数小于零E.回归系数小于零则相关系数大于零20.配合直线回归方程的目的是为了A.确定两个变量之间的变动关系B.用因变量推算自变量C.用自变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在的所有理论值同它的平均值一致和y是函数关系与y不相关与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的C.相关系数有正负号;而回归系数只能取正值D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数三、填空题1.研究现象之间相关关系称作相关分析。

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1 •答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在定的范围内变化。

2•答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3•答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数二样本相关系数,「一】。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数R2的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y与自变量X之间存在着近似的线性函数关系,可表示为Y^ 11X t u t,这就是总体回归函数,其中u t是随机误差项,可以反映未考虑的其他各种因素对Y的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:Y?=耳+弭x t。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的-0和-1是未知的参数,表现为常数;而样本回归直线中的'?Q和?i是随机变量,其具体数值随所抽取的样本观测值不同而变动。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第7章 参数估计练习题7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少?解:⑴已知25,40,5===x n σ样本均值的抽样标准差79.0410405≈===nx σσ ⑵已知5=σ,40=n ,25=x ,410=x σ,%951=-α 96.1025.02==∴Z Z α边际误差55.1410*96.12≈==nZ E σα7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

解.已知.根据查表得2/αz =1.96 (1)标准误差:14.24915===nX σσ(2).已知2/αz =1.96所以边际误差=2/αz *=ns 1.96*4915=4.2(3)置信区间:)(2.124,8.11596.149151202=*±=±ns Z x α7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。

96.12=∂Z144.1674110085414*96.12==⋅∂nZ σ856.87818144.16741104560.2=-=-∂nZ x σ144.121301144.16741104560.2=+=+∂nZ x σ置信区间:(87818.856,121301.144)7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。

(1) 构建μ的90%的置信区间。

(2) 构建μ的95%的置信区间。

(3) 构建μ的99%的置信区间。

解;由题意知100=n , 81=x ,12=s .(1)置信水平为%901=-α,则645.12=αZ .由公式ns z x ⨯±2α974.18110012645.181±=⨯±=即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12=αz由公式得ns z x ⨯±2α=81352.2811001296.1±=⨯± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352(3)置信水平为%991=-α,则576.22=αZ .由公式±x ns z ⨯2α=096.38110012576.281±=⨯±=即81 3.1±则的的%99μ置信区间为7.5 利用下面的信息,构建总体均值的置信区间。

(1)25=x ,5.3=σ,60=n ,置信水平为95%。

(2)6.119=x ,89.23=s ,75=n ,置信水平为98%。

(3)419.3=x ,974.0=s ,32=n ,置信水平为90%。

⑴,60,5.3,25===n X σ置信水平为95% 解:,96.12=αZ89.0605.396.12=⨯=nZ σα置信下限:-X 11.2489.0252=-=nZ σα置信上限:+X 89.2589.0252=+=nZ σα),置信区间为(89.2511.24∴⑵。

,置信水平为,%9875n 89.23s ,6.119===X 解:33.22=αZ43.67589.2333.22=⨯=ns Z α置信下限:-X 17.11343.66.1192=-=n s Z α置信上限:+X 03.12643.66.1192=+=ns Z α),置信区间为(03.12617.113∴⑶x=3.419,s=0.974,n=32,置信水平为90%根据t=0.1,查t 分布表可得645.1)31(05.0=Z .283.0)(2/=∂ns Z所以该总体的置信区间为x ±2/∂Z ()ns =3.419±0.283即3.419±0.283=(3.136 ,3.702) 所以该总体的置信区间为3.136~3.702.7.6 利用下面的信息,构建总体均值μ的置信区间。

(1) 总体服从正态分布,且已知500=σ,15=n ,8900=x ,置信水平为95%。

(2) 总体不服从正态分布,且已知500=σ,35=n ,8900=x ,置信水平为95%。

(3) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为90%。

(4) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为99%。

(1)解:已知500=σ,15=n ,8900=x ,1-95=α%,96.12=αz)9153,8647(1550096.189002=⨯±=±nz x σα所以总体均值μ的置信区间为(8647,9153)(2)解:已知500=σ,35=n ,8900=x ,1-95=α%,96.12=αz)9066,8734(3550096.189002=⨯±=±nz x σα所以总体均值μ的置信区间为(8734,9066)(3)解:已知35=n ,8900=x ,s=500,由于总体方差未知,但为大样本,可用样本方差来代替总体方差∵置信水平1—α=90% ∴645.12=αz∴置信区间为)9039,8761(35500645.1812=⨯±=±ns z x α所以总体均值μ的置信区间为(8761,9039)(4)解:已知35=n ,8900=x ,500=s ,由于总体方差未知,但为大样本,可用样本方差来代替总体方差置信水平1—α=99% ∴58.22=αz∴置信区间为)9118,8682(3550058.289002=⨯±=±ns z x α所以总体均值μ的置信区间为(8682,9118)7.7 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到的数据见Book7.7(单位:h )。

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

解:已知:3167.3=x 6093.1=s n=36 1.当置信水平为90%时,645.12=∂z ,4532.03167.3366093.1645.13167.32±=±=±∂n sz x 所以置信区间为(2.88,3.76)2.当置信水平为95%时,96.12=∂z ,所以置信区间为(2.80,3.84)3.当置信水平为99%时,58.22=∂z ,7305.03167.3366093.158.23167.32±=±=±∂n sz x 所以置信区间为(2.63,4.01)7.8 从一个正态总体中随机抽取样本量为8的样本,各样本值见Book7.8。

求总体均值95%的置信区间。

已知:总体服从正态分布,但σ未知,n=8为小样本,05.0=α,365.2)18(205.0=-t根据样本数据计算得:46.3,10==s x5445.03167.3366093.196.13167.32±=±=±∂ns z x总体均值μ的95%的置信区间为: 89.210846.3365.2102±=⨯±=±ns t x α,即(7.11,12.89)。

7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km )数据见Book7.9。

求职工上班从家里到单位平均距离95%的置信区间。

已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,131.2)116(2/05.0=-t 根据样本数据计算可得:375.9=x ,s=4.113 从家里到单位平均距离得95%的置信区间为:191.2375.914113.4131.2375.92/±=⨯±=±ns t x α,即(7.18,11.57)。

7.10 从一批零件中随机抽取36个,测得其平均长度为149.5cm ,标准差为1.93cm 。

(1) 试确定该种零件平均长度95%的置信区间。

(2) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

解:已知,103=σn=36, x =149.5,置信水平为1-α=95%,查标准正态分布表得2/αZ =1.96.根据公式得: x ±2/αZ nσ=149.5±1.9636103⨯即149.5±1.9636103⨯=(148.9,150.1)答:该零件平均长度95%的置信区间为148.9~150.1 (3) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

答:中心极限定理论证。

如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。

在现实生活中,一个随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存在的。

样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g 。

现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g )见Book7.11。

已知食品重量服从正态分布,要求:(1) 确定该种食品平均重量的95%的置信区间。

(2) 如果规定食品重量低于100g 属于不合格,确定该批食品合格率的95%的置信区间。

(1)已知:总体服从正态分布,但σ未知。

n=50为大样本。

α=0.05,2/05.0Z =1.96 根据样本计算可知 X =101.32 s=1.63 该种食品平均重量的95%的置信区间为45.032.10150/63.1*96.132.101/2/±=±=Z ±X n s α即(100.87,101.77)(2)由样本数据可知,样本合格率:9.050/45==p 。

该批食品合格率的95%的置信区间为: 2/αZ ±p n p p )1(-=0.950)9.01(9.096.1-±=0.9±0.08,即(0.82,0.98) 答:该批食品合格率的95%的置信区间为:(0.82,0.98)7.12 假设总体服从正态分布,利用Book7.12的数据构建总体均值μ的99%的置信区间。

相关文档
最新文档