第九章统计学基础课后习题答案
《统计学》第9章课后习题参考答案

第9章习题参考答案
9.1
解:(1)长度Y(厘米)与重量X(克)之间的散点图如下所示:
由Y与X的散点图可以大致推测长度Y关于重量X是线性相关,且二者呈正相关关系。
(2)首先,先分别求出平均重量和平均长度:
;;
其次,计算回归参数,其计算表如下:
表1:回归方程参数的计算表
(X-(Y-
最后,根据公式(9.6)计算相应的回归参数:
;
所以,Y关于X的一元线性回归方程为:
9.5
解:总变差,回归平方和,残差平方和的计算如下:
表2:总变差,回归平方和,残差平方和的计算表
∴残差平方和:;
回归平方和:
9.6
解:由表2得:
判定系数
又∵习题9.1的散点图显示Y与X是呈正相关关系
∴相关系数
显著性检验:
(1)回归方程的显著性检验:
原假设H0:该回归方程不显著;备择假设H1:该回归方程显著
计算F统计量:
∵在α=0.05的显著性水平下,有4454.79>F0.05(1,4)=7.71
∴拒绝原假设,认为该回归方程式显著的。
(2)回归参数的假设检验:
原假设H0:备择假设H1:
计算t统计量:;
[其中] ∵在α=0.05的显著性水平下,有15.98>t0.05(4)=2.776
∴拒绝原假设,即认为自变量X对因变量Y有显著性影响。
(3)相关关系的显著性检验:
原假设H0:ρ=0;备择假设H1:ρ
计算t统计量:;
∵在α=0.05的显著性水平下,有66.64> t0.05(4)=2.776
∴拒绝原假设,认为总体相关系数不为0。
统计学基础课后答案

尊敬的老师(读者)好:首先感谢使用本教材,由于时间仓促,教材存在一些错误,给您带来不便请您谅解,现对部分错误及添加内容做了修改,同时提供部分习题答案,习题有超出课本范围可直接忽略。
多媒体课件我会陆续发给大家!本教材出版社已经重新修改再次印刷,相信错误基本没有了。
欢迎您批评指正!祝您工作愉快!王瑞卿2009年11月24日教材修改:小错误直接修改在教材上了。
原教材106页,思考与技能训练在原来习题基础上添加如下内容:要求:在原来对应同类习题前加上如下内容一、填空题1.绝对数是说明总体特征的指标。
2.按绝对数的计量单位不同可分为、、三类指标。
3.总体单位总数和标志值总数随着变化而可能转化。
4.相对数是由两个有联系的指标计算得到。
5.结构相对数和比例相对数都是在基础上计算的。
6.计划指标的表现形式可以是绝对数,也可以是和。
7.强度相对数的正指标数值越大,表示现象的强度和密度越8.系数和倍数是将对比的基数定为而计算的相对数。
9.实物指标能够直接反映产品的量,价值指标反映产品的量。
10.我国汉族人口占总人口的91,59%,则少数民族人口占总人口的百分比为。
11.续接原来的填空题二、单项选择题1.下面属于时期指标的是( )A.商场数量B.营业员人数C.商品价格D.商品销售量2.某大学10个分院共有学生5000人、教师300人、设置专业27个。
若每个分院为调查单位,则总体单位总数是( )A.分院数B.学生数C.教师数D.专业数3.下面属于结构相对数的有( )A.人口出生率B.产值利润率C.恩格尔系数D.工农业产值比4.用水平法检查长期计划完成程度,应规定( )A.计划期初应达到的水平B.计划期末应达到的水平C.计划期中应达到的水平D.整个计划期应达到的水平5.属于不同总体的不同性质指标对比的相对数是( )A.动态相对数B. 比较相对数C.强度相对数D.比例相对数6.数值可以直接相加总的指标是( )A.绝对数B.相对数C.时点数D.时期数7.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。
统计学第九章课后习题答案

9.1(1)设原假设为H:不同收入群体对某种特定商品的购买习惯相同:即不同收入群体对某种特定商品的购买习惯不完全相同H1(2)由SPSS计算可得χ2值为17.626(3)自由度=(3-1)×(4-1)=6,当α=0.1时,χ0.12(6)=10.64∵χ2=17.626>10.64=χ0.12(6)故拒绝原假设,即不同收入群体对某种特定商品的购买习惯不完全相同。
(4)由SPSS计算可得φ系数为0.183、c系数为0.180、V系数为0.1299.2解:设原假设为H0:现在情况与经验数据相比没有发生变化;H1:现在情况与经验数据相比发生了变化。
由已知条件可得χ2值为:χ2=(28−0.1×200)20.1×200+(56−0.2×200)20.2×200+(48−0.3×200)20.3×200+(36−0.2×200)20.2×200+(32−0.2×200)20.2×200=14P[χ2(5−1)>14]=0.007295<0.1=α,故拒绝原假设。
9.3设原假设为H0:π1=π2=π3=π4(即阅读习惯与文化程度无关)H1:π1,π2,π3,π4不完全相等(即阅读习惯与文化程度有关)表中各项的期望值:E11=n1×n1n=77×50254=15.16E12=n2×n1n=91×50254=17.91E13=n3×n1n=42×50254=8.27E14=n4×n1n=44×50254=8.66E21=n1×n2n=77×44254=13.34E22=n2×n2n=91×44254=15.76E23=n3×n2n=42×44254=7.28E24=n4×n2n=44×44254=7.62E31=n1×n3n=77×95254=28.80E32=n2×n3n=91×95254=34.04E33=n3×n3n=42×95254=15.71E34=n4×n3n=44×95254=16.46E41=n1×n4n=77×65254=19.70E42=n2×n4n=91×65254=23.29E43=n3×n4n=42×65254=10.75E44=n4×n4n=44×65254=11.26所以χ2=(6-15.16)2/15.16+(12-13.34)2/13.34+……+(13-11.26)2/11.26=31.86。
西财《统计学基础》(肖战峰)教学资料包 课后习题答案 第九章

第九章假设检验一、填空题1.第一类错误 2.Z统计量、标准正态分布 3.t统计量、t4.P值 5.TDIST 6.≥30 7.正相关、负相关二、单选题1.A 2.D 3.A 4.C 5.C三、简答题1.小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为这个假设可能是不成立的。
小概率原理包含了两方面的意思:一是认为小概率事件在一次观察中是不会出现的,二是如果在一次观察中出现了小概率事件,那么合理的解释是原有事件具有小概率的说法不成立。
2.建立假设时应注意以下问题:(1)原假设和备择假设是相互对立的,在一项假设检验中,只能有一个假设成立。
(2)原假设必须包含等号。
(3)建立假设时,往往先确立备择假设,然后在确立原假设。
(4)备择假设的形式不同,相应的检验方法也不同。
(5)假设检验的没保底是搜集充分证据来拒绝原假设。
3.在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为P值。
4.双侧检验(two-sided test)的备择假设中包含不等号(如m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。
单侧检验(one-sided test)的备择假设带有方向性,如m>m0或者m<m0,实际中只可能出现一种情况。
在相同的检验水准下,单侧检验的u界值小于双侧检验的u界值,故单侧检验比双侧检验更容易获得有统计学意义的结果。
两个均数或两个率的比较一般采用双侧检验,除非专业上有非常充分的理由。
5.原假设真时拒绝原假设所犯的错误称为第一类错误;原假设假时没有拒绝原假设所犯的错误称为第二类错误。
从总体上看,两类错位的概率存在一定关系,一个增大,则另一个减小。
当希望两类错误都减小时,唯一的办法是扩大样本容量。
四、计算题1.(1)零件长度的平均值为3.2795,由公式得Z=2.3719,拒绝域为所以拒绝原假设,有明显差异。
(2)略。
2.H0:u=0.618),96.1()96.1,(∞⋃--∞H 1:u 不等于0.618n=20平均值=0.6583S=0.09372由于分布呈正态分布,又为小样本,所以用t 检验 t=1.932t α/2=2.093t 值落在接受域内,故接受原假定。
统计学课后习题答案

第四章 统计描述某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率的计划完成程度. 解产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%.成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%.劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%.某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间. 解本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%.(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划. 我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几 解(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%.某乡三个村2000年小麦播种面积与亩产量资料如下表:要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量.解(1)(2))(75.72840013065015082012070011斤=⨯+⨯+⨯==∑∑==k i iki iiff xx(3)两种不同品种的玉米分别在五块地上试种,产量资料如下:已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些解田块总面积总产量平均亩产量=即: 由于是总体数据,所以计算总体均值: 计算表格乙品种下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:<甲σv 乙σv ,∴甲品种的亩产量更稳定一些.两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业乙企业试比较两个企业哪个企业的产品平均单位成本低,为什么解∴乙企业的产品平均单位成本更低.某粮食储备库收购稻米的价格、数量及收购额资料如下:要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格.解(1))(02.19000915011元≈==∑∑==k i iki iiff xx (2))(02.190009150400030002000360031502400m H 元≈=++++==∑∑xm x已知我国1995年—1999年末总人口及人口增长率资料:试计算该期间我国人口平均增长率. 解计算过程如下:按照平均增长率的公式可知:1-平均发展速度平均增长率=所以,1995年—1999年期间我国人口平均增长率=96.91-1204861253604≈‰某单位职工按月工资额分组资料如下: 根据资料回答问题并计算: (1)它是一个什么数列(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资.结果一样吗(4)分别计算工资的平均差和标准差. 解(1)是等距分组数列 (2)d f f f f f f L M m m m m m m ⨯-+--+≈+--)()(1110下限公式:即:59.54821000)30134()37134(371345000)()(1110≈⨯-+--+=⨯-+--+≈+--df f f f f f L M m m m m m m(注:用上限公式算出的结果与上述结果相同) (注:用上限公式算出的结果与上述结果相同) (3))(22.5343236107500306500134550037450025350011元≈⨯+⨯+⨯+⨯+⨯==∑∑==k i iki iiff xx (元)2.53434.24%7500 71%.12650078%.56550068%.15450059%.103500x 1111≈⨯+⨯+⨯+⨯+⨯=⋅==∑∑∑∑====ki ki iii k i iki iiff x ff x两者结果一样.(忽略小数点位数的保留对结果造成的影响)(4)平均差 92.65411≈-=∑∑==ki iki iidff x xM标准差 33.923)(12≈-=∑=Nf X XKi i iσ某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大解(1) 423001260011===∑∑==k i iki iiff xX 甲(2)05.1030030300)(12≈=-=∑=Nf X XKi i i甲甲σ >甲σv 乙σv ,∴乙商场销售额的代表性大.第五章 统计抽样袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X 的分布律及其分布函数并画出其图形.解先求X 的分布律:由题知,X 的可能取值为3,4,5,且2345{5}/6/10P X C C ===,∴X 的分布律为:⎪⎪⎭⎫ ⎝⎛10/610/310/1543, 由(){}i i ix xF x P X x p ≤=≤=∑得:设X 的密度函数为求: (1)常数c ;(2)X 的分布函数()F x ; (3){13}P X <≤. 解(1)24241()0(32)018f x dx dx c x dx dx c +∞+∞-∞-∞==+++=⎰⎰⎰⎰(2)当2x ≤时,()00xF x dt -∞==⎰;当24x <<时,22211()()0(32)(310)1818xxF x f t dt dt t dt x x -∞-∞==++=+-⎰⎰⎰当4x ≥时,24241()()0(32)0118xx F x f t dt dt t dt dt -∞-∞==+++=⎰⎰⎰⎰.故分布函数 (3)21{13}=(3)(1)(33310)04/918P X F F <≤-=+⨯--= 随机变量,X Y 相互独立,又(2)XP ,1(8,)4YB ,试求(2)E X Y -和(2)D X Y -.解(2)()2()2222E X Y E X E Y -=-=-⨯=-一本书排版后一校时出现错误处数X 服从正态分布(200,400)N , 求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190~210的概率. 解(200,400)X N(1)200230200(230)()2020X P X P --∴≤=≤ (2) 190200200210200(190210)()202020X P X P ---∴≤≤=≤≤某地区职工家庭的人均年收入平均为12000元,标准差为2000元.若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大 解对总体而言,2(12000,2000)XN∴样本均值22000(12000,)25xN某商场推销一种洗发水.据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大解总体比例 3.6=36%10π=万万(1)(,)p N nπππ-∴即2(0.36,0.048)pN第八章 相关分析和回归分析某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下.对以上访问量和营业额数据作相关分析.解相关分析(1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关. (2)计算相关系数计算访问量和营业额的简单线性相关系数为,大于,说明访问量和营业额之间存在较高的线性关系.某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:∑=-6546)(2x x i,∑=-5641)(2y y i375=x ,498=y ,6054))((=--∑y y x x i i(1)计算相关系数,并初步判断x 与y 之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果. 解最小二乘法的计算(一元)(1)计算相关系数,并初步判断x 与y 之间的关系;计算x 与y 相关系数为r=,说明两者的简单线性相关程度非常高,因此可以初步判断x 与y 呈现线性关系.(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:i i x y 10ˆˆˆββ+=,将以上结果代入最小二乘法的计算公式,得到=1ˆβ,=0ˆβ. 因此,产品销售数量为y 对广告费投入为x 的模型为i i x y92484.01852.151ˆ+= (3)说明所计算的回归系数的经济意义;=1ˆβ表示当广告费投入每增加1个单位,产品销售数量会增加个单位. (4)计算模型可决系数,并用其说明模型的拟合效果.由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数R 2=(r)2=2=.可决系数接近1,说明模型拟合的非常好.第九章 统计指数某市场上四种蔬菜的销售资料如下:(1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析.解 %p q p q L %pq pq L p q 11.1092282431227.1072282390220010001======∑∑∑∑)拉氏:(即 ()⎩⎨⎧+=⨯=元175********.10727.10712.115%%计算表明: 四种蔬菜的销量增长了 %,使销售额增加了 162元;四种蔬菜的价格上长了 %,使销售额增加了175元;两因素共同影响,使销售额增长了%, 销售额增加了337元. 结论:某厂三种产品的产量情况如下表:试分析出厂价格和产量的变动对总产值的影响. 解第一步:计算三个总产值:24200064000101100081350000=⨯+⨯+⨯=∑p q(万元);25080064800101020081500001=⨯+⨯+⨯=∑pq (万元);2637005480011102005.81500011=⨯+⨯+⨯=∑pq (万元);第二步:建立指标体系即⎪⎩⎪⎨⎧-+-=-⨯=)250800263700()242000250800(242000263700250800263700242000250800242000263700 第三步:分析结论.计算结果表明:由于出厂价上涨了%,使总产值增加了8800元;由于产量提高了%,使总产值增加了12900元;两因素共同作用,使总产值上升了%,增加了21700元.若给出题中四种蔬菜的资料如下:(1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系什么条件下才会有这种关系的呢 (4)解(1)(2) (3)算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数. 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数.某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较(1) 农副产品收购总额增长了百分之几农民共增加多少收入 (2)(3) 农副产品收购量增加了百分之几农民增加了多少收入 (4)(5) 由于农副产品收购价格提高了5%,农民又增加了多少收入 (6) 验证以上三者之间有何等关系解已知:农民交售农副产品增加收入亿元, 与去年相比增长幅度为12%; 农副产品收购数量增长 %, 农民增加收入 亿元; 农副产品收购价格上涨 %, 农民增加收入 亿元.显然,有:⎩⎨⎧+=⨯=(亿元)5.727.902.16300.10567.10600.112%%%可见,分析结论是协调一致的.某企业生产的三种产品的有关资料如下:(1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本;(3)计算单位成本总指数及由于单位成本变动而增减的总成本.解建立指数体系:结论:计算结果表明:由于产量总指数增加了37%(=%-1),而使总成本增加了37元,由于单位成本总指数下降了%(=%-1),使总成本减少了元.两个因素共同影响使总成本上升了%,增加了元.9.8某商场的销售资料如下:(1)根据上表资料计算相关指标填入上表(见绿色区域数字);(2)计算商品销售量总指数及由于销量变化而增减的销售额;(3)计算商品价格总指数及由于价格变动而增减的销售额.解建立指数体系:计算结果表明:由于商品销量总指数下降了%(=%),而使销售额减少了万元,由于商品价格总指数下降了%(=%),使销售额减少了万元.两个因素共同影响使销售总额下降了%(=%),减少了54万元.某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:(1) 该乡粮食平均亩产提高了百分之几由此增产粮食多少吨 (2)(3) 改善田间耕作管理使平均亩产提高多少增产粮食多少吨 (4)(5) 推广良种使平均亩产提高多少增产粮食多少吨 (6)解计算的相关数据(∑∑∑110100110100x f x f x f x f x f x f )见上表中绿色区域数字;从而有:建立指数体系: ⎪⎩⎪⎨⎧-+=-⨯=)()-(10011001假假假假x x x x x x x x x x x x 即 ()()⎪⎩⎪⎨⎧-+-=-⨯=000 657 48000 737 49000 478 46000 657 48000 478 46000 737 4948.40548.417 32.38748.40532.38748.417 即 ()⎩⎨⎧+=⨯=公斤 000 080 1000 179 2000 259 3 %22.102 %69.104%01.107分析结论: 计算结果表明(1)该乡粮食平均亩产提高了%(=%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了%,粮食增产1 080吨.第十章 时间序列分析某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗.试计算该公司10月上旬的平均在岗人数. 解)(25610256010518252516524750212232)7334262(1)334262(2)4262(2)12250(3250人==++++=++++⨯+---+⨯---+⨯-+⨯++⨯==∑∑iii fxf x 答:该公司10月上旬的平均在岗人数为256人. 某银行2009年部分月份的现金库存额资料如下:要求:(1)该时间序列属于哪一种时间序列.(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额. 解(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:)(4803144032520450480250014224321万元==+++=-+++=x x x x x ; 第二季度平均现金库存额:)(5673170032580600550252014227324万元==+++=-+++=x x x x x ; 上半年平均现金库存额:)(52363140625806005505204504802500172 (2)721万元==++++++=-+++=x x x x 某企业08年上半年的产量和单位成本资料如下:试计算该企业08年上半年的产品平均单位成本.解答:该企业08年上半年的产品平均单位成本为元. 某企业有关资料如下,计算该企业一季度人均月销售额.解 该企业一季度月平均销售额:)(33.12331201501003321万元=++=++=a a a a ;该企业一季度月平均职工人数:)(1133211611012021003224321人=+++=+++=b b b b b ; 该企业一季度人均月销售额:)/(091.111333.123人万元===ba c .某市2001~2005年的地区生产总值如下表:(1) 按平均发展速度估计2002~2004年的地区生产总值. (2) 按此5年的平均发展速度预测2008年和2010年的GDP.解(1)2002~2006年泉州市地区生产总值的平均发展速度为:%12.11399316264==v ; 按平均发展速度估计2002~2004年的地区生产总值分别为:11437%)12.113(9931270%)12.113(9931123%12.11399332=⨯=⨯=⨯(将计算结果填入上表绿色区域内);(2)按此5年的平均发展速度预测2008年和2010年的GDP 分别为:2008年地区GDP 预测值)(23541312.116263亿元=⨯=; 2010年地区GDP 预测值)(7.30111312.116265亿元=⨯=.我国某地区2001年~ 2006年税收总额如下:试计算:(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;(4)用水平法计算平均增长速度;(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入.解(1)~(3)相关计算结果填入下表(见绿色区域数字):(4) 用水平法计算平均发展速度和平均增长速度:平均发展速度%44.1161644.11404.22821603855====v ; 则平均增长速度%44.161%44.1161=-=-=v ;。
统计学习题答案 第9章 时间序列分析

第9章 时间序列分析——练习题●1. 某汽车制造厂2003年产量为30万辆。
(1)若规定2004—2006年年递增率不低于6%,其后年递增率不低于5%,2008年该厂汽车产量将达到多少?(2)若规定2013年汽车产量在2003年的基础上翻一番,而2004年的增长速度可望达到7.8%,问以后9年应以怎样的速度增长才能达到预定目标?(3)若规定2013年汽车产量在2003年的基础上翻一番,并要求每年保持7.4%的增长速度,问能提前多少时间达到预定目标?解:设i 年的环比发展水平为x i ,则由已知得:x 2003=30, (1)又知:320042005200620032004200516%x x x x x x ≥+(),2200720082006200715%x x x x ≥+(),求x 2008由上得32200820072008200320032007(16%)(15%)x x x x x x =≥++ 即为3220081.061.0530x ≥,从而2008年该厂汽车产量将达到 得 x 2008≥30× 31.06×21.05= 30×1.3131 = 39.393(万辆) 从而按假定计算,2008年该厂汽车产量将达到39.393万辆以上。
(2)规定201320032x x =,20042003x x =1+7.8%由上得=107.11%==可知,2004年以后9年应以7.11%的速度增长,才能达到2013年汽车产量在2003年的基础上翻一番的目标。
(3)设:按每年7.4%的增长速度n 年可翻一番, 则有 201320031.0742na a == 所以 1.074log 20.30103log 29.70939log1.0740.031004n ====(年)可知,按每年保持7.4%的增长速度,约9.71年汽车产量可达到在2003年基础上翻一番的预定目标。
原规定翻一番的时间从2003年到2013年为10年,故按每年保持7.4%的增长速度,能提前0.29年即3个月另14天达到翻一番的预定目标。
(整理)统计学原理第九章相关与回归习题答案

第九章相关与回归一.判断题部分题目1:负相关指的是因素标志与结果标志的数量变动方向是下降的。
()答案:×题目2:相关系数为+1时,说明两变量完全相关;相关系数为-1时,说明两个变量不相关。
()答案:√题目3:只有当相关系数接近+1时,才能说明两变量之间存在高度相关关系。
()答案:×题目4:若变量x的值增加时,变量y的值也增加,说明x与y之间存在正相关关系;若变量x的值减少时,y变量的值也减少,说明x与y之间存在负相关关系。
()答案:×题目5:回归系数和相关系数都可以用来判断现象之间相关的密切程度。
()答案:×题目6:根据建立的直线回归方程,不能判断出两个变量之间相关的密切程度。
()答案:√题目7:回归系数既可以用来判断两个变量相关的方向,也可以用来说明两个变量相关的密切程度。
()答案:×题目8:在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。
()答案:×题目9:产品产量随生产用固定资产价值的减少而减少,说明两个变量之间存在正相关关系。
()答案:√题目10:计算相关系数的两个变量,要求一个是随机变量,另一个是可控制的量。
()答案:×题目11:完全相关即是函数关系,其相关系数为±1。
()答案:√题目12:估计标准误是说明回归方程代表性大小的统计分析指标,指标数值越大,说明回归方程的代表性越高。
()答案×二.单项选择题部分题目1:当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A.相关关系B.函数关系C.回归关系D.随机关系答案:B题目2:现象之间的相互关系可以归纳为两种类型,即()。
A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案:A题目3:在相关分析中,要求相关的两变量()。
A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案:A题目4:测定变量之间相关密切程度的指标是()。
部编版高中数学必修二第九章统计带答案知识点总结全面整理

(名师选题)部编版高中数学必修二第九章统计带答案知识点总结全面整理单选题1、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x ,方差为s 2,则( ) A .x =5,s 2=2B .x =5,s 2=1.6 C .x =4.9,s 2=1.6D .x =5.1,s 2=22、2021年3月12日是全国第43个植树节,为提高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论不正确的是( )A .各班植树的棵数不是逐班增加的B .4班植树的棵数低于11个班的平均值C .各班植树棵数的中位数为6班对应的植树棵数D .1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳 3、下列抽样方法是简单随机抽样的是( )A .某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B .从10个手机中逐个不放回地随机抽取2个进行质量检验C .从空间直角坐标系中抽取10个点作为样本D .饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查 4、3个数1,3,5的方差是( ) A .23B .34C .2D .835、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.36、一组数据由10个数组成,将其中一个数由4改为1,另一个数由6改为9,其余数不变,得到新的10个数,则新的一组数的方差相比原先一组数的方差的增加值为()A.2B.3C.4D.57、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.198、为了进一步推动全市学习型党组织、学习型社会建设,某市组织开展“学习强国”知识测试,从全体测试人员中随机抽取了一部分人的测试成绩,得到频率分布直方图如图所示.假设同组中的每个数据都用该组区间的中点值代替,则估计这部分人的测试成绩的平均数和中位数分别是()A.85,87.5B.86.75,86.67C.86.75,85D.85,85多选题9、中国的华为公司是全球领先的ICT(信息与通信)基础设施和智能终端提供商,其致力于把数字世界带给每个人、每个家庭、每个组织,构建万物互联的智能世界.其中华为的5G智能手机是全世界很多年轻人非常喜欢的品牌.为了研究某城市甲、乙两个华为5G智能手机专卖店的销售状况,统计了2020年4月到9月甲、乙两店每月的营业额(单位:万元),得到如下的折线图,则下列说法正确的是()A.根据甲店的营业额折线图可知,该店月营业额的平均值在[31,32]内B.根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势C.根据甲、乙两店的营业额折线图可知乙店的月营业额极差比甲店小D.根据甲、乙两店的营业额折线图可知7、8、9月份的总营业额甲店比乙店少10、(多选)下列调查方式合适的是()A.为了了解炮弹的杀伤力,采用抽样调查的方式B.为了了解全国中学生的睡眠状况,采用普查的方式C.为了了解人们保护水资源的意识,采用抽样调查的方式D.检查一批待售袋装牛奶中的细菌是否超标,采用普查的方式11、某学校为了了解学生一周内在生活方面的支出情况,从全校学生中随机抽取n名学生进行调查,得到频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是()A.样本中数据的中位数小于41B.样本中支出不少于40元的人数为132C.全校学生支出的众数约为45元D.若该校有2000名学生,则约有600人的支出在[50,60]内填空题12、由6个实数组成的一组数据的方差为S12,将其中一个数5改为2,另一个数4改为7 ,其余的数不变,得到新的一组数据的方差为S22,则S22−S12=________.13、已知一组数据4,2a,3−a,5,6的平均数为4,则a的值是_____.部编版高中数学必修二第九章统计带答案(四十二)参考答案1、答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.2、答案:C分析:从图中直接观察可以判定AD正确,结合平均数的定义,将比4班多的里面取出部分补到比4班少的班中,可以使得4班的植树量最少,从而判定B正确;结合中位数的定义可以判定C错误.从图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的指数棵数为10,11个班中只有2、3、8班三个的植树棵数少于10,且大于5棵,其余7个班的植树棵数都超过10棵,且有6、7、9、10、11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2、3、8班中取,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数低于11个班的平均值,故B正确;比6班植树多的只有9、10、11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C是错误的;1到5班的植树棵数的极差在10以内,6到11班的植树棵数的极差超过了15,另外从图明显看出,1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳,故D正确;综上,不正确的只有C,故选:C.小提示:本题考查频数折线图的意义,涉及平均数,中位数,波动大小的判定,难点是平均数的估算,这里采用取长补短法进行估算,可以避免数字的计算.3、答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.4、答案:D分析:由题得3个数的平均数为3,再利用方差公式求解.由题得3个数的平均数为3,所以S2=13[(1−3)2+(3−3)2+(5−3)2]=83.故选:D5、答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的45,故中位数为400+0.5−0.30.25×100=480,③正确.故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题6、答案:B分析:先判断出平均数不变,然后分别表示出原先一组数的方差和新数据的方差,作差化简即可得到答案. 一个数由4改为1,另一个数由6改为9,故该组数据的平均数x不变,设没有改变的八个数分别为x1,x2,x3,⋯,x8,原先一组数的方差s12=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(4−x)2+(6−x)2],新数据的方差s22=110[(x1−x)2+(x2−x)2+(x3−x)2+⋯+(x8−x)2+(1−x)2+(9−x)2所以s22−s12=110[(1−x)2+(9−x)2−(4−x)2−(6−x)2]=110(1−2x+x2+81−18x+x2−16+8x−x2−36+12x−x2)=3,故选:B.小提示:关键点点睛:该题考查了平均数与方差的求解,正确解题的关键是熟练掌握方差的计算公式.7、答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.8、答案:B分析:根据平均数和中位数的定义求解即可由题意可知,平均数约为(0.03×77.5+0.05×82.5+0.06×87.5+0.04×92.5+0.02×97.5)×5=86.75;因为前2组的频率和为5×0.03+5×0.05=0.4<0.5,前3组的频率和为5×0.03+5×0.05+5×0.06=0.7>0.5,所以中位数在[85,90)内,设中位数为x,则5×0.03+5×0.05+(x−85)×0.06=0.5,解得x≈86.67. 所以估计这部分人的测试成绩的平均数和中位数分别是86.75,86.67.故选:B.9、答案:ABD解析:计算出甲店的月营业额的平均值即可判断A;由图可直接判断B;分别计算出甲、乙两店的月营业额极差和7、8、9月份的总营业额即可判断CD.对于A,根据甲店的营业额折线图可知,该店月营业额的平均值为14+21+26+30+52+476=1906≈31.7,故A正确;对于B,根据乙店的营业额折线图可知,该店月营业额总体呈上升趋势,故B正确;对于C,可得甲店的月营业额极差为52−14=38,乙店的月营业额极差为53−7=46,故C错误;对于D,甲店7、8、9月份的总营业额为30+52+47=129,乙店7、8、9月份的总营业额为33+44+53=130,故D正确.故选:ABD.10、答案:AC分析:根据普查和抽样方法的特点判断.了解炮弹杀伤力的过程中具有破坏性,所以采用抽样调查的方式;了解全国中学生的睡眠状况,工作量大,所以采用抽样调查的方式;了解人们保护水资源的意识,工作量大,所以采用抽样调查的方式;检查一批待售袋装牛奶中的细菌是否超标,具有毁损性,所以采用抽样调查的方式.故选:AC.11、答案:BCD分析:设样本数据的中位数为x,根据(0.01+0.024)×10+(x−40)×0.036=0.5求出x可判断A;计算出样本中支出在[50,60]内的频率可得样本中支出不少于40元的人数可判断B;由频率分布直方图得样本中学生支出的众数再估算全校学生支出的众数可判断C;若该校有2000名学生乘以0.3可判断D.在A中,设样本数据的中位数为x,则(0.01+0.024)×10+(x−40)×0.036=0.5,解得x≈44.44>41,故A错误;在B中,样本中支出在[50,60]内的频率为1−(0.01+0.024+0.036)×10=0.3,样本中支出不少于40元的+60=132,故B正确;人数为0.36×60=45(元),所以全校学生支出的众数约为在C中,由频率分布直方图得样本中学生支出的众数约为40+50245元,故C正确;在D中,若该校有2000名学生,则约有2000×0.3=600人的支出在[50,60]内,故D正确.故选:BCD.12、答案:2分析:根据平均数和方差的定义进行求解即可.因为将其中一个数5改为2,另一个数4改为7,其余的数不变,所以这6个实数组成的一组数据的平均数不变,设为x,设没有变化的4个数与平均数差的平方和为S,所以S22−S12=[S+(2−x)2+(7−x)2]−[S+(5−x)2+(4−x)2]=2,6所以答案是:213、答案:2分析:根据平均数的公式进行求解即可.∵数据4,2a,3−a,5,6的平均数为4∴4+2a+3−a+5+6=20,即a=2.所以答案是:2.小提示:本题主要考查平均数的计算和应用,比较基础.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章假设检验
一、填空题
1.第一类错误 2.Z统计量、标准正态分布 3.t统计量、t
4.P值 5.TDIST 6.≥30 7.正相关、负相关
二、单选题
1.A 2.D 3.A 4.C 5.C
三、简答题
1.小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为这个假设可能是不成立的。
小概率原理包含了两方面的意思:一是认为小概率事件在一次观察中是不会出现的,二是如果在一次观察中出现了小概率事件,那么合理的解释是原有事件具有小概率的说法不成立。
2.建立假设时应注意以下问题:
(1)原假设和备择假设是相互对立的,在一项假设检验中,只能有一个假设成立。
(2)原假设必须包含等号。
(3)建立假设时,往往先确立备择假设,然后在确立原假设。
(4)备择假设的形式不同,相应的检验方法也不同。
(5)假设检验的没保底是搜集充分证据来拒绝原假设。
3.在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为P值。
4.双侧检验(two-sided test)的备择假设中包含不等号(如m≠m0),实际上包括两种情况:m>m0或m<m0,无方向性。
单侧检验(one-sided test)的备择假设带有方向性,如m>m0或者m<m0,实际中只可能出现一种情况。
在相同的检验水准下,单侧检验的u界值小于双侧检验的u界值,故单侧检验比双侧检验更容易获得有统计学意义的结果。
两个均数或两个率的比较一般采用双侧检验,除非专业上有非常充分的理由。
5.原假设真时拒绝原假设所犯的错误称为第一类错误;原假设假时没有拒绝原假设所犯的错误称为第二类错误。
从总体上看,两类错位的概率存在一定关系,一个增大,则另一个减小。
当希望两类错误都减小时,唯一的办法是扩大样本容量。
四、计算题
1.(1)零件长度的平均值为3.2795,由公式得Z=2.3719,拒绝域为所以拒绝原假设,有明显差异。
(2)略。
2.H0:u=0.618
)
,
96
.1(
)
96
.1
,
(∞
⋃
-
-∞
H 1:u 不等于0.618
n=20
平均值=0.6583
S=0.09372
由于分布呈正态分布,又为小样本,所以用t 检验 t=1.932
t α/2=2.093
t 值落在接受域内,故接受原假定。
3.H 0:u=70
H 1:u 不等于70
n=36
平均值=66.5
通过计算机得到
P=0.162>0.05
故接受原假定,可认为平均成绩为70分
4.H 0:π大于或等于70
H 1:u 小于70
P=70/300=0.233
Z=1.4289
α=0.05,为左侧检验,-Z α=-1.65,拒绝域
,所以此检验没有落入拒绝域,接受原假定,即这些数据提供了充分证据。
5.H 0:σ2小于或等于25
H 1:σ2大于25
α=0.05,右侧检验
查表得16.92,拒绝域为 由题意,计算得10.89<16.92,
故接受原假定,机器工作正常。
)65.1,(--∞)92.16(∞+,。