统计学习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计学》
一、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。
每小题1分,共14分)
1、对正态总体均值进行区间估计时,其它条件不变,置信水平α
-
1越小,则置信上限与置信下限的差()
①、越大②、越小③、不变
2、若某总体次数分布呈轻微左偏分布,则成立的有()
①、x>
M>o M②、x<e M<o M③、x>o M>e M
e
3、方差分析中的原假设是关于所研究因素( )
①、各水平总体方差是否相等②、各水平的理论均值是否相等
③、同一水平部数量差异是否相等
4、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为
230元和680元,则职工月平均收入的离散程度( )
①、甲类较大②、乙类较大③、两类相同
5、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为()
①、187.5% ②、7% ③、106.48%
6、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于( )
①、应用统计学②、描述统计学③、推断统计学
7、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()
①、扩大2倍②、减少到1/3 ③、不变
8、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31.
则最大艇速的均值
的无偏估计值为()
①、32.5 ②、33 ③、39.6
9、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002
年两年平均为 1.05,试确定1998~2002五年的年平均发展速度()
10、若两个变量的平均水平接近,平均差越大的变量,其( )
①、平均值的代表性越好②、离散程度越大③、稳定性越高
11、季节指数刻画了时间序列在一个年度各月或季的典型季节特征。
在乘法模型中,季节指数是以其平均数等于什么为条件而构成的?()
①、100% ②、400% ③、1200%
12、周末超市的营业额常常会大大高于平日数额,这种波动属于( )
①、长期趋势②、季节变动③、循环变动
13、下列情况下,适合用算术平均法计算平均数的数据是( )
①、不同顾客所需的皮鞋尺码②、一群人的身高③、一群人的
学历
14、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为( )
①、独立事件②、相容事件③、互斥事件
二、填空题(每空1分,共10分)
1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
2、收集的属于不同时间上的数据称为数据。
3、设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值x=5,则总
体均值的置信水平为99%的置信区间_________________。
(Z0.005=2.58)
4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。
6、判定系数的取值围是 。
7、设总体X ~
) ,(2σμN ,x 为样本均值,S 为样本标准差。
当σ未知,且为小样本时, 则n s x μ-服从自由度为n-1的___________________分布。
8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。
三、多项选择题(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号。
共7题,每题2分。
)
1、推断统计学研究的主要问题是:
( )
①、如何科学地由样本去推断总体 ②、如何科学地从总体中抽出样本
③、怎样控制样本对总体的随机性误差
2、数据质量的评价标准包含的方面有: ( )
①、精度 ②、及时性 ③、关联性
3、以下数据的收集方法属于询问调查的是: ( )
①、抽样调查 ② 访问调查 ③ 调查
4、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有 ( )
①、标准差 ②、离散系数 ③、几何平均数
5、估计量的评价标准包括:()
①、无偏性②、有效性③、一
致性
6、如果两个变量之间有一定的相关性,则以下结论中正确的是( )
①、回归系数b的绝对值大于零②、判定系数2R大于零③、相关系数r的绝对值大于0.3
7、常用的加权综合指数包括:( )
①、拉氏指数②、物质生活质量指数③、帕氏指数
四、判断题:(判断命题的正误。
对的,在题干前的括号打√号;错的,在题干前的括号打×号。
共10题,每题1分。
)
()1、茎叶图主要用于顺序型数据的显示。
()2、四分位数不受数据极端值的影响。
()3、在设计调查问卷的回答项目时,封闭性问题的答案往往是选择回答型,所以设计出的答案一定要穷尽和互斥。
()4、标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据在该组数据中的位置,只是使该组数据的平均数为0,标准差为1。
()5、假设检验中要使α和β同时减少的唯一方法是减少样本容量。
()6、对一个正态总体进行抽样调查,不论样本容量大小如何,样本均值统计量总是服从正态分布的。
()7、在参数估计中,样本比例p是非随机变量,而总体参数π通常是未知的随机变量。
( )8、对两个总体方差相等性进行检验,在α=0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。
( )9、相关系数r 的符号反映相关关系的方向,其绝对值的大小反映相关的密切程度。
( )10、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
五、简要回答下列问题(共2题,每题6分。
)
1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。
为了避免这种情况的发生,请根
据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)
1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。
试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)
3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:
要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 2。
附:1080512)(=∑-=i x x i 8.392512
)(=∑-=i y y i 58=x 2.144=y
17900512=∑=i x i 104361512=∑=i y i 4243051=∑=y x i i i
4
计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。
模拟试卷(二)
一、填空题(每小题1分,共10题)
1、我国人口普查的调查对象是,调查单位是。
2、___ =频数÷组距,它能准确反映频数分布的实际状况。
3、分类数据、顺序数据和数值型数据都可以用图来显示。
4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是。
5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP年度化增长率为。
6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了。
7、对回归系数的显著性检验,通常采用的是检验。
8、设置信水平=1-α,检验的P值拒绝原假设应该满足的条件是。
9、若时间序列有18年的数据,采用3年移动平均,修匀后的时间序列中剩下的数据
有个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。
每小题1分,共14分)
1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于( )
①、应用统计学②、描述统计学③、推断统计学
2、若某总体次数分布呈轻微左偏分布,则成立的有()
①、x>
e
M>o M②、x<e M<o M③、x>o M>e M
3、比较两组工作成绩发现σ
甲>σ
乙
,x
甲
>x
乙
,由此可推断
( )
①、乙组x的代表性高于甲组②、甲组x的代表性高于乙组
③、甲、乙组的工作均衡性相同
4、通常所说的指数是指
()
①、个体指数②、动态相对数③、复杂现象总体综合变动的
相对数
5、抽样误差大小()
①、不可事先计算,但能控制②、能够控制,但不能消灭③、能够
控制和消灭
6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的
平均收益率应采用的方法为
()
①、算术平均数 ②、中位数 ③、几何平均数
7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取
一件产品进行检验.这种抽样方式是
( )
①、简单随机抽样 ②、分层抽样 ③、等距抽样
8、在假设检验中,若500:,500:10πΛμμH H ≥,则此检验是 ( )
①、左侧检验 ②、右侧检验 ③、双侧检验
9、季节指数刻画了时间序列在一个年度各月或季的典型季节特征。
在乘法模型中,
季节指数是以其平均数等于什么为条件而构成的? ( )
①、100% ②、400% ③、1200%
10、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为
( )
①、45 ②、40 ③、44
11、若直线回归方程中的回归系数1
ˆβ为负数,则 ( )
①、r 为0 ②、r 为负数 ③、r 为正数
12、当分布数列中各变量值的频率相等时
( )
①、该数列众数等于中位数 ②、该数列众数等于算术均值 ③、该数列无众数
13、某次考试学生的考试成绩X 近似服从正态分布,()64,78~N X ,则可认为有大约
68.26%的学生考试成绩分布的围是
( )
①、(70,80) ②、(70,86) ③、(62,94)
14、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为( )
①、50% ②、25% ③、20%
三、多项选择题:(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号。
共7题,每题2分。
)
1、二手数据审核的主要容是数据的
()
①、适用性②、时效性③、准确性
2、下列命题正确的有()
①、样本容量与置信水平与正比②、样本容量与总体方差成反比
③、样本容量与边际误差成反比
3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有()
①、算术平均数②、移动平均数③、调和平均数
4、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明( )
①、商品零售价格平均上涨了17.5% ②、商品零售量平均上涨了17.5%
③、由于价格提高使零售额增长了17.5%
5、指出下列表述中哪些肯定是错误的( )
①、1.1,3.1100ˆ-=--=r x y
②、8.0,5.2304ˆ=--=r x y ③、6.0,5180ˆ=-=r x y
6
、区间估计
( ) ①、没有考虑抽样误差大小 ②、考虑了抽样误差大小 ③、能说明估计结论的可靠程度
7、回归分析中
( )
①、t 检验是双侧检验 ②、F 检验是检验回归方程的显著性
③、在一元线性回归分析中,t 检验和F 检验是等价的
四、判断题:(判断命题的正误,对的,在题干前的括号打√号;错的,在题干前的括号打×号。
共10题,每题1分。
)
( )1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据。
( )2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
( )3、箱线图主要展示分组的数值型数据的分布。
( )4、异众比率主要用于衡量中位数对一组数据的代表程度。
( )5、统计数据的误差通常有抽样误差和非抽样误差两类。
( )6、若一组数据的均值是450,则所有的观测值都在450周围。
( )7、移动平均不仅能消除季节变动,还能消除不规则变动。
( )8、右侧检验中,如果P 值<α,则拒绝H 0。
( )9、 r=0说明两个变量之间不存在相关关系。
( )10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。
五、简要回答下列问题(共2题,每题6分。
)
1、 结合你的专业学习,写出2个应用统计学知识解决实际问题的例子。
2、根据下面的方差分析表回答有关的问题:
方差分析
注:试验因素A 有三个水平。
⑴写出原假设及备择假设;
⑵写出SST ,SSA ,SSE ,e A T f f f ,,,MSA ,MSE ,n 以及P 值; ⑶判断因素A 是否显著。
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某小区居民共有居民500
户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Z α/2=2) (2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)
2、下面是某商店过去9周的营业额数据:
(1)采用指数平滑法(平滑系数α=0.5)预测第十周的营业额(F8=555.19);(2)若经过计算,平滑系数α=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适?
3、某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:
方差分析表
参数估计表
①求A、B、C的值;②销售量的变差中有多少是由于广告费用的变动引起的?
③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。
⑤检验线性关系的显著性(a=0.05)
4、某企业三种产品的出口价及出口量资料如下:
(1)计算拉氏出口量指数;(2)计算帕氏出口价指数
参考答案:统计学(1)
一、填空题
1、观测数据、实验数据 5、1080、1080
2、时间序列 6、[0,1]
3、[4.742 ,5.258] 或 5±0.258 7、t
4、21% 8、16
二、单项选择题
三、多项选择题
四、 判断题
五、 简要回答下列问
1、举例略。
2、A=SSE / (n-2) = 220158.07 / 10 =22015.807 B=MSR / MSE =1422708.6 / 22015.807 =64.6221
21422708.60
86.60%
1642866.67
SSR R SST =
== 表明销售量的变差中有88.60%是由于广告费用的变动引起的。
六、计算题 1题 解:
49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正
态分布对总体均值进行区间估计。
已知:8.2,6.12==S x 0455.0=α 则有: 202275
.02
==Z Z α 平均误差=4.07
8
.22==n S
极限误差8.04.022
2
=⨯==∆n
S Z α
据公式 x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)
2题 解: 2200113671479127214691519
(1)1421.2(kg/hm )5
F ++++=
=
200120002000200019991999
22001200019991999
22(2)(1)(1)(1)(1)0.515190.50.51469(10.5)1345.5781463.15(kg/hm )
F Y F F Y F F Y Y F αααααααα=+-=+-=+-+-=⨯+⨯⨯+-⨯=∴Q
(3)平滑系数α=0.5时误差均方=9876.51<平滑系数α=0.3时误差均方
=11515.01
∴ 用平滑系数α=0.5预测更合适。
3题 解
① 计算估计的回归方程:
∑∑∑∑∑--=
)(22
1x x n y x xy n β)
==-⨯⨯-⨯290
217900572129042430554003060
=0.567 =-=
∑∑n
x
n
y
ββ))
1
0144.2 – 0.567×58=111.314
估计的回归方程为:y )
=111.314+0.567x
② 计算判定系数:
22
212
2
()0.5671080
0.884392.8
()x x R y y β-⨯=
==-∑∑
4题 解:
① 拉氏加权产量指数
=1
000
00
1.1445.4 1.13530.0 1.08655.2
111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑
②
帕氏单位成本总指数
=
1
1
1
00
53.633.858.5
100.10%1.1445.4 1.13530.0 1.08655.2
q p q q p q
++=
=⨯+⨯+⨯∑∑
参考答案:统计学(2) 一、 填空题
1、 具有我国国籍并在我国境长住的人(指自然人)、每一个人
2、 频数密度 6、7.1%
3、 饼图、条形 7、t
4、 286.5 8、P<α
5、 44% 9、16
二、 单项选择题
三、 多项选择题
四、 判断题
五、 简要回答下列问题
1、举例略。
2、 ⑴ 原假设 3210:μμμ==H
备择假设 ()3,2,1:1=i H i μ不全等
⑵ SST=0.001245 SSA=0.001053 SSE=0.000192 14=T f
2=A f 12=e f MSA=0.000527 MSE=0.000016 15=n
P 值=1.34E-05 ⑶ F 值=32.91667>()88529.312,2=αF
拒绝原假设,因素A 显著。
六、计算题 1题 解:
(1) n = 50 p = 32/50 =64%
E=
()
2
213.58%
64%13.58%50.42%,77.58%αZ ==±置信区间为即
()()()
2
2
2
2
2
12
0.80.2
(2)1000.08p p n E
αZ -⨯⨯=
==
应抽取100户进行调查。
2题 解:
1099988
2
10988
2(1)(1)(1)(1)(1)0.56600.50.5644(10.5)555.19629.80
F Y F F Y F F Y Y F αααααααα=+-=+-=+-+-=⨯+⨯⨯+-⨯=∴Q
(2)平滑系数α=0.5时误差均方=3847.31<平滑系数 α=0.3时误差均方=5112.92
∴ 用平滑系数α=0.5预测更合适。
3题 解
(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807 C=MSR / MSE=1422708.6/22015.807=64.6221 (2)21422708.60
86.60%1642866.67
SSR R SST =
== 表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)0.93R === (4)估计的回归方程:
ˆ363.6891 1.420211y
x =+ 回归系数1
ˆ 1.420211β=表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)检验线性关系的显著性:
H 0 :01=β
∵Significance F=2.17E-09<α=0.05
∴拒绝H 0,, 线性关系显著。
4题 解:
01
001101
100828010001206596000
(1)121.21%
10080808001206079200
15082140100012065160100
(2)166.77%
100828010001206596000
q p
p q I p q p q I p q
⨯+⨯+⨯====⨯+⨯+⨯⨯+⨯+⨯=
=
==⨯+⨯+⨯∑∑∑∑
统计学试卷及答案(三)
一、判断题
1.统计学是一门方法论科学,其目的是探索数据的在数量规律性,以达到对客观事物的科学认识。
()
2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。
()
3.统计数据误差分为抽样误差和非抽样误差。
()
4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据()
5.用来描述样本特征的概括性数字度量称为参数。
()
6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位
数<众数。
()
7.通过散点图可以判断两个变量之间有无相关关系。
()
8.所有可能样本均值的数学期望等于总体均值。
()
9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规
则变动四种。
()
10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的
一种特殊相对数。
()
二、单项选择题
1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中样本是()。
A 100所中学
B 20个城市
C 全国的高中生
D 100所中学的高中生
2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。
这一数据属于()。
A 分类数据
B 顺序数据
C 截面数据
D 时间序列数据
3.某连续变量数列,其首组为50以下。
又知其邻近组的组中值为75,则首组的组中值为()
A 24
B 25
C 26
D 27
4.两组数据相比较()。
A 标准差大的离散程度也就大
B 标准差大的离散程度就小
C 离散系数大的离散程度也就大
D 离散系数大的离散程度就小
5.在下列指数中,属于质量指数的是()。
A 产量指数
B 单位产品成本指数
C 生产工时指数
D 销售量指数
6.定基增长速度与环比增长速度的关系为()。
A 定基增长速度等于相应的各个环比增长速度的算术和
B 定基增长速度等于相应的各个环比增长速度的连乘积
C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1
D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%)
7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了( )。
A 1.8%
B 2.5%
C 20%
D 18%
8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的( )。
A 2倍 B 3倍 C 4倍 D 5倍
9.如果变量x 和变量y 之间的相关系数为﹣1,这说明两个变量之间是( )。
A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是( )。
A 函数关系 B 相关关系 C 没有关系 D 正比例关系
11.在回归分析中,描述因变量y 如何依赖自变量x 和误差项ε的方程称为( )。
A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的( )的指标。
A 相关程度 B 离散程度 C 集中程度 D 离差程度
13.在正态总体方差已知时,在小样本条件下,总体均值在1-α 置信水平下的置信区间可以写为( )。
A n
z
x 2
2
σα
± B n
t
x σ
α2
± C n
z
x σ
α2
± D n
s z x 2
2
α
± 14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将( )。
A 变宽 B 变窄 C 保持不变 D 无法确定
15.在同等条件下,重复抽样误差和不重复抽样误差相比( )。
A 两者相等 B 前者大于后者 C 前者小于后者 D 无法判断 三、 多项选择题
1.按计量尺度不同,统计数据可分为三类即( ) A 时间序列数据 B 实验数据 C 分类数据 D 顺序数据 E 数值型数据
2.统计调查方案的容包括( )。
A 确定调查目的
B 确定调查对象和调查单位
C 设计调查项目和调查表
D 调查所采用的方式和方法
E 调查时间及调查组织和实施的具体细则 3.反映分类数据的图示方法包括( )。
A 条形图
B 直方图
C 圆饼图
D 累积频数分布图
E 茎叶图 4.具有相关关系的有( )。
A 工号和工作效率
B 受教育程度与收入水平
C 子女身高和父母身高
D 收入水平与消费量
E 人口与物价水平 5.下列属于时期数列的有( )。
A 某商店各月库存数
B 某商店各月的销售额
C 某企业历年产品产量
D 某企业某年各季度产值
E 某企业某年各月末人数 四、简答题
1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系(8分)
2.简述众数、中位数和均值的特点和应用场合。
(7分) 五、计算分析题
1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值95%的置信区间。
(已知365.2)18(025.0=-t )。
(12分)
2.已知某企业连续5年钢产量资料如下:
试根据上表资料填出表中数字。
(注意没有的数字划“—”,不准有空格)(10分) 3.某商场出售三种商品销售资料如下表所示:(14分)
试计算:(1)三种商品销售额总指数;(2)三种商品的价格综合指数;(3)三种商品的销售量综合指数;(4)分析销售量和价格变动对销售额影响的绝对数和相对数。
(注:计算结果保留2位小数)
4.某地区1991—1995年个人消费支出和收入资料如下:(14分)
要求:(1)计算个人收入与消费支出之间的相关系数,说明两个变量之间的关系强度;
(2)用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义。
(3)当个人收入为100万元时预测该地区的消费支出为多少?(注:计算结果保留4位小数)
答案:
统计学试卷(三)标准答案
一、判断题(在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分)1.√ 2.√ 3. √ 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √
二、单项选择题(从下列每小题的四个选项中,选出一个正确的,并填写在题后的括号,每题1分,共计15分)
1.D 2.C 3.B 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.B 12.C 13.C 14.B
15.B
三、多项选择题(选出两个及两个以上的正确答案,并填写在题后的括号,每题 2分,共计10分)
1.CDE
2. ABCDE
3.AC
4.BCD
5.BCD
四、简答题(共计15分)
1.举例说明总体、样本、参数、统计量这几个概念及他们之间的区别和联系(8分)
答:区别:总体是具有某种共同性质的多个个体组成的集合;样本是从总体中抽取的一部分个体构成的集合;参数是用来描述总体特征的概括性数字的度量;统计量是用来描述样本特征的概括性数字度量。
联系:样本是从总体中抽取的一部分个体组成的集合;参数是用来描述总体的特征的;统计量是用来描述样本的特征的。
例如:省的所有工业企业构成一个总体,从中抽取100个企业就构成一个样本,对这100个企业构成的样本计算的企业平均工资、企业平均产值等就是统计量,而省所有工业企业的平均工资、平均产值则是参数。
2.简述众数、中位数和均值的特点和应有场合?(7分)
答:众数是一组数据中出现次数最多的变量值,是一种位置代表值,不受极端值的影响,具有不唯一性,也可能没有众数,主要用于分类数据集中趋势的测度;中位数是一组数据排序后处在中点位置的变量值,也是位置代表值,不受极端值的影响,主要用于排序型数据集中趋势的测度,均值是根据数值型数据计算的,利用全部的数据信息,具有优良的数学性质,是实际中最广泛的集中趋势的测度值。
五、计算分析题(本题共50分)
1.解:已知n=8,总体服从正态分布,σ未知,样本抽样分布服从t 分布 365.2)18(025.0=-t
1080
800
===
∑n
x x
46.31
)
(2
=--=
∑n x x s
89.28
46
.3365.22
=⨯==n s t E α
置信下限=10-2.89=7.11 置信上限=10+2.89=12.89
总体均值μ的95%的置信区间为 [7.11,12.89] 2.已知某企业连续五年钢产量资料如下:
3.某企业三种产品的销售资料如下表所示: 解:(1)三种产品销售额增长情况: 相对数:商品销售额指数%84.16028500
45840
011==
=
∑∑q
p q p K pq
绝对数:元)(1734028500458400011=-=-∑∑q p q p
(2)价格综合指数%54.11739000
45840
1
011==
=
∑∑q
p q p 元)(684039000458401011=-=-∑∑q p q p (3)相销售量综合指数%84.13628500
39000
01==
=
∑∑p
q p
q 元)
(10500285003900000
1
=-=-∑∑p q
p q (4)综合分析
160.84%=136.84%*117.54%
17340(元)=10500(元)+3840(元)
从相对数上看:三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果。
从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果。
4.某地区1991-1995年个人消费支出和收入资料如下:
(1)
9872
.0)
345244615)(385301135(345385271125]
)(][)([2
2
2
2
2
2
=-⨯-⨯⨯-⨯=
---=
∑∑∑∑∑∑∑y y n x x n y
x xy n r 8.09872.0>=r ,所以两个变量之间为高度相关。
(2)设估计的值直线回归方程为 x y ∧
∧∧+=10ββ 1688.1)
(2
21=--=
∑∑∑∑∑∧
x x n y x xy n β
9976.205
3851688.15
3451
-=⨯-=-=∑∑∧∧
n
x n
y ββ ∴ x y 1688.19976.20+-=∧
回归系数1.1688说明当个人收入增加1个万元时,消费支出平均增加1.1688
万元。
(3)当100=x 万时,8824.951001688.19976.20y =⨯+-=∧。