《应用统计学 贾俊平》模拟试卷及答案ok
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计学》模拟试卷(一)
一、填空题(每空1分,共10分)
1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
2、收集的属于不同时间上的数据称为 数据。
3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置信区间_________________。
(Z0.005=2.58)
4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。
6、判定系数的取值范围是 。
7、设总体X ~
)
,(2
σμN ,x 为样本均值,S 为样本标准差。
当σ未知,且为小样本时,
则
n s
x μ
-服从自由度为n-1的___________________分布。
8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学
2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变
3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6
4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( )
5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高
6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变
7、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x >
e M >
o
M ②、x <
e M <
o
M ③、x >
o M >
e
M
8、方差分析中的原假设是关于所研究因素 ( ) ①、各水平总体方差是否相等 ②、各水平的理论均值是否相等 ③、同一水平内部数量差异是否相等 9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( ) ①、甲类较大 ②、乙类较大 ③、两类相同
10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本
指数为()
①、187.5% ②、7% ③、106.48%
11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
在乘法模型中,季节指数是以其平均数等于什么为条件而构成的?()
①、100% ②、400% ③、1200%
12、周末超市的营业额常常会大大高于平日数额,这种波动属于( )
①、长期趋势②、季节变动③、循环变动
13、下列情况下,适合用算术平均法计算平均数的数据是( )
①、不同顾客所需的皮鞋尺码②、一群人的身高③、一群人的学历
14、在试验中,两个事件有一个发生时,另一个就不发生,称这两个事件为( )
①、独立事件②、相容事件③、互斥事件
三、多项选择题(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。
共7题,每题2分。
)
1、推断统计学研究的主要问题是:( )
①、如何科学地由样本去推断总体②、如何科学地从总体中抽出样本
③、怎样控制样本对总体的随机性误差
2、数据质量的评价标准包含的方面有:()
①、精度②、及时性③、关联性
3、以下数据的收集方法属于询问调查的是:()
①、抽样调查②访问调查③电话调查
4、测定数值型数据的离散程度,依据研究目的及资料的不同,可用的指标有()
①、标准差②、离散系数③、几何平均数
5、估计量的评价标准包括:()
①、无偏性②、有效性③、一致性
6、如果两个变量之间有一定的相关性,则以下结论中正确的是( )
①、回归系数b的绝对值大于零②、判定系数2R大于零③、相关系数r的绝对值大于0.3
7、常用的加权综合指数包括:( )
①、拉氏指数②、物质生活质量指数③、帕氏指数
四、判断题:(判断命题的正误。
对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。
共10题,每题1分。
)
()1、茎叶图主要用于顺序型数据的显示。
()2、四分位数不受数据极端值的影响。
()3、在设计调查问卷的回答项目时,封闭性问题的答案往往是选择回答型,所以设计出的答案一定要穷尽和互斥。
()4、标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据在该组数据中的位置,只是使该组数据的平均数为0,标准差为1。
()5、假设检验中要使α和β同时减少的唯一方法是减少样本容量。
()6、对一个正态总体进行抽样调查,不论样本容量大小如何,样本均值统计量总是服从正态分布的。
()7、在参数估计中,样本比例p是非随机变量,而总体参数π通常是未知的随机变量。
()8、对两个总体方差相等性进行检验,在 =0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。
()9、相关系数r的符号反映相关关系的方向,其绝对值的大小反映相关的密切程度。
()10、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
五、简要回答下列问题(共2题,每题6分。
)
1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来
更大的欺骗性。
为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)
1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。
试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)
3
附:1080
5
1
2
)
(=∑-=i x x i
8
.3925
1
2
)
(=∑-=i y y i 58=x 2.144=y
17900
5
1
2
=∑=i x i
104361
5
1
2
=∑=i y i
42430
5
1
=∑=y
x i
i i
4
模拟试卷(二)
一、填空题(每小题1分,共10题)
1、我国人口普查的调查对象是 ,调查单位是 。
2、___ =频数÷组距,它能准确反映频数分布的实际状况。
3、分类数据、顺序数据和数值型数据都可以用 图来显示。
4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数是 。
5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率为 。
6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 。
7、对回归系数的显著性检验,通常采用的是 检验。
8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 。
9、若时间序列有18年的数据,采用3年移动平均,修匀后的时间序列中剩下的数据有 个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分)
1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学
2、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x >
e M >
o
M ②、x <
e M <
o
M ③、x >
o M >
e
M
3、比较两组工作成绩发现
σ甲>σ乙,x 甲>x 乙,由此可推断 ( )
①、乙组x 的代表性高于甲组 ②、甲组x 的代表性高于乙组
③、甲、乙组的工作均衡性相同
4、通常所说的指数是指 ( ) ①、个体指数 ②、动态相对数 ③、复杂现象总体综合变动的相对数
5、抽样误差大小 ( ) ①、不可事先计算,但能控制 ②、能够控制,但不能消灭 ③、能够控制和消灭
6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为 ( )
①、算术平均数 ②、中位数 ③、几何平均数 7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是 ( ) ①、简单随机抽样 ②、分层抽样 ③、等距抽样 8、在假设检验中,若
500
:,500:10 μμH H ≥,则此检验是 ( )
①、左侧检验 ②、右侧检验 ③、双侧检验 9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
在乘法模型中,季节指数是以其平均数等于什么为条件而构成的? ( ) ①、100% ②、400% ③、1200%
10、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ( ) ①、45 ②、40 ③、44
11、若直线回归方程中的回归系数1ˆ
β为负数,则 ( ) ①、r 为0 ②、r 为负数 ③、r 为正数
12、当分布数列中各变量值的频率相等时 ( ) ①、该数列众数等于中位数 ②、该数列众数等于算术均值 ③、该数列无众数
13、某次考试学生的考试成绩X 近似服从正态分布,()64,78~N X ,则可认为有大约68.26%的学生考试成绩分布的范围是 ( ) ①、(70,80) ②、(70,86) ③、(62,94)
14、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为 ( ) ①、50% ②、25% ③、20% 三、多项选择题:(在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内。
共7题,每题2分。
)
1、二手数据审核的主要内容是数据的 ( ) ①、适用性 ②、时效性 ③、准确性
2、下列命题正确的有 ( ) ①、样本容量与置信水平与正比 ②、样本容量与总体方差成反比 ③、样本容量与边际误差成反比
3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有 ( ) ①、算术平均数 ②、移动平均数 ③、调和平均数
4、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明 ( ) ①、商品零售价格平均上涨了17.5% ②、商品零售量平均上涨了17.5% ③、由于价格提高使零售额增长了17.5%
5、指出下列表述中哪些肯定是错误的 ( )
①、1.1,3.1100ˆ-=--=r x y ②、8.0,5.2304ˆ=--=r x y ③、6.0,5180ˆ=-=r x y
6、区间估计 ( ) ①、没有考虑抽样误差大小 ②、考虑了抽样误差大小 ③、能说明估计结论的可靠程度
7、回归分析中 ( ) ①、t 检验是双侧检验 ②、F 检验是检验回归方程的显著性 ③、在一元线性回归分析中,t 检验和F 检验是等价的 四、判断题:(判断命题的正误,对的,在题干前的括号内打√号;错的,在题干前的括号内打×号。
共10题,每题1分。
)
( )1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据。
( )2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料。
( )3、箱线图主要展示分组的数值型数据的分布。
( )4、异众比率主要用于衡量中位数对一组数据的代表程度。
( )5、统计数据的误差通常有抽样误差和非抽样误差两类。
( )6、若一组数据的均值是450,则所有的观测值都在450周围。
( )7、移动平均不仅能消除季节变动,还能消除不规则变动。
( )8、右侧检验中,如果P 值<α,则拒绝H0。
( )9、 r=0说明两个变量之间不存在相关关系。
( )10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验。
五、简要回答下列问题(共2题,每题6分。
)
结合你的专业学习,写出2个应用统计学知识解决实际问题的例子。
2、根据下面的方差分析表回答有关的问题:
⑴写出原假设及备择假设; ⑵写出SST ,SSA ,SSE ,
e
A T f f f ,,,MSA ,MSE ,n 以及P 值;
⑶判断因素A 是否显著。
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)
1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Z α/2=2)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08)
2
(1=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适?
3、某汽车生产商欲了解广告费用x 对销售量y 的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结
果:
③销售量与广告费用之间的相关系数是多少?④写出估计的回归方程并解释回归系数的实际意义。
⑤检验线性关系的显著性(a=0.05)
4
参考答案:统计学(1) 填空题
观测数据、实验数据 5、1080、1080 时间序列 6、[0,1] [4.742 ,5.258] 或 5±0.258 7、t 21% 8、16 单项选择题
多项选择题
判断题
1、举例略。
2、A=SSE / (n-2) = 220158.07 / 10 =22015.807 B=MSR / MSE =1422708.6 / 22015.807 =64.6221
21422708.60
86.60%1642866.67SSR R SST =
==
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
六、计算题 1题 解:
49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估
计。
已知:8.2,6.12==S x 0455.0=α
则有:
2
02275.02
==Z Z α 平均误差=4.078
.22==n S
极限误差
8.04.022
2
=⨯==∆n
S Z α
据公式 x x ±=±∆
代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)
2题 解:
2200113671479127214691519
(1)1421.2(kg/hm )
5F ++++=
=
200120002000
200019991999
22001200019991999
22(2)
(1)(1)(1)(1)0.515190.50.51469(10.5)1345.5781463.15(kg/hm )F Y F F Y F F Y Y F αααααααα=+-=+-=+-+-=⨯+⨯⨯+-⨯=∴
(3)平滑系数α=0.5时误差均方=9876.51<平滑系数α=0.3时误差均方=11515.01 ∴ 用平滑系数α=0.5预测更合适。
3题 解
计算估计的回归方程:
∑∑∑∑∑--=)(22
1x x n y x xy n β
==-⨯⨯-⨯290217900572129042430554003060=0.567
=
-=
∑∑n
x
n
y
ββ
1
0144.2 – 0.567×58=111.314
估计的回归方程为:y =111.314+0.567x
计算判定系数:
22
212
2
()0.56710800.884
392.8
()
x x R y y β-⨯=
==-∑∑
4题 解:
拉氏加权产量指数
=
1
000
00
1.1445.4 1.13530.0 1.08655.2
111.60%
45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑
② 帕氏单位成本总指数=
1
1
1
00
053.633.858.5
100.10%
1.1445.4 1.13530.0 1.08655.2
q p q q p q
++=
=⨯+⨯+⨯∑∑
参考答案:统计学(2) 填空题
具有我国国籍并在我国境内长住的人(指自然人)、每一个人 频数密度 6、7.1% 饼图、条形 7、t 286.5 8、P<α 44% 9、16 单项选择题
多项选择题
判断题
1、举例略。
2、 ⑴ 原假设 3
210:μμμ==H
备择假设
()
3,2,1:1=i H i μ不全等
⑵ SST=0.001245 SSA=0.001053 SSE=0.000192 14=T f 2=A f 12
=e f MSA=0.000527
MSE=0.000016 15=n
P 值=1.34E-05 ⑶
F 值=32.91667>
()
88529
.312,2=αF
拒绝原假设,因素A 显著。
六、计算题 1题 解:
1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。
(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%(Z α/2=2)
(2)如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查?(设边际误差E=0.08) (1) n = 50 p = 32/50 =64%
E=
()213.58%
64%13.58%50.42%,77.58%αZ =⨯
=±置信区间为即
()()()
2
2
2
2
2
120.80.2
(2)100
0.08p p n E αZ -⨯⨯==
=
应抽取100户进行调查。
2题 解:
1099
988
210988
2(1)
(1)(1)(1)(1)0.56600.50.5644(10.5)555.19629.80F Y F F Y F F Y Y F αααααααα=+-=+-=+-+-=⨯+⨯⨯+-⨯=∴
(2)平滑系数α=0.5时误差均方=3847.31<平滑系数 α=0.3时误差均方=5112.92
∴ 用平滑系数α=0.5预测更合适。
3题 解
(1)A=SSR / 1=1422708.6 B=SSE / (n-2)=220158.07/10=22015.807
C=MSR / MSE=1422708.6/22015.807=64.6221
(2)
21422708.60
86.60%1642866.67SSR R SST =
==
表明销售量的变差中有88.60%是由于广告费用的变动引起的。
(3)0.93R =
==
(4)估计的回归方程:
ˆ363.6891 1.420211y
x =+ 回归系数
1ˆ 1.420211β=表示广告费用每增加一个单位,销售量平均增加1.420211个单位。
(5)检验线性关系的显著性: H0 :
01=β
∵Significance F=2.17E-09<α=0.05
∴拒绝H0,, 线性关系显著。
4题 解:
01
001101
100828010001206596000
(1)121.21%
10080808001206079200
15082140100012065160100
(2)166.77%
100828010001206596000
q p
p q I p q
p q I p q
⨯+⨯+⨯=
===⨯+⨯+⨯⨯+⨯+⨯=
=
==⨯+⨯+⨯∑∑∑∑。