人大网院统计学考试习题2013.10

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计学(第2版)》2013年10月课程考试考前练习题

一、单选题

1.下列说法不正确的是( B )。 B .只有均值对所有类型的数据都适用 2.指数按其所反映的指标性质不同,可分为( B )。 B .数量指标指数和质量指标指数 3.一组数据有9个观察值,则上四分位数的位置为( C )。 C .5.7

4.回归平方和指的是( C )。 C .∑-2)ˆ(Y Y

5.一项调查表明,北京市大学生每学期在网上购物的平均花费是500元,他们选择在网上购物的主要原因是"价格实惠",则"大学生在网上购物的原因"是( A )。 A .分类型变量

6.如果随机变量),(~2σμN X ,则b aX Y +=服从( D )。 D .),(22σμa b a N +

7.增长量是指( D )。 D .报告期水平与基期水平之差 8.方差分析的主要目的是判断( C )。 C .分类型自变量对数值型因变量是否显著

9.某校学生人数逐年增加,1999年比1998年增长7%,2002年比1999年增长18%,2008年比2002年增长35%,则1998-2008

年平均增长速度为( B )。 B .1%35.1%18.1%07.110-⨯⨯

10.下列说法正确的是( A )。 A .异众比率的作用是衡量众数对一组数据的代表程度

11.一个样本由1000名职工组成,职工的收入水平与受教育程度的相关系数为0.83,这说明( A )。 A .职工收入水平与受教育程度有高度的正相关关系

12.一项关于大学生体重的调查显示,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。据此数据可以推断( A )。 A .女生体重的差异较大

13.正态总体方差已知时,总体均值在α-1的置信水平的置信区间为( C )。 C .n

z x σ

α

2

±

14.一组数据的最大值与最小值之差称为(D )。 D .极差

15.随机变量),(~p n B Y ,则其变异系数为( A )。 A .np

npq

16.测度数据集中趋势的统计指标有( D )。 D .众数

17.某企业销售额增长了%5,销售价格下降了%3,则销售量( D )。 D .增长8.25% 18.计算发展速度的分母是( D )。 D .基期水平

19.95%的置信水平是指( B )。 B .在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95%

20.设离散型随机变量X 的概率分布为

)

3,2,1(,)( ===k b k X P k λ,则( C )。 C .)1(1+=b λ

21.总体参数的置信区间是由样本统计量的点估计值加减( C )得到的。 C .边际误差 22.通常情况下,价格指数如按拉式公式编制,其指数值会( C )。 C .偏大偏小不能确定

23.下列表述中肯定错误的是(D )。 D .6387.0,540ˆ=-=r x y

24.∑∑-0001p q p q 表示( B )。 B .由于产量变动引起的产值增减数 二、填空题

1. 当二项分布的20>n ,25.0

2. 抽样误差是由于抽样的随机性引起的样本结果与_____之间的误差。解答:总体真值

3. 平均发展速度和平均增长速度之间的数量关系式是:_____。解答:平均增长速度=平均发展速度-1

4. 描述数据的集中趋势的统计量主要有_____、_____、_____。解答:均值、中位数、众数

5. 假设检验中确定的显著性水平越高,原假设为真而被拒绝的概率就_____。解答:越高

6. 盒形图由一组数据的最大值、_____、上四分位数、_____、最小值五个特征数值组成。解答:中位数,下四分位数

7. 在单因素方差分析中,总离差平方和Q 、组间离差平方和2Q 与误差平方和1Q 之间的关系式为_____。解答:21Q Q Q +=

8. 在线性回归分析中,只涉及一个自变量的回归称作_____;涉及多个自变量的回归称作_____。 解答:一元线性回归;多元线性回归

9. 影响时间数列的因素大体上可以归结为_____、_____、_____和_____。 解答:长期趋势;季节波动(变动);循环波动(变动);不规则波动(变动) 10. 通常把α错误称为一类错误或_____;把β错误称为二类错误或_____。解答:弃真错误;取伪错误 11. 统计表一般由_____、行标题、_____和数据资料构成。解答:表头,列标题

12. 若变量x 与y 之间不存在线性相关关系,则=r _____;若变量x 与y 之间完全相关,则=r _____。解答:0;1± 13. 研究者想收集证据予以支持的假设通常称为_____。解答:备择假设 三、简答题

1. 假设检验依据的基本原理是什么?解答:假设检验依据的基本原理是小概率原理。所谓小概率原理是指,若一个事件发生的概率很小,在一次试验中就几乎是不可能发生的。根据这一原理,如果在试验中很小概率的事件发生了,我们就有理由怀疑原来的假设是否成立,从而拒绝原假设。

2. 如何理解假设检验的p 值?解答: 值是在零假设正确的条件下,检验统计量取样本统计量或沿备择假设方向趋于更极端值的概率。

如果p 值很小,说明这种样本观测结果出现的可能性很小,有理由拒绝原假设。p 值越小,拒绝原假设的理由就越充分。

值能够反映出某一样本观测结果与原假设不一致的精确程度。

利用p 值进行假设检验的准则是:将p 值与事先确定的检验显著性水平进行比较,

若p 值小于α,说明小概率事件发生,则拒绝原假设;若p 值大于α,说明小概率事件没有发生,则不能拒绝原假设。

3. 试回答描述数据的集中趋势的统计量有哪些?并对这些统计量的特点加以比较。 解答:常用的描述集中趋势的统计量主要有均值、中位数、众数。

(1)均值又分为算术平均数、调和平均数和几何平均数。未经分组整理的原始数据,其算术平均数的计算就是直接将一组数据的各个数值相加除以数值个数,称为简单算术平均数。根据分组整理的数据计算的算术平均数,就要以各组变量值出现的次数或频数为权数计算加权的算术平均数。

(2)调和平均数也称倒数平均数或调和均值。调和平均数和算术平均数在本质上是一致的,实际应用时,当计算算术平均数其分子资料未知时,就采用加权算术平均数计算均值,分母资料未知时,就采用加权调和平均数计算均值。

(3)几何平均数也称几何均值,通常用来计算平均比率和平均速度。

(4)中位数是将变量取值按大小顺序排列后,处于中间位置的那个变量值。中位数很好的代表了一组数据的中间位置,对极端值并不敏感。由于中位数只是数据中间位置的代表取值,因此中位数并没有利用数据的所有信息,其对原始数据信息的代表性不如均值。

(5)众数是指一组数据中出现次数最多的变量值。众数具有不唯一性。

均值、中位数、众数是描述数据集中趋势的主要统计量,它们按照不同的方法来确定,具有不同的特点和应用场合;但是,三者之间存在着一定的数量关系,这种数量关系取决于变量取值的频数分布状况。从分布的角度看,均值是一组数据全部数值的平均数,中位数是处于一组数据中间位置上的数值,众数始终是一组数据分布的最高峰值。对于具有单峰分布的大多数数据而言,均值、中位数、众数存在以下关系:

当变量取值的频数分布对称时,则均值与众数、中位数三者完全相等,即o e M M x ==; 当变量取值的频数分布呈现右偏时,三者之间的关系为o e M M x >>; 当变量取值的频数分布呈现左偏时,三者之间的关系为o e M M x <<。

从上面的关系我们可以看出,当频数分布呈对称分布或近似对称分布时,以均值、中位数或众数来描述数据的集中趋势都比较理想;当频数分布呈偏态时,极端值会对均值产生较大影响,而对众数、中位数没有影响,此时,用众数、中位数来描述集中趋势比较好。

均值不适用于定性数据。均值的优点在于它对变量的每一个取值都加以利用;缺点在于其统计量的稳健性较差,即容易受到极端值的干扰。对于偏态分布的数据,均值的代表性较差。因此,当数据分布的偏斜程度很大时,可以考虑选择中位数或众数作为集中趋势的代表。

相关文档
最新文档