统计题库答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题库1
一、选择题(每题2分,共20分)
1. B
2.C
3.D
4.D
5.A
6.D 7A 8.B 9.D 10.C
二、多项选择题(每题2分,共10分)
1. ABCE
2.ACE
3.ADE
4.AB
5.ADE
三、填空题(每空2分,共20分)
1. 分组标志、组矩
2. 4 元、0.01
3. 参数估计、假设检验
4. 弃真错误、纳伪错误
5. -1,1
四、简答题(每题5分,共20分)
1. 答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。
其缺点是具有不唯一性。(1分)
(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。(1分)
(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中
趋势测度值。其主要缺点是易受数据极端值的影响。(1分)
应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应
选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择
众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定
比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。
(2分)
2. 答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。
p fi检验:若p - -•,不能拒绝H o;若pv>,拒绝H o(3分)。
3. 答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平
高低的影响,也就是与变量的均值大小有关。(2分)。
因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散
程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3分)。
4、答:方差分析的步骤:首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水
平项离差平方和(SSA)。SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA
反映随机误差和系统误差的大小,三者之间的关系:SST= SSA + SSE。第二,计算SSE的
均方MSE , SSA的均方MSA。将MSA和MSE进行对比,即得到所需要的F检验统计量。第三,将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出对原假设H0的决策。
五、计算题(每题10分,共30分)
2•解:根据题意:提出假设:oiu(2 分)
检验统计量z = x—u。=4「4=2 (3 分)
由。=0.05,查表临界值Zj = Z0.o5 =1.645 由于Z = 2>Z =1.645,所以应拒绝H0而接受H1,即北京市家庭每天上网的时间确有显著(5分) 提 高。 3.解: 2 XY-' X、Y 100 3-10 20 2 (4分) 2na X2X)2100 1.5-102 打「Y/ n - X / n = Y - -应20=0 (4 分) 100 100 样本回归方程:Y=2X (2分) 题库2 一、选择题(每题2分,共20分) 2. C 2.D 3.D 4.A 5.D 6.B 7B 8.B 9.B 10.A 二、多项选择题(每题2分,共10分) 1. ABCD 2.ABD 3.ADE 4.AB 5.ADE 三、填空题(每空2分,共20分) 6. 统计设计、统计调查、统计整理、统计分析 7. 右偏、左偏 8. 无偏性、有效性、一致性 9. 线性相关 四、简答题(每题5分,共20分) 1.答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2分)。(1)全距: 计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2分)。(2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺 点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算(2分)。(3)标准差:不易受极端数值的影响,能综合反映全部 单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2分)。(4)离散系数:用来对比不同水平的同类 现象,特别是不同类现象总体平均数代表性的大小(2分)。 2•答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差 越大(4分);样本单位数的多少,样本单位数越大,抽样误差越小(2分);抽样方法:不 重复抽样的抽样误差比重复抽样的抽样误差小(2分);抽样组织方式:简单随机抽样的误 差最大(2分)。 3•答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2分)。 (1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要 依靠相关分析来表明现象数量变化的相关程度(4分)。 (2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之 间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从 一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体 形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估 算和预测提供了一个重要的方法(4分)。 4、答:基本步骤:1•提出原假设和备择假设(2分) 2•确定适当的检验统计量(2分) 3•规定显著性水平a,确定临界值(2分) 4•计算检验统计量的值(2分) 5•作出统计决策(2分) 五、计算题(每题10分,共30分) 1•解: T xf 3750 (1)乙班的平均分数:X乙3750=75 (5 分) f 50 乙班平均分数的标准差: 9 79 乙班平均分数的标准差系数:匚乙13.05% (3 分) 75 (2 )比较哪个班的平均分数更有代表性: 9 9 9 79 因为二甲=• =12.22% 小于二乙=•=1395% 81 75 所以甲班的平均分数更有代表性(2分)。 2•解:已知:=P(1 - P) =0.02 0.98,: p=4%。( 5 分) 1- : = 95.45%即卩Z:./2 =2。