统计学简答题参考答案,DOC
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学简答题参考答案
第一章绪论
1.什么是统计学?怎样理解统计学与统计数据的关系?
答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据
2
第二章统计数据的描述
1描述次数分配表的编制过程。
答:分二个步骤:
(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组
单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。
5.为什么要计算离散系数?
答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。
6.描述茎叶图和直方图,箱线图的画法,并说明它们的用途(P41、42)
答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,而且树叶上只保留该数值的最后一个数
注解、资料来源等,写在表的下方。7、填写数字资料不留空格,即在空格处划上斜线。统计表经审核后,制表人和填报单位应签名并盖章,以示负责。
第三章概率、概率分布与抽样分布
1.解释总体分布、样本分布和抽样分布的含义
答:总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知
的,是统计推断的对象。从总体中随机抽取容量为n 的样本()12,,
,n x x x ,它的分布称为样本分布。由样本的某个函数所形成的统计量()12,,
,n f x x x ,它的分
布称为抽样分布(如样本均值、样本方差的分布)
2.重复抽样与不重复抽样相比,抽样均值抽样分布的标准差有什么不同? 答:重复抽样和不重复抽样下,样本均值的标准差分别为:
差较大。
6.什么是必要的样本容量,其影响因素有哪些?
答:是指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一
影响因素:(1)研究对象的变化程度;(2)所要求或允许的误差大小(即精度要求);
(3)要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。
第四章参数估计
1.简述评价估计量好坏的标准
2
1
(1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。
2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为α。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为β。在其他条件不变时,α增大,β减小;β增大,α减小。
3.什么是显著性水平?它对于假设检验决策的意义是什么?
答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们
4
5
答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的。第七章相关与回归分析
1.相关分析与回归分析的区别与联系是什么?
答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主
要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法,不能揭示现象之间的本质关系。
2.什么是总体回归函数和样本回归函数?它们之间的区别是什么?
且可观察性也不同,它们的联系可有下式:
4.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?
答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。只有在一系列的经典假定下,最小二乘估计量才是BLUE。
5.为什么在多元回归中要对可决系数进行修正?
答:在样本容量一定下,随着模型中自变量个数的增加,可决系数2R会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数,用修正的可决系数来判断增加自变量的合适性。6.在多元线性回归中,对参数作了t检验后为什么还要作方差分析和F检验?
简称标准误。
区别:标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。
第八章时间序列分析与预测
1.从要素分解的角度,时间序列可分解成哪四个要素?
答:一个时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。趋势:是时间序列在长时期内呈现出来的持续向上或持续向下的变动。季节变动:是时间序列在一年内重复出现的周期性波动。它是诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素影响的结果。循环波动:是时间序列呈
(P277).
3.测定季节变动的“原始资料平均法”的基本步骤和原理是什么?
答:A基本步骤1计算各年同期的平均数,为了消除各年同季数据的不规则变动2,计算全部数据的总平均数,找出整个数列的水平趋势3计算季节指数B原理是不考虑长期趋势影响,根据原始数据直接计算季节指数测定季节变