统计学简答题参考答案讲解学习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学简答题参考答
案
统计学简答题参考答案
第一章绪论
1.什么是统计学?怎样理解统计学与统计数据的关系?
答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源。
答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差。
答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.解释描述统计和推断统计的概念?(P5)
答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
第二章统计数据的描述
1描述次数分配表的编制过程。
答:分二个步骤:
(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组
单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则
(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2. 一组数据的分布特征可以从哪几个方面进行测度?
答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
3.怎样理解均值在统计中的地位?
答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,
具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。
4. 简述众数、中位数和均值的特点和应用场合。
答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影
响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。
5.为什么要计算离散系数?
答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。
6.描述茎叶图和直方图,箱线图的画法,并说明它们的用途(P41、42)
答:茎叶图将数据分为“茎”和“叶”两部分,绘制茎叶图的关键是设计好树茎,通常是以该组数据的高位数值作为树茎,而且树叶上只保留该数值的最后一个数字。通过茎叶图可以看出数据的分布形状及数据的离散状况。直方图的绘制方法:在平面直角坐标系上,将分组标志作为横轴,并将各组次数作为纵轴,绘出的长方形图即直方图。通过直方图可以看出数据的分配特征。箱线图是由一个箱子和两条线段组成的。其绘制方法是:首先找出一组数据的五个特征值,即数据的最大值、最小值、中位数和两个四分位数;然后连接两个四分位数画出箱子;再将两个极值点与箱子相连接。通过箱线图可以看出数据分布的特征。
7.设计一张规范的统计表应该注意哪些问题?
答:1、统计表一般为横长方形,上下两端封闭且为粗线,左右两端开口。 2、统计表栏目多时要编号,一般主词部分按甲、乙、丙;宾词部分按(1)(2)等次序编号。 3、统计表总标题应简明扼要,符合表的内容。 4、主词与宾词位置可互换。各栏排列次序应以时间先后、数量大小、空间位置等自然顺序编排。 5、计量单位一般写在表的右上方或总栏标题下方。 6、表内资料需要说明解释部分,如:注解、资料来源等,写在表的下方。7、填写数字资料不留空格,即在
空格处划上斜线。统计表经审核后,制表人和填报单位应签名并盖章,以示负责。
第三章 概率、概率分布与抽样分布
1.解释总体分布、样本分布和抽样分布的含义
答:总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象。从总体中随机抽取容量为n 的样本()12,,
,n x x x ,它的分布称为样本分布。由样本的某个函数所形成的统计量()12,,
,n f x x x ,它的分布称为抽样分布(如样本均值、样本方差的分布)
2.重复抽样与不重复抽样相比,抽样均值抽样分布的标准差有什么不同? 答:重复抽样和不重复抽样下,样本均值的标准差分别为:
因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数
3.解释中心极限定理的含义
答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。
4.简述系统抽样组织方式组织实施的基本步骤(P98)
答:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n 个 单位形成一个样本。
5.整群抽样的优缺点是什么?(P98)
答:整群抽样的优点:可以简化抽样框的编制。样本单元比较集中,实施调查便利,且能节约费用。 整群抽样的缺点:当群内具有一定的相似性,而不同群之间的差别比较大时,相同样本量下整群抽样的抽样效率比简单随机抽样差 ,抽样误差较大。
6.什么是必要的样本容量,其影响因素有哪些?
答:是指一个样本的必要抽样单位数目。在组织抽样调查时,抽样误差的大小直接影响样本指标代表性的大小,而必要的样本单位数目是保证抽样误差不超过某一给定范围的重要因素之一
影响因素:(1) 研究对象的变化程度;(2) 所要求或允许的误差大小(即精度要求);(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。
第四章 参数估计
1.简述评价估计量好坏的标准
答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数θ
的估计量有1ˆθ和2ˆθ,如果()1ˆE θθ=,称1ˆθ是无偏估计量;如果1ˆθ和2
ˆθ是无偏估计量,且()1ˆD θ小于()
2ˆD θ,则1ˆθ比2ˆθ更有效;如果当样本容量n →∞,1ˆθθ→,则1
ˆθ是相合估计量。 2.简述样本容量与置信水平、总体方差、允许误差的关系
答:以估计总体均值时样本容量的确定公式为例:()22/22
z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。