统计学 课后思考题答案 期末复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 统计和统计数据
1、举例说明分类变量、顺序变量、数值变量。
分类变量,是说明事物类别的一个名称,例如性别、职业等。
顺序变量,是说明事物有序类别的一个名称,例如等级、学历等。
数值变量,是说明事物数字特征的一个名称,例如产品产量、商品销售量和年龄等都是数值变量。
第三章 用统计量描述数据
1、一组数据的分布特征可以从哪几个方面进行描述。
数据分布的特征可以从三个方面进行测度和描述:
一是:分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是:分布的离散程度,反映各数据远离其中心值的趋势;
三是:分布的形状,反映数据分布的偏态和峰态。
2、说明众数、中位数和平均数的特点和应用场合。
众数:是一组数据中出现次数最多的变量值。
主要用于测度分类数据的集中趋势,也适用于作为顺序数据以及数值型数据集中趋势的测度值。
一般情况下,只有在数据量较大的情况下,众数才有意义。
中位数:是一组数据排序后处于中间位置上的变量值,主要用于测度顺序数据当然也适用于作为数值型数据的集中趋势,但不适用于分类数据。
平均数:是一组数据相加后除以数据的个数得到的结果,主要适用于数值型数据,而不适用于分类和顺序数据。
3、标准分数有哪些用途?
有了平均数和标准差之后,可以计算一组数据中每个数值的标准分数,以测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点。
4、为什么要计算离散系数?
离散系数,是一组数据的标准差与其相应的平均数之比。
是对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,主要用于对不同组别数据离散程度的比较。
离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。
第五章 参数估计
1、说明区间估计的基本原理。
区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。
与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。
2、简述评价估计量的标准。
(1)无偏性它是指估计量抽样分布的期望值等于被估计的总体参数;(2)有效性它是指估计量的方差尽可能小;
(3)一致性它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数。
3、解释置信水平的含义。
置信水平,是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
4、的含义是什么?
5、简述样本量与置信水平、总体方差、估计误差的关系。
样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;
样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。
第六章 假设检验
1、样本量的大小与显著性有怎样的关系?
显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。
2、什么是P值?利用P值进行检验和利用统计量进
行检验有什么不同?
3、怎样理解“统计上是显著的”?
“显著的”,在这里的意义是指“非偶然的”,它表示这样的样本结果不是偶然得到。