统计学复习(简答题)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复习题
1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识?
答:(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。(2)这是由客观事物本身的特点和统计方法的特性共同决定的。a.从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。b.从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。
2.解释总体与样本、参数和统计量的含义。
总体是我们所要研究的所有基本单位的总和。
样本是总体的一部分单位。
描述总体或概率分布的数量值称为参数。
统计量是对样本数据特征的数量描述。
3.解释总体分布、样本分布和抽样分布的含义。
答:(1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。
4.简述描述统计学和推断统计学的概念及其联系。
描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。
推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。
联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。
5.简述中心极限定理。
从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。
在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。
在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。
假设检验中犯第一类错误的概率被称为显著性水平。
它们的联系是:置信水平越高,置信区间越宽,显著性水平越底。
7.样本统计量的分布和总体分布的关系是什么?
答:样本统计量包括样本均值、样本比率、样本方差。(1)样本均值总体分布的关系:a无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;b在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为
(2)样本比率与总体分布的关系:a样本比率p的数学期望等于总体比率π;b在重复条件下,;在不重复条件下,用修正系数加以修正,
(3)样本方差与总体分布的关系:对于来自正态总体的简单随机样本,则比值
的抽样分布服从自由度为(n-1)的x²分布。
8.抽样推断时为什么必须遵循随机原则抽取样本?
抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性的估计和判断,从而达到对总体现象的认识的一种方法。必须遵循随机原则是因为样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有一个已知的不为零的中选机会。
9.简述假设检验的一般步骤。
答:⑴陈述原假设和备择假设
⑵从所研究的总体中抽出一个随机样本
⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值
⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域
⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。
10.简述第Ⅰ类错误和第Ⅱ类错误的概念,它们发生的概率之间存在怎样的关系?
当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误。犯第Ⅰ类错误的概率记为α。当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误。犯第Ⅱ类错误的概率记为β。关系:和α增大时,β减小;当α减小时,β增大.
11.简述众数、中位数和均值的特点和应用场合。
答:(1)定义:众数是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值,是数据一般水平代表性的一种。中位数是数据排序后,位置在最中间的数值。均值就是算术平均数,是数据集中趋势的最主要测度值.
(2)特点:众数和中位数是从数据分布形状及位置角度来考虑的集中趋势代表值,而均值是经过对所有数据计算后得到的集中趋势值。
(3)应用场合:在对称次数分配和统计分布中,众数、中位数和均值都是同一数值。在有偏的分布中,众数则能更好地描述数据的集中趋势。
12. 为什么要计算离散系数?
当对不同总体或样本数据的离散程度进行比较时,由于平均值不同、计量单位不同,因此直接比较离散指标的绝对数形式,如极差、平均差、标准差等,必须将上述指标与平均值对比,消除平均值不同和计量单位不同的影响,即必须计算离散系数。
13.简述移动平均法的基本原理和特点。
答:⑴基本原理是消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势;
⑵移动平均的方式是选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的N项计算一系列序时平均数。
⑶移动平均法的特点:①对原序列有修匀或平滑的作用。时距项数N越大,对数列的修匀作用越强;
②移动平均项数N为偶数时,需做二项移动平均以移正其位置
③平均时距项数N与季节变动长度一致才能消除季节变动;时距项数N和周期一致才能消