统计学简答题复习
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识?
答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。这是由客观事物本身的特点和统计方法的特性共同决定的。任何事物都是质与量的对立统一,一定事物的质总是表现为一定的量的特征;一定的量的特征代表事物的某种性质。从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。任何一个数据,也都是必然性与偶然性共同作用的结果,必然性反映了事物本质的特征和联系,决定了事物的内在本质是有规律可循的,偶然性反映了事物个别表现的差异性。统计就可以从大量事物的表现中探索到内在的、本质的的数量规律性。
2.解释总体与样本、参数和统计量的含义。
答:总体:所研究的全部个体(元素)的集合。
样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。统计量:根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。
3.解释总体分布、样本分布和抽样分布的含义。
(1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n 的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。
4.简述描述统计学和推断统计学的概念及其联系。
答:描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。
联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。
5.简述中心极限定理。
答:从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。
答:在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。
假设检验中犯第一类错误的概率被称为显著性水平。它们的联系是:置信水平越高,置信区间越宽,显著性水平越低。
7. 几何平均数的适用条件分别是什么?
答:几何平均数的使用条件:总指标等于各个变量连乘积的值,一般用来计算社会经济问题的平均发展速度。
8.抽样推断时为什么必须遵循随机原则抽取样本?
答、只有遵循随机原则从总体中抽取样本,才能排除主观因素等非随机因素对抽样调查的影响,从而使样本单位的分布接近总体单位的分布,样本对总体才具有较大的代表性。这样,根据样本的调查资料来估计和推断总体的数量特征才能较为科学和准确
9.简述假设检验的一般步骤。
答:⑴陈述原假设和备择假设
⑵从所研究的总体中抽出一个随机样本
⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值
⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域
⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可
以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。
10.相关系数(r)绝对值的大小是如何来反映两个变量之间线性关系显著性的?
答:相关系数r是根据从总体中抽取的随机样本的观测值x和y计算出来的,它是对总体相关系数p 的估计。当r=0,表明没有线性相关关系;当0<▏r▏<1时,存在一定的线性相关关系;若r>0,表明x和y为正相关,若r<0,表明y为负相关;当▏r▏=1时,表明x和y完全线性相关,若r=1,表明x 和y完全正相关;若r=-1,表明x和y完全负相关。
11.简述众数、中位数和均值的特点和应用场合。
答:众数是一种位置代表值,它的应用场合比较有限;中位数具有稳健性,数据值与中位数之差的绝对值之和最小;均值就是算术平均数,是数据集中趋势的最主要测度值。众数最容易计算,但不是永远存在,同时作为集中趋势代表值应用的场合很少;中位数很容易理解、很直观,它不受极端值的影响,这既是它有价值的方面,也是它数据信息利用不够充分的地方;均值是对所有数据平均后计算的一般水平代表值,数据信息提取得最充分。
12. 为什么要计算离散系数?
答:当对不同总体或样本数据的离散程度进行比较时,由于平均值不同、计量单位不同,因此直接比较离散指标的绝对数形式,如极差、平均差、标准差等,必须将上述指标与平均值对比,消除平均值不同和计量单位不同的影响,即必须计算离散系数。
13. 标准差是如何来反映一组数的离散程度的? 答:标准差是方差的正平方根,而方差是描述某个变量与平均数的偏离程度,标准差越大,离散程度越大;标准差越低,离散程度越低。
14、 方差分析的基本假设有那些?(P187)
答:1、每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来处正态分布总体的简单随机样本。 2、每个总体的方差σ²必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。 3、观测值是独立的。
15. 简述相关分析和回归分析的区别与联系。。
答:1、具有共同的研究对象:都是对变量间相关关系的分析。2、相关分析主要研究变量间相关的方向、形态和程度,而要确定变量间相关的具体数学形式则要依赖于回归分析。3、只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义。在定量分析时,先对变量进行相关分析,当变量之间确实存在相关关系时,再对变量进行回归分析。4、在相关关系中,变量之间是平等关系,不存在自变量和因变量。而在回归分析中必须明确划分自变量和因变量。
16. 一组数据的分布特征可以从那几个方面进行测定?
答:一组数据的分布特征可以从以下3个方面进行测度:(1)集中趋势的测度(众数、中位数、分位数、均值、几何平均数、切尾均值)。(2)离散程度的测度(极差、内距、方差和标准差、离散系数)。
(3)偏态与峰度的测度(偏态及其测度、峰度及其测度)
17.简述样本容量与置信水平、总体方差、允许误差的关系。
答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。 18.比较单侧检验和双侧检验的区别。
(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异;单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。(2) 建立假设的形式不同,双侧检验的假设是H0: u=u0, H1: u ≠u0;单侧检验的假设是H0: u≤u0, H1: u>u0或H0: u>u0, H1: u≤u0 。(3)否定的区域不同,双侧检验的否定区域是IZ I> Z a/2;单侧检验的否定区域是Z<-Za 或Z>Za
19.甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?
答:不一样。因为计算的对象不同,所使用的方法不同。 平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:
四年的平均增长率=()()()()
%100%61%81%71%914-+⨯+⨯+⨯+ 平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权算术平均得到的,设四年的产品量分别为A 、B 、C 、D ,则
四年的平均次品率=(9%A+7%B+8%C+6%D )/(A+B+C+D)
对于计算题,一定要把课本上的例题要弄明白。如主要集中指标和离散程度的计算、中心极限定理的应用、区间估计、假设检验、方差分析、相关系数的计算和检验、一元回归分析(包括模型的估计、回归系数的检验、随机误差项方差的估计、拟合优度的计算、一元回归模型的点预测和区间预测)等。