2017年安徽大学432统计学[专业硕士]考研真题(回忆版)及详解【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2017年安徽大学432统计学[专业硕士]考研真题(回忆版)及详解
一、选择题
涵盖内容:
1.推断统计
2.集中趋势
3.概率的统计定义
4.方差分析(检验对象)
5.离散趋势
6.变量类型
7.统计量的分布(抽样分布)
8.平均数(中、众、平)
9.回归
方差分析那块考了几个小知识点
二、简答题
1.统计数据按计量尺度可分为哪几种类型?不同类型的数据各有什么特点?
答:(1)统计数据按计量尺度的分类
按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
②顺序数据是只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的。
③数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。
现实中所处理的大多数数据都是数值型数据。
(2)不同类型的数据的特点
分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
2.比较概率抽样与非概率抽样。
答:(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随
机原则,而是根据研究目的对数据的要求,采用某种方式主观地从总体中抽出部分单位对其
实施调查。
(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。
而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
3.一元线性回归模型中有哪些基本假定?
答:(1)因变量y 与自变量x 之间具有线性关系;
(2)在重复抽样中,自变量x 的取值是固定的,即假定x 是非随机的;
(3)误差项ε是一个期望值为0的随机变量,即E (ε)=0;
(4)对于所有的x 值,ε的方差σ2都相同。
这意味着对于一个特定的x 值,y 的方差也都等于σ2;
(5)误差项ε是一个服从正态分布的随机变量,且独立,即ε~N (0,σ2)。
4.简述χ2分布、t 分布、F 分布及正态分布之间的关系。
答:(1)随机变量X 1,X 2,…X n 相互独立,且都服从标准正态分布,则它们的平方和服从自由度为n 的χ2分布。
(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的χ2分布,且X 与Y 独立,
21n i
i X =∑
那么服从自由度为n 的t 分布。
(3)随机变量Y 和Z 分别服从自由度为m 和n 的
χ2分布并且相互独立,那么服从第一自由度为m
,第二自由度为n 的F 分布。
三、计算题 1.某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取的9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.5,6.6,6.7,6.8,7.1,7.3,7.4,7.8,7.8。
(1)画出第二种排队方式等待时间的茎叶图。
(2)比较两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
(圣才P52第八题) 解:(1)第二种排队方式等待时间的茎叶图如图1所示。
叶单位=0.1
图1 第二种排队方式等待时间的茎叶图
X Y Y m Z n
(2)第二种排队方式等待时间的均值为:
2
5.5
6.6
7.879
x x n ++
+===∑…
标准差为: 20.71s ====
第一种排队方式的均值x _1=7.2分钟,标准差s 1=1.97分钟,则离散系数v 1=s 1/x _
1=
1.97/7.2=0.274;
第二种排队方式的离散系数v 2=s 2/x _2=0.71/7=0.101。
由于v 1>v 2,因此第二种排队方式的离散程度较小。
(3)由于第二种排队方式的平均等待时间小于第一种排队方式,并且离散程度较小,所以会选择第二种排队方式。
2.甲、乙两粒种子,发芽率分别为0.8和0.7,在两粒种子中各随机抽取一粒,两粒都发芽的概率和至少有一粒发芽的概率。
解:设A 、B 分别表示取自甲、乙两批种子种的某粒种子发芽这一事件,即有P (A )=0.8,P (B )=0.7。
由于两粒种子是否发芽互不影响,则这两粒种子发芽的概率为P (AB )=P (A )×P
(B )=0.56
至少有一粒种子发芽的概率为1-(1-P (A ))×(1-P (B ))=1-0.2×0.3=0.94
3.造灯泡厂的质量标准时平均使用寿命为1200小时,标准差为300小时,抽取100个作为样本,x _=1245,能否说明该厂的灯泡质量显著地高于规定的标准?
(1)写出H 0和H 1。
(2)假设检验,并说明可能会犯的错误;
(3
)若要拒绝H 0,样本平均寿命至少要达到多少,此时会犯哪种错误。
解:(
1)H 0:μ≤1200,H 1:μ>1200
(2)检验问题属于大样本均值检验,因此构造检验统计量如下:
12451200 1.5300x μz --=== 取α=0.05,拒绝域为z >z α=z 0.05=1.645。
因为z =
1.5<1.645,故落入非拒绝域,则认为没有充分的理由认为该厂的灯泡质量显著地高于规定的标准。
此时容易犯取伪错误,即在原假设为假时,我们没有拒绝原假设。
(3)由上题的分析可知,拒绝域为z >z α=z 0.05=1.645,这要求:
1.645
αx z z =>= 则有:
03001.6451200 1.6451249.35σx μ>+⨯=+⨯= 这表明只有当样本均值达到1249.35时,我们才能有充分的理由认为该厂的显像管质量显著的高于规定的标准,这时可能犯弃真错误,即原假设为真,但是我们拒绝了原假设,可能犯错误的概率为0.05。