应用统计(专业学位)432统计学考研题库
2023年暨南大学432 统计学考研真题试卷

2023年招收攻读硕士学位研究生入学考试试题(A)********************************************************************************************招生专业与代码:应用统计(专业学位)025200考生注意:所有答案必须写在答题纸(卷)上,写在本试题上一律不给分。
一、统计学原理(共75分)(一)简答题(每题10分,共30分)1.何谓指标和指标体系?构建指标体系需要注意哪些事项或原则?2.什么是重点调查和典型调查?两者分别适用于什么场合?分别举例说明。
3.在估计回归模型的参数时,一般使用最小平方法。
请简述最小平方法的基本思想和主要过程。
(二)计算题(每题15分,共45分。
百分数后保留两位小数)1.某厂生产的袋装食品采用自动打包机包装,每袋的标准重量为100g。
某日该厂生产了500包,现采用不重复的简单随机抽样方式抽取40包进行检查,测试结果如下表所示。
每包重量(g)包数98以下 498-100 5100-102 21102-104 5104-106 5合计40根据上述资料:(1)在95%的置信度下,估计该批食品平均重量的区间范围;(10分)(2)如果规定食品重量低于100g属于不合格品,在95%的置信度下估计该批食品合格率的区间范围。
(5分)注:可能需要使用的值Z0.1/2=1.645, Z0.05/2=1.96,t0.05/2(39)=2.0227, t0.1/2(39)=1.6849, t0.05/2(40) =2.0211,二、概率论与数理统计部分(共4道大题,第1题15分,第2、3、4题各20分,合计75分)1. 设连续型随机变量X 的分布函数如下:F(x)=2/2,00,0xM Ne x x -⎧+≥⎪⎨<⎪⎩,(1)求常数M ,N ; (2)求(22)P X <<;(3)写出X 的密度函数f(x)。
应用统计(专业学位)432统计学考研题库

应用统计(专业学位) 432 统计学考研题库(一)一、简答题1.说明条形图和直方图的区别和联系。
【答案】(1)条形图与直方图的区别@形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
@由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
@条形图主要用千展示分类数据,而直方图则主要用于展示数值型数据。
(2)联系两者都是用矩形表示数据分布清况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。
2.回归分析中的误差序列有何基本假定?模型参数的最小二乘估计a和6具有哪些统计特性?若模型用千预测,影响预测精度的因素有哪些?【答案】(1)误差项8是一个服从正态分布的随机变量,且独立,即B~ N(O,a-2 �独立性意味着对千一个特定的叶直,它所对应的8与其他对直所对应的8不相关。
误差项8是一个期望值为0的随机变量,即E(e)=0。
对于所有的x值,8的方差(72都相同。
(2)模型参数的最小二乘估计a和6的统计特性:@线性,即估计量d和6为随机变量y;的线性函数;@无偏性,8和6分别是a和b的无偏估计;@有效性,a和b是所有线性无偏估计量中具有最小方差的估计量。
(3)影响预测精度的因素有:©预测的信度要求。
同样情况下,要求预测的把握度越高,贝应的预测区间就越宽,精度越低;@总体y分布的离散程度6气矿越大,相应的预测区间就越宽预测精度越低@样本观测点的多少n。
n越大,相应的预测区间就越窄,预测精度越高@样本观测点中,解释变量X分布的离散度。
X分布越离散,预测精度越高;@预测点打离样本分布中心t的距离预测点越远离样本分布中心预测区间越宽,精度越低越接近样本分布中心元,区间越窄,精度越高。
3.简述古典概率法和经验概率法如何定义事件发生的概率。
【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:P(A)= 事件A所包含的基本事件的个数m样本空侚所包含的基本事件的个数n应用统计(专业学位) 432 统计学考研题库(二)一、简答题1.若有线性回归模型y,=价+凡x,+ £{ (t;::1.2I (t;::匕···,n)其中E(s)=O;E(矿)=62xf气E(c尼.)=0 (t -:t: s),间:(1)该模型是否违背古典线性回归模型的假定,请简要说明。
应用统计硕士南开大学《432统计学》专硕考研真题

应用统计硕士南开大学《432统计学》专硕考研真题一、南开大学432统计学[专业硕士]考研真题二、统计学第1章统计数据的搜集一、单项选择题1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。
[河海大学2020研]A.简单随机抽样B.分层抽样C.自愿抽样D.方便抽样【答案】D@@@@【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。
例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。
2将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]A.等距抽样B.整群抽样C.类型抽样D.纯随机抽样【答案】C@@@@【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。
等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。
3某机构十分关心小学生每周看电视的时间。
该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是()。
[山东大学2018研]A.概率抽样调查B.观察调查C.实验调查D.公开发表的资料【答案】A@@@@【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。
因此,哪个单位被抽中与否完全是随机的。
题中该机构抽取的300名小学生家长是随机的,每个小学生的家长都有被抽到的概率,因此该机构搜集数据的方式是概率抽样。
4为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。
关于这种调查方式,以下说法正确的是()。
[中央财经大学2018研]A.使用的抽样方式是简单随机抽样B.使用的抽样方式是配额抽样C.使用的抽样方式是非概率抽样D.这种调查不是抽样调查【答案】C@@@@【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
上海财大《432统计学》应用统计硕士考研真题解析

上海财大《432统计学》应用统计硕士考研真题解析第1章导论一、单项选择题1在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D~~~~【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C~~~~【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A~~~~【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A~~~~【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
应用统计(专业学位)432统计学考研强化模拟题

应用统计(专业学位) 432 统计学考研强化模拟题(一)一、简答题l.回归分析中的误差序列有何基本假定?模型参数的最小二乘估计a和6具有哪些统计特性?若模型用千预测,影响预测精度的因素有哪些?【答案】(1)误差项8是一个服从正态分布的随机变量,且独立,即s~ N(O,a-2 1独立性意味着对千一个特定的叶直,它所对应的8与其他x值所对应的6不相关。
误差项6是一个期望值为0的随机变量即E(e)=0。
对千所有的籵直,8的方差矿都相同。
(2)模型参数的最小二乘估计a和6的统计特性:@线性,即估计量d和6为随机变量)ii的线性函数;@无偏性,a和b分别是a和b的无偏估计;@有效性,a和b是所有线性无偏估计量中具有最小方差的估计量。
(3)影响预测精度的因素有:©预测的信度要求。
同样清况下,要求预测的把握度越高,贝应的预测区间就越宽,精度越低@总体y分布的离散程度(J2。
矿越大,相应的预测区间就越宽预测精度越低@样本观测点的多少n。
n越大,相应的预测区间就越窄,预测精度越高@样本观测点中,解释变量x分布的离散度。
x分布越离散,预测精度越高;@预测点,t。
离样本分布中心X的距离预测寺越远离样本分布中心预测区间越宽,精度越低越接近样本分布中心氐区间越窄,精度越高。
2.简述平稳序列和非平稳序列的含义。
【答案】(1)平稳序列是基本上不存在趋势的序列。
这类序列中的观察值基本上在某个固定的水平上波动虽然在不同的时间段波动的程度不同但并不存在某种规律。
其波动可以看成是随机的。
(2)非平稳序列包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。
因此,非平稳序列可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。
3.单因素方差分析的实质是什么?井说明单因素方差分析的步骤。
【答案】单因素方差分析的实质是研究一个分类型自变量对一个数值型因变量的影响。
单因素方差分析的步骤为:(1)按要求检验的K个水平的均值是否相等,提出原假设和备择假设。
432-统计学--2023年广东财经大学硕士研究生入学考试试卷

广东财经大学硕士研究生入学考试试卷考试年度:2023年考试科目代码及名称:432-统计学(自命题)适用专业:025200应用统计[友情提醒:请在考点提供的专用答题纸上答题,答在本卷或草稿纸上无效!]允许使用计算器一、问答题(5题,每题10分,共50分)1.统计数据可分为哪几种类型不同类型的统计数据各有什么特点?2.加权算术平均数和加权调和平均数之间有什么关系?试举例说明它们的应用条件。
3.举例说明数量指标指数和质量指标指数的区分。
4.在假设检验中,什么是显著性水平和检验临界值?试举例说明。
5.什么是相关分析?什么是回归分析?它们之间有何联系和区别?二、计算题(5题,每题15分,共75分)1.某市集市贸易2017-2020年各季度猪肉销售量如下表:单位:公顷试分别用同期平均法和移动平均剔除法计算季节比例。
2.某地区2020年末人口数为2500万人,假定以后每年以9%。
的速度增长,又知该地区2020年GDP为1240亿元。
要求到2025年人均GDP达到10500元,试问该地区计算2025年的GDP应达到多少?GDP的年均增长速度应达到多少?3.某企业生产三种产品,有关资料如下表:要求:用综合指数和平均指数两种方法,计算该企业三种产品产量总指数,并比较两种方法的计算结果。
试用符号检验法,在α二°∙°5的条件下,检验“南北两段含铁量无显著差异”的假设。
5.从均值为从和外的两个服从正态分布的总体中,抽取两个独立的的随机样本,有关结果如下请问在显著性水平α二005情况下,从一外是否等于0?三、综合分析题(1题,每题25分,共25分)根据《国家第十四个五年规划和2035年远景目标纲要》,为推进及完善数据科学专业学位(大数据方向)研究生的建设工作,现开展对于非统计专业本科生就读大数据方向专业硕士学位的意愿调查。
调查经费(2万元),同时需于2023年6月31日前完成调查及调查报告的编写。
关于本次调查的要求如下:1、调查对象:非统计专业的本科学生2、调查内容:调查就读大数据方向应用统计专业学位研究生的意愿。
应用统计硕士(MAS)专业学位研究生入学统一考试科目《432统计学》题库-概率论【圣才出品】

3
U Ai I Ai
i 1
i 1
P
3
U
i 1
Ai
=1
3 PU
i1
Ai
1
P
3
I
i 1
Ai
1
3 i1
P
Ai
1 3 2 2 2 433 3
8.若随机事件 A 和 C 独立,B 和 C 独立,则 A+B 和 C( )。[中国科学技术大学 2013 研]
A.独立 B.不独立 C.不一定独立 【答案】C 【解析】若事件 A 和 C 独立,B 和 C 独立,则有 P(AC)=P(A)P(C),P(BC) =P(B)P(C),P(A∪B)P(C)=[P(A)+P(B)-P(AB)]P(C)=P(A)P(C) +P(B)P(C)-P(AB)P(C)=P(AC)+P(BC)-P(AB)P(C)。另一方面,P ((A∪B)C)=P(AC∪BC)=P(AC)+P(BC)-P(ABC),只有当事件 A∩B 与事 件 C 相互独立时,P(AB)P(C)=P(ABC),此时有 P(A∪B)P(C)=P((A∪B) C),此时 A+B 与 C 独立;其他情形 A+B 与 C 不独立。
则 P(Xi=1)=1/6
Y
600 i1
Xi
~
B
600,16
E(Y)=600×(1/6)=100。
3.事件A、B为对立事件,则下面不成立的是(
__
A.P(AB)=0
)。[浙江工商大学2017研]
B.P(B|A)=∅
_
C.P(A|B)=1
D.P(A+B)=1
【答案】B
【解析】若 A,B 对立,则 A∩B=∅,A∪B=Ω,因此
2.掷一颗均匀的骰子600次,那么出现点数大于5次数的均值为( )。[浙江工商 大学2017研]
应用统计硕士(MAS)专业学位研究生入学统一考试科目《432统计学》题库-统计学(第1~3章)【圣才

2.统计分组中的组内同质性是指该组内个体( )。[浙江工商大学 2016 研] A.在某一标志上具有相同性质 B.在所有标志上具有相同性质 C.在一些标志上具有相同性质 D.在某一标志或某些标志上具有相同性质 【答案】D
1 / 120
圣才电子书 十万种考研考证电子书、题库视频学习平台
A.这是分层抽样 B.这是方便抽样 C.这是简单随机抽样 D.这是配额抽样 【答案】B 【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样单位的非概率 抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产 品的柜台前对路过的顾客进行调查等等。
4.我国最近完成的经济普查属于( )。[中央财经大学 2014 研] A.抽样调查 B.经常性调查 C.统计报表制度 D.全面调查 【答案】D 【解析】经济普查是国家为掌握国民经济第二产业、第三产业的发展规模、结构、效益
5 / 120
圣才电子书 十万种考研考证电子书、题库视频学习平台
中的所有单位(抽取单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始 单位,然后按照事先规定好的规则确定其它样本单位。C 项,类型抽样也称分层抽样,是将 抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。 D 项,整群抽样是指将总体中若干个单位合并为组(称为群),抽样时直接抽取群,然后对 中选群中的所有单位全部实施调查。由以上定义知,题中的抽样方法为重复随机抽样。
【解析】统计分组应该遵循“组内同质性,组间差异性”的原则。其中,组内同质性是 指组内各个体在某一个或者某些标志上具有相同的性质;组间差异性是指每个组内的个体跟 别的小组在某个或者某些标志上存在差异。
3.为了解大学生的消费状况,调查员在食堂门口任意拦截 100 名学生进行了问卷调查。 关于这种调查方式,以下说法正确的是( )。[中央财经大学 2015 研]
应用统计硕士(MAS)专业学位研究生入学统一考试科目《432统计学》辅导资料-统计学(第1~5章)【

圣才电子书
A.随机误差
十万种考研考证电子书、题库视频学习平台
B.抽】B
【解析】抽样框误差是指由于抽样框的不完善性造成的统计推断错误。在概率抽样中需
要根据抽样框抽取样本。一个好的抽样框应该是:抽样框中的单位和研究总体中的单位有一
10.下面哪种调查方式的样本不是随机选取的?( )[山东大学 2016 研] A.分层抽样
5 / 85
圣才电子书
B.系统抽样
十万种考研考证电子书、题库视频学习平台
C.整群抽样
D.判断抽样
在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。等距抽样也称
为系统抽样;纯随机抽样也称为简单随机抽样。
3.某机构十分关心小学生每周看电视的时间。该机构随机抽取 300 名小学生家长对他 们的孩子每周看电视的时间进行了估计。结果表明,这些小学生每周看电视的平均时间为 15 小时,标准差为 5 小时。该机构搜集数据的方式是( )。[山东大学 2018 研]
圣才电子书
十万种考研考证电子书、题库视频学习平台
第一部分 统计学
第 1 章 统计数据的搜集
一、单项选择题 1.要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于( )。 [河海大学 2020 研] A.简单随机抽样 B.分层抽样 C.自愿抽样 D.方便抽样 【答案】D 【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概 率抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售 产品的柜台前对路过的顾客进行调查,等等。
一对应的关系。现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户,
应用统计硕士(MAS)专业学位研究生入学统一考试科目《432统计学》题库-统计学(第4~5章)【圣才

D.N(μ,σ2/n)
【答案】A
【解析】设样本标准差为 s,则在正态总体下,有
n
Y i1
Xi X 2
n 1 s2
2
~
2 n 1
5.设 X~N(0,σ2),则服从 t(n-1)的随机变量为( )。[山东大学 2016 研]
A. n X S
B. n 1X S
C. n X S2
D. n 1X S2
【答案】A
【解析】设 X1,X2,…,Xn 是来自正态分布 N(0,σ2)的一个样本,则有
X
1 n
n i 1
Xi,S2
1 n 1
n i 1
Xi X
2
因此
n X 0
nX ~ t(n 1)
S
S
6.在抽样推断中,样本统计量是( )。[中央财经大学 2015 研]
3 / 91
圣才电子书
3.设总体X~N(μ,σ2),其中μ已知,σ2未知,X1,X2,X3是从总体中抽取的样本, 下列各项不是统计量的是( )。[浙江工商大学2017研]
A.X1+X2-2X3 B.X2+3μ C.max(X1,X2,X3) D.(X1+X2)/σ 【答案】D 【解析】统计量是不含未知参数的样本的函数。ABC 三项均不含参数,而 D 项中,σ 为未知参数。
分布为( )。[中国科学技术大学 2013 研] A.自由度为 1,1 的 F 分布 B.自由度 1,2 的 F 分布 C.自由度为 2,1 的 F 分布 D.自由度 2,2 的 F 分布 【答案】A
2
A.均值为μ,方差为
n
μ
2
B.均值为 ,方差为
n
n
μ
C.均值为 ,方差为
专业硕士应用统计硕士《432统计学》考研真题解析

中央财经大学应用统计硕士《432统计学》[专业硕士]考研真题及详解中央财经大学432统计学[专业硕士]考研真题及详解一、单项选择题(本题包括1~20题共20个小题,每小题1.5分,共30分)1.网站把调查问卷刊登在网页上,然后由感兴趣的网民自行填写。
对于此类调查,以下说法正确的是()。
A.这是简单随机抽样B.这是方便抽样C.这是雪球抽样D.这是全面调查答案:B解析:B项,方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。
A项,简单随机抽样是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式;C项,滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象,往往用于对稀少群体的调查;D项,全面调查是指国家统计系统和各个业务部门为了定期取得系统的、全面的基本统计资料,按一定的要求和表式自上而下统一布置,自下而上提供资料的一种统计调查方法。
2.随机变量X的方差为2,随机变量Y=2X,那么Y的方差是()。
A.1B.2C.4D.8答案:D3.某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是()。
A.面访B.深度访谈C.计算机辅助电话调查D.邮寄调查答案:C解析:C项,计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。
A项,面访即调查者直接走访被调查者,当面听取被调查者的意见,可以比较全面、深入,能获得大量真实的研究资料,但这种方法容易使研究结论带有主观成分;B项,深度访谈是一种无结构的、直接的、一对一的访问形式。
最常应用于探测性调查,但是这种访谈方法所得的资料难以进行统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制;D项,邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者,由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计(专业学位) 432 统计学考研题库(一)一、简答题1.说明条形图和直方图的区别和联系。
【答案】(1)条形图与直方图的区别@形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
@由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
@条形图主要用千展示分类数据,而直方图则主要用于展示数值型数据。
(2)联系两者都是用矩形表示数据分布清况;当矩形的宽度相等时,都是用矩形的高度来表示数据的分布情况。
2.回归分析中的误差序列有何基本假定?模型参数的最小二乘估计a和6具有哪些统计特性?若模型用千预测,影响预测精度的因素有哪些?【答案】(1)误差项8是一个服从正态分布的随机变量,且独立,即B~ N(O,a-2 �独立性意味着对千一个特定的叶直,它所对应的8与其他对直所对应的8不相关。
误差项8是一个期望值为0的随机变量,即E(e)=0。
对于所有的x值,8的方差(72都相同。
(2)模型参数的最小二乘估计a和6的统计特性:@线性,即估计量d和6为随机变量y;的线性函数;@无偏性,8和6分别是a和b的无偏估计;@有效性,a和b是所有线性无偏估计量中具有最小方差的估计量。
(3)影响预测精度的因素有:©预测的信度要求。
同样情况下,要求预测的把握度越高,贝应的预测区间就越宽,精度越低;@总体y分布的离散程度6气矿越大,相应的预测区间就越宽预测精度越低@样本观测点的多少n。
n越大,相应的预测区间就越窄,预测精度越高@样本观测点中,解释变量X分布的离散度。
X分布越离散,预测精度越高;@预测点打离样本分布中心t的距离预测点越远离样本分布中心预测区间越宽,精度越低越接近样本分布中心元,区间越窄,精度越高。
3.简述古典概率法和经验概率法如何定义事件发生的概率。
【答案】概率的古典定义是,如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值,记为:P(A)= 事件A所包含的基本事件的个数m样本空侚所包含的基本事件的个数n应用统计(专业学位) 432 统计学考研题库(二)一、简答题1.若有线性回归模型y,=价+凡x,+ £{ (t;::1.2I (t;::匕···,n)其中E(s)=O;E(矿)=62xf气E(c尼.)=0 (t -:t: s),间:(1)该模型是否违背古典线性回归模型的假定,请简要说明。
(2)如果对该模型进行估计,你会采用什么方法?请说明理由。
【答案】(1)该模型违背了古典线性回归模型的假定。
古典线性回归模型要求误差项具有等?2方差性,即对千不同的自变量X具有相同的方差。
而由题意可知,误差项$,的方差为6日x,与自变量斗有关。
(2)如果对该模型进行估计,会采用加权最小二乘法。
加权最小二乘法是在平方和中加入权1数亏,以调整各项在平方和中的作用。
即寻找参数份fJ2的估计值队,凡使得离差平方和x,Q(凡P2)=I "3仅-护肛)2达到最小。
这样,就消除了异方差性的影响。
闰斗2.简述时间序列的组成要素。
【答案】时间序列的组成要素分为4种,即趋势或长期趋势、季节性或季节变动、周期性或循环波动、随机性或不规则波动。
(1趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势;(2)季节性也称季节变动它是时间序列在一年内重复出现的周期性波动;(3)周期性也称循环波动它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动;(4)随机性也称不规则波动是指偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
3.简述相关系数和函数关系的差别。
【答案】变量之间的关系可分为两种类型:函数关系和相关关系。
(1)函数关系设有两个变量吓印变量Y随变量X一起变化,并完全依赖千入,当变量X取某个数值时'y依确定的关系取相应的值,则称Y是X的函数。
由此可见函数关系是—种—一对应的确定性关系。
(2)相关关系相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。
在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值虽与它(或它们)有关,但却不能完全确定。
这是一种非确定的关系。
应用统计(专业学位) 432 统计学考研题库(三)一、简答题1.概述相关分析与回归分析的联系与区别。
【答案】(1)相关分析和回归分析的联系它们具有共同的研究对象,都是对变量间相关关系的分析,二者可以相互补充。
相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。
同时,在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。
(2)相关分析和回归分析的区别©从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值。
@从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分自变量和因变量相关的变量不一定具有因果关系,均视为随机变量;回归分析是在变量因果关系分析的基础上研究其中的自变量的变动对因变量的具体影响,必须明确划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。
2.简述概率抽祥与非概率抽样的区别。
【答案】(1)概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
非概率抽样是相对千概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
(2)概率抽样与非概率抽样的区别:概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所要的样本量。
而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
3.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?【答案】方差分析不仅可以提高检验的效率,同时由千它是将所有的样本信息结合在一起,也增加了分析的可靠性。
应用统计(专业学位) 432 统计学考研题库(四)一、简答题1.简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。
对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:(1)确定并分离季节成分。
计算季节指数,以确定时间序列中的季节成分。
然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;(2)建立预测模型并进行预测。
对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;(3)计算出最后的预测值。
用预测值乘以相应的季节指数,得到最终的预测值。
2.什么叫变异、变噩和变噩值,试举例说明。
【答案】标志在同一总体不同总体单位之间的差别称为变异。
例如:人的性别标志表现为男、女;年龄标志表现为20岁、30岁等。
变异标志又称为变量,是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。
变量的具体取值称为变量值。
具体包括:(1)分类变量,如性别”就是分类变量,其变量值为男”或女”;(2)顺序变量,如产品等级”就是顺序变量,其变量值可以为"一等品”、“二等品'、“三等品'、"次品”等;(3)数值型变量,如年龄”是连续数值型变量变量值为非负数;“企业数是离散数值型变星,变量值为1,2,……3.在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否已知,以及祥本量的大小来确定。
说明在不同情况下分别需要使用何种检验统计量。
【答案】在对单个总体均值进行假设检验时,采用何种检验统计量取决于所抽取的样本是大样本但30)!还是小样本(n<30),此外还需要区分总体是否服从正态分布、总体方差是否已知等几种情况。
(1)在大样本情况下,样本均值的抽样分布近似服从正态分布。
设总体均值为µ(),总体方差为矿。
当总体方差62已知时,总体均值的检验统计量为:r-µ。
=.可丘当总体方差矿未知时,可以用样本方差s2来近似代替总体方差,此时总体均值检验的统计量为:应用统计(专业学位) 432 统计学考研题库(五)一、简答题1.解释总体分布、样本分布和抽样分布的含义。
【答案】总体分布就是总体中所有个体关千某个变量(标志)的取值所形成的分布。
假设X 为总体随机变量,那么总体分布就是指X的分布。
很显然,同一变量不同的总体或同—总体不同的变量,其分布是不同的。
样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。
假设x为总体随机变量X在样本中的体现,那么样本分布就是指X的分布,或者说是关千《个观测值的分布。
同样,同一变量不同的样本或同一样本不同的变量,其分布是不同的。
一般意义上说,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率组成。
如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计量的分布,而样本统计量是由样本观测值计算而来的。
具体地说,抽样分布就是从容最为W的总体中抽取容量为n的样本时,所有可能的样本统计量所形成的分布。
假设从容量为W的有限总体中最多可以抽取m个容量为n的不同样本,那么把所有m个样本统计值形成频率分布,就是抽样分布。
可以说,抽样分布是研究样本分布与总体分布之间的桥梁。
2.简述统计分组的原则。
【答案】采用组距分组时,需要遵循不重不漏的原则。
不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽。
即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决不重的问题,统计分组时习惯上规定'上组限不在内"。
即当相邻两组的上下限重叠时,恰好等千某一组上限的变量值不算在本组内,而计算在下一组内。
而对千连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内"的规定解决不重的问题,也可以对—个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。