2018年上海交通大学432统计学[专业硕士]考研真题(回忆版)【圣才出品】
上海交通大学 应用统计 432 统计学 试题回忆
2013上海交通大学应用统计432 统计学试题回忆注:[本试题有热心网友”hanxuwps “回忆,在此表示非常感谢,祝好人一生平安】友情提示:交大学制两年半。
按题型分为:单选,简答,计算和分析三部分。
分值分别是2'*30,10'*4,20'*2+10.题目特点:符合大纲,符合给出的参考书。
重视基础和基本原理。
有130分的题都比较简单,唯一不好做的是计算和分析题里的第一题,主要也是因为我没复习过统计学。
复习建议:把两本参考书看好了就行了,课后题最好也做好。
然后再买本圣才的那个什么试题集,主要看一下简答和计算题就可以了。
按内容分:可以明确归入概率论的内容在30分左右,且极为基础,连数三标准都达不到。
统计学的内容绝对超过100分!(可我没复习啊。
)单选题:覆盖全面,考了定义题(比如抽样方式、残差的分布)、原理题(比如P值,R平方的意义,为什么引入P值,为什么引入调整的R平方,二元回归跟两个一元回归相比有什么特点等)、应用题、计算题等。
最多的就是简单的应用题了,给一个实例然后让选择估计量或者置信区间等等,选项都是按标准形式给的,不需要自己具体算。
比较难做的是原理题,建议以后的考生重视一下教材中的相关内容,比如各种统计方法和参数的引入目的和意义是什么,具体又是如何指导实际应用的。
简答题:十分基础。
共四小题:第一题:简单应用:试建立回归方程:考察员工工资y和工作量x1以及员工性别的关系。
并解释各项系数的实际意义。
只是要求简述一下回归方程,没提供具体数据让考生计算。
第二题:定义题:时间序列的构成要素,稳定序列与非稳定序列的定义。
第三题:基本原理题:简述在数据按月统计的条件下,使用“移动平均趋势剔除法”计算季节指数的过程。
第四题:就是简述一下二项分布的中心极限定理。
计算和应用:统计部分40分,算是常考题型。
概率论10分,就是赏给我们的。
第一题:考查的是两个变量的差异性,求差异性的95%的置信区间和0.05水平下差异性是否显著的假设检验。
2018年中国海洋大学432统计学[专业硕士]考研真题及详解【圣才出品】
2018年中国海洋大学432统计学[专业硕士]考研真题及详解一、填空题(20分,每题2分)1.样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为()。
【答案】样本量【解析】样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。
2.一组样本数据为3,3,1,5,13,12,11,9,7,这组数据的中位数是()。
【答案】7【解析】中位数是一组数据排序后处于中间位置上的变量值。
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,最后确定中位数的具体数值。
3.己知一批产品的次品率为4%,从中有放回地抽取5个。
则5个产品中没有次品的概率为()。
【答案】0.815【解析】有放回抽样,每次抽到正品的概率为96%,故5个产品中没次品的概率为0.965=0.815。
4.从均值为200、标准差为50的总体中抽取容量为100的简单随机样本,样本均值的期望值是()。
【答案】200【解析】由中心极限定理可知:从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n 的样本,当样本量n 充分大时,样本均值X _服从均值为μ,方差为σ2/n 的正态分布,故样本均值的期望为200。
5.若边际误差E =5,σ=40,要估计总体均值μ的95%的置信区间所需的样本量为()。
【答案】246【解析】置信水平为95%,已知Z 0.025=1.96,则边际误差为: 2401.965E Z α=⨯=⨯= 故可求得n =246。
6.组内平方和除以相应的自由度的结果称为( )。
【答案】组内方差【解析】由于各误差平方和的大小与观测值的多少有关,为了消除观测值多少对误差平方和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度,这一结果称为均方,也称为方差。
SSE 的均方也称为组内均方或组内方差,记为MSE 。
7.在假设检验中,第一类错误是指( )。
【答案】弃真错误【解析】第一类错误是原假设H 0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误。
贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】
2.统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷
的时间如下(分钟)
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。得到 vs
22.85 0.38 。 12.45
9.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 0.25 厘米。如果已知该 厂生产的零件厚度为正态分布,可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占 ( )。[浙江工商大学 2011 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.随机变量 X 的方差为 2,随机变量 Y=2X,那么 y 的方差是( )。[中央财经大学 2011 研]
A.1 B.2 C.4 D.8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7.设 X1,X2,…,X n 为随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
[中山大学 2012 研] A.样本平均 B.样本中位数 C.样子书
【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指 一 组 数 据 向 某 一 中 心 值 靠 拢 的 程 度 ,它 反 映 了 一 组 数 据 中 心
2018年中央财经大学432统计学[专业硕士]考研真题及详解【圣才出品】
2018年中央财经大学432统计学[专业硕士]考研真题及详解一、单项选择题(每小题2分,共30分)1.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
A.定类数据B.定序数据C.横截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
因此题中数据属于横截面数据。
2.为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。
关于这种调查方式,以下说法正确的是()。
A.使用的抽样方式是简单随机抽样B.使用的抽样方式是配额抽样C.使用的抽样方式是非概率抽样D.这种调查不是抽样调查【答案】C【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
题中的调查方式属于非概率抽样中的滚雪球抽样。
3.在抽样推断中,总体参数是一个()。
A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
4.为了快速了解北京居民对空气污染问题的态度,最适合的数据收集方式是()。
A.面访B.电话调查C.邮寄问卷D.座谈会【答案】B【解析】电话调查是指调查人员通过打电话的方式向被调查者实施调查。
电话调查的最大特点是速度快,能够在很短的时间内完成调查。
而面访、邮寄问卷、座谈会的调查周期都比较长。
新版上海交通大学应用统计专硕考研真题考研经验考研参考书
回首过去一年的各种疲惫,困顿,不安,怀疑,期待等等全部都可以告一段落了,我真的是如释重负,终于可以安稳的让自己休息一段时间了。
虽然时间如此之漫长,但是回想起来还是历历在目,这可真是血与泪坚坚实实一步步走来的。
相信所有跟我一样考研的朋友大概都有如此体会。
不过,这切实的果实也是最好的回报。
在我备考之初也是看尽了网上所有相关的资料讯息,如大海捞针一般去找寻对自己有用的资料,所幸的是遇到了几个比较靠谱的战友和前辈,大家共享了资料和经验。
他们这些家底对我来讲还是非常有帮助的。
而现如今,我也终于可以以一个前人的姿态,把自己的经验下下来,供大家翻阅,内心还是比较欣喜的。
首先当你下定决心准备备考的时候,要根据自己的实际情况、知识准备、心理准备、学习习惯做好学习计划,学习计划要细致到每日、每周、每日都要规划好,这样就可以很好的掌握自己的学习进度,稳扎稳打步步为营。
另外,复试备考计划融合在初试复习中。
在进入复习之后,自己也可以根据自己学习情况灵活调整我们的计划。
总之,定好计划之后,一定要坚持下去。
由于篇幅较长,还望各位同学能够耐心看完,在结尾处附上我的学习资料供大家下载。
上海交通大学应用统计的初试科目为:(101)思想政治理论(201)英语一(303)数学三和(432)统计学。
参考书目为:1.《统计学》(第五版及其以后版本均可),贾俊平,何晓群,金勇进编著,中国人民大学出版社。
2.《概率论与数理统计》,武爱文冯卫国卫淑芝熊德文编,上海交通大学出版社。
先说英语吧。
词汇量曾经是我的一块心病,跟我英语水平差不多的同学,词汇量往往比我高出一大截。
从初中学英语开始就不爱背单词。
在考研阶段,词汇量的重要性胜过四六级,尤其是一些熟词僻义,往往一个单词决定你一道阅读能否做对。
所以,一旦你准备学习考研英语,词汇一定是陪伴你从头至尾的一项工作。
考研到底背多少个单词足够?按照大纲的要求,大概是5500多个。
实际上,核心单词及其熟词僻义才是考研的重点。
应用统计硕士《432统计学》专用教材(随机变量及其分布)【圣才出品】
第二章 随机变量及其分布第一节 随机变量的概念及其分布函数一、随机变量的概念随机变量是指定义在样本空间Ω上的实值函数X =X (ω),常用大写字母X ,Y ,Z 等表示随机变量,其取值用小写字母x ,y ,z 等表示。
随机变量包括离散型随机变量、连续型随机变量和其他随机变量。
1.离散型随机变量的概念假如一个随机变量全部可能取到的值是有限个或可列无限多个,则称其为离散型随机变量。
2.连续性随机变量的概念如果对于随机变量X 的分布函数F (x ),存在非负可积函数f (x ),使对于任意实数x 有则称X 为连续型随机变量,f (x )称为X 的概率密度函数,简称概率密度。
二、随机变量的分布函数 设X 是一个随机变量,对任意实数x ,称()()x F x f t dt -∞=⎰F (x )=P (X ≤x )为随机变量X 的分布函数,且X 服从F (x ),记为X ~F (x )。
分布函数F (x )具有以下的基本性质:1.单调性F (x )是定义在整个实数轴(-∞,+∞)上的单调非减函数,即对任意的x 1<x 2,有F (x 1)≤F (x 2)。
2.有界性对任意的x ,有0≤F (x )≤1,且3.右连续性F (x )是x 的右连续函数,即对任意的x 0,有即 F (x 0+0)=F (x 0)第二节 离散型随机变量及其分布()lim ()0()lim ()1x x F F x F F x →-∞→+∞-∞==+∞==00lim ()()x x F x F x +→=一、离散型随机变量的分布列1.分布列的定义和表示 设X 是一个离散随机变量,如果X 的所有可能取值是x 1,x 2,…,x n ,…,则称X 取x i 的概率p i =p (x i )=P (X =x i ),i =1,2,…,n ,…为X 的概率分布列或简称为分布列,记为X ~{p i }。
分布列可用如下列表方式来表示:2.分布列的基本性质(1)非负性:p (x i )≥0,i =1,2,…;(2)正则性:。
《统计学考研题库》【章节题库+名校考研真题+模拟试题】参数估计【圣才出品】
第7章参数估计一、单项选择题1.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为()。
[山东大学2015研] A.无偏性B.有效性C.一致性D.充分性【答案】B【解析】有效性是指对同一总体参数的无偏估计量,有更小标准差的估计量更有效,即估计量与总体参数的离差越小越好。
2.一项研究表明,大公司的女性管理人员与小公司的女性管理人员颇为相似。
该项研究抽取了两个独立的随机样本,小公司抽取86名女性经理,大公司抽取91名女性经理,根据若干个与工作有关的变量做了比较,其中所提出的一个问题是“如果有机会的话,你是否会改变所从事的工作?”小公司的86名经理中有65人作了否定回答,大公司的91名经理中有51人作了否定回答。
两组女性经理中有机会改变工作的比例之差的95%的置信区间为()。
[山东大学2015研]A.0.195±0.017B.0.195±0.117C.0.195±0.127D.0.195±0.137【答案】D【解析】当两个总体比例π1和π2未知时,可用样本比例p 1和p 2来代替,根据正态分布建立的两个总体比例之差π1-π2在1-α置信水平下的置信区间为:()()()112212121140402121(1)(1)402191918686() 1.960.195+91860.1918376a p p p p p p z n n ---±+=±--=-±3.关于最大似然估计量和无偏估计量的叙述,下列正确的是()[中山大学2014研]A .若T 为参数θ的最大似然估计量,则g (T )为g (θ)的最大似然估计量B .若T 为参数θ的无偏估计量,则g (T )为g (θ)的无偏估计量C .最大似然估计量和无偏估计量总是唯一的D .以上皆非【答案】D【解析】A 项,由最大似然估计的不变性,若ˆq 是q 的最大似然估计,g (θ)是q 的连续函数,则g (θ)的最大似然估计为()ˆg q 。
(NEW)上海财经大学统计与管理学院《432统计学》[专业硕士]历年考研真题(含复试)汇编
B.4.5
C.4.9
D.-7.4
【答案】D
【解析】众数是一组数据中出现次数最多的变量值。题中,-7.4出现 次数为2,而其他数只出现了1次,故该组数据中众数为-7.4。
3.下列关于p-Value的说法正确的是( ) A.p-Value越大,可以拒绝原假设 B.p-Value越大,可以接受原假设 C.p-Value越大越好 D.p-Value越小,可以接受原假设 【答案】B 【解析】P值是当原假设为真时所得到的样本观察结果或更极端结果出 现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现 了,根据小概率原理,就有理由拒绝原假设,P值越小,拒绝原假设的 理由就越充分。
2012年上海财经大学统计与管理学院432统计学[专业硕士]考研真题(回 忆版)
2013年上海财经大学统计与管理学院432统计学[专业硕士]考研真题
2013年上海财经大学统计与管理学院432统计学[专业硕士]考研真题(含 部分答案)
一、选择题(每题2分,共60分)
1.一组数据:-9.4,2.0,3.0,4.5,4.7,5.0,6.3,7.0,其中位数接 近下列哪个数?( )
4.同时抛6枚均匀的硬币,至少有一次正面的概率为( )。 A.1/64 B.17/64 C.49/64 D.63/64 【答案】D 【解析】同时抛6枚硬币,至少有一次正面的概率=1-6枚硬币均为反 面的概率=1-(1/2)6=63/64。 5.为调查学校每个学生的月生活费,某人随机在全校班级中抽取7个班 级调查,这属于( )。
A.简单随机抽样 B.整群抽样
C.分层抽样 D.系统抽样 【答案】B 【解析】整群抽样是将总体中若干个单位合并为群,抽样时直接抽取 群,然后对中选群中的所有单位全部实施调查的抽样方法。题中,在全 校班级中抽取7个班级调查属于整群抽样。 6.下列哪个变量是连续型变量?( ) A.机器出故障后需要修理的小时数 B.一个地区一年的降雨量 C.某商场一天购物的顾客数 D.参加统计考试的人数 【答案】B 【解析】在一定区间内可以任意取值的变量叫连续变量,其数值是连续 不断的,相邻两个数值可作无限分割,即可取无限个数值。反之,其数 值只能用自然数或整数单位计算的则为离散变量。
贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】
1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是 由数字组成的。ACD 三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
8.对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三 分位数,以下哪种描述统计的办法更有效?( )[中山大学 2012 研]
A.直方图 B.茎叶图 C.饼图 D.点图
4 / 33
圣才电子书
【答案】B
十万种考研考证电子书、题库视频学习平台
12.饼图的主要用途是( )。 A.反映一个样本或总体的结构 B.比较多个总体的构成 C.反映一组数据的分布 D.比较多个样本的相似性 【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个 样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值
型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分
位数。
9.某外商投资企业按工资水平分为四组:1000 元以下,1000~1500 元;1500~2000 元;2000 元以上。第一组和第四组的组中值分别为( )。[首经贸 2009 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题 1.对于大批量的数据,最适合描述其分布的图形是( )。[中国海洋大学 2018 研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形 的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占 全部数据的比例。
《统计学考研题库》【章节题库+名校考研真题+模拟试题】时间序列分析【圣才出品】
第13章时间序列分析和预测一、单项选择题1.五月份的商品销售额为60万元,该月的季节指数为120%,则消除季节因素影响后,该月的商品销售额为()万元。
[对外经济贸易大学2015研]A.72B.50C.60D.51.2【答案】B【解析】消除季节因素影响后的商品销售额=该月商品实际销售额/该月季节指数=60/120%=50(万元)。
2.毛衣销售量时间数列分析中,如果第3季的季节指数大于100%,表明该季毛衣销售量()。
[四川大学2013研]A.不受季节影响B.受季节因素影响C.属于旺季D.属于淡季【答案】C【解析】季节指数=同季的平均数/历年各季总的平均数。
故若季节指数大于100%,表示该季度的销售量超过平均水平,故为销售旺季。
3.如果时间序列的逐期观察值按几何级数递增或递减,则适合的预测模型是()。
[四川大学2013研]A.移动平均模型B.线性模型C.指数模型D.抛物线模型【答案】C【解析】时间序列的观察值按几何级数变化,说明变化幅度很大,并非线性变化情况,适合用指数模型进行拟合。
4.时间数列分析中,移动平均法只能用于修匀的数列是()。
[四川大学2013研] A.时期数数列B.时点数数列C.空间数列D.静态数列【答案】A【解析】移动平均法适用于近期预测。
当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的随机波动,因此可以用于修匀时期数列。
5.不存在趋势的序列称为()。
A.平稳序列B.周期性序列C.季节性序列D.非平稳序列【答案】A【解析】时间序列可以分为平稳序列和非平稳序列两大类。
其中平稳序列是指基本上不存在趋势的序列;非平稳序列是指包含趋势、季节性或周期性的序列,它可能只含有其中一种成分,也可能是几种成分的组合。
6.时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为()。
A.趋势B.季节性C.周期性D.随机性【答案】A【解析】趋势是指时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势;时间序列中的趋势可以是线性的,也可以是非线性的。
上海财大应用统计硕士432统计学考研真题库
上海财大应用统计硕士432统计学考研真题库第一部分统计学第1章统计数据的搜集一、单项选择题1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。
[河海大学2020研]A.简单随机抽样B.分层抽样C.自愿抽样D.方便抽样【答案】D~~~~【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。
例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。
2将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]A.等距抽样B.整群抽样C.类型抽样D.纯随机抽样【答案】C~~~~【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。
等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。
3某机构十分关心小学生每周看电视的时间。
该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是()。
[山东大学2018研]A.概率抽样调查B.观察调查C.实验调查D.公开发表的资料【答案】A~~~~【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。
因此,哪个单位被抽中与否完全是随机的。
题中该机构抽取的300名小学生家长是随机的,每个小学生的家长都有被抽到的概率,因此该机构搜集数据的方式是概率抽样。
4为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。
关于这种调查方式,以下说法正确的是()。
[中央财经大学2018研]A.使用的抽样方式是简单随机抽样B.使用的抽样方式是配额抽样C.使用的抽样方式是非概率抽样D.这种调查不是抽样调查【答案】C~~~~【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
2018年暨南大学432统计学[专业硕士]考研真题及详解【圣才出品】
2018年暨南大学432统计学[专业硕士]考研真题及详解一、统计学(共75分)(一)简答题(每题10分,共30分)1.什么是变异与变量?两者有何联系与区别?试举例说明。
答:(1)概念在统计中,变异是普遍存在的,一般意义上的变异就是指标志在总体单位中不同的表现,广义上的变异是指可变标志的属性或数值在总体单位之间表现出来的差异性,既包括品质标志也包括数量标志。
例如,品质标志中的性别、数量标志中的人均工资等存在的差异就为变异。
变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。
如“商品销售额”“受教育程度”“产品的质量等级”等都是变量。
变量的具体取值称为变量值。
(2)两者的联系与区别两者的区别和联系为变异为标志在同一总体不同个体之间表现的差异性。
例如:以每个职工为总体单位时,性别就是品质变异标志,因为性别分男、女。
年龄、工资等是数量标志在同一总体不同个体之间的不同。
变量是将数量变异标志称为变量。
它的表现形式为具体的数值,称为变量值,其可分为连续变量和离散变量。
2.什么是抽样调查与典型调查?两者有何异同点?答:(1)概念抽样调查是按照随机原则从调查总体中抽出一部分单位(在抽样调查中称作样本)进行调查。
并根据调查取得的样本资料推算总体参数的调查方式。
例如从一批产品中随机抽取若干件进行质量检验,并计算合格率,然后以此推断这一批产品的合格率。
典型调查是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。
(2)两者的异同①相同点:抽样调查和典型调查一样都是非全面调查。
②不同点:抽样调查按照随机原则抽取样本,即从调查对象总体中随机抽取部分单位作为样本来进行调查。
随机原则,就是从总体中抽取的样本完全由随机决定,不受主观因素影响,使总体中每个单位都有同等的被抽中的机会。
而典型调查是人为有意识的选择调查单位,不符合随机原则;抽样调查时根据样本的资料推断总体的数值,虽然这种推断存在一定的误差,但是这种误差范围是可以计算加以控制的。
(NEW)北京大学数学科学学院《432统计学》[专业硕士]历年考研真题汇编(含部分答案)
目 录2014年北京大学数学科学学院432统计学[专业硕士]考研真题(回忆版,含部分答案)2015年北京大学数学科学学院432统计学[专业硕士]考研真题(回忆版,含部分答案)2014年北京大学数学科学学院432统计学[专业硕士]考研真题(回忆版,含部分答案)参考答案一、解:从中不放回地抽取两张,总的取法有种。
(1)52张扑克牌中共有四种花色,每种花色有13张牌,因此两张牌花色相同的情况有种。
记A为事件“两张牌花色相同”,则有:(2)“花色相同的条件下,两张牌数字不是次序相邻”的对立事件为“花色相同的情况下,两张牌数字次序相邻”,假设两张牌来自其中的某一种花色,则相邻的情况共有12种。
记B为事件“两张牌数字次序相邻”,则在花色相同的条件下,两张牌数字次序相邻的概率为:因此在花色相同的条件下,两张牌数字不是次序相邻的概率为:二、解:设A表示事件“第二天下雨”,B表示事件“预报下雨”,则根据题意可知则“预报下雨,真的下雨”的概率为:三、解:由于,因此当时当时,有对分布函数求导,得Y的概率密度函数为:四、解:(1)因,故X的概率密度为则当0<y<1时,因此Y的密度函数为(2)又所以五、解:由于第i分钟所放射的粒子数与i-1分钟放射的粒子数互不影响,因此X1,X2,…,X n相互独立。
(1)物理放射性试验中,每分钟放射的粒子数服从泊松分布,设,那么每分钟放出粒子的概率为:解得,所以由于第i分钟所放射的粒子数与i-1分钟放射的粒子数互不影响,因此相互独立。
所以(2)由中心极限定理所以有:六、题目不完整七、答:(1)假设检验就是对问题进行分析后,提出原假设和备择假设,然后根据样本信息作出接受或拒绝原假设的决策,由于决策的依据是样本提供的信息,因此判断有可能正确,也可能不正确,就是说,我们面临犯错误的可能,所犯的错误有两种类型:①第Ⅰ类错误是原假设H0为真却被拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;②第Ⅱ类错误是原假设为伪却没有被拒绝,犯这种错误的概率用β表示,所以也称β错误或取伪错误。
应用统计硕士(MAS)专业学位研究生入学统一考试科目《432统计学》题库-统计学(第4~5章)【圣才
D.N(μ,σ2/n)
【答案】A
【解析】设样本标准差为 s,则在正态总体下,有
n
Y i1
Xi X 2
n 1 s2
2
~
2 n 1
5.设 X~N(0,σ2),则服从 t(n-1)的随机变量为( )。[山东大学 2016 研]
A. n X S
B. n 1X S
C. n X S2
D. n 1X S2
【答案】A
【解析】设 X1,X2,…,Xn 是来自正态分布 N(0,σ2)的一个样本,则有
X
1 n
n i 1
Xi,S2
1 n 1
n i 1
Xi X
2
因此
n X 0
nX ~ t(n 1)
S
S
6.在抽样推断中,样本统计量是( )。[中央财经大学 2015 研]
3 / 91
圣才电子书
3.设总体X~N(μ,σ2),其中μ已知,σ2未知,X1,X2,X3是从总体中抽取的样本, 下列各项不是统计量的是( )。[浙江工商大学2017研]
A.X1+X2-2X3 B.X2+3μ C.max(X1,X2,X3) D.(X1+X2)/σ 【答案】D 【解析】统计量是不含未知参数的样本的函数。ABC 三项均不含参数,而 D 项中,σ 为未知参数。
分布为( )。[中国科学技术大学 2013 研] A.自由度为 1,1 的 F 分布 B.自由度 1,2 的 F 分布 C.自由度为 2,1 的 F 分布 D.自由度 2,2 的 F 分布 【答案】A
2
A.均值为μ,方差为
n
μ
2
B.均值为 ,方差为
n
n
μ
C.均值为 ,方差为
2016年上海交通大学432统计学[专业硕士]考研真题(回忆版)【圣才出品】
2016年上海交通大学432统计学[专业硕士]考研真题(回忆版,不完整)一、选择题(2×30)有两道考察原假设设置的问题还考察了显著性水平相比和P值相比的缺点二、简答题(4×10)1.给出一个具体问题,建立多元回归模型,并解释各回归系数的含义2.简述时间序列的构成要素;简述平稳序列和非平稳序列的含义答:(1)时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。
时间序列分析的主要目的是根据已有的历史数据对未来进行预测。
时间序列的构成因素包括以下几个方面:①趋势(T)趋势,又称长期趋势,它是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动。
时间序列中的趋势可以是线性的,也可以是非线性的。
②季节性(S)季节性,又称季节变动,它是时间序列在一年内重复出现的周期性波动。
季节性中的“季节”一词是广义的,它不仅仅是指一年中的四季,其实是指任何一种周期性的变化,诸如气候条件、生产条件、节假日或人们的风俗习惯等各种因素作用的结果。
③周期性(C)周期性,又称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动。
周期性通常是由商业和经济活动引起的,它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;它也不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。
④随机性(I)随机性,又称不规则波动,它是时间序列中除去趋势、周期性和季节性之后的偶然性波动,即某些偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。
综上所述,时间序列的成分可以分为四种,即趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。
按四种成分对时间序列的影响方式不同,时间序列可分解为多种模型,如加法模型、乘法模型等。
(2)平稳序列平稳序列是基本上不存在趋势的序列。
贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的搜集)【圣才出品】
第2章数据的搜集一、单项选择题1.为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生,组成样本进行调查,这种抽样方法属于()。
[浙江工商大学2011研]A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】B【解析】简单随机抽样就是即使从包括N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的;分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;系统随机抽样也称为机械随机抽样或等距离随机抽样。
它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本;整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
2.为调查在中国的省会城市和4个直辖市的居民年收入,需要从这些城市的居民中抽取一个样本,你认为以下四种抽样方式哪一种会得到更有代表性的样本?( )。
[中山大学2011研]A.简单随机抽样B.整群抽样C.系统随机抽样D.分层随机抽样【答案】D【解析】在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法和其他抽样方法结合在一起使用;整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;系统随机抽样也称为机械随机抽样或等距离随机抽样。
它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本;分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,分层抽样在实践中得到了广泛的应用。
3.某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是( )。
[中央财经大学2011研]A.面访B.深度访谈C.计算机辅助电话调查D.邮寄调查【答案】C【解析】面访即调查者直接走访被调查者,当面听取被调查者的意见。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018年上海交通大学432统计学[专业硕士]考研真题(回忆版,十分不全)
一、单项选择题30*2
比较基础,p值的优势,组内方差等等
二、简答题10*4
1.根据样本比例确定样本量
2.确定并分离季节成分的步骤
3.多元线性回归变量选择方法,逐步回归法
4.给出一个样本均值为μ方差,然后D(x3)有限,然后求样本三阶距的概率密度和分布形状(不会…)
三、计算题20+20+10
1.置信区间,假设检验
2.方差分析表补充完整,写出回归方程,小影方程是否显著,解释系数意义,计算判定系数解释意义。
3.r个人相互传球,然后传给r-1个人概率相同,问第n次还是最初那个人的概率p 是多少?。