人大统计学考研真题

合集下载

中国人民大学432-统计学考研参考书目、考研真题、复试分数线

中国人民大学432-统计学考研参考书目、考研真题、复试分数线

中国人民大学432-统计学考研参考书目、考研真题、复试分数线432-统计学课程介绍中国人民大学考研复试分数线学术学位:学科门类政治、外语、专一(数学)、专二、总分01哲学50509090330↓02经济学5555909036003法学50↓50↓909035004教育学5050180330↓05文学5555909035006历史学5050180335↑07理学4545909030008工学4545909030009医学5050180↑30012管理学50↓50↓9090350↓13艺术学45459090330专业学位:专业学位政治、外语、专一、专二、总分备注02经济类专业学位(金融、应用统计、税务、国际商务、保险、资产评估)50509090340035101法律(非法学)50509090340↓035102法律(法学)505090903300352社会工作505090903300453汉语国际教育50509090315↓0552新闻与传播55559090355↓0651文物与博物馆4545180↑3200852软件工程454580803000951农村与区域发展505090903001251工商管理100↓50170↓未通过提前面试同教育部A类分数线通过提前面试1252公共管理115↑50180↑1253会计12060225↑全日制120↑50205↑非全日制1255图书情报12055↓195↓1351艺术40↓40↓9090325↑注:1、各学院可根据生源情况上调复试基本要求。

差额复试比例120%以上。

2、不符合教育部复试基本要求者不予录取。

3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。

4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相关政策另行确定,考生可向相关院系或研招办咨询。

5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。

2003-2016年中国人民大学统计学805考研真题集

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)2016年人大学统计学考研真题(完整版)1,构造几何分布,标准化的样本空间,取值空间,事件空间。

2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。

3,给出联合分布,求条件分布,和条件概率。

4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。

写出详细论证过程。

5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。

6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。

7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。

8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

证明取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分)每题10分1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。

在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。

2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布3.设走进某商店的顾客数是均值为50的随机变量。

又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。

再设任一顾客所花的钱数和进入该商店的总人数相互独立。

试问该商店一天的平均营业额是多少?三、已知Y1,……,Y n是相互独立的随机变量,且均服从。

统计学考研专业试题及答案

统计学考研专业试题及答案

统计学考研专业试题及答案一、选择题1. 在统计学中,描述数据集中趋势的度量是:A. 方差B. 标准差C. 均值D. 众数答案:C2. 以下哪个是正态分布的特点?A. 均值等于中位数B. 均值等于众数C. 均值小于中位数D. 均值大于众数答案:A3. 以下哪个统计量不是度量数据离散程度的?A. 方差B. 标准差C. 均值D. 四分位数间距答案:C二、填空题4. 假设检验中的两类错误是________和________。

答案:第一类错误;第二类错误5. 样本均值的抽样分布服从正态分布的条件是样本容量足够大,即n≥______。

答案:30三、简答题6. 请简述中心极限定理的内容。

答案:中心极限定理指出,即使原始总体分布不是正态分布,只要样本容量足够大,样本均值的分布将趋近于正态分布。

7. 描述性统计和推断性统计的区别是什么?答案:描述性统计主要关注数据的收集、组织、描述和展示,以提供对数据集的直观理解。

推断性统计则利用样本数据来推断总体的特征,包括参数估计和假设检验。

四、计算题8. 假设有一个总体均值为μ=100,标准差为σ=15。

从这个总体中随机抽取一个样本容量为n=36的样本,样本均值为x̄=102。

请计算并判断样本均值是否显著不同于总体均值。

答案:首先计算样本标准误差(SE),SE = σ/√n = 15/√36 =2.5。

然后计算z值,z = (x̄ - μ)/SE = (102 - 100)/2.5 = 0.8。

由于z值在标准正态分布的临界值范围内(例如,对于α=0.05,z临界值为±1.96),我们不能拒绝原假设,即样本均值不显著不同于总体均值。

五、论述题9. 论述总体参数估计的两种方法:点估计和区间估计,并给出它们的区别。

答案:点估计是指用样本统计量来估计总体参数的单个值。

它提供了一个具体的数值作为总体参数的估计。

而区间估计则提供了一个范围,在这个范围内总体参数有一定的置信水平(如95%)被认为包含在内。

人大统计学考博试题汇总10-12

人大统计学考博试题汇总10-12

为了了解总体特征,通过对总体抽样得到代表总体的样本,信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量。

统计量的分布称为抽样分布。

10年统计理论与应用一、名词解释典型相关,脸谱图,多元正态分布的密度函数二、二元条件分布四、抽样:列举复杂样本的方差计算方法,第二问是事后分层抽样五、总体比例的区间估计与假设检验六、Logistic回归:好似是S-PLUS软件或者SAS跑出来结果让根据结果写方程及分析七、企业经济统计:列举很多统计指标,让你根据这些指标写出你想分析什么问题,采用什么方法,能得出什么结论。

统计学一、X服从参数为a的泊松分布,a服从参数为b的伽马分布,问X的混合分布是什么?二、先验分布和后验分布的关系三、写出常用的三种非参数统计方法四、当因变量不服从正态分布时,如何建模?A对数正态分布B二项分布C二点分布D泊松分布五、以前考过的原题:关于抽样中整群抽样和随机抽样调查家庭电脑拥有量的一个案例1.有一组数据,考虑建立伽马函数和正态分布函数,如何判断所建立的函数能够更好地反映原始数据的信息2.区间估计和假设检验的区别和联系3.矩估计和极大似然估计的特点、以及据估计在什么情况下不适用4.是一道方差分析的题,具体不记得了,根据题意要求写出如何判断是否存在显著性差异,〔个人感觉不是很难〕5.显著性检验中,利用统计量检验和利用p至检验有什么不同6.谈谈对bayes方法的理解统计理论:总共是8道,前几年统计理论分A.B卷,现在不分了,前面60分必做,后面选做题100分,从中选择40分就可以了。

1.〔1〕什么是抽样分布,抽样分布与假设检验的关系〔2〕什么是多重共线性,如何识别多重共线性2.是高等数理统计中的一道题,本人做的不好,后来听其他同学说不是很难。

大致是给出一个密度函数和两个统计量T1 和T2〔具体形式不记得了,不是很难〕〔1〕证明T1 和T2 无偏〔2〕如何判断T1 和T2 的有效性〔3〕假设T=cmax(….)〔括号里面的东西不记得了〕,如何确定常数c,使得T的方差到达最小。

人民大学《统计学》题库及答案

人民大学《统计学》题库及答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:1一、(20分)随机抽取20块手机电池,测得其使用寿命数据如下(单位:小时):10089939981007101110021013999100899598399510009771015101099810051011996列出描述上述数据所适用的统计图形,并说明这些图形的用途。

直方图:直观的展示一组数据(电池使用寿命)的分布情况。

箱线图:直观反映原始数据(电池寿命)的数据分布的特征,如偏态,是否有离群点。

二、(20分)方差分析中有哪些基本假定?这些假定中对哪个假定的要求比较严格?1、方差分析有3个基本假定:(1)正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)方差齐性:各个总体的方差必须相同;(3)独立性:每个样本数据是来自因子各水平的独立样本2、对独立性要求比较严格,独立性得不到满足会对方差分析结果有较大影响,对正态性和方差齐性的要求相对比较宽松。

三、(20分)某种食品每袋的标准重量是100克,从该批食品中抽取一个随机样本,检验假设100:0H ,1001H 。

(1)如果拒绝0H ,你的结论是什么?,如果不拒绝0H ,你的结论是什么?(2)能否得到一个样本能够证明该食品的平均重量是100克?请说明理由。

(3)如果由该样本得到的检验的03.0P ,你的结论是什么?0.03这个值是犯第Ⅰ类错误的概率,是实际算出来的显著性水平,你怎样解释这个P 值?(1)拒绝0H :该种食品每袋的平均重量不是100g不拒绝0H :提供的样本不能证明该种食品每袋的平均重量不是100g(2)不能,样本得出的结论只能是拒绝或不拒绝原假设,并不能直接确定原假设为真(3)结论:若给定显著性水平为0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是100克;但若给定显著性水平为0.01,则不能拒绝原假设P 值:如果该种食品每袋的平均重量是100g ,样本结果会像实际观测那样极端或更极端的概率仅为0.03四、(20分)在建立多元线性回归模型时,通常需要对自变量进行筛选。

2007年中国人民大学805统计学考研真题

2007年中国人民大学805统计学考研真题

2007年人大统计学专业课初试题参考解答一、(1)①需假定总体是正态总体。

②不能用数据证明。

数据至多只能检验该数据的分布是否接近正态分布,而不能从理论上证明或肯定它一定就来自正态分布总体,即正态性检验不能提供不拒绝正态性原假设的结论。

③不是。

该区间是确定的区间,要么覆盖真实总体均值,要么不覆盖,没有概率可言。

它是置信度为95%的随机置信区间的一个样本实现,后者才是以95%的概率覆盖真实总体均值。

(2)①需假定:总体服从正态分布;总体方差未知;样本量较小(一般 30)。

②不能。

“接受零假设”的说法是不妥的,否则就得负责任的给出犯第二类错误的概率,而该检验的备选假设是“总体均值>4.8克”,据此是无法算出此概率的。

所以只能说,在显著水平为0.05时利用该数据进行检验不足以拒绝零假设,不拒绝不等同于接受。

二、(1)不是。

因为只有员工看到并愿意答复电子邮件时才有机会进入样本,所以每个员工入样的概率并不一样,这其实是一种非概率抽样。

(2)①不对。

不说实话只是产生响应误差的原因之一,而被调查者与调查者两方面的因素,都有可能导致响应误差。

调查者不当的引导或者问卷设计不科学或者被调查者知识的局限性,都可能使被调查者对要回答的问题的理解产生偏差,这时候即使他(她)说了“实话”,也会产生响应误差,因为这不是我们想要的“实话”。

另外,拒绝回答也是一种重要原因。

②随机误差是不可以避免的,因为它是由抽样的随机性造成的,是客观的。

(3)整体来说是不独立的。

因为同一个网络公司员工加班时间一般是不独立的,而不同网络公司员工加班时间一般是独立的。

三、(1)令自驾车上班人数比例为π,由于不能轻易否定原结论,则检验假设为:01:30%:30%H H ππ≥⎧⎨<⎩ (2)①令样本量为n ,其中驾车上班人数为X ,假定X 服从二项分布(,0.3)B n ,X 的样本值为0x ,则00{}{0}{1}{}p P X x P X P X P X x =≤==+=++=L 值②检验统计量0~(0,1)H Z N =。

人大805统计学真题

人大805统计学真题

15年真题1.一1000住户的小区,每户人家没车的概率0.1,有一辆车的概率0.7,有两辆车的概率0.2,问应该设多少停车位才能有95%以上的概率使小区的每辆车都有车位。

2. 证明多元回归分析中最小二乘估计具有最小方差线性无偏性。

3. 有一件什么事抽了100个人,分别给出了其中没有投诉,投诉一次,两次,三次,大于等于四次的具体人数,用卡方拟合检验判断其是否符合均值为1的泊松分布。

再假设确实服从泊松分布,求泊松分布参数的极大似然估计。

4. 假设检验中的p值指什么,用p值和用统计量进行检验有什么不同,再举例说明为什么假设检验不能证明原假设的正确性。

5. A袋中有编号1到n的n个红球,B袋中有n个篮球,每次从A中取出一个球后再从B 中取一个球放入A中(若B中取完则只取A),问A中取出的最后一个球为红球的概率。

6. 从五个正态总体中一共抽取五组样本,有一张表给出了每组样本的样本容量以及偏差平方和,假设这五个正态总体具有相同的方差,求方差95%的置信区间。

7. 现要研究位置(居民区商业区某某区)和竞争者数量(0 1 2 3)对销售额的大小有无影响,给出具体的做法。

14年真题1.证明概率的题,和13年真题差不多,比13年简单,方法也差不多2.计算某条件分布为二元正态分布3.半道证明依概率收敛,剩下半道我记不清了4.利用统计思想证明下面一个积分,被积函数我记不清了,积分最后是dx1dx2...dxn,我觉得这是这次最恶心的一道题,无从下手,大家可以上网找找类似的5.写出广义似然比检验量,并利用此检验量检验下面的假设,一道假设检验的题,检验内容不难,关键是要知道广义似然比检验量是什么6.统计决策中的风险函数和损失函数是什么,剩下半道好像还有点贝叶斯的什么函数我记不太清了7.最大似然估计和贝叶斯后验估计的区别和联系8.写出列联表检验全部过程9.普通的一个假设检验,应该是两总体均值情况中,两个总体方差均未知,样本量为10的近似t检验2013年人大统计学、精算学专业课试题(回忆版)一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

2019年人大统计学考研题目(回忆版)

2019年人大统计学考研题目(回忆版)

2010年考研题目(p.s试题来自于网上,如有错误恳请包涵)(一)五道问答题(50分)1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有 1、两个总体正态分布2、总体方差未知3、两个总体的样本独立抽取(否则为匹配样本)4、小样本(n<30)5、每一个总体样本内部也相互独立(否则为有限总体情况)题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。

如果还要写可以加上原假设未写明。

2.在参数统计中,卡方分布有哪些应用,并举例说明【分析】在参数统计中,卡方分布有时序:检验白噪声的lb统计量、q统计量检验异方差相关性的Q统计量、lm统计量GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。

典型相关分析中检验典型相关系数的卡方分布。

多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。

统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。

(有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下) 3.贝叶斯统计与经典统计的区别【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。

经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。

2022年中国人民大学432统计学考研真题和答案

2022年中国人民大学432统计学考研真题和答案

2022年中国人民大学432统计学考研真题和答案2022年中国人民大学《432统计学》考研全套内容简介•中国人民大学统计学院《432统计学》[专业硕士]历年考研真题汇总•全国名校应用统计硕士《432统计学》考研真题精选及详解•应用统计硕士《432统计学》名校考研真题(2017年前)详解说明:本部分收录了本科目近年考研真题,方便了解出题风格、难度及命题点。

此外提供了相关院校考研真题,部分真题提供了视频讲解。

2.教材教辅•贾俊平《统计学》(第7版)笔记和课后习题(含考研真题)详解•贾俊平《统计学》(第7版)考研真题(含复试)与典型习题详解说明:以上为本科目参考教材配套的辅导资料。

•试看部分内容第一部分统计学第1章统计数据的搜集一、单项选择题1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。

[河海大学2020研]A.简单随机抽样B.分层抽样C.自愿抽样D.方便抽样【答案】D查看答案【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。

例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。

2将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]A.等距抽样B.整群抽样C.类型抽样D.纯随机抽样【答案】C查看答案【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。

等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。

3某机构十分关心小学生每周看电视的时间。

该机构随机抽取30 0名小学生家长对他们的孩子每周看电视的时间进行了估计。

结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。

该机构搜集数据的方式是()。

[山东大学2018研] A.概率抽样调查B.观察调查C.实验调查D.公开发表的资料【答案】A查看答案【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。

2022中国人民大学流行病与卫生统计学考研专业目录招生人数参考书目历年真题复试分数线答题方法复习经验

2022中国人民大学流行病与卫生统计学考研专业目录招生人数参考书目历年真题复试分数线答题方法复习经验

2022中国人民大学流行病与卫生统计学考研专业目录招生人数参考书目历年真题复试分数线答题方法复习经验指导一、2022年中国人民大学流行病与卫生统计学专业考研招生目录二、2022年中国人民大学流行病与卫生统计学专业考研复试分数线三、2022年中国人民大学流行病与卫生统计学专业考研参考书四、2022年中国人民大学流行病与卫生统计学考研真题613卫生统计1、细颗粒物2、持久性污染物二、选择题略三、简答题1、维生素C的作用及缺乏表现2、亚硝酸盐中毒及其防治3、Pearon相关与pearman秩相关的区别4、环境流行病学的特点5、富营养化现象及其危害6、职业病的特点7、噪声的控制措施8、疫源地的概念及其消灭条件9、评价真实性的指标及其关系有效率。

请回答该研究属于何种类型的研究,怎样分析,为什么?四、论述题1、人通过饮食摄入蛋白质30g后,通过以下三种途径进行了代谢,其中粪氮1、2g,尿氮4g,皮肤氮0。

3g,试计算其氮平衡,并评价其蛋白质营养状况及其对健康的影响。

2、甲乙两厂工龄小于十年的人数分别为500与100名,患病人数分别为25与4名;工龄大于十年的人数分别为100与600名,患病人数分别为20与66名。

(1)、列表,计算统计指标(2)、哪个患病率高,为什么?3、试述反映小气候对人体影响的指标4、论述队列研究和病例对照研究的基本原理及其异同点。

五、2022年中国人民大学流行病与卫生统计学考研真题答题黄金攻略名师点评:认为只要专业课重点背会了,就能拿高分,是广大考生普遍存在的误区。

而学会答题方法才是专业课取得高分的关键。

下面易研老师以经常考察的名词解释、简答题、论述题、案例分析为例,来讲解标准的答题思路。

(一)名词解析答题方法【考研名师答题方法点拨】名词解释最简单,最容易得分。

在复习的时候要把参考书中的核心概念和重点概念夯实。

回答出名词本身的核心含义,力求尊重课本。

这是最主要的。

简答该名词的特征、内涵、或者其构成、或者举一个案例加以解释。

统计学考研初试题及答案

统计学考研初试题及答案

统计学考研初试题及答案一、单项选择题(每题2分,共20分)1. 下列哪项是描述数据集中趋势的统计量?A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 总体参数与样本统计量之间的区别在于:A. 总体参数是固定的,样本统计量是变化的B. 总体参数是变化的,样本统计量是固定的C. 两者都是固定的D. 两者都是变化的答案:A3. 在统计学中,以下哪种分布是描述二项分布的?A. 正态分布B. t分布C. 泊松分布D. F分布答案:A4. 以下哪种方法用于估计总体均值?A. 回归分析B. 假设检验C. 置信区间D. 方差分析5. 以下哪种图形用于展示变量之间的关系?A. 直方图B. 散点图C. 箱线图D. 饼图答案:B6. 统计学中的“误差”通常指的是:A. 测量误差B. 抽样误差C. 系统误差D. 所有上述选项答案:D7. 以下哪个不是描述离散程度的统计量?A. 方差B. 标准差C. 平均数D. 极差答案:C8. 以下哪种方法用于确定两个变量之间是否存在关系?A. 相关系数B. 回归分析C. 假设检验D. 所有上述选项答案:D9. 在统计学中,以下哪种分布用于描述正态分布的样本均值?B. F分布C. 正态分布D. 卡方分布答案:A10. 以下哪种检验用于确定两个独立样本的均值是否存在显著差异?A. t检验B. 卡方检验C. 相关性检验D. 方差分析答案:A二、多项选择题(每题3分,共15分)1. 下列哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 标准差D. 方差答案:A B2. 在统计分析中,以下哪些方法可以用于预测未来值?A. 回归分析B. 时间序列分析C. 假设检验D. 描述性统计答案:A B3. 以下哪些是统计学中的抽样方法?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A B C D4. 以下哪些是统计学中的非参数检验?A. 卡方检验B. 曼-惠特尼U检验C. 克鲁斯卡尔-瓦利斯检验D. 斯皮尔曼等级相关系数答案:B C D5. 下列哪些是数据收集的方法?A. 观察法B. 实验法C. 调查法D. 文献法答案:A B C三、简答题(每题5分,共20分)1. 简述什么是中心极限定理,并说明其在统计学中的应用。

统计学考研真题精选6

统计学考研真题精选6

统计学考研真题精选6(总分:120.00,做题时间:150分钟)一、单项选择题(总题数:27,分数:27.00)1.在抽样推断中,样本统计量是( )(分数:1.00)A.未知但确定的量B.—个已知的量C.随机变量√D.唯一的解析:统计量是用来描述样本特征的概括性数字度量。

它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。

2.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。

如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从 ( )。

(分数:1.00)A.正态分布,均值为12分钟,标准差为0.3分钟√B.正态分布,均值为12分钟,标准差为3分钟C.左偏分布,均值为12分钟,标准差为3分钟D.左偏分布,均值为12分钟,标准差为0.3分钟解析:中心极限定理:设从均值为µ、方差为(有限)的任意一个总体中抽取样本量为n的样本,当n充分大(通常是大于36)时,样本均值文的抽样分布近似服从均值为µ、的正态分布。

故即使总体是左偏分布,该样本均值仍服从正态分布,其均值为 12,标准差为3/10 =0.3。

3.设总体是来自总体X)。

(分数:1.00)A.t(15)B.t(16)C.X2(15)D.N(0,1) √4.1000名学生参加某课程的考试,平均成绩是82分,标准差是8分,从学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准差分别为()。

(分数:1.00)A.82, 8B.82, 0.8 √C.82, 64D.86,1解析:由中心极限定理得,在大样本条件下,样本均值无的抽样分布近似服从均值为µ的正态分布。

故该样本均值的数学期望为82,标准差为8/10 =0.8。

5.某批产品的合格率为90%,从中抽出n= 100的简单随机样本,以样本合格率估计总体合格率P,的期望值和标准差分别为()。

统计学研究生考试真题试卷

统计学研究生考试真题试卷

统计学研究生考试真题试卷一、选择题(每题2分,共20分)1. 在统计学中,一个总体的参数通常由样本的哪个量来估计?A. 样本均值B. 样本方差C. 样本中位数D. 样本标准差2. 以下哪个不是统计学中的常见分布?A. 正态分布B. 二项分布C. 泊松分布D. 指数分布3. 假设检验中的零假设(H0)通常表示什么?A. 研究假设是正确的B. 研究假设是错误的C. 没有效应或差异D. 存在效应或差异4. 以下哪个统计量用于衡量变量间的线性关系?A. 方差B. 标准差C. 相关系数D. 回归系数5. 什么是置信区间?A. 一个估计值B. 一个估计值的上下限C. 一个估计值的准确度D. 一个估计值的可信度6. 以下哪个是描述性统计分析的主要目的?A. 推断总体参数B. 预测未来趋势C. 描述数据特征D. 检验假设7. 什么是样本量?A. 总体中所有个体的数量B. 研究中实际观察到的个体数量C. 研究中假设的个体数量D. 研究中随机选择的个体数量8. 以下哪个是多元回归分析中可能遇到的问题?A. 异方差性B. 同方差性C. 线性无关D. 正态性9. 以下哪个统计软件是专门用于统计分析的?A. ExcelB. WordC. PhotoshopD. R10. 什么是抽样误差?A. 由于抽样方法不当导致的误差B. 由于样本量过小导致的误差C. 由于测量不准确导致的误差D. 由于数据录入错误导致的误差二、简答题(每题10分,共30分)1. 解释什么是中心极限定理,并简述其在实际应用中的意义。

2. 描述如何进行一个简单的线性回归分析,并解释其结果如何帮助理解变量之间的关系。

3. 什么是假设检验中的I型错误和II型错误?请举例说明。

三、计算题(每题15分,共30分)1. 给定一组数据:5, 7, 9, 12, 15, 18, 21, 24, 27, 30。

计算样本均值、样本方差和样本标准差。

2. 假设你正在分析一个二项分布的实验,其中成功的概率是0.3,样本量是100。

2017年中国人民大学805统计学考研真题(回忆版)

2017年中国人民大学805统计学考研真题(回忆版)

2017年中国人民大学805统计学考研真题(回忆版)
新祥旭考研官网:
/doc/a1e226b603d276a20029bd6478 3e0912a3167c59.html 2017年中国人民大学805统计学考研真题(回忆版)
1.证明:2n+1个样本中位数,几乎处处收敛到1/
2.
2.证明:Y 为非负随机变量,则E[Y^n]=∫ny^(n-1)P(Y≥y)dy.(积分上下限分别为正无穷和0)
3.W ,X 相互独立,h(x)连续可导,Y=W+h(X).Y 关于{X=x}的条件分布与Y=W+h(x)的分布一样。

4.b(N,p),给出p 的一个最小方差无偏估计量并证明无偏性和最小方差。

并在N=1时比较贝叶斯估计和最小方差无偏估计量各自的好处。

5.线性回归分析中,对残差有什么假定,为什么要这样假定。

并给出检验假定的方法。

6.请给出一个方法检验广告投放地区(A1,A2,A3),广告投放方式(B1,B2,B3)对销售量的影响。

(给出具体模型)
7关于一元回归分析的题目,回归方程是二次的。

题目很长,是一道证明题。

8.为什么要讨论第一类错误和第二类错误?并说明两类错误的关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人大统计学考研历年真题精华版(03-09)2009年人大统计学专业课初试题一、有两个正态总体,均值和方差未知,但已知方差相等。

从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。

如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

三、周期过程cos()t t X A ωϕ=+,其中频率ω和振幅A 都是常数,而相位ϕ是一个在区间[-π,π]上服从均匀分布的随机变量。

问{t X }是否平稳?说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。

待估计的参数为总体比例。

如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。

(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”)五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。

六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=,()0 ()t s E t s εε=≠,则(1)该模型是否违背古典线性回归模型的假定?请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。

第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。

每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。

对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。

假定40只白鼠的初始活动状态相同。

请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。

1分表示非常不满意,100分表示非常满意。

数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大统计学专业课初试题一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。

”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:净含量是每袋不低于250g。

但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?(2)说明这些假设所发挥的主要作用;(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。

(1)以大坝为例,概略说明需考虑的主要因素;(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。

(画出框图,并尽量避免过多使用文字)2007年人大统计学专业课初试题一、(20分)下面是一种零件误差的数据(单位:克):6.1 4.7 6.5 6.27.76.4 5.57.1 6.1 5.35.76.1 5.3 4.0 4.83.2 3.9 1.94.9 3.85.3 2.6 5.3 5.5 5.82.7 6.8 7.4 5.63.3(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。

请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。

如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。

能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。

请回答以下问题:(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。

但一家研究机构则认为自驾车上班的人数比例达不到这一水平。

为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。

对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。

请问,这样做是否有道理?请加以说明。

什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?六、(20分)回归模型y=β0+β1x1+β2x2+…+βp x p+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?七、(25分)对于聚类分析,请回答以下问题:(1)分层聚类前,需要对什么进行选择?(2)描述分层聚类分析的详细步骤;(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βp x p+ε,如果一个SPSS回归分析的结果如下表所示:a. Predictor s:(Constant),Beginning Salaryb. Predictor s:(Constant),Beginning Salary,Employment Category则:(1)表中所用选择自变量的方法可能是什么?(2)表中的最后一个Sig.如何求得?意义是什么?(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大统计专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。

为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。

现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;(3)利用P值进行检验和利用统计量进行检验有什么不同?(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。

为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。

根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:差异源SS df MS F P-value F crit行列误差总计1.553.480.145.17428140.391.740.0221.7297.680.0002360.0000027.018.65(1)不同的车速对磨损程度是否有显著影响?(2)不同供应商的轮胎之间磨损程度是否显著差异?(3)在上面的分析中,你都做了哪些假设?四、(15分)说明什么条件下适合采取简单随机抽样?五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型X=AF+ε的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

相关文档
最新文档