人民大学2003-2009年统计学考研真题
人大统计学真题03-06
![人大统计学真题03-06](https://img.taocdn.com/s3/m/b9c6d22b0066f5335a812127.png)
2006年人大统计专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。
为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。
现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;(3)利用P值进行检验和利用统计量进行检验有什么不同?(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。
为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。
根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:差异源SS df MS F P-value F crit行 列 误差 总计1.55 3.48 0.14 5.174 2 8 140.39 1.74 0.0221.72 97.680.000236 0.0000027.01 8.65(1)不同的车速对磨损程度是否有显著影响?(2)不同供应商的轮胎之间磨损程度是否显著差异? (3)在上面的分析中,你都做了哪些假设?四、(15分)说明什么条件下适合采取简单随机抽样? 五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。
中国人民大学432-统计学考研参考书目、考研真题、复试分数线
![中国人民大学432-统计学考研参考书目、考研真题、复试分数线](https://img.taocdn.com/s3/m/8b693f17227916888486d7ba.png)
中国人民大学432-统计学考研参考书目、考研真题、复试分数线432-统计学课程介绍中国人民大学考研复试分数线学术学位:学科门类政治、外语、专一(数学)、专二、总分01哲学50509090330↓02经济学5555909036003法学50↓50↓909035004教育学5050180330↓05文学5555909035006历史学5050180335↑07理学4545909030008工学4545909030009医学5050180↑30012管理学50↓50↓9090350↓13艺术学45459090330专业学位:专业学位政治、外语、专一、专二、总分备注02经济类专业学位(金融、应用统计、税务、国际商务、保险、资产评估)50509090340035101法律(非法学)50509090340↓035102法律(法学)505090903300352社会工作505090903300453汉语国际教育50509090315↓0552新闻与传播55559090355↓0651文物与博物馆4545180↑3200852软件工程454580803000951农村与区域发展505090903001251工商管理100↓50170↓未通过提前面试同教育部A类分数线通过提前面试1252公共管理115↑50180↑1253会计12060225↑全日制120↑50205↑非全日制1255图书情报12055↓195↓1351艺术40↓40↓9090325↑注:1、各学院可根据生源情况上调复试基本要求。
差额复试比例120%以上。
2、不符合教育部复试基本要求者不予录取。
3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。
4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相关政策另行确定,考生可向相关院系或研招办咨询。
5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。
2003-2016年中国人民大学统计学805考研真题集
![2003-2016年中国人民大学统计学805考研真题集](https://img.taocdn.com/s3/m/78f7ecb2dd3383c4bb4cd2b7.png)
人大统计学考研历年真题精华版(03- 16)2016年人大学统计学考研真题(完整版)1,构造几何分布,标准化的样本空间,取值空间,事件空间。
2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。
3,给出联合分布,求条件分布,和条件概率。
4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。
写出详细论证过程。
5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。
6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。
7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。
8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。
2013年人大805统计学真题一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。
证明取出的最后一个球是红球的概率是1/2。
2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。
二、简述:(30分)每题10分1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。
在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。
2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布3.设走进某商店的顾客数是均值为50的随机变量。
又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。
再设任一顾客所花的钱数和进入该商店的总人数相互独立。
试问该商店一天的平均营业额是多少?三、已知Y1,……,Y n是相互独立的随机变量,且均服从。
统计学考试题及答案(中国人民大学第六版)
![统计学考试题及答案(中国人民大学第六版)](https://img.taocdn.com/s3/m/2ec5753ec281e53a5802ffbd.png)
统计学一、单选1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计量是A 该校学生的总人数B 该校学生的月月平均生活费支出C 该校学生的生活费总支出D 100名学生的月平均生活费支出2、下列变量中,顺序变量是A职工人数 B产量 C产品等级 D利润总额3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位组成一个样本。
这种抽样方式是A 简单随机抽样B 分层抽样C 整群抽样D 系统抽样4、指出下面陈述中错误的是A 抽样误差只存在于概率抽样中B 非抽样误差只存在于非概率抽样中。
C概率抽样和非概率抽样都存在非抽样误差。
D在普查中存在非抽样误差。
5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图6、当样本量一定时,置信区间的宽度A 随置信水平的增大而减小B随置信水平的增大而增大C与置信水平的大小无关D与置信水平的平方根成反比7、在检验一个正态总体方差时,使用的分布是A z分布B t分布C X 分布D F分布8、指出下面陈述中的错误的是A 抽样误差可以避免B 抽样误差不可避免C 非抽样误差可以避免D 抽样误差可以控制9、假设检验中,如果计算出的P值越小,说明检验的结果越A 真实B 不真实C 显著D 不真实10、双因素方差分析涉及 自变量A 一个分类型B 一个数值型C 两个分类型D 两个数值型二、填空题1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内2、对于一组具有单峰分布的数据而言,当数据的m m >时,可判断数据是(左偏)分布3、连续变量在编制组距式变量数列时,其相邻两组的上下限必须重叠。
为解决不重的问题,应按照( 上组限不在内 )的规定确定数据所在的组4、单因素方差分析中,组间平方和SSA 对应的自由度为( k-1 ),组内平方和SSE 对应的自由度( n-k )5、数值型变量根据其取值的不同,可分为( 连续 )型变量和(离散 )型变量。
统计学考研试题及答案
![统计学考研试题及答案](https://img.taocdn.com/s3/m/954961b1534de518964bcf84b9d528ea81c72fb7.png)
统计学考研试题及答案一、单项选择题(每题2分,共10分)1. 在统计学中,总体是指()A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的统计量2. 下列哪项不是描述性统计的内容?()A. 数据的收集B. 数据的分类C. 数据的图表展示D. 相关性的度量3. 抽样误差是指()A. 抽样中的随机误差B. 抽样中的系统误差C. 统计量的抽样分布的期望D. 统计量的抽样分布的标准差4. 在回归分析中,如果自变量和因变量的关系是线性的,那么这种关系被称为()A. 正相关B. 负相关C. 线性回归D. 非线性回归5. 下列哪项是统计学中常用的离散程度的度量?()A. 均值B. 方差C. 标准差D. 众数二、简答题(每题5分,共20分)1. 简述统计学中的参数估计和假设检验的区别。
2. 描述统计学中常用的几种概率分布,并说明它们的应用场景。
3. 解释什么是标准正态分布,并说明其在统计学中的重要性。
4. 简述方差分析的基本原理及其在实际研究中的应用。
三、计算题(每题10分,共30分)1. 某工厂生产的产品,其长度服从正态分布N(12, 0.5^2)。
求:(1) 长度小于11.5的产品所占的比例;(2) 长度在11.8到12.2之间的产品所占的比例;(3) 平均每天生产1000个产品,求长度小于11.5的产品数量的期望值。
2. 已知两组数据,第一组数据的平均数为50,标准差为10,样本容量为100;第二组数据的平均数为60,标准差为15,样本容量为200。
请计算两组数据的合并平均数,并说明合并平均数的意义。
3. 某研究者想要测试一种新药对高血压患者血压的影响。
在实验前,他测量了50名患者的平均血压为150mmHg,标准差为20mmHg。
实验后,这50名患者的平均血压降低到了140mmHg。
请问这个结果是否具有统计学意义?(α=0.05)四、论述题(每题15分,共30分)1. 论述统计学在社会经济数据分析中的作用和重要性。
中国人民大学2009年硕士生入学考试试题
![中国人民大学2009年硕士生入学考试试题](https://img.taocdn.com/s3/m/9520785c2e3f5727a5e96223.png)
招生专业:中国人民大学经济类专业 考试科目:经济学综合 科目代号:402 一、简答题(每题 15 分,共 60 分) 1.简述影响利润率和平均率润率的因素。 2.简述社会主义市场经济条件下坚持公有制经济为主体和发展非公有制经济的关系。 3.简要说明消费者均衡以及其比较静态分析,并有替代效应和收入效应解释正常商品需求 曲线的形状。 4.结合财政制度自动稳定器、财政政策乘数效应和挤出效应三个概念,简要分析和评价财 政政策有效性。 二、计算题(每题 15 分,共 30 分) 5. 假设一家厂商用两种生产要素生产一种产品, 其生产函数为 y ( x1 2 x2 2 ) 和 x2 代表要素 1 和 2 的投入数量。产品和要素的价格分别为 p 、 r1 和 r2 。 请按下面的要求回答问题: (1)判断该生产技术的规模经济状况; (2)计算两种要素的边际技术替代率 MRTS12 ; (3)计算该厂商对要素 1 和 2 的需求; (4)如果要素的价格上涨,讨论该厂商利润将发生怎样变化。 6.考虑一个经济: Y K L ,这个经济有 1000 单位资本和 1000 个工人,工人的名义工 资水平为 W ,经济的一般物价水平为 P 。 (1)请把这个经济中的劳动需求表达成实际工资和资本存量的函数。 (2)如果实际工资可以调整到使劳动市场均衡,那么实际工资是多少?在该均衡状态下, 就业量、产出和工人所得的总工资量是多少? (3)如果政府要求企业把实际工资上涨到 1,会导致就业量如何变化? 三、论述题(每题 20 分,共 60 分) 7.论资本有机构成变化对资本主义生产和再生产的影响。 8.试论(微观)市场失灵的原因和对策。
1 3 2 3 1 1 月 10 日,国家统计局公布 11 月经济运行数据。数据显示,11 月工业品的出 厂价格同比上涨 2.0%,涨幅创近 31 个月新低,而此前 2008 年 8 月 PPI 涨幅为 10.10%,9 月下降至 9.1%,10 月再次大幅下跌至 6.60%。请用你所学的宏观经济学理论和模型分析: (1)11 月份 PPI 的快速回落是前一阶段紧缩性货币政策所导致的吗? (2)PPI 的快速回落给出了那些有关未来宏观经济走势的信息? (3)请评价先前紧缩性货币政策有的效性,并回答:相机抉择的货币政策好还是固定规则 的货币政策好?
人大统计学考研历年真题(03-09)参考答案
![人大统计学考研历年真题(03-09)参考答案](https://img.taocdn.com/s3/m/515524fd5022aaea988f0f03.png)
人大统计学考研历年真题参考解答精华版(03-09)2009年人大统计学专业课初试题参考解答一、设第一、二个总体均值分别为1μ与2μ,样本均值分别为1X 与2X ,样本方差分别为21S 与22S 。
1.构造原假设和备择假设012112:0:0H H μμμμ-≤↔->2.构造统计量。
由于两总体方差相等,且均为正态总体,则可以构造如下检验统计量:t =其中222112212(1)(1)1564354953.521535pn S n S S n n -+-⨯+⨯===+-+ 则446 1.82017.31447.2111t ⨯⨯===⨯ 3.计算临界值。
给定显著性水平α,如0.05α=,计算临界值120.05(2)(50)t n n t α+-=,由于50>30,则0.050.05(50) 1.645t z ≈=。
4.做出决策。
由于 1.8201 1.645t =>,故拒绝原假设,即认为12μμ>。
二、1.对于回归模型Y X βε=+,β的最小二乘估计为:'1'()X X X y β-=。
现在来看它的期望'1''1''1''1''1'()[()]()()()()()(())()()E E X X X y X X X E y X X X E X X X X X E X X X E ββεβεβε-----===+=+=+ 从上面可以看出,要使β为无偏估计,则必须满足()0E ε=,所以只有当()0E ε≠时,β才为有偏估计。
2.使()0E ε≠的原因:①遗漏了关键自变量,即全模型正确时,而我们误用了选模型。
用选模型建模时,使得误差项中含有遗漏自变量的信息,从而期望不为零。
证明过程如下证明:假设正确模型为Y X βε=+,令(,)p t X X X =,p t βββ⎛⎫= ⎪⎝⎭。
而我们选用了模型p p Y X βε=+来估计β,得到'1'()p p p p X X X y β-=,则'1''1''1''1''1'()[()]()()() ()(,) ()p p p p p p p p p p p p p p p t t p p p p t t E E X X X y X X X E y X X X X X X X X X X X X X ββββββ-----===⎛⎫= ⎪⎝⎭=+从上式可以看出p β是p β的有偏估计。
人民大学《统计学》题库及答案
![人民大学《统计学》题库及答案](https://img.taocdn.com/s3/m/fd7ec89ba1116c175f0e7cd184254b35eefd1aeb.png)
1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:1一、(20分)随机抽取20块手机电池,测得其使用寿命数据如下(单位:小时):10089939981007101110021013999100899598399510009771015101099810051011996列出描述上述数据所适用的统计图形,并说明这些图形的用途。
直方图:直观的展示一组数据(电池使用寿命)的分布情况。
箱线图:直观反映原始数据(电池寿命)的数据分布的特征,如偏态,是否有离群点。
二、(20分)方差分析中有哪些基本假定?这些假定中对哪个假定的要求比较严格?1、方差分析有3个基本假定:(1)正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)方差齐性:各个总体的方差必须相同;(3)独立性:每个样本数据是来自因子各水平的独立样本2、对独立性要求比较严格,独立性得不到满足会对方差分析结果有较大影响,对正态性和方差齐性的要求相对比较宽松。
三、(20分)某种食品每袋的标准重量是100克,从该批食品中抽取一个随机样本,检验假设100:0H ,1001H 。
(1)如果拒绝0H ,你的结论是什么?,如果不拒绝0H ,你的结论是什么?(2)能否得到一个样本能够证明该食品的平均重量是100克?请说明理由。
(3)如果由该样本得到的检验的03.0P ,你的结论是什么?0.03这个值是犯第Ⅰ类错误的概率,是实际算出来的显著性水平,你怎样解释这个P 值?(1)拒绝0H :该种食品每袋的平均重量不是100g不拒绝0H :提供的样本不能证明该种食品每袋的平均重量不是100g(2)不能,样本得出的结论只能是拒绝或不拒绝原假设,并不能直接确定原假设为真(3)结论:若给定显著性水平为0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是100克;但若给定显著性水平为0.01,则不能拒绝原假设P 值:如果该种食品每袋的平均重量是100g ,样本结果会像实际观测那样极端或更极端的概率仅为0.03四、(20分)在建立多元线性回归模型时,通常需要对自变量进行筛选。
人民大学应用统计历届试题
![人民大学应用统计历届试题](https://img.taocdn.com/s3/m/61c2fd4cf7ec4afe04a1df02.png)
A、0.0001 C、0.001
(2000 年) 评价参数点估计量优劣的 常用标准有哪些?请写出其中一个 标准的定义。
(2000 年) 某企业抽查两组产品的使用寿命, A 组抽查 10 个产品的寿命为
360,345,350,355,350,355,350,345,360,355;
(2002年) 描述对总体参数进行矩估计的方 法。
(2002年) 作为公司原材料采购员,你非 常想知道应该提前多少天订货,才能最 少地占用资源。如果订得太早,货物滞 留在货场,不仅占用大量资金,也要花 费场地费;如果订得太晚,缺少原材料, 就会耽误生产。为了更好地了解订货规 律,你从过去的订货记录中随机地抽取 了 10 次(每一次,你的供货商都承诺 2 周之内到货),得到数据如下(天):
Φ(1.645)=0.95)
(1999 年) 火柴销售量及各影响因素的关系初 步估计如下: ˆ y =17.40+0.05 x1+0.26 x2-0.01 x3-0.24 x4 标准差(6.21)(0.02)(0.02)(0.03)(0.01)
R2=0.92 n=15
ˆ 式中:是火柴销售量(万盒);x1是煤气用户 y 数 (万户);x2是卷烟销量 (万箱);x3是蚊 香销量 (万箱);x4是打火机销量 (百万个)。
B 组抽查的结果为
350,355,350,360,340,345,350,360,370,345。
试用矩估计法估计这两组产品的平均寿 命及标准差,并做比较分析。
(2000 年) 用近 26 年的数据,建立某地区货 运周转量 y (亿吨公里) 和工农业总产值 x1 (亿元)、基建总投资 x2(亿元)之间的二元 线性回归方程: ˆ y =0.643+0.536x1+0.744x2 标准差(0.04) (0.45)
2017年中国人民大学统计学院432统计学[专业硕士]考研真题(回忆版)【圣才出品】
![2017年中国人民大学统计学院432统计学[专业硕士]考研真题(回忆版)【圣才出品】](https://img.taocdn.com/s3/m/4784f59ed15abe23482f4d4f.png)
2017年中国人民大学统计学院432统计学[专业硕士]考研真题(回忆版)今年的试题延续了去年的趋势,更趋向于灵活和考察理解,而不是单纯的概念背诵。
并且在多道题目下都出现了多达3、4个小问,考察知识范围更大更细。
共八道题,除一道多元统计题为10分外,其余均为20分,共150分。
以下为回忆版,未能准确记叙所有题目和问题,多有错漏,供参考。
一、考察专题一图表展示与概括性度量为考察本市学生语文成绩和数学成绩,选取甲、乙、丙三所学校,根据每个班级学生平均成绩状况把每个学校的班级分为高、中、低三挡,从每个学校的每个档次中抽取一个班级,共九个班级进行考察。
以语文成绩和数学成绩作为横、纵坐标,将所有学生数据绘制散点图,这样的方法好吗?将每个班级学生的数学成绩由高到低排列并绘制折线图,有助于揭示什么信息?这样的方法是否合理?比较研究各校成绩状态用什么图表,简述过程总结:本专题内容目前考察方向偏重理解,应熟练掌握各类图表特性。
二、考察专题三参数估计与假设检验美国大选。
假设真实的特朗普和希拉里的支持比例是51:49。
想要通过抽取一定量的样本估计这个比例。
需要多大的估计误差才比较合理?在这样的估计误差下,样本量要多少?此处给出了估计总计比例是样本量的确定公式,问三、同上样本量50,估计总体均值,给出了两个置信区间,分别是t分布和正态分布的估计。
可以看出两个区间的中点是一样的,t分布的估计区间要大一点。
问观察这两个区间有什么发现,解释现象在这里使用t分布合理吗,为什么四、专题五方差分析五、专题四卡方分析说A因子有三个处理A1,A2,A3;B因子有4个处理B1,B2,B3,B4。
每个试验单元重复五次试验,一个响应变量y问分析的数学模型是什么?要写出分析步骤六、第八专题多元统计分析说有3000个人的13类数据,包括胸围啊,腰围啊,身高啊,臂长啊等等。
想要根据这些数据确定制作衣服的规格,怎么分析。
七、第六专题回归分析说有n个解释变量,一个响应变量。
统计学考研专业试题及答案
![统计学考研专业试题及答案](https://img.taocdn.com/s3/m/07fe1d8077eeaeaad1f34693daef5ef7ba0d1206.png)
统计学考研专业试题及答案一、单项选择题(每题2分,共20分)1. 下列哪项不是描述性统计学的主要功能?A. 计算数据的均值B. 数据的分类C. 数据的图形表示D. 推断总体参数答案:D2. 在总体中随机抽取一个样本,样本容量为n,总体方差为σ²,样本均值为x̄,若要进行假设检验,以下哪个是正确的零假设形式?A. μ = σ²B. μ ≠ σ²C. μ = x̄D. μ ≠ x̄答案:C3. 以下哪个统计量是度量数据集中趋势的?A. 方差B. 标准差C. 众数D. 极差答案:C4. 在回归分析中,如果自变量X增加一个单位,因变量Y预期将增加多少,这是指的哪个统计量?A. 相关系数B. 回归系数C. 决定系数D. 标准误差答案:B5. 下列哪项不是统计学中常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. 均匀分布答案:D6. 一个随机变量X服从二项分布B(n, p),若要求X的方差,以下哪个公式是正确的?A. Var(X) = np(1-p)B. Var(X) = npC. Var(X) = np/pD. Var(X) = n/p答案:A7. 在统计学中,为了减少抽样误差,通常采用哪种方法?A. 增加样本容量B. 减少样本容量C. 只选择特定群体D. 随机抽样答案:A8. 下列哪项是时间序列分析的主要目的?A. 预测未来趋势B. 分析变量间的关系C. 确定因果关系D. 描述数据分布答案:A9. 在统计学中,如果两个变量的相关系数为0,这意味着什么?A. 两个变量之间存在线性关系B. 两个变量之间不存在线性关系C. 两个变量之间一定存在非线性关系D. 两个变量之间一定没有关系答案:B10. 下列哪项是统计学中的抽样误差?A. 抽样过程中的随机误差B. 样本选择的偏差C. 测量过程中的错误D. 抽样过程中的系统误差答案:A二、简答题(每题10分,共20分)11. 简述统计学中的中心极限定理,并说明其在实际应用中的意义。
2019年人大统计学考研题目(回忆版)
![2019年人大统计学考研题目(回忆版)](https://img.taocdn.com/s3/m/0d43a217ccbff121dc36831d.png)
2010年考研题目(p.s试题来自于网上,如有错误恳请包涵)(一)五道问答题(50分)1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有 1、两个总体正态分布2、总体方差未知3、两个总体的样本独立抽取(否则为匹配样本)4、小样本(n<30)5、每一个总体样本内部也相互独立(否则为有限总体情况)题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。
如果还要写可以加上原假设未写明。
2.在参数统计中,卡方分布有哪些应用,并举例说明【分析】在参数统计中,卡方分布有时序:检验白噪声的lb统计量、q统计量检验异方差相关性的Q统计量、lm统计量GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。
典型相关分析中检验典型相关系数的卡方分布。
多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。
统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。
(有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下) 3.贝叶斯统计与经典统计的区别【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。
经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。
中国人民大学统计学试题库(2011年7月更新)
![中国人民大学统计学试题库(2011年7月更新)](https://img.taocdn.com/s3/m/15d105f40242a8956aece40f.png)
)
A、是连续不断的
B、是以整数断开的 C、用测量或计算方法取得
D、相邻两值之间可取无限数值
E、相邻两值之间不可能有小数
10、总体、总体单位、标志、指标间的相互关系表现为:(
)
A、没有总体单位就没有总体,总体单位不能离开总体而存在
B、总体单位是标志的承担者
C、统计指标的数值来源于标志
D、指标是说明总体特征的,标志是说明总体单位特征的
入该组。
9、次数分布有两种表现方法,一种是用表格表示,另一种是用图表示。
10、统计整理就是对统计资料进行汇总、加工处理。
11、能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。
三、单项选择题
3、在分布数列中,各组单位数与总体单位数的比率称为
,又称为比重或百分比。
4、变量值中最大值与最小值的差额称为
;在组距数列中,各组上限与下限的差额
称为
。
5、统计汇总技术主要有
和
两种形式。
6、统计表从形式上看,由
、
、
和
四部分构成;从内
容上看,由
和
两部分构成。
7、统计表按主词是否分组和分组程度可分为
、
和
。
)
A、标志 B、指标 C、变异 D、变量
10、一个统计总体(
)
A、只能有一个标志 B、只能有一个指标
C、可以有多个标志 D、可以有多个指标
11、统计对总体数量的认识是(
)
A、从总体到单位 B、从单位到总体
C、从定量到定性 D、以上都对
12、变量是可变的(
)
A、品质标志 B、数量标志 C、数量标志和指标 D、质量指标
于(
2009年高级统计学研究生考试试题
![2009年高级统计学研究生考试试题](https://img.taocdn.com/s3/m/78b1423ec4da50e2524de518964bcf84b8d52d56.png)
2009年高级统计学研究生考试试题习题城镇居民消费水平通常用表1.7中的八项指标进行描述。
我国1991年30个省、市、自治区城镇居民月平均消费数据也在表中给出。
现要求对其进行主成分分析。
表1.7 1991年30个省、市、自治区城镇居民月平均消费数据1x 人均粮食支出(元/人) 5x 人均衣着商品支出(元/人) 2x 人均副食支出(元/人)6x 人均日用品支出(元/人) 3x 人均烟、酒、茶支出(元/人) 7x 人均燃料支出(元/人) x 人均其他副食支出(元/人)x 人均非商品支出(元/人)二、一个实例:科技园区经济发展预测1 科技园区经济发展预测的特点自1991年我国开始实施火炬计划并建立第一个国家级科技园区以来,至今已建成国家级科技园区53个。
如表1所示,在过去的十多年里,这些科技园区得到了超常规的发展,其发展速度远高于同期的国家经济发展速度。
据国家科技部网站公布的数据,2002年,53个科技园区实现的技工贸总收入达到15326.4亿元,工业增加值3268.1亿元,出口创汇329.2亿美元,三项指标均为1991年创建初期的150倍左右。
表11.2 1991年~2002年国家级科技园区发展状况(产值单位:亿元)由此可见,我国科技园区已成为国民经济发展新的增长极和高新技术产业发展的重要基地,并必将继续对我国经济发展产生重大影响。
也正因为国家级科技园区所具备的越来越大的影响力,使得对其发展进行预测就显得越来越有现实价值。
因为对其发展进行准确的预测,进而做出科学的决策,对于促进科技园区实现持续、快速、健康发展具有重要的战略意义。
然而,作为一个小型经济区域,国家级科技园区的经济发展预测存在高度的非线性、耦合性和时变性。
非线性:科技园区是在众多确定性因素和非确定性因素交互作用下形成的复杂非线性系统;强耦合性:反映衡量科技园区经济发展的各项指标、构成科技园区的各行业等无不密切关联,每一个指标或行业的变化都会导致其它指标或行业的变化;时变性:科技园区是一个动态的开放系统,反映其运行规律的数学模型始终在不断的变化中。
2017年中国人民大学805统计学考研真题(回忆版)
![2017年中国人民大学805统计学考研真题(回忆版)](https://img.taocdn.com/s3/m/c84f3230443610661ed9ad51f01dc281e53a56da.png)
2017年中国人民大学805统计学考研真题(回忆版)
新祥旭考研官网:
/doc/a1e226b603d276a20029bd6478 3e0912a3167c59.html 2017年中国人民大学805统计学考研真题(回忆版)
1.证明:2n+1个样本中位数,几乎处处收敛到1/
2.
2.证明:Y 为非负随机变量,则E[Y^n]=∫ny^(n-1)P(Y≥y)dy.(积分上下限分别为正无穷和0)
3.W ,X 相互独立,h(x)连续可导,Y=W+h(X).Y 关于{X=x}的条件分布与Y=W+h(x)的分布一样。
4.b(N,p),给出p 的一个最小方差无偏估计量并证明无偏性和最小方差。
并在N=1时比较贝叶斯估计和最小方差无偏估计量各自的好处。
5.线性回归分析中,对残差有什么假定,为什么要这样假定。
并给出检验假定的方法。
6.请给出一个方法检验广告投放地区(A1,A2,A3),广告投放方式(B1,B2,B3)对销售量的影响。
(给出具体模型)
7关于一元回归分析的题目,回归方程是二次的。
题目很长,是一道证明题。
8.为什么要讨论第一类错误和第二类错误?并说明两类错误的关系。
2014年中国人民大学805统计学考研试题(回忆版)
![2014年中国人民大学805统计学考研试题(回忆版)](https://img.taocdn.com/s3/m/0ca3af1b6bec0975f565e26a.png)
您所下载的资料来源于
考研资料下载中心 获取更多考研资料,请访问2014年中国人民大学805统计学考研试题统计学考研试题((回忆版回忆版))
1.A 袋中n 个分别标记为1~n 的红色球,B 袋中n 个无标记的相同白色球。
试验每次从A 中取出一个球,不放回,再从B 中取出一个球放入A 中,当B 中球取完后就只从A 中取出。
求最后一个取出的球是标记为n 的红球的概率;求最后一个取出的球是红球的概率。
2.Θ服从N(μ,σ^2),当Θ=θ时,ξ服从N(θ,1)【linyn11提供,谢谢】,证明(Θ,ξ)的分布为二维正态分布。
求当ξ=x 时,Θ的条件分布
3.以统计思想证明,max(x1,x2,······,xn)的(-n+1)次方的n 重定积分(积分下限是0,上限是a)=na.
4.几乎全忘了,Sn=X1+X2+······+Xn,证明Sn/n-μ的期望为μ,还有依概率收敛什么的············
5.X 服从参数为r 的泊松分布,求参数r 的广义似然比检验统计量,拒绝域,势函数。
6.贝叶斯后验分布函数与极大似然函数的异同;统计决策中损失函数与风险函数,及贝叶斯风险。
7.列联表检验,Pearson 方法,广义似然比检验。
8.题中给出了甲乙两种药物的效果,以时间来表示,求甲乙两种药物药效的显著程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人大统计学考研历年真题精华版(03-09)2009年人大统计学专业课初试题一、有两个正态总体,均值和方差未知,但已知方差相等。
从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。
如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。
三、周期过程cos()t t X A ωϕ=+,其中频率ω和振幅A 都是常数,而相位ϕ是一个在区间[-π,π]上服从均匀分布的随机变量。
问{t X }是否平稳?说明原因。
四、把一个总体分为三层,各层的权重和预估的比例见下表。
待估计的参数为总体比例。
如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。
(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”)五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。
六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=,()0 ()t s E t s εε=≠,则(1)该模型是否违背古典线性回归模型的假定?请简要说明。
(2)如果对该模型进行估计,你会采用什么方法?请说明理由。
七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。
第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。
每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。
对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。
假定40只白鼠的初始活动状态相同。
请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。
1分表示非常不满意,100分表示非常满意。
数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。
(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。
2008年人大统计学专业课初试题一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。
”请你从统计的角度对该报道做简要评论。
二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。
三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。
四、(30分)食品厂家说:净含量是每袋不低于250g。
但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。
(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。
(1)请具体指明这些假设有哪些?(2)说明这些假设所发挥的主要作用;(3)请讨论这些假设最终产生的影响。
六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。
七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。
(1)以大坝为例,概略说明需考虑的主要因素;(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。
(画出框图,并尽量避免过多使用文字)2007年人大统计学专业课初试题一、(20分)下面是一种零件误差的数据(单位:克):6.1 4.7 6.5 6.27.76.4 5.57.1 6.1 5.35.76.1 5.3 4.0 4.83.2 3.9 1.94.9 3.85.3 2.6 5.3 5.5 5.82.7 6.8 7.4 5.63.3(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。
请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。
如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。
能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。
请回答以下问题:(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。
但一家研究机构则认为自驾车上班的人数比例达不到这一水平。
为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。
(1)请写出检验的原假设和备择假设;(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。
对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。
请问,这样做是否有道理?请加以说明。
什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?六、(20分)回归模型y=β0+β1x1+β2x2+…+βp x p+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?七、(25分)对于聚类分析,请回答以下问题:(1)分层聚类前,需要对什么进行选择?(2)描述分层聚类分析的详细步骤;(3)描述K均值(快速)聚类分析的详细步骤。
八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βp x p+ε,如果一个SPSS回归分析的结果如下表所示:a. Predictor s:(Constant),Beginning Salaryb. Predictor s:(Constant),Beginning Salary,Employment Category则:(1)表中所用选择自变量的方法可能是什么?(2)表中的最后一个Sig.如何求得?意义是什么?(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。
2006年人大统计专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。
为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。
现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;(3)利用P值进行检验和利用统计量进行检验有什么不同?(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。
为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。
根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:差异源SS df MS F P-value F crit行列误差总计1.553.480.145.17428140.391.740.0221.7297.680.0002360.0000027.018.65(1)不同的车速对磨损程度是否有显著影响?(2)不同供应商的轮胎之间磨损程度是否显著差异?(3)在上面的分析中,你都做了哪些假设?四、(15分)说明什么条件下适合采取简单随机抽样?五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。
六、(20分)解释因子模型X=AF+ε的意义并写出模型的假设。
七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。