人大统计学专业课初试题
统计学考研初试题及答案
统计学考研初试题及答案一、单项选择题(每题2分,共20分)1. 在统计学中,以下哪项不是描述性统计学的研究内容?A. 数据的收集B. 数据的分析C. 数据的解释D. 数据的推断答案:D2. 以下哪个统计量是用来衡量数据集中趋势的?A. 方差B. 标准差C. 中位数D. 极差答案:C3. 总体参数和样本统计量的主要区别在于:A. 数值大小B. 是否基于样本数据C. 是否可变D. 是否需要推断答案:B4. 在假设检验中,如果原假设是正确的,但实际上拒绝了原假设,这种情况称为:A. 第一型错误B. 第二型错误C. 功效D. 效能答案:A5. 以下哪个选项是正态分布的特点?A. 均值等于中位数B. 均值小于方差C. 均值大于标准差D. 均值等于极差答案:A二、简答题(每题10分,共30分)1. 简述相关系数和回归系数的区别。
答案:相关系数衡量的是两个变量之间的线性关系强度和方向,取值范围在-1到1之间。
回归系数则是指在回归分析中,自变量对因变量的影响程度,它表示自变量每变化一个单位,因变量预期的平均变化量。
2. 什么是抽样分布?请说明其在统计推断中的作用。
答案:抽样分布是指在所有可能的样本中,某个统计量(如样本均值)的概率分布。
在统计推断中,抽样分布允许我们使用样本数据来推断总体参数,它为假设检验和置信区间的计算提供了理论基础。
三、计算题(每题25分,共50分)1. 某工厂生产的产品中,次品率估计为5%,现从这批产品中随机抽取100个产品进行检查,请问:(1) 样本中次品数的期望是多少?(2) 如果样本中出现了6个次品,计算样本中次品率的95%置信区间。
答案:(1) 样本中次品数的期望是 \( E(X) = n \times p = 100 \times 0.05 = 5 \) 个。
(2) 样本中次品率为 \( \hat{p} = \frac{6}{100} = 0.06 \),标准误差 \( SE = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} =\sqrt{\frac{0.06 \times 0.94}{100}} = 0.02 \)。
大学考试—统计学——试题库及答案
A.它是从定性认识开始以定量认识为最终目的B.它是从事物量的研究开始来认识事物的本质C.它是在质与量的联系中研究社会经济现象的数量方面D.它是一种纯数量的研究回答错误!正确答案: CA.数量指标指数和质量指标指数B.个体指数和总指数C.综合指数和平均数指数D.算术平均数指数和调和平均数指数回答错误!正确答案: AA.加权调和平均法B.几何平均法C.简单算术平均法D.加权算术平均法回答错误!正确答案: AA.现象间存在的函数关系B.现象间的一种非确定性的数量关系C.现象间的一种确定性的数量关系D.现象间客观存在的依存关系回答错误!正确答案: BA.抽样调查B.统计报表C.全面调查D.普查回答错误!正确答案: BA.115%B.125%C.37.5%D.15%回答错误!正确答案: DA.比较相对指标B.比例相对指标C.结构相对指标D.强度相对指标回答错误!正确答案: CA.OB.XC.—回答错误!正确答案: CA.50个B.≥30个C.≥50个D.30个回答错误!正确答案: BA.单一表和一览表B.简单表和分组表C.简单表和复合表D.简单表和一览表回答错误!正确答案: AA.成数的数值越接近0.3,成数的方差越大B.成数的数值越接近l,成数的方差越大C.成数的数值越接近0.5,成数的方差越大D.成数的数值越接近0,成数的方差越大回答错误!正确答案: CA.18%B.20%D.1.8%回答错误!正确答案: DA.报告法B.通讯法C.直接观察法D.采访法回答错误!正确答案: DA.简单表和复合表B.单一表和一览表C.简单表和分组表D.简单表和一览表回答错误!正确答案: BA.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数B.总体参数有5%的概率未落在这一区间内C.总体参数有95%的概率落在这一区间内D.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数回答错误!正确答案: DA.从0到1B.无范围限制C.从-1到1D.从-1到0回答错误!正确答案: CA.增加约3/5B.增加39.7%C.没有什么变化D.减少约3/5回答错误!正确答案: DA.从质到量B.从量到质C.从质到量,再到质和量的结合D.从总体到个体回答错误!正确答案: CA.指标B.变量值C.标志D.变量回答错误!正确答案: BA.从质到量,再到质和量的结合B.从质到量C.从总体到个体D.从量到质回答错误!正确答案: CA.间隔性B.连续性C.一致性D.可比性回答错误!正确答案: DA.该班每一名学生的学习情况B.该班每一名学生C.该班50名学生D.该班50名学生的学习情况回答错误!正确答案: BA.时期指标并价值指标B.时点指标并价值指标C.时期指标并实物指标D.时点指标并实物指标回答错误!正确答案: BA.总体参数的具体数值B.总体参数的名称C.用来估计总体参数的统计量的名称D.用来估计总体参数的统计量的具体数值回答错误!正确答案: CA.因变量是给定的,自变量是随机的B.自变量是给定的,因变量是随机的C.两个变量都是非随机的D.两个变量都是随机的回答错误!正确答案: BA.基期质量指标B.报告期质量指标C.基期数量指标D.报告期数量指标回答错误!正确答案: AA.发展速度B.增长速度C.平均发展水平D.发展水平回答错误!正确答案: AA.综合指数B个体指数C.调和平均数指数D.算术平均数指数回答错误!正确答案: AA.抽样误差B.系统性误差C.登记性误差D.代表性误差回答错误!正确答案: AA.正相关B.无相关C.曲线相关D.负相关回答错误!正确答案: AA.该班50名学生的学习情况B.该班每一名学生的学习情况C.该班50名学生D.该班每一名学生回答错误!正确答案: DA.该市全部职工B.该市每个职工家庭C.该市职工家庭户数D.该市全部职工家庭回答错误!正确答案: DA.无相关B.正相关C.负相关D.曲线相关回答错误!正确答案: CA.定基发展速度-1等于环比增长速度B.环比增长速度的连积等于环比发展速度C.定基长速度的连乘积等于定基发展速度D.环比发展速度-1等于环比增长速度回答错误!正确答案: DA.左方B.右方C.都可以D.上方回答错误!正确答案: AA.报告期B.研究期C.末期D.基期回答错误!正确答案: DA.增大到原来的6倍B.也是原来的1/3C.增大到原来的3倍D.增大到原来的9倍回答错误!正确答案: DA.可以有多个标志B.只能有一个标志C.只能有一个指标D.可以有多个指标回答错误!正确答案: DA.无法进行正确判断B.平均数小,代表性大C.两个平均数代表性相同D.平均数大,代表性大回答错误!正确答案: DA.99.5%B.85.7%C.116.7%D.100.5%回答错误!正确答案: AA.结构影响指数B.综合指数C.可变构成指数D.平均指数回答错误!正确答案: BA.该市职工家庭户数B.该市全部职工C.该市全部职工家庭D.该市每个职工家庭回答错误!正确答案: CA.只有一个成立而且必有一个成立B.原假设一定成立,备选假设不一定成立C.都有可能不成立D.都有可能成立回答错误!正确答案: AA.使得选中的单位不多不少,合乎要求B.保证总体中每个单位有同等的机会被抽取;C.任意抽取单位D.随便抽取单位;回答错误!正确答案: BA.分析方法是配合回归方程B.分析目的是判断现象之间相关的密切程度,并配合相应的回归方程以便进行推算和预测C.分析方法主要是绘制相关图和计算相关系数D.分析目的是确定自变量和因变量E.分析对象是相关关系回答错误!正确答案: C EA.表明两个相关变量间的数量变动关系B.关键在于确定方程中的参数a和bC.可用来根据自变量值推算因变量值,并可进行回归预测D.回归系数b=0时,相关系数r=0E.建立前提条件是现象之间具有较密切的直线相关关系回答错误!正确答案: A B C EA.置信区间B.置信度C.点估计量D.概率E.抽样平均误差回答错误!正确答案: B C D EA.简单随机抽样B.等距抽样C.不重复抽样D.重复抽样E.整群抽样回答错误!正确答案: C DA.产品产量指数B.价格指数C.职工人数指数D.商品销售额指数E.产品成本指数回答错误!正确答案: A C EA.综合指数B.数量指标指数C.个体指数D.销售量指数E.总指数回答错误!正确答案: B C DA.也能表明变量之间相关的方向B.与回归系数密切相关C.其数值大小决定有无必要配合回归方程D.是在线形相关条件下测定两个变量间相关关系密切程度的指标E.是测定两个变量间有无相关关系的指标回答错误!正确答案: A B C DA.典型调查B.普查C.全面报表D.抽样调查E.定期报表回答错误!正确答案: A B EA.只能间断计量B.不能直接相加C.可以连续计量D.可以直接相加E.与时间间隔长短无关回答错误!正确答案: A B EA.价格指数B.产品产量指数C.商品销售额指数D.产品成本指数E.职工人数指数回答错误!正确答案: A DA.农作物收获率随着耕作深度的加深而提高B.职工家庭收入不断增长,消费支出也相应增长C.产量大幅度增加,单位成本相应下降D.税率一定,纳税额随销售收入增加而增加E.商品价格一定,销售额随销量增加而增加回答错误!正确答案: A B CA.几何平均数B.算术平均数C.中位数D.调和平均数E.众数回答错误!正确答案: A B DA.无效估计B.近似估计量C.一致估计量D.有偏估计量E.无偏估计量回答错误!正确答案: C EA.如何科学确定目标总体范围B.如何科学地由所抽样本去推断总体C.怎样消除样本对总体代表性误差D.如何科学地从总体中抽样样本E.怎样控制样本对总体的代表性误差回答错误!正确答案: B D EA.性别B.民族C.年龄D.工资E.职务回答错误!正确答案: A B EA.劳动生产率指数B.农副产品收购价格指数C.农副产品产量指数D.价格指数E.商品销售量指数回答错误!正确答案: C EA.指标数值B.总标题C.纵栏标题D.主词E.横行标题回答错误!正确答案: A B C EA.变量数列B.时期数列C.时点数列D.平均数时间数列E.相对数时间数列回答错误!正确答案: C D EA.登记性误差B.代表性误差C.责任心误差D.技术性误差E.系统性回答错误!正确答案: A C DA.是一个小样本B.一个样本有40个单位C.是一个大样本D.样本容量40个E.样本个数40个回答错误!正确答案: B C DA.工业总产值B.商品库存量C.企业固定资产价值D.职工人数E.企业工伤事故情况回答错误!正确答案: A B EA.直接观察法B.问答法C.大量观察法D.报告法E.采访法回答错误!正确答案: A D EA.衡量总体参数的集中程度B.衡量样本统计量与总体参数之间的差距C.衡量样本统计量的集中程度D.衡量样本统计量的离散程度E.衡量总体参数的离散程度回答错误!正确答案: B DA.单相关B.函数关系C.负相关D.正相关E.相关关系回答错误!正确答案: A C EA.无偏性B.综合性C.有效性D.显著性E.一致性回答错误!正确答案: A C EA.一次性调查B.全面调查C.经常性调查D.专门调查E.非全面调查回答错误!正确答案: A B DA.商品流通费用率B.人均国民收入C.人口出生率D.人口密度E.某市每千人拥有病床数回答错误!正确答案: A B C D EA.样本指标也是随机变量B.样本指标随着样本的不同而不同C.总体指标是随机变量D.样本指标的数值不是唯一确定的E.样本指标是样本变量的函数回答错误!正确答案: A B DA.各月末银行存款余额B.历年出生的婴儿数C.历年的工业总产值D.各月商品库存量E.历年年末人数回答错误!正确答案: B CA.假设检验B.点估计C.区间估计D.抽样估计E.近似估计回答错误!正确答案: B CA.指标是说明总体特征的概念B.指标和标志都是变量C.标志是说明总体单位特征的概念D.质量指标是不能用数值表示的E.可变的数量标志是变量回答错误!正确答案: A C EA.基期质量指标B.报告期质量指标C.报告期数量指标D.基期数量指标回答错误!正确答案: A CA.指标数值只能间断计量B.指标数值通过连续登记加总取得C.指标数值的大小与时间长短有直接关系D.指标数值不能直接相加E.指标数值具有可加性回答错误!正确答案: B C EA.某企业为亏损企业B.该市工业企业机器台数为7500台C.该市工业企业职工人数80万人D.某企业资金利润率为30%E.该市工业企业实际产值为110亿元回答错误!正确答案: B C EA.指标数值B.总标题C.纵栏标题D.主词E.横行标题回答错误!正确答案: A B C EA.人均国民收入B.居民家庭收入的中位数C.工人劳动生产率D.全员劳动生产率E.平均工资回答错误!正确答案: B EA.E.定基增长量除以最初水平B.定基发展速度-1C.环比发展速度的连乘积D.环比增长速度的连乘积E.环比增长速度加1后的连乘积再减1回答错误!正确答案: A B EA.累计增长量除以固定水平B.环比发展速度连乘积减去100%C.环比增长速度的连乘积D.定基发展速度减1E.逐期增长量除以固定水平回答错误!正确答案: A B DA.数量性B.同质性C.大量性D.差异性E.客观性回答错误!正确答案: B C DA.总体均值B.允许的估计误差C.总体方差D.置信水平E.总体比例回答错误!正确答案: B C D正确错误回答错误!正确答案: B正确错误回答错误!正确答案: A错误回答错误!正确答案: B正确错误回答错误!正确答案: A错误正确回答错误!正确答案: A正确错误回答错误!正确答案: A错误正确回答错误!正确答案: B错误正确回答错误!正确答案: A正确回答错误!正确答案: B正确错误回答错误!正确答案: B错误正确回答错误!正确答案: B错误正确回答错误!正确答案: A错误正确回答错误!正确答案: A错误正确回答错误!正确答案: A正确回答错误!正确答案: A正确错误回答错误!正确答案: B错误正确回答错误!正确答案: B错误正确回答错误!正确答案: A错误正确回答错误!正确答案: B正确错误回答错误!正确答案: A所选择单位的标志值占总体标志总量的绝大比例,这些单位就是重点单位错误正确回答错误!正确答案: A错误正确回答错误!正确答案: A正确错误回答错误!正确答案: B错误正确回答错误!正确答案: A正确错误回答错误!正确答案: B正确错误回答错误!正确答案: B典型调查中典型单位的选取可以不遵循随机原则错误正确回答错误!正确答案: B正确错误回答错误!正确答案: B正确错误回答错误!正确答案: B错误正确回答错误!正确答案: B错误正确回答错误!正确答案: B错误正确回答错误!正确答案: B对统计总体中的全部单位进行调查称为普查正确错误回答错误!正确答案: A错误正确回答错误!正确答案: A正确错误回答错误!正确答案: B正确错误回答错误!正确答案: B正确错误回答错误!正确答案: A正确错误回答错误!正确答案: A手工汇总中的点线法只能汇总单位数,不能汇总标志值。
统计学考试题及答案(中国人民大学第六版)
统计学一、单选1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计量是A 该校学生的总人数B 该校学生的月月平均生活费支出C 该校学生的生活费总支出D 100名学生的月平均生活费支出2、下列变量中,顺序变量是A职工人数 B产量 C产品等级 D利润总额3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位组成一个样本。
这种抽样方式是A 简单随机抽样B 分层抽样C 整群抽样D 系统抽样4、指出下面陈述中错误的是A 抽样误差只存在于概率抽样中B 非抽样误差只存在于非概率抽样中。
C概率抽样和非概率抽样都存在非抽样误差。
D在普查中存在非抽样误差。
5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图6、当样本量一定时,置信区间的宽度A 随置信水平的增大而减小B随置信水平的增大而增大C与置信水平的大小无关D与置信水平的平方根成反比7、在检验一个正态总体方差时,使用的分布是A z分布B t分布C X 分布D F分布8、指出下面陈述中的错误的是A 抽样误差可以避免B 抽样误差不可避免C 非抽样误差可以避免D 抽样误差可以控制9、假设检验中,如果计算出的P值越小,说明检验的结果越A 真实B 不真实C 显著D 不真实10、双因素方差分析涉及 自变量A 一个分类型B 一个数值型C 两个分类型D 两个数值型二、填空题1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内2、对于一组具有单峰分布的数据而言,当数据的m m >时,可判断数据是(左偏)分布3、连续变量在编制组距式变量数列时,其相邻两组的上下限必须重叠。
为解决不重的问题,应按照( 上组限不在内 )的规定确定数据所在的组4、单因素方差分析中,组间平方和SSA 对应的自由度为( k-1 ),组内平方和SSE 对应的自由度( n-k )5、数值型变量根据其取值的不同,可分为( 连续 )型变量和(离散 )型变量。
人大统计学考研历年真题(03-09)参考答案
人大统计学考研历年真题参考解答精华版(03-09)2009年人大统计学专业课初试题参考解答一、设第一、二个总体均值分别为1μ与2μ,样本均值分别为1X 与2X ,样本方差分别为21S 与22S 。
1.构造原假设和备择假设012112:0:0H H μμμμ-≤↔->2.构造统计量。
由于两总体方差相等,且均为正态总体,则可以构造如下检验统计量:t =其中222112212(1)(1)1564354953.521535pn S n S S n n -+-⨯+⨯===+-+ 则446 1.82017.31447.2111t ⨯⨯===⨯ 3.计算临界值。
给定显著性水平α,如0.05α=,计算临界值120.05(2)(50)t n n t α+-=,由于50>30,则0.050.05(50) 1.645t z ≈=。
4.做出决策。
由于 1.8201 1.645t =>,故拒绝原假设,即认为12μμ>。
二、1.对于回归模型Y X βε=+,β的最小二乘估计为:'1'()X X X y β-=。
现在来看它的期望'1''1''1''1''1'()[()]()()()()()(())()()E E X X X y X X X E y X X X E X X X X X E X X X E ββεβεβε-----===+=+=+ 从上面可以看出,要使β为无偏估计,则必须满足()0E ε=,所以只有当()0E ε≠时,β才为有偏估计。
2.使()0E ε≠的原因:①遗漏了关键自变量,即全模型正确时,而我们误用了选模型。
用选模型建模时,使得误差项中含有遗漏自变量的信息,从而期望不为零。
证明过程如下证明:假设正确模型为Y X βε=+,令(,)p t X X X =,p t βββ⎛⎫= ⎪⎝⎭。
而我们选用了模型p p Y X βε=+来估计β,得到'1'()p p p p X X X y β-=,则'1''1''1''1''1'()[()]()()() ()(,) ()p p p p p p p p p p p p p p p t t p p p p t t E E X X X y X X X E y X X X X X X X X X X X X X ββββββ-----===⎛⎫= ⎪⎝⎭=+从上式可以看出p β是p β的有偏估计。
人大博士统计学试题(02-05)
招生专业:统计学 考试科目:统计学考试时间:3月31日上午1、 试述统计中常用的几种概率分布,它们的特点、作用以及它们之间的关系。
(20分)2、 请论证(论述)下列问题:(1) 怎样理解置信度1-α的意义? (9分) (2) 如何理解区间估计中的精度和可靠性? (8分) (3) 怎样处理区间估计中精度和可靠性的矛盾? (8分)3、 药厂生产一种新的止痛片,厂方希望验证服用新药片后至开始起作用的时间间隔比原先止痛药片至少缩短一半,因此厂方提出需要检验的假设:012112:2:2H u u H u u =>此处,μ1、μ2分别是服用原止痛药片和新止痛药片后至开始起作用的时间间隔的总体均值。
设两总体均为正态且方差分别为已知值21σ和22σ。
现分别从两总体中抽取一样本121,,......,n x x x 和122,,......,n y y y ,设两个样本独立,取显著性水平为α,请给出上述假设0H 的拒绝域。
(15分)4、 谈谈你对方差分析的理解,并举例说明其在实际中的应用。
(20分)5、 在一般的线性回归分析中,对回归模型t t t y x αβε=++有哪些基本假设?试加以解释和说明。
(20分)招生专业:统计学 考试科目:统计学考试时间:3月23日上午1、(10分)设随机变量ξ在区间(1,6)上服从均匀分布,求方程210x x ξ++=有实根的概率。
2、(15分)设随机变量ξ的密度函数为(),xp x Ae x -=-∞<<∞。
求:(1)系数A :(2)ξ落在区间(0,1)内的概率; (3)ξ的分布函数。
3、(20分)从总体X 中抽取样本X 1,X 2,X 3,证明下列三个统计量:3121236X X X u ∧=++,3122244X X X u ∧=++,3123333X X X u ∧=++都是总体均值E(X)的无偏估计量,并确定哪个估计量更有效。
4、(15分)甲乙两台机床加工同一种零件,设这两台机床加工的零件外径服从正态分布,标准差120.2,0.4σσ==。
2007年中国人民大学805统计学考研真题
2007年人大统计学专业课初试题参考解答一、(1)①需假定总体是正态总体。
②不能用数据证明。
数据至多只能检验该数据的分布是否接近正态分布,而不能从理论上证明或肯定它一定就来自正态分布总体,即正态性检验不能提供不拒绝正态性原假设的结论。
③不是。
该区间是确定的区间,要么覆盖真实总体均值,要么不覆盖,没有概率可言。
它是置信度为95%的随机置信区间的一个样本实现,后者才是以95%的概率覆盖真实总体均值。
(2)①需假定:总体服从正态分布;总体方差未知;样本量较小(一般 30)。
②不能。
“接受零假设”的说法是不妥的,否则就得负责任的给出犯第二类错误的概率,而该检验的备选假设是“总体均值>4.8克”,据此是无法算出此概率的。
所以只能说,在显著水平为0.05时利用该数据进行检验不足以拒绝零假设,不拒绝不等同于接受。
二、(1)不是。
因为只有员工看到并愿意答复电子邮件时才有机会进入样本,所以每个员工入样的概率并不一样,这其实是一种非概率抽样。
(2)①不对。
不说实话只是产生响应误差的原因之一,而被调查者与调查者两方面的因素,都有可能导致响应误差。
调查者不当的引导或者问卷设计不科学或者被调查者知识的局限性,都可能使被调查者对要回答的问题的理解产生偏差,这时候即使他(她)说了“实话”,也会产生响应误差,因为这不是我们想要的“实话”。
另外,拒绝回答也是一种重要原因。
②随机误差是不可以避免的,因为它是由抽样的随机性造成的,是客观的。
(3)整体来说是不独立的。
因为同一个网络公司员工加班时间一般是不独立的,而不同网络公司员工加班时间一般是独立的。
三、(1)令自驾车上班人数比例为π,由于不能轻易否定原结论,则检验假设为:01:30%:30%H H ππ≥⎧⎨<⎩ (2)①令样本量为n ,其中驾车上班人数为X ,假定X 服从二项分布(,0.3)B n ,X 的样本值为0x ,则00{}{0}{1}{}p P X x P X P X P X x =≤==+=++=L 值②检验统计量0~(0,1)H Z N =。
人大805统计学真题
15年真题1.一1000住户的小区,每户人家没车的概率0.1,有一辆车的概率0.7,有两辆车的概率0.2,问应该设多少停车位才能有95%以上的概率使小区的每辆车都有车位。
2. 证明多元回归分析中最小二乘估计具有最小方差线性无偏性。
3. 有一件什么事抽了100个人,分别给出了其中没有投诉,投诉一次,两次,三次,大于等于四次的具体人数,用卡方拟合检验判断其是否符合均值为1的泊松分布。
再假设确实服从泊松分布,求泊松分布参数的极大似然估计。
4. 假设检验中的p值指什么,用p值和用统计量进行检验有什么不同,再举例说明为什么假设检验不能证明原假设的正确性。
5. A袋中有编号1到n的n个红球,B袋中有n个篮球,每次从A中取出一个球后再从B 中取一个球放入A中(若B中取完则只取A),问A中取出的最后一个球为红球的概率。
6. 从五个正态总体中一共抽取五组样本,有一张表给出了每组样本的样本容量以及偏差平方和,假设这五个正态总体具有相同的方差,求方差95%的置信区间。
7. 现要研究位置(居民区商业区某某区)和竞争者数量(0 1 2 3)对销售额的大小有无影响,给出具体的做法。
14年真题1.证明概率的题,和13年真题差不多,比13年简单,方法也差不多2.计算某条件分布为二元正态分布3.半道证明依概率收敛,剩下半道我记不清了4.利用统计思想证明下面一个积分,被积函数我记不清了,积分最后是dx1dx2...dxn,我觉得这是这次最恶心的一道题,无从下手,大家可以上网找找类似的5.写出广义似然比检验量,并利用此检验量检验下面的假设,一道假设检验的题,检验内容不难,关键是要知道广义似然比检验量是什么6.统计决策中的风险函数和损失函数是什么,剩下半道好像还有点贝叶斯的什么函数我记不太清了7.最大似然估计和贝叶斯后验估计的区别和联系8.写出列联表检验全部过程9.普通的一个假设检验,应该是两总体均值情况中,两个总体方差均未知,样本量为10的近似t检验2013年人大统计学、精算学专业课试题(回忆版)一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。
人大统计学真题03-06
2006年人大统计专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。
为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。
现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;(3)利用P值进行检验和利用统计量进行检验有什么不同?(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。
为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。
根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:差异源SS df MS F P-value F crit行 列 误差 总计1.55 3.48 0.14 5.174 2 8 140.39 1.74 0.0221.72 97.680.000236 0.0000027.01 8.65(1)不同的车速对磨损程度是否有显著影响?(2)不同供应商的轮胎之间磨损程度是否显著差异? (3)在上面的分析中,你都做了哪些假设?四、(15分)说明什么条件下适合采取简单随机抽样? 五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。
高等统计学考题-人大精简版
一、多项选择题(每题4分,一共20分,每题要求:选择正确答案,对选择或未选答案进行简要而清晰的原因解释。
将答案填写在答题纸上,填写在试题上无效。
得分规则:选对并对答案解释合理,得4分;没有对未选答案解释最多得2分;漏选得1分,选错可参考解释酌情给分;不选得0分)1.有关样本的分布,以下陈述正确的是:ABCA. 如果样本X 1,…,X n 独立同分布来自Gamma 分布,∑==ni i X n X 11在大样本下有近似的正态分布;【对。
满足中央极限定理条件】B.如果样本X 1,…,X n 独立同分布来自N (2,σμ),∑==ni i X n X 11在大样本情况下有精确分布N (n /,2σμ);【对。
独立同分布正态随机变量的均值仍是正态分布,方差值符合中央极限定理】C.如果样本X 1,…,X n 独立同分布来自N (2,σμ),即使样本量不大,∑==ni i X n X 11也服从正态分布;【对。
独立同分布正态随机变量的均值仍是正态分布】D.如果样本X 1,…,X n 来自任意分布,在大样本情况下,由X 1,…,X n 组成的数据有近似的正态分布;【错。
如果X 1,…,X n 强相关,则不成立;即使i.i.d 情况下也不是任意的数据组成方式都是正态分布】2.有关检验的p 值,下面说法正确的是:CA. 一般为[0,0.1]之间的一个很小的概率;【错。
p 值是计算得出的概率,取值0-1之间】 B. 接受备择假设的最小显著性水平; 【错。
接受备择假设说法不准确】C. 如果p 值小于显著性水平,则拒绝零假设; 【对。
符合假设检验规则】D. 样本统计量的分布函数。
【错。
p 值根据检验统计量分布函数计算得出】(卷3)5.有关检验的p值,下面说法正确的是:CDA.一般为[0,0.1]之间一个较小的概率;【错。
检验结果不拒绝原假设的情况下,p值较大】B.接受备择假设的最小显著性水平;【错。
接受备择假设说法不准确】C.如果p值小于显著性水平,则拒绝零假设;【对。
统计初级试题及答案
统计初级试题及答案一、单选题(每题1分,共10分)1. 统计学是研究什么的科学?A. 社会现象B. 自然现象C. 数据收集、处理、分析和解释D. 经济政策答案:C2. 下列哪项不是描述统计学的主要特征?A. 描述性B. 推断性C. 预测性D. 规范性答案:D3. 以下哪个选项不是统计数据的类型?A. 定类数据B. 定序数据C. 定距数据D. 定比数据答案:B4. 简单随机抽样是指什么?A. 每个样本单位被抽中的概率相等B. 样本单位按照一定的顺序抽取C. 样本单位按照大小顺序抽取D. 样本单位按照随机数抽取答案:A5. 以下哪个选项不是统计图表的类型?A. 条形图B. 饼图C. 折线图D. 表格答案:D6. 总体参数与样本统计量之间的关系是什么?A. 完全相同B. 近似相等C. 完全不同D. 没有关系答案:B7. 相关系数的取值范围是多少?A. -1到1之间B. 0到1之间C. 1到10之间D. 任意实数答案:A8. 以下哪个选项不是统计学中的假设检验?A. t检验B. 方差分析C. 回归分析D. 卡方检验答案:C9. 以下哪个选项不是概率分布?A. 二项分布B. 正态分布C. 泊松分布D. 指数分布答案:D10. 以下哪个选项不是描述数据集中趋势的度量?A. 平均数B. 中位数C. 众数D. 方差答案:D二、多选题(每题2分,共10分)1. 以下哪些是统计学的主要分支?A. 描述统计学B. 推断统计学C. 应用统计学D. 理论统计学答案:A、B、C、D2. 以下哪些是统计数据的类型?A. 定类数据B. 定序数据C. 定距数据D. 定比数据答案:A、B、C、D3. 以下哪些是统计图表的类型?A. 条形图B. 饼图C. 折线图D. 表格答案:A、B、C4. 以下哪些是描述数据离散程度的度量?A. 方差B. 标准差C. 极差D. 变异系数答案:A、B、C、D5. 以下哪些是统计学中的假设检验?A. t检验B. 方差分析C. 回归分析D. 卡方检验答案:A、B、D三、判断题(每题1分,共10分)1. 统计学是一门应用广泛的学科。
中国人民大学统计学试题库(2011年7月更新)
)
A、是连续不断的
B、是以整数断开的 C、用测量或计算方法取得
D、相邻两值之间可取无限数值
E、相邻两值之间不可能有小数
10、总体、总体单位、标志、指标间的相互关系表现为:(
)
A、没有总体单位就没有总体,总体单位不能离开总体而存在
B、总体单位是标志的承担者
C、统计指标的数值来源于标志
D、指标是说明总体特征的,标志是说明总体单位特征的
入该组。
9、次数分布有两种表现方法,一种是用表格表示,另一种是用图表示。
10、统计整理就是对统计资料进行汇总、加工处理。
11、能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。
三、单项选择题
3、在分布数列中,各组单位数与总体单位数的比率称为
,又称为比重或百分比。
4、变量值中最大值与最小值的差额称为
;在组距数列中,各组上限与下限的差额
称为
。
5、统计汇总技术主要有
和
两种形式。
6、统计表从形式上看,由
、
、
和
四部分构成;从内
容上看,由
和
两部分构成。
7、统计表按主词是否分组和分组程度可分为
、
和
。
)
A、标志 B、指标 C、变异 D、变量
10、一个统计总体(
)
A、只能有一个标志 B、只能有一个指标
C、可以有多个标志 D、可以有多个指标
11、统计对总体数量的认识是(
)
A、从总体到单位 B、从单位到总体
C、从定量到定性 D、以上都对
12、变量是可变的(
)
A、品质标志 B、数量标志 C、数量标志和指标 D、质量指标
于(
2022年中国人民大学432统计学考研真题和答案
2022年中国人民大学432统计学考研真题和答案2022年中国人民大学《432统计学》考研全套内容简介•中国人民大学统计学院《432统计学》[专业硕士]历年考研真题汇总•全国名校应用统计硕士《432统计学》考研真题精选及详解•应用统计硕士《432统计学》名校考研真题(2017年前)详解说明:本部分收录了本科目近年考研真题,方便了解出题风格、难度及命题点。
此外提供了相关院校考研真题,部分真题提供了视频讲解。
2.教材教辅•贾俊平《统计学》(第7版)笔记和课后习题(含考研真题)详解•贾俊平《统计学》(第7版)考研真题(含复试)与典型习题详解说明:以上为本科目参考教材配套的辅导资料。
•试看部分内容第一部分统计学第1章统计数据的搜集一、单项选择题1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。
[河海大学2020研]A.简单随机抽样B.分层抽样C.自愿抽样D.方便抽样【答案】D查看答案【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。
例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。
2将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]A.等距抽样B.整群抽样C.类型抽样D.纯随机抽样【答案】C查看答案【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。
等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。
3某机构十分关心小学生每周看电视的时间。
该机构随机抽取30 0名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是()。
[山东大学2018研] A.概率抽样调查B.观察调查C.实验调查D.公开发表的资料【答案】A查看答案【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。
中国人民大学统计专业课初试题
2007年人大统计专业课初试题一、(20分)下面是一种零件误差的数据(单位:克):6.14.7 6.5 6.27.76.45.57.16.1 5.35.76.1 5.3 4.0 4.83.23.9 1.94.9 3.85.32.6 5.3 5.5 5.82.7 6.87.4 5.63.3(1)根据涉及t 分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。
请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法。
(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。
如果进行t 检验,需要假定哪些条件?t 检验结果为p 值等于0.0807。
能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?统计学:假设检验答:(1)在对总体均值进行区间估计时,需要考虑总体是否为正态分布、总体方差是否已知、用于构造估计量的样本是大样本(30n ≥)还是小样本(30n <)等几种情况。
当总体是正态总体,方差已知或非正态总体,大样本时,样本均值x 的抽样分布为正态分布。
当总体是正态总体,但总体方差未知,而且是小样本时,则需要用样本方差代替总体方差,此时需要用t 分布来建立总体均值μ的置信区间。
该题目中所涉及的正是第二种情况,因此若使该置信区间有意义,需要对总体进行正态分布的假定。
这种假定是可以用数据证明的。
例如可以通过Q-Q 图来大致验证这批数据是否来自正态分布的总体。
总体均值95%置信区间,不代表区间(4.637785,5.728882)以0.95的概率覆盖真实总体均值。
样本确定,置信区间亦随之确定,就不再是一个随机区间,而是一个确定的区间,这个确定的区间要么包含总体真值,要么不包含总体真值,不存在以某种概率覆盖真实总体均值,所以“该区间以0.95的概率覆盖真实总体均值”这种说法是不对的。
人大统计学真题07-09
2009年人大统计学专业课初试题一、有两个正态总体,均值和方差未知,但已知方差相等。
从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。
如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。
三、周期过程人=Acos(、•,其中频率••和振幅A都是常数,而相位是一个在区间卜n , n ]上服从均匀分布的随机变量。
问{XJ是否平稳?说明原因。
四、把一个总体分为三层,各层的权重和预估的比例见下表。
待估计的参数为总体比例。
如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。
(假设各层总体单位数量N h 都充分大,忽略“有限总体校正系数”)五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。
六、若有线性回归模型%「°「1人• ;t (t =1,2,…,n),其中EG戸0,EG2)-*,E(;「s) " (t^s),则(1)该模型是否违背古典线性回归模型的假定?请简要说明。
(2)如果对该模型进行估计,你会采用什么方法?请说明理由。
七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。
第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。
每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。
对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。
假定40只白鼠的初始活动状态相同。
请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。
1分表示非常不满意,100分表示非常满意。
人民大学《统计学》题库及答案
1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:12中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:23中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:3一、(20分)在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。
(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置平均数:一组数据相加后除以数据的个数得到的结果。
若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会比较大。
(如中国选手发挥很稳定,适合使用平均数判断其成绩)中位数:一组数据排序后处于中间位置上的变量值,但不受极端值的影响。
(如波兰选手大多数成绩比较平均,但有一枪打到8.1,会严重影响其平均值,但不会影响中位数)(2)离散程度:各变量值远离其中心值的程度,它可以反映选手发挥的稳定性标准差:方差的平方根,能够很好的反映出数据的离散程度,若选4中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:45中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:56中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:67中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:78中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:8一、(20分)在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。
人大统计学专业课初试题
2003年人大统计学专业课初试题一、(15分)考虑两个国家之间按GDP进行经济比较。
假定在既定汇率水平上,甲国GDP与乙国GDP之间的比例为1:20。
一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。
请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应用国际收支平衡表原理判断当期国际收支的顺、逆差状况。
三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。
要求:(1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分)(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。
(15分)四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。
公司为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块四。
经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):(1)将方差分析表中划线部分的数值补齐;(6)(2)分析小麦品种对产量的影响是否显著;(4)(3)分析不同地块对产量的影响是否显著;(4)(4)在产量变动的差异中,被品种所解释的百分比是多少?(3)(5)在产量变动的差异中,被地块所解释的百分比是多少?(3)(6)上面的分析包含哪些假定?(10)五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。
某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。
公司领导想知道本公司职工是否比其他单位的职工更容易生病。
(1)公司领导感兴趣的原假设和替换假设是什么?(3)(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。
2013年人大805统计学初试真题与解答
1 2
解:难题,我们先搞清楚这个抽球的过程:
开始
取出一个球 记下颜色
放回
丢掉这个球
再取出一个球
丢掉这个球
No
比较这个球和上一 个球的颜色
Yes
我们发现抽完所有 (a b) 个球所需的总次数是不确定的,举个例子, a 2, b 1 的 情况, 如果抽取顺序是红-红-白-白, 则 4 次抽完, 如果抽取顺序是红白红白白, 则 5 次抽完,经典的抽球模型难以套用,考虑用数学归纳法来证明结论: 设 P( x, y) 为有 x 个红球、 y 个白球时,最后摸到的是红球的概率,则
i 1
i
(i 1)!
e / (1 e )
1 j e 1 e j 0 j !
1 e
第四题: (2n 1) 个独立同分布样本,分布函数是 F ( x) ,求中位数 x( n 1) 的分布。 解: f( n1) ( x)
(2n 1)! [ F ( x)]n [1 F ( x)]n f ( x) n! n!
小结:次序统计量的知识详见茆诗松《概率论与数理统计教程》p273. 第五题:设走进某商店的顾客数是均值为 50 的随机变量,又设这些顾客所花的
钱数是相互独立的、均值为 100 元的随机变量, 再设任一顾客所花的钱数和进入 该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 解: EN 50
P(0,步记为一轮摸球。
(i) 表示第一轮扔掉 i 个红球的概率;
( j ) 表示第一轮扔掉 j 个白球的概率。
P(1,1) (1) P(0,1) (1) P(1,0)
1 2
P( x, y) ( x) P(0, y) ( x 1) P(1, y) ... (1) P( x 1, y)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2003年人大统计学专业课初试题一、(15分)考虑两个国家之间按GDP进行经济比较。
假定在既定汇率水平上,甲国GDP与乙国GDP之间的比例为1:20。
一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。
请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应用国际收支平衡表原理判断当期国际收支的顺、逆差状况。
三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。
要求:(1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分)(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。
(15分)四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。
公司为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块四。
经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):(1)将方差分析表中划线部分的数值补齐;(6)(2)分析小麦品种对产量的影响是否显著;(4)(3)分析不同地块对产量的影响是否显著;(4)(4)在产量变动的差异中,被品种所解释的百分比是多少?(3)(5)在产量变动的差异中,被地块所解释的百分比是多少?(3)(6)上面的分析包含哪些假定?(10)五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。
某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。
公司领导想知道本公司职工是否比其他单位的职工更容易生病。
(1)公司领导感兴趣的原假设和替换假设是什么?(3)(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。
(10)(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)(3)在假设检验中,P值代表什么含义?(6)(4)在本例中,P=0.001说明了什么?(3)(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。
(8)六、(30分)关于回归分析讨论下列问题:(1)画出回归建模步骤的流程图;(7)(2)简要描述各个步骤的内容;(8)(3)设1ˆ()X X X yβ-''=是多元回归方程参数的最小二乘估计,证明21ˆ()()D X Xβσ-'=;(8)(4)由21ˆ()()D X Xβσ-'=,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)2004年人大统计学专业课初试题本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。
第一部分必答题1.(25分)下面是A、B两个班学生的数学考试成绩数据:A班:55 76 66 85 75 62 79 73 93 7667 85 74 61 78 71 92 79 65 8373 57 77 70 90 75 63 81 73 96B班:34 71 56 90 66 48 81 58 96 7155 85 62 44 79 57 95 68 54 8461 39 73 57 94 68 51 82 61 100(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;(2)两个班考试成绩的描述统计量如下,试进行比较分析:(3)要判断考试成绩是否有离群点,可使用哪些方法?(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。
通过Excel进行方差分析得到下面的部分结果:方差分析表(1)完成上面的方差分析表;(2)若显著性水平α=0.05,检验三种方法组装的产品数量之间是否有显著性差异;(3)在上面的方差分析中包含了哪些基本假定?(4)简述多重比较的前提和作用。
3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为H0:p=1/2;H1:p=1/5。
从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。
试给出以下内容:(1)总体及其分布;(2)样本量n;(3)拒绝域;(4)第一类错误的概率。
4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。
5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。
第二部分选答题(在下面五道题中任选三道题)6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。
要求:(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。
中国国民经济核算有关资料单位:亿元7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的《内地与香港关于建立更紧密经贸关系的安排》。
其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。
可以预见,由此将大大促进香港对内地的贸易和投资活动。
要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。
(说明:根据目前中国国民经济核算,仍将香港作为“非常住单位”,即作为“境外”看待。
)8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:(1)计算有关指标,描述该地区人口基本结构状况;(2)计算有关指标,描述该地区人口变动状况;(3)计算有关指标,描述该地区劳动就业状况。
单位:万人9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。
已知预定利率为5%,q30=0.02,q31=0.03,q32=0.04,,假设费用发生在保年初,各年费用为:年份每份保单每1000元保额占总保费的比例1 10 2.5 0.102 5 1.0 0.053 5 1.0 —赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。
计算:(1)每年总保费;(2)第一年在总保费下的责任准备金。
10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利率假设恒定为4%。
(1)求退休时个人账户的累计额;(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。
2005年人大统计学专业课初试题一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据(1)画出该组数据的茎叶图;(2)画出该组数据的箱线图;(3)根据茎叶图和箱线图说明上网者年龄分布的特征。
二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。
要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法? 三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:平均 107 标准误差 4.99 样本标准差 29.96 样本方差 897.77(1)确定餐馆月平均用水量95%的置信区间;(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因; (3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。
(z0.05=1.645, z0.025=1.96,t0.05=1.69,t0.025=2.03) 四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y )与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。
为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):15 19 22 24 3016 19 22 24 3117 20 23 25 3418 20 23 27 3819 21 23 29 41(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;(2)检验回归方程的线性关系是否显著;(3)检验各回归系是否显著;(4)计算多重判定系数R2,并说明它的实际意义;(5)计算估计标准误差sy,并说明它的实际意义;(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。
五、(42分)假设一个已知简单总体的全部真实数据列于下表:(1)绘出散点图;(2)如果根据Y的数值将总体分成两个子总体,最好的分发是什么?(3)举例说明上表数据所反映的现象可能是什么?(4)计算出Y的总体均值Y和总体方差S2;(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;(7)计算每一种方式在此情形下的设计效应,并说明其意义。
六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。
七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。
八、(9分)A、B两个地区的贫困线均为年收入1000元。
A地区有11%的人年收入900元,9%的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。
(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2)(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4)(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进(3)九、(15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):(1)在表中括号内填上适当的数字;(3)(2)请解释储备资产所对应的-125亿元的含义;(3)(3)根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系(6)(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3)2006年人大统计学专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。