黄良文《统计学》课后习题(参数估计)【圣才出品】
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第9章 相关与回归分析 【圣才出品】
把判定系数的平方根定义为相关系数,就是要使得当变量间正相关时,相关系数就取正 号,等于判定系数的算术平方根;当变量间负相关时,相关系数就取负号。
(2)相关关系的显著性检验 两个变量 X 和 Y 成对数据的所有可能取值构成了一个总体,称为二元总体,一般情况
3 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
这种相关关系不是线性形式。 若变量 Y 随着 X 的增加而增加,则相关关系称为正相关;若 Y 随着 X 的增加而减少,
则相关关系称为负相关。 (1)相关关系的度量 ①总变差的平方和分解
2
设数据点为(X1,Y1),(X2,Y2),…,(XN ,YN)变量 Y 的总变差定义为 Y Y
③指数曲线:Y=abx 或 logY=loga+(logb)X ④几何曲线:Y=aXb 或 logY=loga+blogX 以上这些方程只要进行适当的变量替换,都可以转化为变量的线性形式。 (2)最小二乘法 在一组给定数据的所有拟合曲线中,若某曲线使得其偏差平方和 D12 D22 DN2 达 到最小,则称该曲线为最佳拟合曲线。 使残差平方和 D12 D22 DN2 达到最小的这一要求称为最小二乘法,因此最佳拟合 曲线也称为最小二乘曲线。特别地,最佳拟合直线称为最小二乘直线,最佳拟合二次曲线(抛 物线)称为最小二乘抛物线。 ①最小二乘直线 设接近一系列点(X1,Y1,),(X2,Y2),…,(XN,YN)的最小二乘直线方程为:
它服从自由度为 N-2 的 t 分布。 (3)分类变量间的相关系数 用这个 2 统计量可以定义两个分类变量的相关系数:
黄良文《统计学》课后习题-第一章至第八章【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
其存在的意义。所以统计学的研究对象就是统计数据。
1.7 统计学的对象有什么特点,其中社会经济统计学的对象包括那些内容,又有什么 特点?
答:统计学的研究对象是客观现象总体数量的数量特征和数量关系。其具有的特点包括: (1)统计研究对象的基本特征是它的数量性。统计研究是运用各种数据来反映客观事 物量的类型、量的顺序、量的大小、量的关系等等。统计研究就是对事物认识的深化和具体 化,而“数字是统计的语言”。 (2)统计研究对象具有总体性的特点。统计研究要对总体中各单位普遍存在的事实进 行大量观察和综合分析,得出反映现象总体的数量特征。 (3)统计研究对象具有单位的变异性。统计研究同类现象总体的数量特征,它的前提 则是总体各单位的特征表现存在着差异,而且这种差异是随机的。 社会经济统计学的研究对象是社会经济现象的数量特征和数量关系。也要研究自然技术 因素对社会生产生活变化的影响,研究社会生产、生活的发展变化对自然、环境的影响。 社会经济统计学的研究对象除了具有上述的数量性、总体性、变异性外还具有社会性的 特点。
1.2 统计学是怎样产生和发展的? 答:统计学是统计实践的经验总结,又是指导统计实践活动的科学。在历史上漫长的时 间各国虽然有统计活动但未曾出现统计学,只有当统计活动发展到一定程度,积累了一定的 材料、经验和方法才可能产生统计学。
1 / 98
圣才电子书 十万种考研考证电子书、题库视频学习平台
小、量的关系等等。
(2)总体性。统计研究要对总体中各单位普遍存在的事实进行大量观察和综合分析,
得出反映现象总体的数量特征。
(3)单位的变异性。统计研究同类现象总体的数量特征,它的前提则是总体各单位的
黄良文《统计学》章节题库(参数估计)【圣才出品】
黄良文《统计学》章节题库第6章参数估计一、单项选择题1.无偏估计是指()。
A.样本估计值等于总体真值B.估计量的方差最小C.估计量的误差趋近于0D.估计量的期望等于总体真值【答案】D【解析】设总体参数为θ,估计量为θ,θθ=)ˆ(E ,则称θ为θ的无偏估计。
由θθ=)ˆ(E ,可知估计量θ的期望等于总体的真值θ。
2.一个估计量的有效性是指()。
A.该估计量的数学期望等于被估计的总体参数B.该估计量的一个具体数值等于被估计的总体参数C.该估计量的方差比其他估计量大D.该估计量的方差比其他估计量小【答案】D【解析】有效性是指对同一总体参数的两个无偏估计,有更小标准差的估计量更有效。
3.在一所规模较大的高中学校里,全体注册学生的年龄分布未知,但在一个400名学生的简单随机样本中,发现200人年龄超过15岁,下列判断正确的是()。
A.恰好全体注册学生的50%超过15岁B.全体注册学生中约50%超过15岁,但可能偏离少许百分点C.全体注册学生中约50%超过15岁,但可能偏离10或20个百分点D.无法判断【答案】B【解析】点估计是根据样本数据计算的一个估计值。
点估计的优点在于它能够明确地估计总体参数,但一般该值不会等于总体参数的真值。
4.一个95%的置信区间是指()。
A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数【答案】C【解析】对于置信区间的理解,要注意:①置信水平为95%的置信区间指在用某种方法构造的所有区间中,有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值;②总体参数的真值是固定的,未知的,而样本构造的区间则是不固定的。
置信区间是一个随机区间;③95%这个概率不是用来描述某个特定的区间包含总体参数真值可能性的,而是针对随机区间而言。
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第1章 导 论【圣才出品】
第1章导论1.1复习笔记一、统计学的对象和方法1.统计和统计学(1)统计工作的产生和发展统计工作就是通过社会调查或科学实验,搜集客观现象的现实数据,用来描述和分析自然、社会、经济、政治、文化现象的变化情况。
其产生和发展过程包括:①适应市场经济的发展以及国家对外扩张的需要,大大拓展了统计的活动范围。
②设立统计专业机构,促成统计活动专业化、独立化。
③统计方法的完善,大大提高了统计的认识能力。
④电子计算技术为统计活动的现代化进程提供了手段。
(2)统计学的产生和发展最初的统计学是作为国家重大事项的记述。
这一学派称为国势学派或记述学派,其创始人是17、18世纪德国的海尔曼·康令(H.Conring,1606—1681)和高特弗洛里特·阿亨瓦尔(G.Achenwall,1719—1772)。
经历18世纪到19世纪中叶,把概率论引入统计学,使统计方法发生了重大的飞跃。
其代表人物有法国的拉普拉斯(place,1749—1827)和比利时统计学家阿道夫·凯特勒(A.Quetelet,1796—1874)。
政治算术派是以总体数量比较的方法对社会经济问题进行分析,代表人物有威廉·配第(W.Petty,1623—1687)和约翰·格朗特(J.Graunt,1620—1674)。
此后,应用概率论研究随机现象数量规律的数理统计方法及其在各个领域的应用迅速得到发展。
描述统计学以卡尔·皮尔逊(K.Pearson,1857—1936)为代表,到了20世纪20年代的推断统计学以费歇尔(R.A.Fisher,1880一1962)为创始人。
2.统计学的研究对象统计学的研究对象是指统计研究所要认识的事物客体。
统计对象的特点包括数量性、总体性、单位的变异性的特点。
而社会经济统计学的研究对象除了具有上述的数量性、总体性、变异性外还具有社会性。
3.统计学的研究方法(1)统计的组织系统①统计的社会系统统计活动系统包括统计主体、统计客体和统计宿体三个组成部分。
《统计学考研题库》【章节题库+名校考研真题+模拟试题】参数估计【圣才出品】
第7章参数估计一、单项选择题1.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为()。
[山东大学2015研] A.无偏性B.有效性C.一致性D.充分性【答案】B【解析】有效性是指对同一总体参数的无偏估计量,有更小标准差的估计量更有效,即估计量与总体参数的离差越小越好。
2.一项研究表明,大公司的女性管理人员与小公司的女性管理人员颇为相似。
该项研究抽取了两个独立的随机样本,小公司抽取86名女性经理,大公司抽取91名女性经理,根据若干个与工作有关的变量做了比较,其中所提出的一个问题是“如果有机会的话,你是否会改变所从事的工作?”小公司的86名经理中有65人作了否定回答,大公司的91名经理中有51人作了否定回答。
两组女性经理中有机会改变工作的比例之差的95%的置信区间为()。
[山东大学2015研]A.0.195±0.017B.0.195±0.117C.0.195±0.127D.0.195±0.137【答案】D【解析】当两个总体比例π1和π2未知时,可用样本比例p 1和p 2来代替,根据正态分布建立的两个总体比例之差π1-π2在1-α置信水平下的置信区间为:()()()112212121140402121(1)(1)402191918686() 1.960.195+91860.1918376a p p p p p p z n n ---±+=±--=-±3.关于最大似然估计量和无偏估计量的叙述,下列正确的是()[中山大学2014研]A .若T 为参数θ的最大似然估计量,则g (T )为g (θ)的最大似然估计量B .若T 为参数θ的无偏估计量,则g (T )为g (θ)的无偏估计量C .最大似然估计量和无偏估计量总是唯一的D .以上皆非【答案】D【解析】A 项,由最大似然估计的不变性,若ˆq 是q 的最大似然估计,g (θ)是q 的连续函数,则g (θ)的最大似然估计为()ˆg q 。
黄良文《统计学》课后习题(方差分析)【圣才出品】
各水平均值分别为 X1g 67.8,X 2g 83.2, X 3g 73.6 。 利用 Excel 可得方差分析表,如表 8-4 所示。
表 8-4 方差分析表
3/7
圣才电子书 十万种考研考证电子书、题库视频学习平台
差异源
SS
df
MS
F
P-value
组间
604.93
SS
df
MS
F
P-value
组间
52.62
4
13.16
4.72
0.0105
组内
44.62
16
2.79
—
—
总计
97.24
20
—
—
—
对于 5%的显著性水平,F=4.72>F0.05(4,16)=3.01,因此拒绝原假设,认为不同 品牌的汽油间是存在显著差异的。
同。各水平均值分别为
X1g 13.4, X 2g 13.667,X 3g 11.75, X 4g 16, X 5g 12 。
利用 Excel 可得方差分析表,如表 8-6 所示。
4/7
圣才电子书
十万种考研考证电子书、题库视频学习平台
表 8-6 方差分析表
差异源
(N=4)。各水平均值分别为:
X1g
20
12
15 4
19
16.5
X
2g
17
14
4
12
15
14.5
X 3g
23
16
18 4
14
17.75
X
4g
15
17
4
20
12
16
X 5g
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第14章 统计综合评价 【圣才出品】
以上各式中的 xij 是对第 i 个参评单位、第 j 项逆指标的实际值进行转化后生成的正指标 数值, xij 是第 i 个参评单位、第 j 项评价指标的实际值。i =1,2,…,m;j=1,2,…,n。
②适指标转化为正指标
设某一适度指标的理想值为 a,则 xij 与 a 的距离越小越好,因此 xij j 与 a 的距离 a xij 相当于一个逆指标,将 a xij 转化为正指标,则有:
第五步,以各评价项目的分值为变量,根据既定各评价项目的权数,利用加权平均法综
合评价总分值。
(3)评价指标的无量纲化
①相对化处理方法
进行相对化处理,必须先对每个评价指标确定一个对比的基准值,而后计算实际值与基
5 / 39
圣才电子书 十万种考研考证电子书、题库视频学习平台
系统聚类法的具体操作步骤为: 第一步,度量指标(类)间的相似程度。 常用的方法是相关系数或判别系数法。根据 N 个指标的历史资料,分别计算两两指标 的相关系数(或判别系数)并形成相关系数矩阵 R(或判别系数矩阵 R2),以相关系数矩阵 R(或判别系数矩阵 R2)表示指标间的相关关系。 第二步,度量指标(类)间的距离。 利用相关系数矩阵 R(或判别系数矩阵 R2)表示指标(类)间相似程度时,必须将其 变换为距离 d,d 值若越小,则表明两个指标之间的关系越密切。d= 第三步,根据聚类图确定指标(类)的个数,从每类中选择出最具有代表性的指标。 3.数据预处理方法 (1)评价指标的类型一致化
2 / 39
圣才电子书 十万种考研考证电子书、题库视频学习平台
家意见趋于集中,然后由最后一次咨询确定的评价指标体系。 (2)定量方法 ①试算法 它是通过历史资料的试算来判断指标的有效性。 ②系统聚类法 它是通过判断指标之间的相似程度来筛选指标的一种方法。假设有 N 个指标,将每个
黄良文《统计学》章节题库(相关与回归分析)【圣才出品】
(xi x )2
Lxx
Lxy Lxx Lyy
Lyy r Lyy 。
Lxx
Lxx
6.在线性相关的条件下,相关系数为 0.8,且 (xi x )2 2 , ( yi y)2 5 ,
则回归系数为( )。
A.0.32
B.2
C.8
D.12.5
【答案程的表达式中,一定错误的是( )。
A. yˆ =-25-3x r =0.89
B. yˆ =-5-6x
r =-0.94
C. yˆ =23-21x r =-0.96
D. yˆ =-36+3x r =0.988
【答案】A
【解析】根据同一组数据求出的回归直线方程中 ˆ1 的数值和相关分析中的相关系数 r
圣才电子书
C. r ˆ1
Lyy Lxx
D. r 1 ˆ12
十万种考研考证电子书、题库视频学习平台
【答案】A
【解析】样本相关系数 r
(xi x )( yi y)
(xi x )2 ( yi y)2
Lxy ,所以回归系数 Lxx Lyy
ˆ1
(xi x ) ( yi y) Lxy
11.对估计的一元回归方程 Yˆt ˆ0 ˆ1X t 进行回归系数的假设检验。若在给定的显著
5 / 20
圣才电子书 十万种考研考证电子书、题库视频学习平台
性水平下不能拒绝原假设 H0,则可认为 x 与 y 之间( )。 A.不存在任何相关关系 B.不存在高度的线性相关关系 C.不存在因果关系 D.不存在显著的线性相关关系 【答案】D
1 / 20
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.在回归直线 yˆ ˆ0 ˆ1x 中,如果 ˆ1 <0,则 x 与 y 之间的相关系数( )。 A.r =0 B.r=1 C.0<r<1 D.-1≤r<0
黄良文《统计学》课后习题(抽样分布与抽样方法)【圣才出品】
N
5
(2)重复抽样的两两样本的平均数如表 5-1 所示。
表 5-1 两两样本的平均数
单位:元
样本值
140
160
180
200
220
140
140
150
160
170
180
160
150
160
170
180
190
180
160
170
180
190
200
200
170
180
190
200
210
220
180
190
200
210
(2)由(1)可得:
P(X a) P( X 40 a 40) 1 ( a 40) 0.05
2
2
2
即
( a 40) 0.95 2
则 a 40 1.645 ,解得:a=43.29。 2
1/8
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.3 设 X~t(n),写出它的密度函数以及均值和方差。 解:t(n)的密度函数为:
220
由表 5-1 可知,样本均值的分布如表 5-2 所示。
表 5-2 样本均值的分布
样本均值 X (元)Fra bibliotek频数概率
140
1
1/25
150
2
2/25
160
3
3/25
170
4
4/25
3/8
圣才电子书
180
十万种考研考证电子书、题库视频学习平台
5
1/5
190
4
4/25
200
量 n=36 的样本。(1)求样本均值 X 的抽样分布;(2)如果 P( X a) 0.05 ,求 a 的值。
黄良文《统计学》课后习题(概率基础)【圣才出品】
于 3000 元的概率。 解:设该市居民家庭人均年收入为 X,对 X 进行标准化,令 Z X 4000 ,则 Z~N(0, 1200
1)。
(1) P(5000
X
7000)
P
5000 4000 1200
X 4000 1200
7000 4000 1200
P(0.8333 Z 2.5) (2.5) (0.8333) 0.9938 0.7977 0.1961
解:设取出白球为事件 A,抽到第 k 箱为事件 Bk ,则 P(Bk)=1/3,k=1,2,3;P
(A|B1)=1/5,P(A|B2)=1/2,P(A|B3)=5/8。
(1)由全概率公式可得,取出的球是白球的概率为:
P( A) P( AB1) P( AB2) P( AB3) P(B1)P( A | B1) P(B2 )P( A | B2 ) P(B3 )P( A | B3 ) 1 1 5 53
5 2 8 120
(2)由贝叶斯公式可得:
P(B2
| A)
P( AB2 ) P( A)
P(B2 )P( A | B2 ) P( A)
Hale Waihona Puke 11 32 5320 53
120
4.5 某市居民家庭人均年收入是服从 X =4000 元, =1200 元的正态分布,求该市
居民家庭人均年收入:(1)在 5000~7000 元的概率;(2)超过 8000 元的概率;(3)低
i 1
i 1
3/9
圣才电子书 十万种考研考证电子书、题库视频学习平台
4.7 对于离散型随机变量 X,证明 Var(X)=E(X2)-[E(X)]2。
证明:由离散型随机变量 X 的方差Var(X ) [xi E(X )]2P(xi ) 可得: Var(X ) [xi E(X )]2P(xi )
黄良文《统计学》课后习题(统计综合评价)【圣才出品】
黄良文《统计学》课后习题第14章统计综合评价14.1判断题:(1)资产负债率、万元产值消耗能源比率和物耗率皆为逆指标。
【答案】×【解析】逆指标是指指标取值越小越好的指标。
万元产值消耗能源比率和物耗率皆为逆指标,而资产负债率并不是越小越好,而是取值越接近某一确定的数值越好,因此为适度指标。
(2)综合评价是对客观对象从不同的侧面、不同的角度进行全面的分析与评价,故它完全地消除了主观因素的影响。
【答案】×【解析】在综合评价中,各指标的评价标准以及权数的确定,常常需要依靠有关专家来确定,不同的专家给出的标准和权重会有所差异,因此,综合评价的结果,往往带有一定的主观性。
(3)评价指标若服从正态分布,可利用标准化方法进行消除量纲影响的处理。
【答案】√(4)经过标准化处理后的数据ijx '取值范围01ij x '≤≤。
【答案】×【解析】经标准化处理后的数值围绕着0上下波动,数值大于0的说明高于平均水平,数值小于0的说明低于平均水平。
(5)进行归一化处理后,权数之和一定为1。
【答案】√(6)变异系数法是一种客观赋权的方法。
【答案】√【解析】变异系数法是一种客观赋权的方法,它不需要依靠专家先对各指标的权重做出评定,而是直接利用各指标所包含的信息,通过计算得到指标的权重。
(7)利用功效系数法进行无量纲处理,对于逆指标,分子分母应颠倒。
【答案】×【解析】若采用相对化处理方法进行无量纲处理,对于逆指标,分子分母应颠倒。
(8)综合评价分值越高的参评单位,其效益越好。
【答案】×【解析】综合汇总有总分评定模型、加权平均综合模型和距离综合模型等方法。
其中,最优值距离模型是以各项评价指标的实际值与最优值(或标准值)之间距离的大小来衡量评价对象效益的高低。
采用此模型的参评单位,分值越小说明参评单位与最优值越接近,表明效益越好。
14.2现有7个指标,根据历史资料计算每两个指标的相关系数,建立相关系数矩阵,如表14-1所示。
《统计学》知识要点总结历年考研真题与典型题(参数估计)【圣才出品】
3.评价估计量的标准 (1)无偏性 无偏性:指估计量抽样分布的数学期望等于被估计的总体参数。
独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样
本中的元素相互独立,则称为独立样本。
①大样本的估计
如果两个总体都为正态分布,或两个总体不服从正态分布但两个样本都为大样本(n1
≥30 和 n2≥30)时,两个样本均值之差 ( x1 x2 ) 的抽样分布服从期望值为(μ1-μ2)、方
x t (n 1) ,根据 t 分布建立的总体均值 μ 在 1-α 置信水平下的置信区间为: s/ n
s x t / 2 n
式中, t /2 是自由度为
n-1
时
t
分布的上 2
分位数。
2.总体比例的区间估计
3 / 57
圣才电子书 十万种考研考证电子书、题库视频学习平台
设总体参数为 ,所选择的估计量为ˆ ,如果 E ˆ =θ,则称ˆ 为 的无偏估计量。
(2)有效性 有效性:指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。 (3)一致性 一致性:指随着样本量的增大,点估计量的值越来越接近被估总体的参数。即一个大样 本给出的估计量要比一个小样本给出的估计量更接近总体的参数。
都可以用样本方差 s2 近似代替总体方差 σ2,这时总体均值 μ 在 1-α 置信水平下的置信区
间为:
x z / 2
s n
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第6章 参数估计 【圣才出品】
(2)顺序统计量法
1 / 29
圣才电子书 十万种考研考证电子书、题库视频学习平台
顺序统计量法:即用样本中位数 Me,或样本极差 R 来估计总体的数学期望μ或总体的
均方差σ的方法。
若 为θ的无偏估计量,其均方误差等于其方差 MSE D 。
设1 、 2 为 的两个无偏估计量,若1 的方差小于 2 的方差,即 D 1 D 2 ,
则称1 是较 2 有效的估计量。
(3)一致性
设 (x1,x2,…, xn )是未知参数θ的估计量,当 n→∞时,要求 按概率收敛于θ。
即 lim P 1(ε为任意小正数)。则称 为θ的满足一致性标准要求的估计量。 n
二、参数的区间估计
区间估计:就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。
设1 和 2 都是两个统计量 1 2 ,分别作为总体参数θ区间估计的下限和上限,则
要求有
。式中, (0< <1)是区间估计的显著性水平,1- 称
s12
和
s22
来代替,这样两个总
体均值之差 1 2 在1 置信水平下的置信区间为
②小样本的估计方法
两个总体都服从正态分布,两个随机样本分别独立地抽自两个总体。当两个总体方差
2 1
和
2 2
已知时,两个总体均值之差的置信区间为
。
当总体方差
2 1
和
2 2
未知但相等时,需要用两个样本的方差
s12
1 n
n i 1
Xi X
2
不是总
体方差的无偏估计量。但是
s2 n1
黄良文《统计学》章节题库(概率基础)【圣才出品】
黄良文《统计学》章节题库第4章概率基础一、单项选择题1.一项随机试验中所有可能结果的集合称为()。
A.复杂事件B.简单事件C.样本空间D.基本事件【答案】C【解析】一个随机现象称为一个随机试验。
一个随机试验的所有可能结果的集合称为该随机试验的样本空间,而样本空间的任一子集合称为一个(随机)事件;如果事件是由样本空间的一个元素所组成则称为简单事件,也就是不可以再分解的事件,又称为基本事件或样本点;复杂事件则是样本空间的两个元素以上的子集,或者说由简单事件组合而成的事件。
2.抛两枚硬币,用0表示反面,1表示正面,其样本空间为Ω=()。
A.{00,01,10,11}B.{1,2}C.{0,1}D.{01,10}【答案】A【解析】样本空间为一个随机试验中所有的简单事件的全体。
抛两枚硬币,每抛一次都是由0和1组成的一个两位数的组合,所有的组合构成了样本空间,即{00,01,10,11}。
3.下列数字中不可能是随机事件概率的是()。
A.0B.1C.0.98D.1.01【答案】D 【解析】随机事件的概率的取值范围为:0()1P A ≤≤。
4.抛掷两枚硬币,出现两个正面记为事件A ,出现两个反面记为事件B 。
则()。
A.A B Ω+=B.A 与B 为互补事件C.A 与B 为互斥事件D.A 与B 为相互独立事件【答案】C 【解析】样本空间为Ω={正正,正反,反正,反反},所以A B =∅ ,但A+B≠Ω,故两事件为互斥事件。
5.设A ,B 为随机事件,且P (A )=0.3,P (B )=0.4,P (AB )=0.1,则P (A ∪B )=()。
A.0.4B.0.5C.0.6D.0.7【答案】C【解析】P(A∪B)=P(A)+P(B)-P(AB)=0.3+0.4-0.1=0.6。
6.设P(A)=0.5,P(B)=0.7,P(A∪B)=.0.8,则(P AB为()。
A.0.1B.0.24C.0.5D.0.6【答案】A【解析】由于P(AB)=P(A)+P(B)-P(A∪B)=0.5+0.7-0.8=0.4,所以=Ω-=-=-=-=P AB P A B P A AB P A P AB()[()]()()()0.50.40.17.一道有四个备选答案的单项选择题,某学生知道正确答案的可能性为3/4,他不知道正确答案时猜对的概率是1/4。
黄良文《统计学》(第2版)笔记和课后习题(含考研真题)详解 第8章 方差分析 【圣才出品】
验这 k 个总体(水平)的均值是否相等,即通过简单随机样本检验以下假设:
不全相等
这里的原假设 H 0 表示:对所讨论的数值变量(因变量)而言,分类变量(自变量)的
不同水平没有显著差异,即分类变量对该数值变量没有显著影响。
二、单因素方差分析
1 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
总变差 SST 进行平方和分解可以得到: SST=SSA+SSE
其中,组内变差 SSE 为:
组间变差为:
2 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.单因素方差分析的数学模型 把表 8-1 的每一行看作是取自某一水平所对应正态分布总体的容量为 N 的简单随机样
(2)双因素试验的总变差 SST:
4 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
对总变差 SST 进行平方和分解,可以得到 SST=SSE+SSA+SSB。 其中,随机变差 SSE 为
因素 A 的变差 SSA 为
因素 B 的变差 SSB 为
2.双因素方差分析 (1)双因素方差分析的数学模型
在原假设成立的情况下,
,
和
。 3.等均值原假设的 F 检验
(1)对于等均值原假设 H 0 ,可以构造 F 统计量为:
在显著性水平α的条件下,只要 F≥ F 2 [M-1,M(N-1)]就可以拒绝原假设 H 0 ,认
3 / 26
圣才电子书 十万种考研考证电子书、题库视频学习平台
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 8 章 方差分析
8.1 复习笔记
一、方差分析方法引导
黄良文《统计学》课后习题(统计数据的搜集与整理)【圣才出品】
黄良文《统计学》课后习题第2章统计数据的搜集与整理2.1选择题(1)统计调查对象是()。
A.总体各单位标志值B.总体单位C.现象总体D.统计指标【答案】C【解析】调查对象是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。
(2)统计调查方法体系中,作为“基础”的是()。
A.经常性抽样调查B.必要的统计报表C.重点调查及估计推算等D.周期性普查【答案】D【解析】为适应社会主义市场经济的要求,目前,我国建立起了以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。
(3)要对某企业的生产设备的实际生产能力进行调查,则该企业的“生产设备”是()。
A.调查对象B.调查单位C.调查项目D.报告单位【答案】A【解析】调查对象是指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。
调查对象是该企业的“生产设备”;调查单位是每一个生产设备;调查项目是实际生产能力;报告单位是该企业。
(4)下面哪些现象适宜采用非全面调查?()A.企业经营管理中出现的新问题B.某型号日光灯耐用时数检查C.一个地区新增加的人口数D.某地区森林的木材积蓄量【答案】ABD【解析】全面调查是对被研究总体的所有单位一一进行调查;非全面调查是选取被研究现象总体中的一部分单位进行调查。
ABD三项属于一些不可能或没必要进行全面调查的社会现象,应采用抽样调查的方式进行调查。
2.2有人说抽样调查“以样本资料推断总体数量特征”缺乏科学依据,你认为呢?答:抽样调查是一种非全面调查,包括概率抽样和非概率抽样。
概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查总体的数量特征。
对于一些不可能或没必要进行全面调查的社会现象,如对于一些破坏性的试验,以及对普查资料进行必要的修正时,都可采用抽样调查。
由于抽样调查的样本单位按随机原则抽取,保证每个单位有相等的机会被抽取,排除了主观因素对选样的影响;以样本数据推算总体数量特征,不可避免地会产生误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
0.23 1.645
0.23 (1 0.23), 1.645
200
[0.181, 0.279]
0.23 (1 0.23)
200
即拥有该品牌空调的家庭占到 18.1%~27.9%之间。
(2)当 1- =95%, 0.05 时, Z 2 Z0.025 1.96 ,则总体比例的置信区间为:
0.017 16
即[2.118,2.132],可以 90%的概率保证钉子的平均长度在 2.118 到 2.132cm 之间。
6.5 从一批电子管中抽取 100 只,若抽取的电子管的平均寿命为 1000 小时,标准差
σ为 40 小时,试求整批电子管的平均寿命的置信区间(置信水平为 95%)。
解:总体 X 的分布形式未知,但总体标准差 40 ,且 n=100>30,故可以认为 X 近 似服从 N (, 2 n) 。由于1 95%, 0.05, 2 1.96,X 1000 。所以总体均值
0.01] 16
即[2.121,2.129],可以 90%的概率保证钉子的平均长度在 2.121 到 2.129cm 之间。
(2)当σ未知时, 0.1 , t(2 15) 1.753 ,总体均值 的置信区间为:
X
t
2
s ,X n
t
2
s n
2.125
1.753
0.017,2.125 1.753 16
圣才电子书
十万种考研考证电子书、题库视频学习平台
黄良文《统计学》课后习题
第 6 章 参数估计
6.1 阐述参数估计量的优良标准。
答:判别参数估量的优良性包括三条标准:无偏性、有效性和一致性。
(1)无偏性。若要求估计量ˆ 的数学期望等于待估计参数的真值,即 E(ˆ) 。则称ˆ
为 的满足无偏性准则的估计量。 (2)有效性。设 ˆ1 , ˆ2 为 的两个无偏估计量,若 ˆ1 的方差小于 ˆ2 的方差,即
D(ˆ1) D(ˆ2 ) ,则称ˆ1 是较ˆ2 有效的估计量。 (3)一致性。设ˆ(x1,x2,…,xn) 是未知参数 的估计量,当 n→∞时,要求ˆ 按概
率收敛于 。即 lim P(| ˆ | ) 1 ( 为任意小正数)。则称ˆ 为 的满足一致性标准要求的估计量。
解:由于 E(X) xf (x)dx
b
x
dx a b ,
a ba
2
E(X 2) x2 f (x)dx b x2 dx b2 ab a2 ,
a ba
3
Var(X ) E(X 2) E 2(X ) b2 ab a2 ( a b)2 (b a )2
3
2
12
因此按矩法,建立方程组:
X
s
2
ab 2
(b a)2 12
解得: aˆ X 3s , bˆ X 3s 。
6.4 随机地从一批钉子中抽取 16 枚,测得其长度(单位:cm)为 2.14,2.10,2.13,
2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11。设
p Z 2
p(1 n
p), p
Z
2
p(1 p)
n
0.23 1.96
0.23 (1 0.23), 1.96
200
[0.172,0.288]
0.23 (1 0.23)
200
即拥有该品牌空调的家庭占到 17.2%~28.8%之间。
6.7 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如表 6-1
15 0.017
(1)当σ=0.01 时, 0.1 , Z 2 1.645 ,总体均值 的置信区间为:
2/8
圣才电子书 十万种考研考证电子书、题库视频学习平台
[X
Z 2
,X n
Z
2
] [2.125 1.645 n
0.01,2.125 1.645 16
所示。
表 6-1
来自总体 1 的样本
来自总体 2 的样本
n1 14 X1 53.2 s12 96.8
n1 7 X 2 43.4 s22 102.0
n 1
以用样本估计方差
s2 ( X X )2 作为总方差 2 的估计量。
n 1
1/8
圣才电子书 十万种考研考证电子书、题库视频学习平台
6.3 设总体 X 具有在区间[a,b]上的均匀分布,其分布密度函数为
f
(x)
b
1
a
,a
x
b
0,其它
其中:a,b 是未知参数,试用矩估计法求 a 与 b 的估计量。
的置信区间为:
X
Z 2
,X n
Z 2
n
1000
1.96
40 ,1000 1.96 100
40 100
即[992.16,1007.84],可以 95%的概率保证电子管的平均寿命在 992.16 到 1007.84
小时之间。
6.6 在一项家计调查中,我们欲了解居民拥有某一品牌的空调情况。今随机抽取了 200 户居民,调查发现拥有该品牌空调的家庭占到 23%。求总体比例的置信区间,置信水平分 别为 90%和 95%。
钉长分布为正态分布,试求总体平均数 的置信水平为 90%的置信区间:(1)已知σ=0.01
(cm);(2)若σ未知。
解:由样本数据可得:
x x 2.14 2.10 … 2.11 2.125(cm)
n
16
s (x x)2
n 1 (2.14 2.125)2 (2.10 2.125)2 (2.11 2.125)2
n
6.2 以样本估计方差 s2 ( X X )2 作为总体方差σ2 的估计量,为什么分母是 n 一
n1
1,而不是 n?说明理由。
答:如果分母是 n,即 sn2
(X X )2 ,此估计量并不满足无偏性的要求,也不满足
n
有效性,而
s2 ( X X )2 是σ2 的无偏估计、有效估计和一致估计,符合估计优良性的三个标准。所
解:已知 n=200,p=23%,np=46>5。 (1)当 1- =90%, 0.1 时, Z 2 Z0.05 1.645 ,则总体比例的置信区间为:
3/8
圣才电子书 十万种考研考证电子书、题库视频学习平台
p Z 2
p(1 n
p), p
Z
2
p(1 p)