概率论与数理统计 7.3节
《概率论与数理统计》课程教案
※相合性是对一个估计量的基本要求,若估计量不具有相合性,那么不论将样本容量n取得多么大,都不能将θ估计得足够准确,因而不可取
可以用大数定律的思想处理。
板书,回顾
PPT
课后作业
包括课后作业、数值实验作业、其它要求
课后小结
课后小结是教案执行情况的经验总结,目的在于改进和调整教案,为下一轮课讲授设计更加良好的教学方案。应全面审视教学过程,特别注意对意外发现、点滴收获、以及因个别疏漏而及时补充的方法等方面的内容进行撰写
无偏性若估计量 = (X1,X2,…,Xn)的数学期望E( )存在,且对于任意的θ Θ有E( )=θ,则称 是θ的无偏估计量。
ห้องสมุดไป่ตู้即E( )-θ=0,
称E( )-θ为以 作为θ的估计的系统误差,那么无偏估计的实际意义就是无系统误差。(人为的或系统本身原因导致的误差,而不是测量误差)
例如:设总体X的k阶矩,期望和方差分别为μk,μ,σ2
由于E(Ak)=E( )= = =μk
E(S2)=E( )=σ2,
E( )=E( )=μ
所以k阶样本矩,样本方差和样本均值分别为k阶总体矩μk,方差σ2和期望μ的无偏估计量
而σ2的一个估计量 =B2= 由于
E(B2)=E( )= ≠σ2,因而是有偏的
其中,由方差恒等式E(X2)=D(X)+E(X)2
由于方差是随机变量取值与其数学期望的偏离程度的度量,这样在无偏的情况下E( )=E( )=θ,以方差小者为好,即估计量的有效性
有效性设 = (X1,X2,…,Xn)与 = (X1,X2,…,Xn)都是θ的无偏估计量,若对于任意θ Θ,有D( )D( )且至少对于某一个θ Θ,上式中的不等号成立,则称 较 有效。
第三版详细《概率论与数理统计》课后习题答案
习题一:1.1 写出下列随机试验的样本空间:(1) 某篮球运动员投篮时, 连续5 次都命中, 观察其投篮次数; 解:连续5 次都命中,至少要投5次以上,故}{ ,7,6,51=Ω; (2) 掷一颗匀称的骰子两次, 观察前后两次出现的点数之和; 解:}{12,11,4,3,22 =Ω;(3) 观察某医院一天内前来就诊的人数;解:医院一天内前来就诊的人数理论上可以从0到无穷,所以}{ ,2,1,03=Ω;(4) 从编号为1,2,3,4,5 的5 件产品中任意取出两件, 观察取出哪两件产品; 解:属于不放回抽样,故两件产品不会相同,编号必是一大一小,故:()}{;51,4≤≤=Ωj i j i (5) 检查两件产品是否合格;解:用0 表示合格, 1 表示不合格,则()()()()}{1,1,0,1,1,0,0,05=Ω;(6) 观察某地一天内的最高气温和最低气温(假设最低气温不低于T1, 最高气温不高于T2); 解:用x 表示最低气温, y 表示最高气温;考虑到这是一个二维的样本空间,故:()}{216,T y x T y x ≤≤=Ω ;(7) 在单位圆内任取两点, 观察这两点的距离;解:}{207 x x =Ω;(8) 在长为l 的线段上任取一点, 该点将线段分成两段, 观察两线段的长度. 解:()}{l y x y x y x =+=Ω,0,0,8 ; 1.2(1) A 与B 都发生, 但C 不发生; C AB ;(2) A 发生, 且B 与C 至少有一个发生;)(C B A ⋃; (3) A,B,C 中至少有一个发生; C B A ⋃⋃;(4) A,B,C 中恰有一个发生;C B A C B A C B A ⋃⋃; (5) A,B,C 中至少有两个发生; BC AC AB ⋃⋃; (6) A,B,C 中至多有一个发生;C B C A B A ⋃⋃;(7) A;B;C 中至多有两个发生;ABC(8) A,B,C 中恰有两个发生.C AB C B A BC A ⋃⋃ ; 注意:此类题目答案一般不唯一,有不同的表示方式。
概率论与数理统计第7章参数估计PPT课件
a1(1, ,k )=v1
1 f1(v1, ,vk )
假定方程组a2(1, ,k ) v2 ,则可求出2 f2(v1, ,vk )
ak (1, ,k ) vk
k fk (v1, ,vk )
则x1 xn为X的样本值时,可用样本值的j阶原点矩Aj估计vj,其中
Aj
1 n
n i1
xij ( j
L(x1, ,xn;ˆ)maxL(x1, ,xn;),则称ˆ(x1, ,xn)为
的一种参数估计方法 .
它首先是由德国数学家
高斯在1821年提出的 ,然而, 这个方法常归功于英国统
Gauss
计学家费歇(Fisher) . 费歇在1922年重新发现了
这一方法,并首先研究了这
种方法的一些性质 .
Fisher
10
极大似然估计是在已知总体分布形式的情形下的 点估计。
极大似然估计的基本思路:根据样本的具体情况
注:估计量为样本的函数,样本不同,估计量不 同。
常用估计量构造法:矩估计法、极大似然估计法。
4
7.1.1 矩估计法
矩估计法是通过参数与总体矩的关系,解出参数, 并用样本矩替代总体矩而得到的参数估计方法。 (由大数定理可知样本矩依概率收敛于总体矩, 且许多分布所含参数都是矩的函数)
下面我们考虑总体为连续型随机变量的情况:
n
它是的函数,记为L(x1, , xn; ) f (xi , ), i 1
并称其为似然函数,记为L( )。
注:似然函数的概念并不仅限于连续随机变量 ,
对于离散型随机变量,用 P {Xx}p(x,)
替代f ( x, )
即可。
14
设总体X的分布形式已知,且只含一个未知参数,
《概率论与数理统计》第七章假设检验.
《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论与数理统计浙大四版 第七章 第七章3讲
参数 (这样我们才能确定一个大概率区间).
而这与总体分布有关,所以,总体分布的 形式是否已知,是怎样的类型,至关重要.
这里,我们主要讨论总体分布为正态 的情形. 若样本容量很大,即使总体分布 未知,应用中心极限定理,可得总体的近 似分布,于是也可以近似求得参数的区间 估计.
第四节
区间估计
引言
前面,我们讨论了参数点估计. 它 是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个 近似值,它没有反映出这个近似值的误 差范围,使用起来把握不大. 区间估计 正好弥补了点估计的这个缺陷 .
也就是说,我们希望确定一个区间,使我
们能以比较高的可靠程度相信它包含真参
内. 这里有两个要求:
1. 要求 以很大的可能被包含在区间[ˆ1,ˆ2]
内,就是说,概率P{ˆ1ˆ2}要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间 长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其 它准则.
可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下
尽可能提高精度.
P {ˆ1ˆ2}1
称区间 [ˆ1,ˆ2]为 的 置信水平为1 的
置信区间.
寻找置信区间的方法,一般是从确定 误差限入手.
我们选取未知参数的某个估计量 ˆ,根
据置信水平1 ,可以找到一个正数 ,
使得 P{ˆ||}1
称 为ˆ 与之间的误差限 .
只要知道 ˆ 的概率分布,确定误差限并不难.
由不等式 |ˆ | 可以解出 :
S(T, ),且其分布为已知.
称S(T, )为枢轴量.
概率论与数理统计 7.2 数理统计中的三大分布
7.2 数理统计中的三大抽样分布
在数理统计中,以标准正态变量为基石而构 造的三个著名统计量有着广泛的应用,这是因为 这三个统计量不仅有明确背景,而且其抽样分布 的密度函数有明显的数学表达式,它们被称为统 计中的“ 三大抽样分布 ” 。
1. 2 分布
数理统计
2分布是由正态分布派生出来的一种分布.
t1 (n) t (n)
o t (n)
x
t分布的上分位点t (n)可查表
求得,例t0.025(15) 2.1315.
当n 45时,对于常用的的值,可用正态近似 t (n) z
例3:X ~ t(15)
(1)求 0.01的上侧分位数; (2) P( X ) 0.05,求 ; (3)P( X ) 0.95 ,求 .
记为 t ~ t(n). t分布概率密度函数为:
f (t)
[(n 1)
2]
(1
t
2
)
n1 2
,
t
(n 2) n n
t 分布的图像
y N (0,1) 数理统计
t(n)
t分布的性质: 1. 设t ~ t(n),则E(t) 0, D(t) n (n 2) (n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
F分布的上分位点的性质:
F1 (n1, n2 )
1 F (n2 , n1 )
F分布的上分位点可查表求得.例,
F0.95 (12,9)
1 F0.05 (9,12)
1 2.80
0.357
例4. F ~ F (24,15),求 1,2 使 P(F 2 ) 0.025 P(F 1) 0.025
中国矿业大学周圣武概率论与数理统计_图文
定义2 设 都是参数θ的无偏估计量,若有
则称
有效。
例:160页,例7、例8
定义3 设
为参数θ的估计量,
若对于任意θ∈Θ,当
则称
的一致估计量。
例:由大数定律知
一致性说明:对于大样本,由一次抽样得到的估 计量 的值可作θ的近似值
例5 设 X1, X2, …, Xn 是取自总体 X 的一个样本,
⑴ 验证
试求θ的极大似然估计值。 解
极大似然估计的不变性
练习
1.设总体X在
上服从均匀分布,
X1 , X 2 ,L X n是来自X的样本,试求 q 的矩估计量
和最大似然估计.
2.设X1,X2,…Xn是取自总体X的一个样本
其中 >0, 求 的极大似然估计.
课堂练习
P156:5,6
作业
P178:1,2,5,6
Fisher
最大似然法的基本思想:
问题:请推断兔子 是谁打中的?
例6 袋中放有白球和黑球共4个,今进行3次有放回 抽样,每次抽取1个,结果抽得2次白球1次黑球,试 估计袋中白球个数。 解 设袋中白球个数为m,
X为3次抽样中抽得的白球数,则
当袋中白球数m分别为1,2,3时, p对应的值分别为1/4,2/4,3/4, X对应的分布律见下表
中国矿业大学周圣武概率论与数理统计_图文 .ppt
第七章 参数估计
§7.1 点估计 §7.2 估计量的评选标准 §7.3 区间估计 §7.4 单个正态总体参数的区间估计 §7.4 两个正态总体参数的区间估计
统计推断
矩估计 点估计 最大似然估计
参数估计
最小二乘估计
区间估计
参数假设检验
假设检验 非参数假设检验
新人教A版高中数学《7.3.1 离散型随机变量的均值》教学设计
7.3.1 离散型随机变量的均值教学设计一、内容与内容解析1.内容:离散型随机变量均值的定义,随机变量的均值与样本均值的联系与区别,离散型随机变量均值的性质,利用组合数解决实际问题.2.内容解析:(1)离散型随机变量均值的定义:我们的目的是构造一个数值,用来描述随机变量取值的平均水平.设取有限个值的离散型随机变量X ,它的分布列为p i =P(X=x i ),i=1,2,…,n.可以直接构造以p i 为x i 的权重的加权平均数∑x i p i n i=1,来描述X 取值的平均水平.由于随机变量的均值和方差都是度量性的概念,而度量因比较而产生,因此教科书并未直接给出均值的定义,而是以比较两名运动员的射箭水平为问题情境,以频率稳定到概率为依据,由X 观测值的频率分布稳定到X 的分布列,观测值的平均数(样本均值)稳定到∑x i p i n i=1,将样本均值的稳定值定义为随机变量的均值.这种方法揭示了样本均值与随机变量均值(总体均值)的关系,为用样本均值估计随机变量均值提供了依据. 随机变量的均值(数学期望)是样本均值的稳定值,它是客观存在的.如果随机变量的分布列已知,期望值唯一确定;如果随机变量的分布列未知,可由样本均值进行估计.(2)随机变量的均值与样本均值的联系与区别:了解随机变量均值与样本均值的关系,可以进一步深入理解随机变量均值的意义.为此教科书设置了一个观察栏目,以掷骰子为例,已知出现点数X 的均值为3. 5,利用计算机模拟掷骰子重复60次和300次的试验各进行6组,用图形表示掷出点数的平均数.观察图形可以看到掷出点数的平均数具有随机性,但随着试验次数的增大,点数的平均数逐渐稳定到3. 5实际上,频率稳定到概率是样本均值稳定到随机变量均值的特殊情形.在教学中,还可以再多进行几次模拟试验,类比事件的频率稳定到概率,了解样本均值的特点及其与随机变量均值的关系.(3)离散型随机变量均值的性质:随机变量的均值有许多性质,我们主要研究其线性运算性质E(aX+b)=aE(X)+b. 该性质根据定义不难直接证明.在教学中,可引导学生类比平均数的性质或根据均值的意义,先猜出结果再计算证明.在后面的学习中,包括求随机变量的均值、方差及探究方差的性质,都可以进行这方面的训练,这是培养学生直观想象素养的重要途径.在教学中,教师可根据学情向学生提出以下问题:设X,Y 都是离散型随机变量,如何求E(X 十Y )?让学生根据均值的意义,猜出结果.也可以进行掷两枚般子的试验,通过求点数之和X十Y的均值,发现结论.一般地,有E(X +Y)=E(X)+E(Y).(4)利用均值解决实际问题:本节课是前面学习完随机变量分布列的基础上进行研究的,知识上具有着承前启后的作用.随机变量的均值和方差是概率论和数理统计的重要概念,本节课是从实际出发,通过抽象思维,建立数学模型,进而认知数学理论,应用于实际的过程.3.教学重点:离散型随机变量均值的意义、性质及应用.二、目标与目标解析1.目标:(1)理解离散型随机变量的均值的意义和性质.(2)能够根据离散型随机变量的分布列求出均值.(3)运用离散型随机变量的均值解决一些相关的实际问题.2.目标解析:达成上述目标的标志是:(1)能根据定义求解离散型随机变量的均值.(2)能掌握两个随机变量的均值公式,并熟练求解.(3)可以快速有效的解决常见离散型随机变量的均值应用问题.三、教学问题诊断解析1.问题诊断:(1)让学生理解离散型随机变量均值的定义是教学的难点.实际上我们构造了一个数值,用来描述随机变量取值的平均水平.因为随机变量的均值(数学期望)是样本均值的稳定值,它是客观存在的,学生如果不能体会到为什么引入权重计算加权平均数,不明白为什么要学习离散型随机变量均值,可能会产生对定义公式的陌生感.解决方案:以比较两名运动员的射箭水平为具体的问题情境,通过比较两名运动员的射箭成绩均值,从而感知引入均值概念的必要性.(2)让学生体会随机变量的均值与样本均值的联系与区别是第二个教学问题,也是教学的难点.了解随机变量均值与样本均值的关系,可以进一步深入理解随机变量均值的意义.随机变量的均值(数学期望)是样本均值的稳定值,它是客观存在的.如果随机变量的分布列已知,期望值唯一确定;如果随机变量的分布列未知,可由样本均值进行估计.解决方案:在教学中,还可以多进行几次模拟试验,类比事件的频率稳定到概率,了解样本均值的特点及其与随机变量均值的关系.2.教学难点:对离散型随机变量均值的意义的理解.四、教学支持条件希沃白板软件五、教学过程 一、 问题导学对于离散型随机变量,可以由它的概率分布列确定与该随机变量相关事件的概率.但在实际问题中,有时我们更感兴趣的是随机变量的某些数字特征.例如,要了解某班同学在一次数学测验中的总体水平,很重要的是看平均分;要了解某班同学数学成绩是否“两极分化”则需要考察这个班数学成绩的方差.本节课我们一起来认识离散型随机变量的均值.二、 探究新知探究1.甲乙两名射箭运动员射中目标靶的环数的分布列如下表所示:如何比较他们射箭水平的高低呢?类似两组数据的比较,首先比较击中的平均环数,如果平均环数相等,再看稳定性. 假设甲射箭n 次,射中7环、8环、9环和10环的频率分别为:甲n 次射箭射中的平均环数当n 足够大时,频率稳定于概率,所以x 稳定于7×0.1+8×0.2+9×0.3+10×0.4=9. 即甲射中平均环数的稳定值(理论平均值)为9, 这个平均值的大小可以反映甲运动员的射箭水平.同理,乙射中环数的平均值为7×0.15+8×0.25+9×0.4+10×0.2=8.65. 从平均值的角度比较,甲的射箭水平比乙高.1、离散型随机变量取值的平均值.一般地,若离散型随机变量X 的概率分布为:则称E(X)=x 1p 1+x 2p 2+⋯+x i p i +⋯+x n p n为随机变量X 的均值或数学期望,数学期望简称期望.均值是随机变量可能取值关于取值概率的加权平均数,它综合了随机变量的取值和取值的概率,反映了随机变量取值的平均水平.312478910.n n n nx n n n n=⨯+⨯+⨯+⨯三、典例解析例1. 在篮球比赛中,罚球命中1次得1分,不中得0分,如果某运动员罚球命中的概率为0.8,那么他罚球1次的得分X 的均值是多少?分析:罚球有命中和不中两种可能结果,命中时X =1,不中时X =0,因此随机变量X 服从两点分布,X 的均值反映了该运动员罚球1次的平均得分水平. 解:因为P(X =1)=0.8,P(X =0)=0.2,所以E(X )=1×P(X =1)+0×P(X =0)=1×0.8+0×0.2 =0.8 即该运动员罚球1次的得分X 的均值是0.8. 一般地,如果随机变量X 服从两点分布, 那么: E(X)=1×p +0×(1−p)=p .设计意图:例1的教学重点是通过教学活动使学生认识到,对于一般的0-1分布,均值就是事件A 的概率,样本均值是事件A 发生的频率. 例2.抛掷一枚质地均匀的骰子,设出现的点数为X,求X 的均值. 分析:先求出X 的分布列,再根据定义计算X 的均值. 解:X 的分布列为P (X=k)= 16,k=1,2,3,4,5,6 因此,E(X)= 16(1+2+3+4+5+6)=3.5. 求离散型随机变量X 的均值的步骤:(1)理解X 的实际意义,写出X 全部可能取值; (2)求出X 取每个值时的概率; (3)写出X 的分布列(有时也可省略); (4)利用定义公式E (X )=∑x i p i n i=1求出均值探究2. 已知X 是一个随机变量,且分布列如下表所示.设a,b 都是实数且a ≠0,,则Y =a X + b 也是一个随机变量,那么,这两个随机变量的均值之间有什么联系呢?P p 1p2…p i…p n离散型随机变量的均值的性质若X,Y是两个随机变量,且Y=aX+b,则有E(Y)=aE(X)+b,即随机变量X的线性函数的均值等于这个随机变量的均值E(X)的同一线性函数.特别地:(1)当a=0时,E(b)=b,即常数的均值就是这个常数本身.(2)当a=1时,E(X+b)=E(X)+b,即随机变量X与常数之和的均值等于X的均值与这个常数的和.(3)当b=0时,E(aX)=aE(X),即常数与随机变量乘积的均值等于这个常数与随机变量的均值的乘积.例3:猜歌名游戏是根据歌曲的主旋律制成的铃声来猜歌名.某嘉宾参加猜歌名节目,猜对每首歌曲的歌名相互独立,猜对三首歌曲A,B,C歌名的概率及猜对时获得相应的公益基金如下表所示:规则如下:按照A,B,C的顺序猜,只有猜对当前歌曲的歌名才有资格猜下一首,求嘉宾获得的公益基金总额X的分布列及均值.歌曲A B C猜对的概率0.80.60.4获得的公益基金额/元100020003000解:分别用A,B,C表示猜对歌曲A,B,C歌名的事件,A,B,C相互独立P(X=0)=P(A)=0.2, P(X=1000)=P(A B)=0.8×0.4=0.32,P(X=3000)=P(ABC)=0.8×0.6×0.6=0.288,(X=6000)=(ABC)=0.8×0.6×0.4=0.192.X的分布列如下表所示:X0100040006000P0.20.480.1280.192X的均值为E(X)=0×0.2+1000×0.32+3000×0.288+6000×0.192=2336.思考:如果改变猜歌的顺序,获得公益基金的均值是否相同?如果不同,你认为哪个顺序获得的公益基金均值最大?解:如果按ACB的顺序来猜歌,分别用A,B,C表示猜对歌曲A,B,C歌名的事件,A,B,C相互独立; (X=0)=(A)=0.2,(X =1000)=(A C )=0.8×0.4=0.32,P (X =3000)=P (A C B )=0.8×0.4×0.4=0.128, (X =6000)=(A CB)=0.8×0.4×0.6=0.192. X 的分布列如下表所示: X 0 1000 3000 6000 P 0.20.320.2880.192X 的均值为E(X)=0×0.2+1000×0.48+4000×0.128+6000×0.192=2144.按由易到难的顺序来猜歌,获得的公益基金的均值最大设计意图:通过解决实际问题,了解风险决策的原则及一般方法.对于例3,选择不同的猜歌顺序,X 的分布列是不同的,不能直接进行比较,所以决策的原则是选择期望值E(X)大的猜歌顺序,这称为期望值原则.猜对的概率大表示比较容易猜,猜对的概率小表示比较难猜.对于教科书边空中的问题,可以让学生列出所有不同的猜歌顺序,分别求出X 的分布列和均值,通过比较进行验证.实际上,猜3首歌有6 种不同的顺序,不同顺序及其E(X)如表所示.例4.根据气象预报,某地区近期有小洪水的概率为0.25,有大洪水的概率为0.01,该地区某工地上有一台大型设备,遇到大洪水时要损失60000元,遇到小洪水时要损失10000元.为保护设备,有以下三种方案: 方案1:运走设备,搬运费为3800元.方案2:建保护围墙,建设费为2000元,但围墙只能挡住小洪水. 方案3:不采取措施,希望不发生洪水. 工地的领导该如何决策呢?解:设方案1、方案2、方案3的总损失分别为X1,X2,X3. 采用方案1,无论有无洪水,都损失3800元.因此,P(X1=3800)=1.采用方案2,遇到大洪水时,总损失为2000+6000=62000元;没有大洪水时,总损失为2000元,猜歌顺序 E(X)/元 猜歌顺序 E(X)/元 ABC 2336 BCA 2112 ACB 2144 CAB 1904 BAC2256CBA1872因此,P(X2=62 000)=0.01,P(X2=2000)=0.99.采用方案3,P(X3=60 000)=0.01,P(X3=10000)=0.25,P(X3=0)=0.74.于是,E(X1)=3800,E(X2)=62 000×0.01+2 000×0.99=2 600,E(X3)=60 000×0.01+10 000×0.25+0×0.74=3 100.因此,从期望损失最小的角度,应采取方案2.如果问题中的天气状况多次发生,那么采用方案2能使总损失减到最小,不过,因为洪水发生的随机性,所以对于个别的一次决策,采用方案2也不一定是最好的.设计意图:例4也是利用期望值决策的问题.在教学中,重点是使学生领悟利用期望值决策的思想方法,同时也要了解期望值决策的局限性.随机变量的期望是一个理论上的均值,如果是大量重复地就同样的问题进行决策,期望值原则是一个合理的决策原则.例如,保险公司面对众多的客户,每份保单需要理赔金额的期望值对制定合理的保险费率具有重要的参考意义.如果是一次性决策的话,可以采用期望值原则决策,也可以采用其他的决策原则.四、小结1. 期望的概念:E(X)=x1p1+x2p2+…+x i p i+…+x n p n2. 期望的意义:离散型随机变量的期望,反映了随机变量取值的平均水平.3. 期望的计算公式:E(aX+b)=aE(X)+b4.求离散型随机变量ξ的期望的基本步骤:(1)确定取值:理解X 的实际意义,写出X 全部可能取值; (2)求概率:求出X 取每个值时的概率; (3)写分布列:写出X 的分布列(有时也可省略); (4)求均值:利用定义公式∑x i p i n i=1求出均值 5.特殊随机变量的均值(两点分布的期望):E(X)=p.五、课后作业P66-67练习1、2、3题 P71习题7.3的2、3、4、6题六、教学反思本节课需要学生探究的内容比较多,由于学生的数学基础比较薄弱,所以在教学过程中教师不仅要耐心的指导,还要努力创设一个轻松和谐的课堂氛围,让每个学生都能大胆的说出自己的想法,保证每个学生都能学有所得.为了让每个学生在课上都能有话说,还需要学生做到课前预习,并且教师要给学生提出明确的预习目标.进一步发展学生直观想象、数学抽象、逻辑推理和数学运算的核心素养.。
概率论与数理统计教程(茆诗松)第七章
t
28 July 2013
t1 2 ( n 1)
华东师范大学
第七章 假设检验
第29页
若取 =0.05,则 t0.975(4)= 2.776. 现由样本计算得到: x 239.5, s 0.4, 故
由此可得如下结论:
28 July 2013
华东师范大学
第七章 假设检验
第13页
当 减小时,c 也随之减小,必导致的增大; 当 减小时,c 会增大,必导致 的增大; 说明:在样本量一定的条件下不可能找到一 个使 和 都小的检验。 英国统计学家 Neyman 和 Pearson 提出水平 为 的显著性检验的概念。
x 0 u / n
三种假设的拒绝域形式分别见下图:
28 July 2013
华东师范大学
第七章 假设检验
第20页
W {u c}
W {u c} W {u c1 或 u c2 }
(a) H1 : 0
28 July 2013
(b) H1 : 0
(c) H1 : 0
的拒绝域为W,则样本观测值落在拒绝域内 的概率称为该检验的势函数,记为
g ( ) P ( x W ),
28 July 2013
0 1
(7.1.3)
华东师范大学
第七章 假设检验
第10页
势函数 g ( )是定义在参数空间 上的一个函数。 犯两类错误的概率都是参数 的函数,并可由势 函数算得,即:
28 July 2013
华东师范大学
第七章 假设检验
第11页
这个势函数是 的减函数
28 July 2013
华东师范大学
概率论于数理统计7.3
ˆ ˆ 得置信区间 ( 1 , 2 )
15
概率论与数理统计
7.3.3 置信区间常用公式
(一) 一个正态总体 X ~N ( 2)的情形 (1) 方差 2已知, 的置信区间
n
得 的置信度为1 的置信区间为 ( X u , X u ) n n
2 2
17
概率论与数理统计
(2) 方差 2未知 , 的置信区间
S S , X t (n 1) X t (n 1) (2) 2 2 n n
推导
n 2
得 2 的置信度为1 置信区间为
n 2 ( X i ) i 1 , 2 ( n) 2 ( X i ) i 1 (3) 2 1 (n) 2
n 2
19
概率论与数理统计
(4) 当 未知时, 方差 2 的置信区间 选取 则由
越小, 1- 越大, 估计的可靠度越高,但
ˆ ˆ 这时, 2 1往往增大, 因而估计精度降低.
7
概率论与数理统计
处理“可靠性与精度关系”的原 则
先
再
求参数 置信区间
保 证 可靠性
提 高 精 度
(3) 确定后, 置信区间的选取方法不唯一, 常 选最小的一个.
8
概率论与数理统计
0.4 0.3 0.2 0.1
(n 1) S 2 (n 1) S 2 , 2 2 (n 1) (n 1) 1 2 2
2 (4)
2
-2
1
概率论和数理统计(第三学期)第7章数理统计的基本概念
n i1
i
1 n
n
Ei
i1
D
D 1 n
n i 1
i
1 n2
n
Di
i 1
2
n
2
S~ 1 n
n i 1
i
2
1 n
n i 1
i2 2i
2
1 n
n
i2
i 1
2
n
i
i 1
n
2
1 n
n
i2
i 1
2
2
2
1 n
n
i2
i 1
2
E S~2
E
1 n
n
i2
i 1
23
.209
2
2 0.95
20
10
.851
当自由度n 45时,可用下面近似公式去求2 n:
x2 n
1 2
u
2
2n 1
例3
求
2 0.05
60 .
解
2 0.05
60
1 2
u0.05
2
2 60 1
1 1.645
2
119 78.798
2
3、t分布的上侧分位点
对于给定的α(0<α<1),使
2
e
xi 2 2
2
(2
) e 2
n 2
1
2 2
n i1
xi 2
在数理统计中,总体的分布往往是未知的,需 要通过样本找到一个分布来近似代替总体分布。
§7.3 分布的估计
频率分布 例 某炼钢厂生产的钢由于各种因素的影响,各炉
钢的含硅量可以看作是一个随机变量,现记录了 120炉钢的含硅量百分数,求出这个样本的频数分 布与频率分布。
抽样分布及其上分位数
例4 对Z ~ N (0,1),Tn ~ t(n),有
P( Z z /2 ) , P( Z z /2 ) 1 ,
P( Tn t /2(n)) , P( Tn t /2(n)) 1
证明: P( Z z / 2 ) P(Z z / 2 ) P(Z z / 2 )
对标准正态密度函数( x)有
sup pn( x) ( x) 0.0041
x
特别,当n 时, 有
lim
n
pn
u
1
u2
e 2 (u)
2
概率论与数理统计
t分布的性质
定理3.5: 如果Z~N(0,1) , ~ 2(n), 且Z与 相互独立,则有
Z ~ t(n)
n
概率论与数理统计
定理 3.6
如果X1,X2,…,Xn是来自正态总体 N (, 2 )
的样本, Xn和S 2分别为样本均值和样本方差,
则有
Xn ~ t(n 1)
Sn
概率论与数理统计
证明:由定理3.4
Z
Xn / n
~
N (0,1),
(n 1)S 2
2
~
2(n 1).
且它们独立. 则由定理3.5得到
Z
Xn
/(n 1) / n
F分布的性质
定理3.7:如果 ~ 2(n), ~ 2(m),和独立,则 F n ~ F (n, m) m 1 m ~ F (m, n) F n
概率论与数理统计
设X1, X2 , , Xn是来自总体X的样本, Y1,Y2 , ,Ym是来自总体Y的样本. 如果总体X 和总体Y 独立,则来自这 两个总体的样本也相互独立.于是
/2 /2
P( Z z / 2 ) 1 P( Z z / 2 ) 1 ,
概率论与数理统计第七章-精品
湖南商学院信息系 数学教研室
第七章 参数估计
第一节 第二节
第三节 第四节 第五节
矩估计 极大似然估计
估计量的优良性准则 正态总体的区间估计(一) 正态总体的区间估计(二)
总体是由总体分布来刻画的.
总体分布类型的判断──在实际问题中, 我们根据问题本身的专业知识或以往的经验 或适当的统计方法,有时可以判断总体分布 的类型.
即
uX
2 2
1 n n i1
Xl2
求解得
u ˆˆ2 Xn 1i n1Xl2X2n 1i n1( XiX)2
∴均值,方差2的矩估计是:
uˆˆ 2Xn1
n
(Xi
i1
,2)两个未知参
两点说明:
1、求似然函数L( ) 的最大值点,可以应
用微积分中的技巧。由于ln(x)是x的增函
数,lnL( )与L( )在 的同一值处达到 它的最大值,假定是一实数,且lnL( ) 是 的一个可微函数。通过求解所谓“似 然方程”: dlnL() 0
d
可以得到 的MLE .
(1) 由总体分布导出样本的联合概率函数 (或联合密度);
(2) 把样本联合概率函数(或联合密度)中自变
量看成已知常数,而把参数 看作自变量, 得到似然函数L( ); (3) 求似然函数L( ) 的最大值点(常常转化 为求ln L()的最大值点) ,即 的MLE;
(4) 在最大值点的表达式中, 用样本值代入 就得参数的极大似然估计值 .
Var(X-)= 2
即 E(X)=
Var(X)= 2
即 E(X)=
Var(X)= 2
令 X
2
概率论与数理统计教程(茆诗松)第7章厦大版
(p £ 0.01)
检验的水平
显然,两类错误的概率可作为衡量一个检验好坏的标准。对于一
用数学语言来讲,一个检验就是样本空间X (所有样本点的集合)
的一个划分:{W , W },其中 W U W = X , W I W = f 。
当样本点落入W中时就拒绝H0(接受H1) ;当样本点落入 W 中时 就接受H0(拒绝H1) 。我们称W为“拒绝域”, W 为“接受域”。 检验的这个定义过于一般,我们不能从这个定义中得到任何构造 合理检验的指导原则。实际中一般使用能够衡量样本点与零假设 之间偏离程度的统计量来构造检验。称用来构造检验的统计量为 检验统计量。 对例7.1.1的假设检验问题
假设检验问题的表示
由此可见,在假设检验中不仅要明确什么是零假设,而且还要 明确备择假设是什么。因此一个假设检验问题通常表示为
H0 : q Î Q0 vs H1 : q Î Q1
(7.1.2)
其中 Q0 È Q1 Ì Q,Q0 Ç Q1 = f 。当备择假设是逻辑对立假
设时也可以不写出来。
比如,例7.1.1中的假设检验问题可表示为
当零假设被拒绝时,从逻辑上讲就意味着接受一个与之对立的 假设。我们称与零假设对立的假设为“备择假设”或“对立假设” (alternative hypothesis),并记为 “H1:θ∈ Θ\Θ0 ”。这样的 假设可称为“逻辑对立假设”
在某些应用中,拒绝零假设不一定意味着接受逻辑对立假设, 而可能是意味着接受一个特定的假设“H1:θ∈ Θ1 ”,其中Θ1 为Θ\Θ0的真子集。
例7.1.2
随机抽测了50 名 2000 年 1 月出生的男婴的体重,希望确 定男婴的体重 X 是否服从正态分布。
F (x):X 的分布函数
概率论与数理统计(理工类第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。
第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1 =168320=0.56,p2 =96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1 -p2 p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ =x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi123456 ≥7含fi 个错误的页数 36 4019221问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ =x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下p =P{X=i}=(λ )ie -λ i !=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i=1k(fi -np )2np ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算 p ,np ,fi -np ,(fi -np )2/(np )(i=1,2,⋯,7). 要求每一个np ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即p =P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使np ≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。
《概率论与数理统计》课件第七章 参数估计
03
若存在, 是否惟一?
添加标题
1
2
3
4
5
6
对于同一个未知参数,不同的方法得到的估计量可能不同,于是提出问题
应该选用哪一种估计量? 用何标准来评价一个估计量的好坏?
常用标准
(1)无偏性
(3)一致性
(2)有效性
7.2 估计量的评选标准
无偏性
一致性
有效性
一 、无偏性
定义1 设 是未知参数θ的估计量
09
则称 有效.
10
比
11
例4 设 X1, X2, …, Xn 是X 的一个样本,
添加标题
问那个估计量最有效?
添加标题
解 ⑴
添加标题
由于
添加标题
验证
添加标题
都是
添加标题
的无偏估计.
都是总体均值
的无偏估计量.
故
D
C
A
B
因为
所以
更有效.
例5 设总体 X 的概率密度为
关于一致性的两个常用结论
1. 样本 k 阶矩是总体 k 阶矩的一致性估计量.
是 的一致估计量.
由大数定律证明
用切比雪夫不 等式证明
似然函数为
其中
解得参数θ和μ的矩估计量为
2
时
3
令
1
当
6
,故
5
,表明L是μ的严格递增函数,又
4
第二个似然方程求不出θ的估计值,观察
添加标题
所以当
01
添加标题
从而参数θ和μ的最大似然估计值分别为
03
添加标题
时L 取到最大值
02
添加标题
概率论与数理统计第七章
点估计 区间估计
参数估计的类型
点估计 —— 估计未知参数的值
区间估计—— 估计未知参数的取值范围, 并使此范围包含未知参数 真值的概率为给定的值。
§7.1 点估计
要求: (1) 理解参数的点估计、估计量和估计值的概念。 (2)掌握矩估计法和最大似然估计法。
第七章 参数估计
总体是由总体分布来刻画的。
总体分布类型的判断──在实际问题中,我们根据 问题本身的专业知识或以往的经验或适当的统计 方法,有时可以判断总体分布的类型。
总体分布的未知参数的估计──总体分布的参数往 往是未知的,需要通过样本来估计。通过样本来 估计总体的参数。称为参数估计,它是统计推断 的一种重要形式。
例如
(1)为了研究人们的市场消费行为,我们要 先搞清楚人们的收入状况。
假设某城市人均年收入X∼N(, 2)。但参数 和 2 的具体值并不知道,需要通过样本来估计。
(2)假定某城市在单位时间(譬如一个月)内
交通事故发生次数 X ∼ p()。
参数未知,需要从样本来估计。
点估计
参数估计 区间估计
例如, X∼N(, 2), 若, 2未知, 通过构造样本的函数,给出它
矩估计法的具体做法如下
设总体的分布函数中含有k个未知参数1,2, ,k 。
(1) 写出总体的前k阶矩μ1, μ2, , μk ,一般是这 k 个 未知参数的函数, 记为:
μi μi (θ1,θ2 , ,θk ) i=1, 2, … , k
(2)从这 k 个方程中解出
θ j θ j ( μ1, μ2 , , μk ) j=1, 2, …, k
(3) 那么用诸 μi 的估计量 Ai 分别代替上式中的诸 μi,
概率论与数理统计习题详解(周概容)——习题7解
—习题解答●7.1— 7.1 假设总体X服从参数为??的泊松分布,nXXX21??是来自总体X的简单随机样本,X是样本均值,2S是样本方差,对于任意实数??,证明12SXE是??的无偏估计量.熟知,对于任何总体,样本均值X是总体数学期望的无偏估计量,样本方差2S是总体方差的无偏估计量;对于泊松分布的总体,数学期望和方差都等于分布参数??,因此.11122SXSXEEE 7.2 设总体X服从参数为??的泊松分布;21nXXX??是来自X的简单随机样本,求2??的无偏估计量.熟知XXDE.设X为样本均值,则.,2222221nnXnXnXXXEEDE 由此可见2??的无偏估计量为.XnX12?? 7.3 设21mXXX??是来自正态总体2NX的简单随机样本,统计量1121niiiXXkD 是总体方差2??的无偏估计量,求常数k.由条件知:222XE.由于统计量D是总体方差2??的无偏估计量,则.22112221112211121122222 nkkXXXXkXXkDniniiiiiniiiEEE 由此可见121nk.7.4 总体2??aNX2??bNY;基于分别来自总体X和Y的两个相互独立的简单随机样本21mXXX??和21nYYY??,得样本均值X和Y及样本方差2xS和2yS;证明总体X和Y的联合样本方差1121222yxxySnSmnmS 是总体X和Y的共同方差2??的无偏估计量,并且计算其方差.熟知,对于任意总体,样本方差2xS和2yS都是2??的无偏估计量,可见22221121yxxySnSmnmSE,—习题解答●7.2—即联合样本方差2xyS是2??的无偏估计量.由正态总体的抽样分布,知2222 xySnm?? 服从自由度为2 nm=??的2??分布;而自由度为??的2??变量的方差等于2??:事实上,设??UUU21??是独立标准正态分布随机变量,则服从自由度为??的2??分布的随机变量X可以表示为:22221??UUUX.由于10NUi,可见21102iUUUiiiEDE;.33de23e21de2122223244222 iuuuiUuuuuuUEE ??????.由此可见21UXEE.因此.22222222422222222 nmnmnmnmSnmnmSxyxy????????????DDD2 7.5 设总体X 服从参数为pm的二项分布,其中m已知;21nXXX??是来自X的简单随机样本,1 求未知参数p的最大似然估计量;2 证明所得估计量是无偏的.1 总体X的概率函数可以表示为.,若不然;,若;0 10 1Cmxpppxpxmxxm?? 参数p的似然函数为XnmnXnniXmniipppXppLi1C11;,其中X为样本均值.对数似然方程为0111ln1lnlnClnln1pXnmnpXnppLpXnm npXnpLniXmi;其解mXp即未知参数p的最大似然估计量.2 由于总体X的数学期望为mp,而对于任何总体X,样本均值X是其数学期望的无偏估计量,可见X 是mp的无偏估计量,从而mXp是未知参数p的无偏估计量.—习题解答●7.3—7.6 设总体X服从区间0??上的均匀分布,21nXXX??是来自X的简单随机样本,1 求未知参数??的最大似然估计量;2 假如所得估计量是有偏估计量,将其修正为无偏估计量. 1 总体X的概率密度函数为.,若不然;,若;001xxf 未知参数??的似然函数为,若不然.;,若;0 0111nnniiXXXfL?? 易见,似然函数??L无驻点.需要直接求??L的最大值点,记nnXXXXmax21;由于nX,且??L随??减小而增大,所以当??nX 时??L达到最大值,故??nX就是未知参数??的最大似然估计量.2 现在验证估计量??nX的无偏性.为此,首先求??nX的概率分布.总体X的分布函数为.,若,,若,若 1 0 0 0 xxxxxF 由于nXXX21??独立同分布,可见??nX的分布函数为,11nnnnnxFxXxXxXxXxXxFPPPP???? 其概率密度为.,若不然,,若0 0dd11xnxxFxFnxFxxfnnnnn 因此,有1dd01??nnxnxxxxxfXnnnnE.这样,??nX是??的有偏估计量.容易验证,??的无偏估计量为1nXnn??.7.7 已知随机变量X的概率密度为若不然.若0 101xxxf 试根据来自X的简单随机样本21nXXX??,求未知参数??的最大似然估计量.—习题解答●7.4—未知参数??的似然函数和对数似然函数为.;;10ln1lnln21n1112111niinnniiXXXXnLXXXXfL??????????由此,得似然方程n1 0lnlniiXnL;其惟一解是niinXnXXn11lnln??????.于是,就是未知参数??的最大似然估计量.7.8 设ugt??是严格单调函数且有惟一反函数.证明,若是未知参数??的最大似然估计量,则gtgT????是的最大似然估计量.设??L是未知参数??的似然函数.记th是??gt??的惟一反函数,则??LthL??.设D是函数??gt??的值域,由“是未知参数??的最大似然估计量”,可见maxmax??thLLLThLDt,即gT??是??gt??的最大似然估计量.7.9 设21nXXX??是来自总体X的简单随机样本,总体X的概率密度为:;,,,若若xxxfx0e 试求未知参数??的最大似然估计量1和矩估计量2. 1 参数??的似然函数为.nXniXniiniiiXfL??1ee11 由此可见,其似然方程无解,需要直接求其似然函数,,,若不然若0 exp211nniiXXXnXL?? 的最大值.当nXXX21??时0L,而当nXXX21??,即nXXXmin21??时??L随??的增大而增大,可见当nXXXmin21??时??L达到最大值.参数??的最大似然估计量为nXXXmin??211??.—习题解答●7.5— 2 求参数??的矩估计量.总体X 的数学期望为:.1edeeded xxxxxxxxxxxfXE 用样本均值X估计XE:1??2X,可得参数??的矩估计量为1??2??X=??.7.10设每次射击的命中率为p.接连不断独立地进行射击直到命中目标为止,nkkk21??是n轮射击各轮实际射击的次数,求命中率p 的最大似然估计量和矩估计量.1 设X表示实际射击的次数,则X服从参数为p的几何分布,而nkkk21??是来自总体X的简单随机样本.总体X的概率函数为2111xpppxpx.命中率p的似然函数为.,1lnlnln1111111pnkpnpLpppppkppLniininknkniiniii将该式两侧对p求导数并令其等于0,得似然方程:.011dlnd1pnkpnppLnii 其惟一解niiknp1 ?? 就是命中率p的最大似然估计量. 2 设X是实际射击的次数,而nkkk21??是来自总体X的简单随机样本,则样本均值为pXknXnii111E,.于是,由pX??1 ??,得未知参数p的矩估计量niiknXp1 1??.7.11 设来自总体X的简单随机样本21nXXX??,总体X的概率分布为22112321????????X,其中0lt??lt1.试求—习题解答●7.6—1 未知参数??的最大似然估计量1;2 未知参数??的矩估计量2;3 当样本值为(112132)时的最大似然估计值1和矩估计值2. 1 求参数??的最大似然估计量.分别以2121n和表示21nXXX?? 中1,2和3出现的次数,则似然函数和似然方程为.,,01222dlnd1ln22ln22lnln1211221212121222222212122121 nLnLLnn 似然方程的惟一解就是参数??的最大似然估计量:n22??211.2 求参数??的矩估计量.总体X的数学期望为221314XE.在上式中用样本均值X估计数学期望XE,可得??的矩估计量:321??2X. 3 对于样本值(112132),由上面得到的一般公式,可得最大似然估计值;321223222??211n?????? 矩估计值326523321??2X??.7.12 设随机变量X的分布函数为.,若,,若=1 0 111xxxxF 其中参数1.设nXXX21??为来自总体X的简单随机样本,求 1 未知参数??的矩估计量;2 未知参数??的最大似然估计量.由条件知随机变量X的概率密度为.,若,,若1 0 11xxxxf 1 X的数学期望为1d11xxxXE.用样本均值X估计XE得—习题解答●7.7— 1X,1XX?? 就是未知参数??的矩估计量.2 未知参数??的似然函数和对数似然函数为;,,,若不然;若ininnnniiXnLXXXXXXXfL1211211ln1lnln 01 似然方程为0lndlnd1niiXnL??????,其唯一解niiXn1ln???? 就是未知参数??的最大似然估计量.7.13 设随机变量X的分布函数为.,,,=xxxxF 0 122 其中0.设nXXX21??为来自总体X的简单随机样本,求未知参数??的最大似然估计量.由条件知随机变量X的概率密度为.,若,,若xxxxf 0 232 未知参数??的似然函数为.若若,,,nnnnnniiXXXXXXXXXXfL ***********??????似然函数??L显然无驻点,需要直接求其最大值点.由??L值随??增大而增大,可见??L的最大值点为nXXXmin??21??.于是nXXXmin??21??就是未知参数??的最大似然估计量.7.14 为观察一种橡胶制品的耐磨性,从这种产品中各随意抽取了5件,测得如下数据:—习题解答●7.8— 185.82,175.10,217.30,213.86,198.40.假设产品的耐磨性2NX,求2和的无偏估计值.样本容量n5.经计算,得样本均值X198.10,样本方差23.3240063.1822S.于是??的无偏估计值;10.198X?? 23.3242??S是2??的无偏估计.7.15 对某种袋装食品的质量管理标准规定:每袋平均重500克,标准差10克.现在从一商店的一批这种袋装食品中随意抽取了14袋,测量每袋的重量,得如下数据:500.90,490.01,501.63,500.73,515.87,511.85,498.39,514.23,487.96,525.01,509.37,509.43,488.46,497.15.假设这种袋装食品每袋的重量X服从正态分布2N.试利用??和??的0.95置信区间,说明抽查结果是否表明这一批袋装食品每袋平均重??和标准差??符合标准.经计算样本均值,64.503??X样本标准差11.11??S正态总体的数学期望??的1置信区间的一般形式为:XX,其中??的表达式区分202已知和2??未知两种情形:未知,若,已知,若 1 00nStnun 其中??u是标准正态分布水平??双侧分位数(附表3),1??nt??是自由度为1n??的t分布水平??双侧分位数(附表4)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由给定数据算得
s
2
x 14.95
2
1 5
( xi 6 x ) 0.051.
2 i 1
6
s 0.226
ch7-86
由公式 (2) 得 的置信区间为
(x s 6 (14.71, t0.025 (5), 15.187 )
K 5S
2
x
s 6
t0.025 (5) )
(3) 选取枢轴量
(1) 若 2=0.06, 求 的置信区间 (2) 若 2未知,求 的置信区间 (3) 求方差 2的置信区间.
X 0.1
置信度 均为0.95
解 (1) X ~ N ( , 0.06 / 6) 即 N ( ,0.01)
~ N (0,1) z z 0.025 1.96
由
解
X P z 2 n
X z
2
确定 z
2
n
得 的置信度为 1 的置信区间为
( X z
2
0
n
,
X z
2
0
n
)
(2) 方差 2未知 , 的置信区间
S S , X t (n 1) X t (n 1) (2) 2 2 n n
(一) 一个正态总体 X ~N ( 2)的情形 (1) 方差 2已知, 的置信区间
( X z
2
n
, X z
2
) n
(1)
推导 由
X ~ N ( ,
2
) n
选取枢轴量
X
g ( X 1 , X 2 ,, X n , )
n
~ N (0,1)
ch7-80
X 1.96 1 , 5 X 1.96 1 5
称随机区间
为未知参数 的置信度为0.95的置信区间.
ch7-71
置信区间的意义
反复抽取容量为5的样本,都可得 一个区间,此区间不一定包含未知参数 的真值, 而包含真值的区间占95%.
若测得 一组样本值, 算得 x 1.86 则得一区间(1.86 – 0.877, 1.86 + 0.877) 它可能包含也可能不包含 的真值, 反复 抽样得到的区间中有95%包含 的真值.
(5)
ch7-89
(2) 1 , 2未知( 但 12 22 2 ) 1 2的置信区间
2 2
X Y ~ N ( 1 2 , ( X Y ) ( 1 2 ) 1 n 1 m
2
2
(n 1) S1
2
)
n
m
2 (m 1) S 2
g ( X x , X 2 , , X n , )
取枢轴量
g ( X 1 , X 2 , , X n , ) X 1/ 5
~ N (0, 1)
ch7-78
给定置信度 1 ,定出常数 a , b ,使得
P(a g ( X 1 , X 2 , X n , ) b) 1
2
~ (n 1)
2
~ N (0,1)
2
2
2
~ (m 1)
2
2
(n 1) S1
(m 1) S 2
2
~ (n m 2)
2
( X Y ) ( 1 2 ) 1 n 1 m ( n 1) S1 ( m 1) S 2
2 2
~ t ( n m 2)
ch7-82
(3) 当 已知时, 方差 2 的 置信区间
Xi 2 Q ~ ( n) 由概率 取枢轴量 , i 1 n 2 (Xi ) 2 2 P 1 (n) i 1 ( n) 1 2 2 2 得 2 的置信度为1 置信区间为
( 引例中 a 1.96, b 1.96 )
由 a g ( X 1 , X 2 , X n , ) b 解出 T1 , T2
得置信区间 ( T1 , T2 )
引例中
( T1 , T2 ) ( X 1.96 1 , 5 X 1.96 1 ) 5
ch7-79
置信区间常用公式
0.05 0.025
2
-2
(4)
2
1
• 2
2
4
6
8
•
10
2
2
ch7-84
例1 某工厂生产一批滚珠, 其直径 X 服从 正态分布 N( 2), 现从某天的产品中随机 抽取 6 件, 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1
(1) 1 , 2
2
2
已知,
1
n
2
1 2
的置信区间
2
X ~ N ( 1 ,
), Y ~ N ( 2 ,
2
m
)
X ,Y
相互独立,
( X Y ) ( 1 2 )
1
n
2
2
m
2
~ N (0,1)
1 2
的置信区间为
2 2 2 2 ( X Y ) z 1 2 , ( X Y ) z 1 2 2 2 n m n m
则称 [ T1 , T2 ]为 的置信水平为1 - 的
置信区间或区间估计. T1 置信下限 T2
T2 T1 T2 T1
反映了估计精度
越小, 估计精度越高.
反映了估计的可靠度, 越小, 越可靠. 越小, 1- 越大, 估计的可靠度越高,但
2
的置信区间为
2 S1 1 2 S 2 F (n 1, m 1) 1 2 (9)
ch7-94
(6) 方差比 的置信区间 ( 1 , 2 已知)
ch7-68
§7.3
区间估计
引例 已知 X ~ N ( ,1), 的无偏、有效点估计为 X
常数
随机变量
不同样本算得的 的估计值不同, 因此除了给出 的点估计外, 还希望根据 所给的样本确定一个随机区间, 使其包含 参数真值的概率达到指定的要求.
ch7-69
如引例中,要找一个区间,使其包含 的 真值的概率为0.95. ( 设 n = 5 )
2 2
( X Y ) t 2
(6)
ch7-91
(3) 1 , 2 未知, n, m > 50, 1 2的置信区间
2 2
1
n
2
2
m
2
S1 n
2
S2
2
m
~ N (0,1) S1 n
2
( X Y ) ( 1 2 ) S2
2
m
X 1 ~ N 0 , 1 X ~ N , 1 5 5
取 查表得
0.05
z / 2 1.96
ch7-70
这说明
X P 1.96 0.05 1 5
即
P X 1.96 1 X 1.96 1 0.95 5 5
ch7-81
推导
选取枢轴量
T
X S n
~ T ( n 1)
X 由P t (n 1) 2 S n
确定t ( n 1)
2
故
S S 的置信区间为 X t2 (n 1) , X t2 (n 1) n n
2
3.92
2
0.4
0.3
0.2
z 2 z1 1.84 ( 2.13)
3 3
0.1
3.97
1
-2 z1
-1
z 2 2
3
3
ch7-74
置信区间的定义
设 为待估参数, 是一给定的数, ( 0<<1). 若能找到统计量 T1 , T2 , 使
P(T1 T2 ) 1
nm2
ch7-90
P
( X Y ) ( 1 2 ) 1 n 1 m (n 1) S1 (m 1) S 2
2 2
nm2
t 1 2
1 2
的置信区间为
1 n 1 m (n 1) S1 (m 1) S 2 nm2
n 2
n 2 ( X i ) i 1 , 2 ( n) 2
( X i ) i 1 (3) 2 1 (n) 2
n 2
ch7-83
(4) 当 未知时, 方差 2 的置信区间 选取 K
P( 1
2
2
( n 1) S
2
2
~ ( n 1)
2
则由
0.15
( n 1) S
2
2
) 1
2
2
0.125 0.1 0.075
2
得 2 的置信区间为
2 (n 1) S 2 (n 1) S , 2 2 (n 1) (n 1) 1 2 2
这时, T2 T1 往往增大, 因而估计精度降低.