理学概率统计第八章第二节

合集下载

应用概率统计之判别分析

应用概率统计之判别分析
假设m 个总体出现的先验概率分别为: 假设将属于Gi 的样品错判给 Gj 的损失记为C(j|i)。
显然有 C(i|i)=0 ,C(j|i)≥0 。 假设判别规则为: R=(R1, …,Rm )。则根据此规则
的错判概率为:
励志人生 好好学习
• 判别法则R把来自总体Gi 的个体错判给其它总体的 平均损失:
励志人生 好好学习
应用概率统计之判别分 析
励志人生 好好学习
第八章 判别分析
➢ 判别分析的含义:
➢ 根据给定的若干总体的观测资料,构造出一个 判别函数,并由此函数对于某一样品属于哪个总体 做出判断。
➢ 判别分析的主要方法:
➢ 距离判别(Distance Discrimination);
➢ Bayes 判别;Fisher判别等。
定义 x 和总体 G 之间的马氏距离为:
✓ 马氏距离满足距离的三条公理。 ✓ 当V=I 时,马氏距离即为通常的欧式距离。
励志人生 好好学习
若变量之间是相互无关的,则协方差矩阵为对角矩阵
励志人生 好好学习
励志人生 好好学习
二、两个总体的判别分析
1. 两个总体有相同的协方差阵:
❖ 直观的判别准则:
一、Fisher 线性判别函数 假设有m 个总体G1, …,Gm ,xi 表示来自总体Gi 的
样品。对任一给定的方向u, xi 在该方向上的投影为

励志人生 好好学习
在u 方向各总体之间的分离程度——组间离差
励志人生 好好学习
在u方向各总体内部的聚集程度——组内离差
Fisher判别的思想:选择u,B(u)/E(u) 达到最大。
Bayes 判别的基本概念 两个总体的判别 三群以上的判别

中北大学概率统计习题册第八章完整答案

中北大学概率统计习题册第八章完整答案

第八章 假设检验【主要内容】一、显著性检验的基本思想为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设0H ,然后在0H 为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小概率事件居然发生了,就完全有理由拒绝0H 的正确性,否则没有充分理由拒绝0H 的正确性,从而接受0H ,这就是显著性检验的基本思想。

二、假设检验的基本步骤1.由实际问题提出原假设0H (备选假设1H );2.选取适当的统计量,并在0H 为真的条件下确定该统计量的分布;3.根据问题的要求确定显著性水平α(一般题目中会给定),从而得到拒绝域;4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对0H 作出判断。

三、两类错误当0H 本来是正确的,但检验后作出了拒绝0H 的判断,这种错误称为第一类错误,也称拒真错误;当0H 本来是不正确的,但检验后作出了接受0H 的判断,这种错误称为第二类错误,也称纳伪错误。

注:只对第一类错误加以控制,而不考虑第二类错误的假设检验,称为显著性检验。

四、单个正态总体的假设检验 1.μ的假设检验:设总体),(~2σμN X ,),,,(21n X X X Λ为来自X 的一个样本,显著性水平为α。

① 2σ已知时,对μ的假设检验:)1,0(~0N n X U σμ-=,(a )0100:,:μμμμ≠=H H ,(双边检验)0H 的拒绝域为1/2{}W U u α-=>;(b )0010:,:H H μμμμ≤>,(单边检验)0H 的拒绝域为1{}W U u α-=>;(c )0010:,:H H μμμμ≥<,(单边检验)0H 的拒绝域为1{}W U u α-=<-。

②2σ未知时,对μ的假设检验:)1(~0--=n t n SX T μ,(a )0100:,:μμμμ≠=H H ,(双边检验)0H 的拒绝域为1/2{(1)}W T t n α-=>-;(b )0010:,:H H μμμμ≤>,(单边检验)0H 的拒绝域为1{(1)}W T t n α-=>-;(c )0010:,:H H μμμμ≥<,(单边检验)0H 的拒绝域为1{(1)}W T t n α-=<--。

概率统计各章节知识点总结.ppt

概率统计各章节知识点总结.ppt
概率统计各章节总结
第一章
概率的计算
1)统计定义: fn ( A) n 稳定值 P( A)
2)概率的性质:1~5
3)等可能概型:P(
A)
m n
4)条件概率:P(B
A)
k m
P( AB) P( A)
独立
5)乘法定理: P( AB) P( A)P(B A) P(A)P(B)
1 P(A B)
A AB1 U AB2
1 n
n k 1
Xk
P
p
X1, X 2 , , X n , 相互独立
E( Xk ) 同分布
1
n
n k 1
Xk
P
n
X1 , X 2 , , X n , 相互独立
X k n 近似
同分布E( X k ) D( X k ) 2 k1 n
~ N (0,1)
Xn ~ B(n, p)
Xn np
X ~ N (, 2 ) Th1 X ~ N (, 2 n),
Th2
X1, X 2 , , X n (n 1)S 2 2 ~ 2(n 1) 独立
X , S 2
1n X n i1 X i
S 2
1 n1
n i 1
(Xi
X )2
X ~ t(n 1)
Sn
第六章
常用统计量及抽样分布
2统计量
6)全概率公式:P( A) P(B1 )P( A B1 ) P(B2 )P( A B2 )
7)贝叶斯公式:P(B1
A)
P(B1 )P( A B1 ) P( A)
A
B1
互斥
B2
第二章
随机变量概率分布
离散型随机变量
连续型随机变量

8.4.2系统抽样

8.4.2系统抽样


=

∴取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序
号的学生,得到容量为50的样本.其学生号码依次为
16,36,56,76, …,996.
与简单随机抽样相比,系统抽样有哪些优点与缺点?
优点:可避免抽到的样本集中在一定的范围,而另有一些范围没有抽到的现象.
缺点:抽取过程较繁锁.
(3)确定第一个编号:在第一段编号中用简单随机抽样随机抽取一个编号(如 = );
(4)取样:从每一段中将编号15,115,215,…,915共10个号码选出,由这 10个号码所对
应的工人担任质量监督员.
新授
系统抽样的特点:
(1)个体数目比较多;
(2)把总体分成均衡的若干部分,分段间隔相等,在第一
3.学校从一年级800名学生中采用系统抽样方法抽取50名学生做牙齿健康检查,设计
抽样方案.
解:抽样方案如下:
(1)编号:将这800名学生随机编号为1至800;
(2)分段:取间隔 =


= ,将总体分为50段,每段含有16个个体,即第一段号码
为1至16,第二段号码为17至32,……,第五十段号码为785至800;
(3)确定第一个编号:在第一段编号中用简单随机抽样随机抽取一个编号(如 = );
(4)取样:从每一段中将编号7,23,39…,791共50个号码选出,由这50名学生做牙齿
健康检查.
4.某职业院校为了解一年级新生的健康状况,从1000名新生中,利用系统抽样抽取50
名学生进行技能测试,若将这1000名学生随机编号,在抽取的50名学生中,编号落在
(560,800]内的人数是多少?
解:抽样分段间隔 =

理学概率论与数理统计浙江大学第四版盛骤概率论部分

理学概率论与数理统计浙江大学第四版盛骤概率论部分

例:
✓ ✓ ✓ ✓
抛一枚硬币,观察试验结果; 对某路公交车某停靠站登记下车人数; 对某批电子产品测试其输入电压; 对听课人数进行一次登记;
9
§2 样本空间·随机事件
(一)样本空间
定义:随机试验E的所有结果构成的集合称为E的 样本空间,记为S={e},
例:
➢ ➢
称S中的元素e为基本事件或样本点.
一枚硬币抛一次 S={正面,反面}; 记录一城市一日中发生交通事故次数
概率论与数理统计是研究随机现象 数量规律的一门学科。
1
第一章 概率论的基本概念
• 1.1 随机试验 • 1.2 样本空间 • 1.3 概率和频率 • 1.4 等可能概型(古典概型) • 1.5 条件概率 • 1.6 独立性
第二章 随机变量及其分布
• 2.1 随机变量 • 2.2 离散型随机变量及其分布 • 2.3 随机变量的分布函数 • 2.4 连续型随机变量及其概率密度 • 2.5 随机变量的函数的分布
第十二章 平稳随机过程
• 12.1 平稳随机过程的概念 • 12.2 各态历经性 • 12.3 相关函数的性质 • 12.4 平稳过程的功率谱密度
5
概率论
第一章概率论的基本概念
6
第一章 概率论的基本概念
关键词: 样本空间 随机事件 频率和概率 条件概率 事件的独立性
7
§1 随机试验
确定性现象
解:假设接待站的接待时间没有规定,而各来访者在一周 的任一天中去接待站是等可能的,那么,12次接待来 访者都是在周二、周四的概率为 212/712 =0.000 000 3.
人们在长期的实践中总结得到“概率很小的事件在一次 试验中实际上几乎是不发生的”(称之为实际推断原理)。 现在概率很小的事件在一次试验中竟然发生了,因此有理由 怀疑假设的正确性,从而推断接待站不是每天都接待来访者, 即认为其接待时间是有规定的。

概率论与数理统计图文课件最新版-第六章-第八章知识结构图-数理统计的客观背景

概率论与数理统计图文课件最新版-第六章-第八章知识结构图-数理统计的客观背景

总体

概率统计
注 ▲ 研究对象的某项数量指标 X 是一个随机变量 因此,X 所有可能取的值的分布为总体 X 的 分布,记为F( x ),称其为总体 X 的分布函数。 这是由于每个个体的出现是随机的,所以相 应的数量指标的出现也带有随机性。从而可 以把这种数量指标看作一个随机变量,因此 随机变量的分布就是该数量指标在总体中的 分布。
例如 在几何学中要证明“等腰三角形底角相等”, 则只须从“等腰”这个前提出发,运用几何 公理,逐步推出这个结论. 而一个习惯于统计思想的人,就可能会应用 如下的方法:
做很多大小形状不一的等腰三角形,实际测量 其底角,看其差距如何,然后根据所得资料判 断可否作出“底角相等”的结论。 这样的方法 即为归纳式的方法.
概率统计
随机抽样法: 是一种从局部推断整体的方法.
要较好地反映所研究和讨论的随机变量整体的特
性,就必须研究: (1) 如何抽样,抽多少,怎么抽
抽样方法问题
(2) 如何对抽样的结果进行合理分析,作出科学
的判断.
统计推断问题
今后所讨论的统计问题主要属于下面这种类型:
从所研究的随机变量的某个集合中抽取一部分元素, 对这部分元素的某些数量指标进行试验与观察,根 据试验与观察获得的数据来推断这集合中全体元素 的数量指标的分布情况或数字特征。
▲ 由于是从一部分样本观察值去推断该全体对象 (总体)情况,即,由部分推断全体. 所以在数理统计中使用的推理方法是:
归纳推理法
概率统计
▲ 但这种“归纳推理”不同于数学中的“演绎推理”
因为它在作出结论时,是根据所观察到的大量个别 情况 “归纳” 起来所得,而不是从一些假设、命题、 已知的事实等出发,按一定的逻辑推理去得出来的

《理学概率教案》课件

《理学概率教案》课件

《理学概率教案》PPT课件第一章:概率论的基本概念1.1 概率的定义与性质介绍概率的定义,理解概率是衡量随机事件发生可能性大小的数。

掌握概率的基本性质,如非负性、归一性等。

1.2 样本空间与事件理解样本空间的概念,即所有可能结果的集合。

学习事件的定义,包括基本事件和复合事件。

掌握事件的运算,包括并、交、补等。

第二章:随机变量及其分布2.1 随机变量的概念介绍随机变量的定义,理解随机变量是样本空间到实数的函数。

学习离散随机变量和连续随机变量的概念。

2.2 随机变量的分布函数理解分布函数的定义和性质,包括单调性、界限性等。

学习离散随机变量的概率质量函数和累积分布函数。

掌握连续随机变量的概率密度函数和累积分布函数。

第三章:大数定律与中心极限定理3.1 大数定律学习大数定律的定义和意义,理解随机变量序列的极限性质。

掌握弱大数定律和强大数定律的表述及证明。

3.2 中心极限定理介绍中心极限定理的定义,理解当样本容量足够大时,样本均值的分布趋于正态分布。

学习中心极限定理的证明及应用,包括样本均值的抽样分布等。

第四章:随机变量的数字特征4.1 期望的概念理解期望的定义,掌握期望的计算方法。

学习期望的性质,如线性性、单调性等。

4.2 方差与标准差掌握方差的定义和计算方法,理解方差的意义。

学习标准差的概念,即方差的平方根。

4.3 协方差与相关系数理解协方差的概念,掌握协方差的计算方法。

学习相关系数的概念,理解相关系数衡量两个随机变量线性相关程度。

第五章:随机过程与马尔可夫链5.1 随机过程的概念介绍随机过程的定义,理解随机过程是随机变量序列随时间演变的过程。

学习离散随机过程和连续随机过程的概念。

5.2 马尔可夫链掌握马尔可夫链的定义和性质,理解马尔可夫链的转移概率和马尔可夫性。

学习马尔可夫链的分类,包括齐次马尔可夫链和非齐次马尔可夫链等。

第六章:条件概率与贝叶斯定理6.1 条件概率的概念理解条件概率的定义,掌握条件概率的计算方法。

《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布

《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布

《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆短期的机遇变异
重复投掷一枚均匀硬币六次,观察每次出现的面: (1)正反正反反正 (2)反反反正正正 (3)正反反反反反
直觉认为结果(1)是随机的,结果(2)和结果 (3)很不随机。 从概率的观点认为结果(1)、(2)、(3)的发 生有相同的概率,因而没有哪一个结果比其他结果更多 一点或少一点随机性。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
◆变异性(Variablity)
统计数据和统计资料具有变异性, 即个体之间有 差异,而对同一个体的多次观察,其结果也会不一样, 并且几乎每一次观察都随着时间的不同而改变,因而变 异性是一个重要的统计观念。 抽样结果的差异是变异性的主要表现 不能仅仅根据一次抽样的结果就断下结论!
《概率统计简明教程》第二版
第八章 统计量与抽样分布
二、总体和样本
1.总体
我们关心的是总体中的个体的某项指标(如人的身高、 灯泡的寿命, 汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指标 的出现也带有随机性 . 从而可以把这种数量指标看作一 个随机变量X ,因此随机变量X的分布就是该数量指标在 总体中的分布.
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆长期的规律性
在某地的彩票活动中,七年中有人累计中两次大 奖的机会是: 一半对一半
人们的潜意识常常与理性思考的结果有很大差别, 如不善于统计思考,即使面对十分平常的现象,也会闹 出笑话。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
第八章 统计量与抽样分布
二、总体和样本

《概率论与数理统计教学课件》8第八章—正态总体均值和方差的假设检验

《概率论与数理统计教学课件》8第八章—正态总体均值和方差的假设检验
0
真)
P1 2
(
x y
11
k)
k t (n1 n2 2)
sw
n1 n2
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11
t (n1 n2 2)
2
n1 n2
注:

2 1
2 2
2
未知时
检验假设

H0 : 1 -2 (或1 2 ), H0 : 1 2 (或1 2 ),
2
概率统计
所以拒绝H 0 ,可认为这两种轮胎的耐磨性有显著差异。
注: ▲ 用两种不同的方法得到了两种不同的结论,那么
究竟应该采取哪一个结论比较合理呢?
显然,应该采取第二种方法得出的结论是合理的
因为数据配对的方法是针对同一架飞机的,它是 排除了因飞机之间的试验条件的不同而对数据产 生的干扰,所以它是直接反映了这两种轮胎的耐 磨性的显著差异的情况,因此,应采取第二种方 法得出的结论,即可认为这两种轮胎的耐磨性有 显著差异。
概率统计
按单个正态总体中当 2 未知时,关于 的假设检验
的计算公式,可得 H0 的拒绝域为:
C { t t t (n 1)}
2
经计算 d 320 , s2 89425 ,
t
d s
320 2.83 89425
n
8
t (n 1) t0.05 (7) 2.365
2
2
因为: t 2.83 t0.05 (7) 2.365
为已知常数,显著水平为
概率统计
Q 检验统计量
(X Y)
~ N (0,1)
2 1
2 2
n1 n2

第八章损失分布第一次课

第八章损失分布第一次课
i 1 。 k
Ai ) f n ( Ai )
i 1
k
且 fn ( A) 随n的增大渐趋稳定,记稳定值为p.
21 21
2、概率的统计定义
fn ( A)的稳定值p定义为A的概率,记为P(A)=p 定义1:
定义2:将概率视为测度,且满足:
1。 0 P( A) 1
2° P() 1
22 25 21 25 24 21 18 24 27 31
fn(H) 0.44 0.50 0.42 0.50 0.48 0.42 0.36 0.48 0.54 0.62
251 249 256 253 251 246 244 258 262 247
fn(H) 0.502 0.498 0.512 0.506 0.502 0.492 0.488 0.516 0.524 0.494
15
例2:将n个不同的球,投入N个不同的盒中(n≤N),
设每一球落入各盒的概率相同,且各盒可放的球数 不限,记A={ 恰有n个盒子各有一球 },求P(A)。 解:
① ②…… 1 2 ② n ②

N 1 2 ② …… N 1 2 ① N N

1 2
16 16
即当n=2时,共有N2个样本点;一般地,n个 球放入N个盒子中,总样本点数为Nn,使A发生的
27
2、互补事件
( 1 )互补事件:即不可能同时 发生而又必然有一个会发生的 两个事件 (2)互补事件的概率之和等于1
A A
P( A) P( A ) 1

P( A ) 1 P( A)
例如:掷一个骰子,“出现2点”的概率 是 1/6,则“不出现2点”的概率就是5/6 。
28
3、相容事件的加法公式

概率统计与随机过程 8- 参数估计

概率统计与随机过程 8- 参数估计
EX = A1 = X 2 EX = A2
EX = A1 = X E ( X − EX ) 2 = S 2
EX = A1 = X E ( X − EX ) 2 = B2
此外还需比较估计的优劣性, 此外还需比较估计的优劣性 , 这一点将在下 一节将会介绍,这里不再多说。 一节将会介绍,这里不再多说。
设随 机 变量X :EX =μ, DX =σ
1 n
2
分别为总体X的一阶原点矩和二阶中心矩; 分别为总体X的一阶原点矩和二阶中心矩;而
i =1
∑ Xi = X ,
i =1
n
1 n −1
∑ ( X i −X ) = S
2
n
2
分别为样本的一阶原点矩和样本方差. 分别为样本的一阶原点矩和样本方差.
ˆ 称 µ =
ˆ= 1 θ n

n
i =1
Xi
2、极大似然函数法
先看一个简单的例子: 某位同学与一位猎人一起外出打猎,一 只野兔从前方窜过.只听到一声枪响,野兔 应声倒下.如果要你推测,是谁打中的呢? 你会如何想呢? 你就会想,只发一枪便打中,猎人命中的 概率一般大于这位同学命中的概率.看来这 一枪是猎人射中的. 这个例子所作的推断已经体现了极 大似然法的基本思想.
ln L = ∑ [(1 − xi ) ln(1 − p ) + xi ln p ]
i =1
n
令 d ln L =
dp
1 p

xi −
1 1− p

(1 − x i ) = 0
ˆ ⇒ p=x
多参数情形的极大似然估计 f 若总体X的概率密度为: ( x ; θ 1 , θ 2 , L , θ k ) 其中 θ ,θ ,L,θ 为未知参数, x , x ,⋅ ⋅ ⋅, x 为样本观察值, 此时似然函数为: L( x , x ,L, x ;θ ,θ ,L,θ ) = C f ( x ;θ ,θ ,L,θ )

概率论与数理统计(茆诗松)第二版课后第八章习题参考答案

概率论与数理统计(茆诗松)第二版课后第八章习题参考答案

第八章 方差分析与回归分析本章前三节研究方差分析,讨论多个正态总体的比较,后两节研究回归分析.讨论两个变量之间的相关关系.§8.1 方差分析8.1.1问题的提出上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比较问题.通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比较.一般将该因素称为一个因子,所检验的每种情形称为水平.在每个水平下需要考察的指标都分别构成一个总体,比较它们的总体均值是否相等.对每一个总体都分别抽取一个样本,样本容量称为重复数.如果只对一个因子中的多个水平进行比较,称为单因子方差分析,对多个因子的水平进行比较,称为多因子方差分析.本章只进行单因子方差分析.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A 1 , A 2 , A 3 ,为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量.实验结果如下表所示: 饲料鸡重/gA 1 1073 1009 1060 1001 1002 1012 1009 1028 A 2 1107 1092 990 1109 1090 1074 1122 1001 A 3 1093 1029 1080 1021 1022 1032 1029 1048 在此例中,就是要考察饲料对鸡增重的影响,需要比较三种饲料对鸡增肥的作用是否相同.这里,饲料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡60天后的重量分别构成一个总体,这里共有3个总体,每一个总体抽取样本的重复数都是8,比较这3个总体的均值是否相等. 8.1.2单因子方差分析的统计模型设因子A 有r 个水平A 1 , A 2 , …, A r ,在每个水平下需要考察的指标都构成一个总体,即有r 个总体,分别记为Y 1 , Y 2 , …, Y r ,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是m ,总体Y i 的样本Y i 1 , Y i 2 , …, Y im ,i = 1, 2, …, r .作出以下假定:(1)每一个总体都服从正态分布,即r i N Y i i i ,,2,1),,(~2L =σµ;(2)各个总体的方差都相等,即22221r σσσ===L ,都记为σ 2;(3)各个总体及抽取的样本相互独立,即Y ij 相互独立,i = 1, 2, …, r ,j = 1, 2, …, m . 需要比较它们的总体均值是否相等,即检验的原假设与备择假设为H 0:µ 1 = µ 2 = … = µ r vs H 1:µ 1 , µ 2 , …, µ r 不全相等,如果H 0成立,就可以认为这r 个水平下的总体均值相同,称为因子A 不显著;反之,如果H 0不成立,就称为因子A 显著.在水平A i 下的样品Y ij 与该水平下的总体均值µ i 之差ε ij = Y ij − µ i 为随机误差.由于Y ij ~ N (µ i , σ 2 ),因此随机误差ε ij ~ N (0 , σ 2 ).对所有r 个水平下的总体均值求平均,即∑==+++=ri i r r r 1211)(1µµµµµL称为总均值.每个水平A i 下的总体均值µ i 与总均值µ 之差a i = µ i − µ 称为该水平A i 下主效应.显然所有主效应a i 之和等于0,即01=∑=ri ia,检验所有水平下的总体均值是否相等,也就是检验所有主效应a i 是否全等于0.这样单因子方差分析在重复数相等的情形下,统计模型为⎪⎪⎩⎪⎪⎨⎧===++=∑=).,0(;0;,,2,1,,,2,1,21σεεµN a m j r i a Y ij r i i ij i ij 相互独立,且都服从L L 检验的原假设与备择假设为H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0. 8.1.3平方和分解一.试验数据对于r 个总体下的试验数据Y ij , i = 1, 2, …, r ,j = 1, 2, …, m ,记T i 表示第i 个总体下试验数据总和,⋅i Y 表示第i 个总体下样本均值,n = rm 表示总的样本容量,T 表示总的试验数据总和,Y 表示总的样本均值,即∑==mj ij i Y T 1,∑=⋅==mj ij i i Y m m T Y 11, i = 1, 2, …, r ,∑∑∑=====r i mj ij r i i Y T T 111,∑∑∑=⋅=====ri i r i m j ij Y r Y rm T n Y 111111, 用⋅i Y 作为µ i 的点估计,Y 作为µ 的点估计.又记⋅i ε表示第i 个总体下随机误差平均值,ε表示总的随机误差平均值,即∑=⋅=mj ij i m 11εε, i = 1, 2, …, r ,∑∑∑=⋅====ri i r i m j ij r n 11111εεε.显然有⋅⋅+=i i i Y εµ,εµ+=Y .在单因子方差分析中通常将试验数据及基本计算结果写成表格形式 因子水平试验数据和 和的平方平方和A 1 Y 11 Y 12 … Y 1m T 1 21T∑21jY A 2 Y 21 Y 22 … Y 2m T 2 22T∑22jY┆ ┆ ┆ ┆ ┆ ┆ ┆┆A rY r 1Y r 2…Y rmT r2r T ∑2rjYΣ T∑=ri i T 12∑∑==ri mj ijY112二.组内偏差与组间偏差数据Y ij 与样本总均值Y 之差Y Y ij −称为样本总偏差,可以分成两部分之和:)()(Y Y Y Y Y Y i i ij ij −+−=−⋅⋅,其中⋅⋅⋅−=+−+=−i ij i i ij i i ij Y Y εεεµεµ)()(是第i 个总体内数据与该总体内样本均值的偏差,称为组内偏差,反映第i 个总体内的随机误差;εεεµεµ−+=+−+=−⋅⋅⋅i i i i i a Y Y )()(是第i 个总体内样本均值与总样本均值的偏差,称为组间偏差,反映第i 个总体的主效应. 三.偏差平方和及其自由度在统计学中,对于k 个独立数据Y 1 , Y 2 , …, Y k ,平均值∑==ki i Y k Y 11,称Y i 与Y 之差为偏差,所有偏差的平方和∑=−=ki i Y Y Q 12)(称为这k 个数据的偏差平方和,反映这k 个数据的分散程度.由于所有偏差之和0)(11=−=−∑∑==Y k Y Y Y ki i k i i , 即这k 个偏差由k 个独立数据受到一个约束条件形成,可以证明它们与k − 1个独立(随机)变量可以相互线性表示,称之为等价于k − 1个独立(随机)变量.一般地,若k 个独立数据受到r 个不相关的约束条件,则它们等价于k − r 个独立(随机)变量.在统计学中,把形成平方和的变量所等价的独立变量个数,称为该平方和的自由度,通常记为f .如上述偏差平方和Q 的自由度为k − 1,即f Q = k − 1.由于平方和的大小与变量个数(或自由度)有关,为了对偏差进行比较,通常考虑偏差平方和与其自由度之商,称为均方和,记为MS ,反映一组数据的平均分散程度,如样本方差∑=−−=ni i X X n S 122)(11就是样本数据偏差的均方和. 四.总平方和分解公式总偏差平方和记为S T 或SST ,其自由度记为f T ,有∑∑==−=r i mj ij T Y Y S 112)(,f T = rm − 1 = n − 1;组内偏差平方和记为S e 或SSE ,其自由度记为f e ,有∑∑==⋅−=r i mj i ij e Y Y S 112)(,f e = r (m − 1) = n − r ;组间偏差平方和记为S A 或SSA ,其自由度记为f A ,有∑∑∑=⋅==⋅−=−=ri i r i m j i A Y Y m Y Y S 12112()(,f A = r − 1.组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应.定理 总偏差平方和S T 可以分解为组内偏差平方和S e 与组间偏差平方和S A 之和,其自由度也可作相应的分解,即S T = S e + S A ,f T = f e + f A ,称之为平方和分解公式. 证:∑∑∑∑==⋅⋅==−+−=−=ri mj i i ij ri mj ij T Y Y Y Y Y Y S 112112()[()(∑∑∑∑∑∑==⋅⋅==⋅==⋅−−+−+−=ri mj i i ij ri mj i ri mj i ij Y Y Y Y Y Y Y Y 11112112))((2)()(A e A e ri i A e ri mj i ij i A e S S S S Y Y S S Y Y Y Y S S +=++=×−++=−−++=∑∑∑=⋅==⋅⋅0]0[(2])()[(2111,且显然有f T = n − 1 = (n − r ) + (r − 1) = f e + f A . 8.1.4检验方法由于组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应,通过比较组内偏差平方和与组间偏差平方和检验因子的显著性.下面将证明在假设所有主效应都等于0成立的条件下,它们的均方和之商服从F 分布.定理 在单因子方差分析模型中,组内偏差平方和S e 与组间偏差平方和S A 满足(1)E(S e ) = (n − r )σ 2,且)(~22r n Se −χσ; (2)∑=+−=ri i A a m r S 122)1()E(σ,且当H 0:a 1 = a 2 = … = a r = 0成立时,)1(~22−r S Aχσ;(3)S e 与S A 相互独立. 证:根据第五章的定理结论知:设X 1 , X 2 , …, X n 相互独立且都服从正态分布N (µ , σ 2),记∑==ni i X n X 11,∑=−=ni i X X S 120)(,则X 与S 0相互独立,且)1(~22−n S χσ.(1)∑∑==⋅−=ri mj i ij e Y Y S 112)(,Y i 1 , Y i 2 , …, Y im 相互独立且都服从正态分布N(µ i , σ 2),∑=⋅=mi ij i Y m Y 11,则∑=⋅−mj i ij Y Y 12)(与⋅i Y 相互独立,且)1(~)(12122−−∑=⋅m Y Y mj i ijχσ,因在不同水平下的样本都相互独立,则∑∑==⋅−ri mj i ij Y Y 112)(与⋅⋅⋅r Y Y Y ,,,21L 也相互独立,且根据独立χ 2变量的可加性知)(~)(121122r rm Y Y r i mj i ij−−∑∑==⋅χσ,故)(~)(1211222r n Y Y S r i mj i ije−−=∑∑==⋅χσσ,即得E(S e ) = (n − r )σ 2;(2)∑∑∑∑∑=⋅=⋅==⋅=⋅−+−+=−+=−=ri i i r i i r i ir i i i r i i A a m m a m a m Y Y m S 112121212(2)()()(εεεεεε,因ε ij (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (0, σ 2 ),有∑=⋅=m j ij i m 11εε (i = 1, 2, …, r ) 相互独立且都服从正态分布,0(2m N σ,∑=⋅=ri i r 11εε,则0)E()E()E(=−=−⋅⋅εεεεi i 且)1(~)(2212−−∑=⋅r mri i χσεε,即m r r i i 212)1()(E σεε−=⎥⎦⎤⎢⎣⎡−∑=⋅, 故21211212)1()E(2)(E )E(σεεεε−+=−+⎥⎦⎤⎢⎣⎡−+=∑∑∑∑==⋅=⋅=r a m a m m a m S ri i r i i i r i i ri iA ,当H 0:a 1 = a 2 = … = a r = 0成立时,∑∑=⋅=⋅−=−=ri i r i i A m Y Y m S 1212)()(εε,故)1(~)(22122−−=∑=⋅r mS ri i Aχσεεσ;(3)因∑∑==⋅−=ri mj i ij e Y Y S 112)(与⋅⋅⋅r Y Y Y ,,,21L 相互独立,有S e 与∑=⋅=ri i Y r Y 11相互独立,且∑=⋅−=ri i A Y Y m S 12(,故S e 与S A 相互独立.由于)(~22r n S e −χσ,当H 0:a 1 = a 2 = … = a r = 0成立时,)1(~22−r S A χσ,且S e 与S A 相互独立,则根据F 分布的定义可知:当H 0成立时,有),1(~)()1(22r n r F MS MS f S f S r n S r S F eAe e A A eA−−==−−=σσ.由于∑=+−=ri i A a m r S 122)1()E(σ,则F 越大,即S A 越大时,越有可能发生a i ≠ 0,则检验的拒绝域为右侧.步骤:假设H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==, 显著水平α ,右侧拒绝域W = {f ≥ f 1 − α (r − 1, n − r )},计算f ,并作出判断. 这是F 检验法.通常列成方差分析表: 来源 平方和 自由度 均方和 F 比 因子 S A f A = r − 1 MS A = S A / f A F = MS A / MS e误差 S e f e = n − r MS e = S e / f A总和S Tf T = n − 1为了计算方便,可给出三个偏差平方和的计算公式.对于一组数据X 1 , X 2 , …, X n ,记∑==ni i X n X 11,则有2112212121)(⎟⎟⎠⎞⎜⎜⎝⎛−=−=−∑∑∑∑====n i i ni i n i i n i i X n X X n X X X , 记∑==m j ij i Y T 1,∑∑∑=====r i mj ij r i i Y T T 111,可得2112211112211211211)(T n Y Y n Y Y n Y Y Y S r i mj ij r i m j ij ri mj ij ri mj ij ri mj ij T −=⎟⎟⎠⎞⎜⎜⎝⎛−=−=−=∑∑∑∑∑∑∑∑∑∑==========, 212211121212121111)(T n T m Y n mr Y m m Y r Y m Y Y m S r i i r i m j ij r i m j ij r i i ri i A −=⎟⎟⎠⎞⎜⎜⎝⎛−⎟⎟⎠⎞⎜⎜⎝⎛=⎥⎦⎤⎢⎣⎡−=−=∑∑∑∑∑∑∑======⋅=⋅, ∑∑∑===−=−=r i i r i mj ijA T e T m Y S S S 121121.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A 1 , A 2 , A 3 ,为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量.实验结果如下表所示: 饲料鸡重/gA 1 1073 1009 1060 1001 1002 1012 1009 1028 A 2 1107 1092 990 1109 1090 1074 1122 1001 A 3 1093 1029 1080 1021 1022 1032 1029 1048 在显著水平α = 0.05下检验这三种饲料对雏鸡增重是否有显著差别. 解:假设H 0:a 1 = a 2 = a 3 = 0 vs H 1:a 1 , a 2 , a 3不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==,平方和显著水平α = 0.05,n = 24,r = 3,m = 8,右侧拒绝域W = { f ≥ f 0.95 (2, 21)} = { f ≥ 3.47},试验数据计算表 因子水平试验数据Y ijT i2i T∑=mj ijY 12A 1 1073 1009 1060 1001 10021012100910288194 67141636 8398024 A 2 1107 1092 990 1109 10901074112210018585 73702225 9230355 A 31093 1029 1080 1021 10221032102910488354 69789316 8728984总和 25133 210633177 26357363计算可得0833.96602513324121063317781112212=×−×=−=∑=T n T m S r i i A ,875.282152106331778126357363112112=×−=−=∑∑∑===r i i r i mj ije T m Y S ,方差分析表来源平方和自由度均方和F 比因子 9660.0833 2 4830.0417 3.5948 误差 28215.875 21 1343.6131 总和 37875.958323有F 比f = 3.5948 ∈ W ,故拒绝H 0 ,接受H 1 ,可以认为这三种饲料对雏鸡增重有显著差别, 并且检验的p 值p = P {F ≥ 3.5948} = 1 − 0.9546 = 0.0454 < α = 0.05. 8.1.5参数估计在方差分析问题中,可对总均值µ ,误差的方差σ 2作参数估计.当检验结果为因子不显著时,各水平下指标的总体均值与总体方差都相同,可将所有水平的指标看作一个统一的总体,全部试验数据是来自正态总体Y ~ N (µ , σ 2 ) 的一个容量为n = rm 的样本,因此样本均值nT Y n Y r i m j ij ==∑∑==111,样本方差1)(111122−=−−=∑∑==n S Y Y n S T r i m j ij.这样总均值µ 和误差的方差σ 2的点估计分别为Y =µˆ,22S =∧σ,置信度为1 − α 的置信区间分别是 ])1([2/1nSn t Y −±∈−αµ,])1()1(,)1()1([22/222/122−−−−∈−n S n n S n ααχχσ.当检验结果为因子显著时,还可进一步对主效应a i 作参数估计. 一.点估计由于试验数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ + a i , σ 2 ),根据最大似然估计法,得到总均值µ ,误差的方差σ 2及主效应a i 的点估计.似然函数∏∏∏∏====⎪⎭⎪⎫⎪⎩⎪⎨⎧−−−==r i mj i ij r i m j ij r a y y p a a a L 11222112212)(exp π21)(),,,,,(σµσσµL ⎭⎬⎫⎩⎨⎧−−−=∑∑==ri mj iij na y 112222)(21exp )π2(1µσσ, 取对数,得∑∑==−−−−−=r i mj i ija yn n L 11222)(21)ln(2π)2ln(2ln µσσ.令关于µ 的偏导数等于0,有⎟⎟⎠⎞⎜⎜⎝⎛−−=−⋅−−−=∂∂∑∑∑∑∑=====r i i r i mj ijri mj i ij a m n y a y L 11121121)1()(221ln µσµσµ0101112112=⎟⎟⎠⎞⎜⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛−−=∑∑∑∑====µσµσn y n y r i m j ij r i mj ij , 得y y n r i mj ij ==∑∑==111µ,故总均值µ 的最大似然估计为Y =µˆ. 令关于a k 的偏导数等于0,有01)1()(221ln 1212=⎟⎟⎠⎞⎜⎜⎝⎛−−=−⋅−−−=∂∂∑∑==k mj kj mj k kj k ma m y a y a L µσµσ, k = 1, 2, …, r , 得µµ−=−=⋅=∑k mj kj k y y m a 11,故主效应a i 的最大似然估计为Y Y Y a i i i −=−=⋅⋅µˆˆ, i = 1, 2, …, r ,相应,第i 个水平下的总体均值µ i 的最大似然估计为⋅=+=i i i Y a ˆˆˆµµ. 令关于σ 2的偏导数等于0,有0)(2112)(ln 112422=−−+⋅−=∂∂∑∑==r i mj i ija yn L µσσσ,得∑∑==−−=r i m j i ij a y n 1122)(1µσ,故误差的方差σ 2的最大似然估计为nS Y Y n e r i m j i ij M =−=∑∑==⋅∧1122)(1σ.由于E(S e ) = (n − r )σ 2,可知∧2Mσ不是σ 2的无偏估计,修偏得σ 2的无偏估计e eMS rn S =−=∧2σ. 二.置信区间对总均值µ ,误差的方差σ 2及第i 个水平下的总体均值µ i 给出置信区间.第i 个水平下总体均值µ i 的点估计为∑=⋅==mj ij i i Y m Y 11ˆµ,因试验数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m )相互独立且都服从正态分布N(µ i , σ 2),则有),(~2mN Y i i σµ⋅,即)1,0(~N mY ii σµ−⋅,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅i Y 相互独立,则根据χ 2分布的定义可得 )(~ˆ)(2r n t mY r n S m Y i i eii −−=−−⋅⋅σµσσµ,故第i 个水平下总体均值µ i 的置信度为1 − α 的置信区间是]ˆ)([2/1mr n t Y i i σµα−±∈−⋅.总均值µ 的点估计为∑∑====r i mj ij Y n Y 111ˆµ,因数据Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ i , σ 2 ),有Y 服从正态分布,且µµµ====∑∑∑∑∑=====r i i r i mj i r i m j ij n m n Y n Y 111111)E(1)E(,n n n n Y nY ri mj r i mj ij 222112211211)Var(1)Var(σσσ=⋅===∑∑∑∑====, 得,(~2nN Y σµ,即)1,0(~N nY σµ−,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与Y 相互独立,则根据t 分布的定义可得 )(~ˆ)(2r n t nY r n S n Y e−−=−−σµσσµ, 故总均值µ 的置信度为1 − α 的置信区间是ˆ)([2/1nr n t Y σµα−±∈−.误差的方差σ 2的点估计为r n S e −=∧2σ,且)(~22r n Se −χσ,故误差的方差σ 2的置信度为1 − α 的置信区间是⎥⎦⎤⎢⎢⎢⎣⎡−−−−=⎥⎦⎤⎢⎣⎡−−∈∧−∧−)()(,)()()(,)(22/222/1222/22/12r n r n r n r n r n S r n S e e ααααχσχσχχσ. 例 由前面的鸡饲料对鸡增重问题的数据给出总均值µ ,误差的方差σ 2及三个水平下总体均值µ1 , µ 2 , µ 3的点估计和置信区间(α = 0.05).解:前面已检验知因子显著,则三个水平下总体均值µ1 , µ 2 , µ 3的点估计为25.102488194ˆ111====⋅m T Y µ, 125.107388585ˆ222====⋅m T Y µ,25.104488354ˆ333====⋅m T Y µ,总均值µ 的点估计为2083.10472425133ˆ====n T Y µ,误差的方差σ 2的点估计为6131.13432==−=∧e eMS rn S σ, 置信度为0.95的置信区间是]2008.1051,2992.997[86131.13430796.225.1024[]ˆ)21([975.011=×±=±∈⋅m t Y σµ,]0758.1100,1742.1046[86131.13430796.2125.1073[]ˆ)21([975.022=×±=±∈⋅m t Y σµ,]2008.1071,2992.1017[]86131.13430796.225.1044[]ˆ)21([975.033=×±=±∈⋅mt Y σµ,]7684.1062,6482.1031[]246131.13430796.22083.1047[]ˆ)21([975.0=×±=±∈nt Y σµ,[]9608.2743,2861.7952829.10875.28215,4789.35875.28215)21(,)21(2025.02975.02=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∈χχσe e S S . 8.1.6重复数不等的情形如果每个水平下试验次数不全相等,称为重复数不等的情形,其检验方法与在重复数相等的情形下类似,只是在对数据的表述和处理上有几点区别. 一.数据设第i 个水平A i 下的重复数为m i ,所取得的样本为i im i i Y Y Y ,,,21L ,i = 1, 2, …, r .显然重复数总数为n ,即m 1 + m 2 + … + m r = n . 二.总均值总均值µ 是各水平下总体均值µ i 的以频率nm i为权数的加权平均,即 ∑==+++=r i i i r r m n n m n m n m 122111µµµµµL .三.主效应约束条件第i 个水平下主效应a i = µ i − µ ,则满足011=−=∑∑==µµn m a m ri iir i ii .四.模型单因子方差分析在重复数不等的情形下,统计模型为⎪⎪⎩⎪⎪⎨⎧===++=∑=).,0(;0;,,2,1,,,2,1,21σεεµN a m m j r i a Y ij r i i i i ij i ij 相互独立,且都服从L L 检验H 0:a 1 = a 2 = … = a r = 0 vs H 1:a 1 , a 2 , …, a r 不全等于0.五.平方和的计算记∑==im j ij i Y T 1,∑=⋅==im j ij i i i i Y m m T Y 11,∑∑∑=====ri i ri m j ij T Y T i111,∑∑∑=⋅=====ri i i r i m j ij Y m n Y n n T Y i 11111, 则各平方和的计算公式为n T Y Y n Y Y Y S ri m j ijri m j ijri m j ij T iii21122112112)(−=−=−=∑∑∑∑∑∑======, n T m T Y n Y m Y Y m Y Y S ri ii ri i i ri i i ri m j i A i21221212112)()(−=−=−=−=∑∑∑∑∑==⋅=⋅==⋅, ∑∑∑===−=−=ri ii ri m j ijA T e m T Y S S S i12112. 例 某食品公司对一种食品设计了四种新包装,为了考察哪种包装最受顾客欢迎,选了10个地段繁华程度相似、规模相近的商店做试验,其中两种包装各指定两个商店销售,另两种包装各指定三个商店销售.在试验期内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,见下表包装类型销售量数据A 1 12 18 A 2 14 12 13 A 3 19 17 21 A 4 24 30在显著水平α = 0.01下检验这四种包装对销售量是否有显著影响. 解:假设H 0:a 1 = a 2 = a 3 = a 4 = 0 vs H 1:a 1 , a 2 , a 3 , a 4不全等于0,统计量),1(~r n r F MS MS f S f S F eAe e A A −−==,显著水平α = 0.01,n = 10,r = 4,右侧拒绝域W = { f ≥ f 0.99 (3, 6)} = { f ≥ 9.78},销售量数据计算表计算可得258180101349812212=×−=−=∑=T n m T S ri ii A ,463498354412112=−=−=∑∑∑===ri i i ri mj ije m T Y S ,方差分析表来源平方和自由度均方和F 比因子 258 3 86 11.2174 误差 46 6 7.6667 总和 3049有F 比f = 11.2174 ∈ W ,故拒绝H 0 ,接受H 1 ,可以认为这四种包装对销售量有显著影响, 并且检验的p 值p = P {F ≥ 11.2174} = 1 − 0.9929 = 0.0071 < α = 0.01. 由于因子显著,则四个水平下总体均值µ1 , µ 2 , µ 3 , µ 4的点估计为15230ˆ1111====⋅m T Y µ, 13339ˆ2222====⋅m T Y µ, 19357ˆ3333====⋅m T Y µ, 27254ˆ4444====⋅m T Y µ, 总均值µ 的点估计为1810180ˆ====n T Y µ, 误差的方差σ 2的点估计为6667.72==−=∧e eMS rn S σ, 置信度为0.99的置信区间是]2587.22,7413.7[]26667.77074.315[]ˆ)6([1995.011=×±=±∈⋅m t Y σµ,]9267.18,0733.7[]36667.77074.313[]ˆ)6([2995.022=×±=±∈⋅m t Y σµ,]9267.24,0733.13[]36667.77074.319[]ˆ)6([3995.033=×±=±∈⋅m t Y σµ,]2587.34,7413.19[]26667.77074.327[]ˆ)6([4995.044=×±=±∈⋅m t Y σµ,]2462.21,7538.14[106667.77074.318[]ˆ)6([995.0=×±=±∈nt Y σµ,[]0775.68,4801.26757.046,5476.1846)6(,)6(2005.02995.02=⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∈χχσeeS S .§8.2 多重比较上一节是将多个总体作为一个整体进行检验.如果检验结果是因子A 显著,则可以认为各水平下的均值µ i 不全相等,但却不能直接说明µ i 中哪些可以认为相等,哪些可以认为不等.这一节是对各个µ i 两两之间进行比较,对µ i − µ j ,也就是效应差a i − a j 作出估计、检验. 8.2.1效应差的置信区间效应差a i − a j = µ i − µ j 的点估计为⋅⋅−j i Y Y .因Y ik ~ N (µ i , σ 2 ), (i = 1, 2, …, r , k = 1, 2, …, m i ),则),(~121i i m k ik i i m N Y m Y iσµ∑=⋅=,,(~121jj m k jkj j m N Ym Y jσµ∑=⋅=,且当i ≠ j 时,⋅i Y 与⋅j Y 相互独立,可得))11(,(~2σµµji j i j i m m N Y Y +−−⋅⋅, 即)1,0(~11)()(N m m Y Y ji j i j i +−−−⋅⋅σµµ,但σ 未知,用r n S e −=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅⋅j i Y Y ,相互独立,则根据t 分布的定义可得 )(~11ˆ)()()(11)()(2r n t m m Y Y r n S m m Y Y ji j i j i ej i j i j i −+−−−=−+−−−⋅⋅⋅⋅σµµσσµµ,故效应差a i − a j = µ i − µ j 的置信度为1 − α 的置信区间是]11ˆ)([2/1ji j i j i m m r n t Y Y +⋅−±−∈−−⋅⋅σµµα. 例 由前面的鸡饲料对鸡增重问题的数据给出各效应差µ i − µ j 的点估计和置信区间(α = 0.05). 解:因m 1 = m 2 = m 3 = 8,n = 24,r = 3,有25.102488194111===⋅m T Y ,125.107388585222===⋅m T Y ,25.104488354333===⋅m T Y , 则各效应差µ i − µ j 的点估计分别为875.48125.107325.10242121−=−=−=−⋅⋅∧Y Y µµ, 2025.104425.10243131−=−=−=−⋅⋅∧Y Y µµ, 875.2825.1044125.10733232=−=−=−⋅⋅∧Y Y µµ;因6553.3621875.28215ˆ==−=r n S e σ,有1142.385.06553.360796.211ˆ)21(975.0=××=+⋅j i m m t σ,则各效应差µ i − µ j 的置信度为0.95的置信区间分别是]7608.10,9892.86[]1142.38875.48[]8181ˆ)21([975.02121−−=±−=+⋅±−∈−⋅⋅σµµt Y Y , ]1142.18,1142.58[]1142.3820[]8181ˆ)21([975.03131−=±−=+⋅±−∈−⋅⋅σµµt Y Y , ]9892.66,2392.9[]1142.38875.28[]8181ˆ)21([975.03232−=±=+⋅±−∈−⋅⋅σµµt Y Y . 例 由前面的食品包装对销售量影响问题的数据给出各效应差µ i − µ j 的点估计和置信区间(α = 0.01). 解:因m 1 = 2,m 2 = 3,m 3 = 3,m 4 = 2,n = 10,r = 4,有15230111===⋅m T Y ,13339222===⋅m T Y ,19357333===⋅m T Y ,27254444===⋅m T Y , 则各效应差µ i − µ j 的点估计分别为213152121=−=−=−⋅⋅∧Y Y µµ,419153131−=−=−=−⋅⋅∧Y Y µµ, 1227154141−=−=−=−⋅⋅∧Y Y µµ,619133232−=−=−=−⋅⋅∧Y Y µµ, 1427134242−=−=−=−⋅⋅∧Y Y µµ,827194343−=−=−=−⋅⋅∧Y Y µµ;因7689.2646ˆ==−=r n S e σ,有2653.107689.27074.3ˆ)6(995.0=×=⋅σt ,则各效应差µ i − µ j 的置信度为0.99的置信区间分别是]3709.11,3709.7[]9129.02653.102[]3121ˆ)6([995.02121−=×±=+⋅±−∈−⋅⋅σµµt Y Y , ]3709.5,3709.13[]9129.02653.104[]3121ˆ)6([995.03131−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]7347.1,2653.22[]12653.1012[]2121ˆ)6([995.04141−−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]3816.2,3816.14[]8165.02653.106[]3131ˆ)6([995.03232−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]6291.4,3709.23[]9129.02653.1014[]2131ˆ)6([995.04242−−=×±−=+⋅±−∈−⋅⋅σµµt Y Y , ]3709.1,3709.17[]9129.02653.108[]2131ˆ)6([995.04343−=×±−=+⋅±−∈−⋅⋅σµµt Y Y .8.2.2 多重比较问题对各个µ i 两两之间进行比较,也就是检验任意两个水平A i 与A j 下的总体均值是否相等,即检验假设j i ij H µµ=:0 vs j i ij H µµ≠:1, i , j = 1, 2, …, r .对于每一个假设ijH 0可以采取上一章两个正态总体的均值比较方法进行检验,但这里需要同时检验2)1(2−=r r C r 个这种假设. 设需要同时检验k 个假设k i H i ,,2,1,0L =,每一个假设的显著水平是α ,即在iH 0成立的条件下,接受i H 0的概率为1 − α ,但在所有k 个假设i H 0都成立的条件下,要同时接受所有假设iH 0的概率就可能远小于1 − α .事实上,此时对每一个假设i H 0,拒绝i H 0的概率为α ,而对所有k 个假设k i H i ,,2,1,0L =,至少拒绝其中一个i H 0的概率最大时可能达到k α ,即同时接受所有假设i H 0的概率就可能只有1 − k α .可见,需要同时检验多个假设时,一般不应逐个检验每一个假设,而是采用多重比较方法同时检验多个假设.多重比较方法,就是针对所有假设,构造一个统一的拒绝域,再逐个进行比较.这里,需要检验假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 在ij H 0成立的条件下,⋅i Y 与⋅j Y 不应相差太大.对每一个假设ijH 0,拒绝域可以取为}|{|ij j i ij c Y Y W ≥−=⋅⋅,其中c ij 是常数.对所有的假设ijH 0,统一的拒绝域取为U U rj i ij j i rj i ijc Y YWW ≤<≤⋅⋅≤<≤≥−==11}|{|.分成重复数相等与不等两种场合进行讨论. 8.2.3重复数相等场合的T 法重复数相等时,各水平是平等的,由对称性,可以要求所有的c ij 相等,记为c ,即统一的拒绝域为}min max {}||max {}|{|1111c Y Y c Y Y c Y YW i ri i ri j i rj i rj i j i ≥−=≥−=≥−=⋅≤≤⋅≤≤⋅⋅≤<≤≤<≤⋅⋅U .因Y ij , (i = 1, 2, …, r , j = 1, 2, …, m ) 相互独立且都服从正态分布N (µ i , σ 2),有,(~2mN Y i i σµ⋅.当所有的假设ijH 0都成立时,即µ 1 = µ 2 = … = µ r = µ ,有,(~2mN Y i σµ⋅,则)1,0(~N mY i σµ−⋅.但σ 未知,用r n S e−=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅i Y 相互独立,则根据t 分布的定义可得 )()(~ˆ)(2e i ei f t r n t mY r n S m Y =−−=−−⋅⋅σµσσµ.统一的拒绝域W 的形式可改写为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥−−−=≥−=⋅≤≤⋅≤≤⋅≤≤⋅≤≤m c m Y m Y c Y Y W i r i i r i i r i i r i σσµσµˆˆmin ˆmax }min max {1111, 其中mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=是从分布为t ( f e )的总体中抽取容量为r 的样本所得的最大与最小顺序统计量之差(极差),称之为t 化极差统计量,其分布记为q (r , f e ).显然,t 化极差统计量Q 的分布q (r , f e ) 只与水平个数r 以及t 分布的自由度f e 有关,而与参数µ , σ 2及重复数m 无关.分布q (r , f e )的准确形式比较复杂,通常采用随机模拟方法得到其分位数q 1 − α (r , f e ).对于给定的容量r 及自由度f e ,随机模拟方法是(1)随机生成r 个标准正态分布N (0, 1) 随机数x 1 , x 2 , …, x r ,将这r 个随机数按由小到大的顺序排列,得到其最小随机数x (1) 和最大随机数x (r ) ;(2)随机生成1个自由度为f e 的χ 2分布χ 2 ( f e ) 随机数y ; (3)计算er f y x x q )1()(−=;(4)重复(1)至(3)步N 次,得到t 化极差统计量Q 的N 个观测值,只要N 非常大(如10 4或10 5次),就可得q (r , f e )的各种分位数q 1 − α (r , f e )的近似值.当显著水平为α 时,拒绝域{}),(ˆ1ef r q Q m c Q W ασ−≥=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥=,有m c f r q e σαˆ),(1=−,可得 mf r q c e σαˆ),(1⋅=−,再逐个将||⋅⋅−j i Y Y 与c 比较,得出每一对µ i 与µ j 是否有显著差异的结论.步骤:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 统计量mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=,显著水平α ,右侧拒绝域{}),(ˆ1e f r q Q m c Q W ασ−≥=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≥=,计算mf r q c e σαˆ),(1⋅=−,逐个将||⋅⋅−j i Y Y 与c 比较,得出结论.例 由前面的鸡饲料对鸡增重影响问题的数据对各因子作多重比较(α = 0.05).解:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ 3, 统计量mY Y mY mY Q i ri i ri i ri i ri σσµσµˆmin max ˆminˆmax1111⋅≤≤⋅≤≤⋅≤≤⋅≤≤−=−−−=,显著水平α = 0.05,r = 3,f e = n − r = 21,右侧拒绝域W = {Q ≥ q 0.95 (3, 21)} = {Q ≥ 3.57},因m = 8,6553.3621875.28215ˆ==−=r n S e σ,有2658.4686553.3657.3=×=c , 由于c Y Y >=−=−⋅⋅875.48|125.107325.1024|||21,故µ 1与µ 2有显著差异;c Y Y <=−=−⋅⋅20|25.104425.1024|||31,故µ 1与µ 3没有显著差异; c Y Y <=−=−⋅⋅875.28|25.1044125.1073|||32,故µ 2与µ 3没有显著差异;8.2.4重复数不等场合的S 法重复数不等时,因)1,0(~11)()(N m m Y Y ji j i j i +−−−⋅⋅σµµ,但σ 未知,用r n S e−=σˆ替换.由于)(~22r n S e −χσ且S e 与⋅⋅j i Y Y ,相互独立,则根据t 分布的定义可得 )()(~11ˆ)()(e ji j i j i f t r n t m m Y Y =−+−−−⋅⋅σµµ,当所有的假设ijH 0都成立时,即µ 1 = µ 2 = … = µ r = µ ,有)(~11ˆe ji j i ij f t m m Y Y T +−=⋅⋅σ,得),1(~11ˆ)(222e j i j i ijij f F m m Y Y T F ⎟⎟⎠⎞⎜⎜⎝⎛+−==⋅⋅σ,从而统一的拒绝域可以取为U U r j i ji j i r j i ji j i c m m Y Y m m c Y Y W ≤<≤⋅⋅≤<≤⋅⋅≥+−=+≥−=11}11||{}11|{| }ˆmax {}ˆ11ˆ)(max {}ˆ11ˆ||max {221222211σσσσσc F c m m Y Y cm m Y Y ij r j i j i j i r j i ji j i r j i ≥=≥⎟⎟⎠⎞⎜⎜⎝⎛+−=≥+−=≤<≤⋅⋅≤<≤⋅⋅≤<≤,可以证明,),1(~1max 1e ij rj i f r F r F −−≤<≤&.当显著水平为α 时,拒绝域{}),1(ˆ)1(122e f r f F r c F W −≥=⎭⎬⎫⎩⎨⎧−≥=−ασ,有221ˆ)1(),1(σα−=−−r c f r f e ,可得),1()1(ˆ1e f r f r c −−=−ασ,因此⎟⎟⎠⎞⎜⎜⎝⎛+−−=+=−j i e ji ij m m f r f r m m c c 11),1()1(ˆ111ασ, 再逐个将||⋅⋅−j i Y Y 与ji ij m m cc 11+=比较,得出每一对µ i 与µ j 是否有显著差异的结论. 步骤:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ r , 统计量),1(~11ˆ)1()(max1max 2211e j i j i rj i ijrj i f r F m m r Y Y r F F −⎟⎟⎠⎞⎜⎜⎝⎛+−−=−=⋅⋅≤<≤≤<≤&σ,显著水平α ,右侧拒绝域{}),1(ˆ)1(122e f r f F r c F W −≥=⎭⎬⎫⎩⎨⎧−≥=−ασ, 计算⎟⎟⎠⎞⎜⎜⎝⎛+−−=+=−j i e ji ij m m f r f r m m cc 11),1()1(ˆ111ασ, 逐个将||⋅⋅−j i Y Y 与c ij 比较,得出结论.例 由前面的食品包装对销售量影响问题的数据对各因子作多重比较(α = 0.01). 解:假设j i ijH µµ=:0 vs j i ij H µµ≠:1, 1≤ i < j ≤ 4, 统计量),1(~11ˆ)1()(max)1(max 224141e j i j i j i ij j i f r F m m r Y Y r F F −⎟⎟⎠⎞⎜⎜⎝⎛+−−=−=⋅⋅≤<≤≤<≤&σ,显著水平α = 0.01,r = 4,f e = n − r = 6,右侧拒绝域W = {F ≥ f 0.99 (3, 6)} = {F ≥ 9.78},因m 1 = m 4 = 2,m 2 = m 3 = 3,7689.2646ˆ==−=r n S e σ,有9981.1478.937689.2=××=c , 则6914.13312134241312=+====cc c c c ,9981.14212114=+=c c ,2459.12313123=+=c c , 由于12212|1315|||c Y Y <=−=−⋅⋅,故µ 1与µ 2没有显著差异;13314|1915|||c Y Y <=−=−⋅⋅,故µ 1与µ 3没有显著差异; 144112|2715|||c Y Y <=−=−⋅⋅,故µ 1与µ 4没有显著差异; 23326|1913|||c Y Y <=−=−⋅⋅,故µ 2与µ 3没有显著差异; 244214|2713|||c Y Y >=−=−⋅⋅,故µ 2与µ 4有显著差异; 34438|2719|||c Y Y <=−=−⋅⋅,故µ 3与µ 4没有显著差异.§8.3 方差齐性检验在单因子方差分析统计模型中,总是假设各个水平下的总体方差都相等,即222221σσσσ====r L ,称之为方差齐性.但方差齐性不一定自然成立,需要对其进行检验,检验的原假设与备择假设为H 0:22221r σσσ===L vs H 1:22221,,,r σσσL 不全相等,称为方差齐性检验.各水平下的总体方差2i σ分别是以该水平下的样本方差2i S 作为点估计,以由22221,,,r S S S L 构成的函数作为检验的统计量.分成重复数相等与不等两种场合进行讨论. 8.3.1重复数相等场合的Hartley 检验法重复数相等时,样本方差⎥⎦⎤⎢⎣⎡−−=⎥⎦⎤⎢⎣⎡−−=−−=∑∑∑=⋅==⋅m T Y m Y m Y m Y Y m S i m j ij i m j ij m j i ij i2122121221111)(11,i = 1, 2, …, r , 各水平是平等的,以r 个水平下样本方差),,2,1(,2r i S i L =的最大值与最小值之比作为检验的统计量H ,即},,,min{},,,max{2222122221r r S S S S S S H L L =.在方差齐性成立的条件下,统计量H 的分布只与水平个数r 及样本方差2i S 的自由度f = m − 1有关,记为H (r , f ).分布H (r , f )的准确形式比较复杂,通常采用随机模拟方法得到其分位数H 1 − α (r , f ).显然有H ≥ 1,且H 的观测值越接近1,方差齐性越应该成立,因此拒绝域取为W = {H ≥ H 1 − α (r , f )}.步骤:假设H 0:22221r σσσ===L vs H 1:22221,,,r σσσL 不全相等,统计量},,,min{},,,max{2222122221rr S S S S S S H L L =,显著水平α ,右侧拒绝域W = {H ≥ H 1 − α (r , f )}, 计算H ,并作出判断. 这称之为Hartley 检验法.例 由前面的鸡饲料对鸡增重影响问题的数据采用Hartley 检验法进行方差齐性检验(α = 0.05).解:假设H 0:232221σσσ== vs H 1:232221,,σσσ不全相等,统计量},,min{},,max{232221232221S S S S S S H =, 显著水平α = 0.05,且r = 3,f = m − 1,右侧拒绝域W = {H ≥ H 0.95 (3, 7)} = {H ≥ 6.94},根据试验数据计算表,可得T 1 = 8194,T 2 = 8585,T 3 = 8354,8398024121=∑=mj j Y ,9230355122=∑=mj jY,8728984123=∑=mj j Y ,则9286.759)881948398024(71221=−=S ,9821.2510885859230355(71222=−=S ,9286.759)883548728984(71223=−=S ,可得W H ∉==3042.39286.7599821.2510,故拒绝H 0 ,接受H 1 ,可以认为三个水平下的总体方差满足方差齐性.8.3.2 重复数不等场合大样本情形的Bartlett 检验法重复数不等时,样本方差⎥⎦⎤⎢⎣⎡−−=⎥⎦⎤⎢⎣⎡−−=−−=∑∑∑=⋅==⋅i i m j ij i i i m j ij i m j i ij i im T Y m Y m Y m Y Y m S i i i 2122121221111)(11,i = 1, 2, …, r , 记i i m j ijm j i ij i m T Y Y Y Q ii21212)(−=−=∑∑==⋅为第i 个水平下的偏差平方和,f i = m i − 1为其自由度,有i i i f Q S =2,且e r i m j i ijr i i S Y YQ i=−=∑∑∑==⋅=1121)(,e ri ir i i f r n r mf =−=−=∑∑==11,则组内偏差均方和∑∑∑=======ri i ei ri ii e ri ie e e e Sf f S f f Q f f S MS 1212111, 即MS e 等于样本方差22221,,,r S S S L 以各自自由度所占比例为权数的加权算术平均,而相应的加权几何平均记为GMS e ,即∏==ri f f i e eiS GMS 12)(.以MS e 与GMS e 之商的一个函数作为检验统计量.可以证明,大样本情形,在方差齐性成立的条件下,)1(~])ln()ln([1ln 212−−==∑=r S f MS f C GMS MS C f B ri i i e e e e e χ&,其中常数⎟⎟⎠⎞⎜⎜⎝⎛−−+=∑=e r i i f f r C 11)1(3111. 由于算术平均必大于等于几何平均,即MS e ≥ GMS e ,当且仅当所有2i S 都相等时等号成立,即B 的观测值越小,方差齐性越应该成立,因此拒绝域取为)}1({21−≥=−r B W αχ.。

概率统计电子教案(18)

概率统计电子教案(18)
估计。
解 由于
1
=E
(
X
)
2
2
1
2
12
=D(
X
)
(2
1 )2Βιβλιοθήκη 12因此 1,2 的矩估计分别为 ˆ1 X 3Sn, ˆ2 X 3Sn .
例8.3 设 (X1,, Xn ) 是取自总体X的一个样本,
总体X的密度函数为
( 1)x , 0 x 1,
f (x) 0,
其余.
其中 未知, 1。求 的矩估计。
例8.1(续) 设一升自来水中含有的大肠杆菌个数
X ~ P()
其中 未知, 0 。为了检查自来水消毒设备的效果,从
消毒后的水中随机地抽取了50次,每次1升。化验得到每 升水中大肠杆菌个数如下
大肠杆菌个数/升 0 1 2 3 4
出现的次数
17 20 10 2 1
试估计平均每升自来水中大肠杆菌的个数。
ˆ g(ˆ1, ,ˆk )
为 的极大似然估计。
例8.4 设 (X1,, Xn )是取自正态总体 N(, 2) 的
一个样本。
(1)当 未知 ( )但 2已知时,求 的
极大似然估计量。
(2)当 已知但 2未知 ( 2 0) 时,求 2的极
大似然估计量。
(3)当 与 2( , 2 0) 均未知时, 求 与 2 的极大似然估计量。
体X的密度函数(或概率函数)为 f (x;1,,k ),似然函数

n
L(1,,k ; x1,xn ) ˆ f (xi ;1,,k ), i 1 (1,,k )
这是一个多元函数。称满足
L(ˆ1,,ˆk
)
max
(1 ,,k )Θ
L(1,,k

四年级上册数学教案-8.2模球游戏|北师大版

四年级上册数学教案-8.2模球游戏|北师大版

四年级上册数学教案8.2 模球游戏|北师大版今天,我要和大家一起学习的是北师大版四年级上册的数学教案,第八章第二节——模球游戏。

这是一个既有趣又有挑战性的课程,通过这个游戏,我们可以更好地理解概率和统计的基本概念。

一、教学内容我们将会使用教材第八章第二节的内容,主要包括模球游戏的规则和如何通过游戏来理解概率和统计的基本概念。

二、教学目标通过这个课程,我希望学生们能够理解模球游戏的规则,并能够运用概率和统计的知识来分析游戏的结果。

三、教学难点与重点重点是让学生掌握模球游戏的规则和概率统计的基本概念。

难点是让学生能够运用这些知识来分析和解决实际问题。

四、教具与学具准备我准备了一些不同颜色的球,每种颜色代表不同的概率。

还有记录结果的表格和计算器。

五、教学过程我会向学生们介绍模球游戏的规则。

我会用实物演示,让学生们直观地理解游戏的规则。

然后,我会组织学生们进行游戏,让他们亲身体验并记录游戏的结果。

在游戏过程中,我会引导学生思考和讨论,帮助他们理解和掌握概率和统计的知识。

六、板书设计我会设计一个简洁明了的板书,列出游戏的规则和概率统计的基本概念,方便学生们理解和记忆。

七、作业设计作业题目:假设你有一袋红色和蓝色的球,红色球有3个,蓝色球有2个。

你随机取出一个球,请计算取出红色球的概率。

答案:取出红色球的概率是3/5。

八、课后反思及拓展延伸通过这个课程,我希望学生们能够理解和掌握模球游戏的规则和概率统计的基本概念。

同时,我也希望他们能够运用这些知识来分析和解决实际问题。

在课后,我可以鼓励学生们进行拓展延伸,比如自己设计类似的游戏,或者寻找生活中的例子来应用概率和统计的知识。

这样,我们就完成了今天的学习。

我相信通过这个有趣的模球游戏,学生们一定能够更好地理解和掌握概率和统计的知识。

让我们期待他们的表现吧!重点和难点解析一、教学内容的深入理解教学内容是围绕着模球游戏的规则和概率统计的基本概念展开的。

这是一个理论与实践相结合的课程,因此,我需要学生们在课堂上积极参与,亲身体验游戏,并记录游戏的结果。

8.4.3分层抽样

8.4.3分层抽样
(4)取样:对112名业务人员用系统抽样的方法,从中抽取14人;因为管理人员16名、
后勤服务人员32名,人员较少,可用简单随机抽样的方法抽取;将以上各层抽出
的个体合并,即得到由20名会议代表组成的样本.
分层抽样的特点:
(1)适用于由差异比较明显的几部分组成的总体;
(2)按比例确定每层抽取个体的个数;
C社区抽取 ×


= 户;
(4)取样:各社区可用系统抽样的方法;从中抽取对应数量的户,将以上抽出的个
体合并,即得到由90户低收入家庭组成的样本.
1.分层抽样
当总体由差异明显的几部分组成时,可将总体按差异情况分成互不重叠的几
个部分(在统计上称为“层”),再从每一层内随机抽取一定数量的个体组成样
∴三个不同年级中抽取的学生人数分别为
×


= , ×


= , ×


= ,
即需要抽取高一学生26名,高二学生25名,高三学生29名.
各年级可以采用简单随机抽样或系统抽样的方法抽取.
分层抽样
当总体由差异明显的几部分组成时,可将总体按差异情况分成
互不重叠的几个部分(在统计上称为“层”),再从每一层内随机


=






=
+ +
解得 = .
1 某职业院校有退休教师20人,公共基础课教师65人,专业课教师95人,为了解学校
管理情况,采用分层抽样方法抽取36人参加座谈会,求退休教师、公共基础课教师、
专业课教师各应抽取多少人?

++
解 :抽取教师数与教师总数比为
想一想

概率统计第八章作业解答

概率统计第八章作业解答

2 2 2 2 H0: 1 2 ; H 1 : 1 2
S1 统计量 F 2 , H 0 成立时, F ~ F n1 1, n2 1 S2
拒绝域: F F n1 1, n2 1
2

要检验假设
2 2 H0: 1 2 ; H 1 : 1 2
2
H1 : 0 ;
( 0 2.64)
x 2.62, 0 2.64, 0.06, n 100, 0.01, z 2.57
2
x 0 z 3.33 2.57 拒绝 H 0 。 n

认为新工艺对此零件电阻有显著影响。
第一次作业选做题
S1 F 2 0.686 4.82 接受H 0 , S2
即认为甲机床加工精度不比乙机床高。
2
2. 某 种 零 件 长 度 服 从 正 态 分 布 , 按 规 定 其 方 差 不 得 超 过
2 0 0.016 。现从一批零件中抽取 25 件测量其长度,计算得样
本方差为 0.025。问能否由此判断这批零件合格(=0.05)?
1.解
H 0 :1 2 ;H1 :1 2
2
2
2
2
2
S1 统计量 F 2 , S2
H 0 成立时, F ~ F n1 1, n2 1
拒绝域: F F n1 1, n2 1 , n1 6, n2 9
5%, F n1 1, n2 1 F0.05 5,8 4.82

2 S 2 又 n 1 2 24.86 0 而 9.886 24 .86 45 .559 接受H 0 ,

即认为熔化时间分散度与通常无显著差异。

第二课时概率

第二课时概率

能力提高
• (2010湖北省咸宁市)某联欢会上有一个有 奖游戏,规则如下:有5张纸牌,背面都是 喜羊羊头像,正面有2张是笑脸,其余3张是 哭脸.现将5张纸牌洗匀后背面朝上摆放到 桌上,若翻到的纸牌中有笑脸就有奖,没有 笑脸就没有奖. • (1)小芳获得一次翻牌机会,她从中随机 翻开一张纸牌.小芳得奖的概率是 . • (2)小明获得两次翻牌机会,他同时翻开 两张纸牌.小明认为这样得奖的概率是小芳 的两倍,你赞同他的观点吗?请用树形图或 列表法进行分析说明.
类型一 生活中的确定事件与随机事件 [2010· 长沙]下列事件是必然事件的是(A) A.通常加热到100℃,水沸腾 B.抛一枚硬币,正面朝上 C.明天会下雨 D.经过城市中某一有交通信号灯的路口,恰好遇到红灯
【解析】必然事件是一定发生的,因为在通常情况 下,水在100℃时一定沸腾,选A. 【点悟】 对一个事件作出判断要看它在每次实验中是必然会 发生,还是肯定不会发生,还是可能发生也可能不 发生.
中考指南:
• 概率是近几年河南中考的常考内容,主要 考察随机事件的意义,用频率估计概率的 意义,概率模拟设计以及用概率事件进行 决策都是概率考察的内容,河南2008年的 19题,2009年的13题。2010年的12题都是 考察简单事件发生的概率的计算,分值在3 到9分之间,预计2011年的中考仍是必考的 内容。
• 5、(2010珠海)中央电视台举办的第14届“蓝 色经典· 天之蓝”杯青年歌手大奖赛,由部队文工 团的A(海政)、B(空政)、C(武警)组成种 子队,由部队文工团的D(解放军)和地方文工 团的E(云南)、F(新疆)组成非种子队.现从种 子队A、B、C与非种子队D、E、F中各抽取一个 队进行首场比赛. • (1)请用适当方式写出首场比赛出场的两个队的所 有可能情况(用代码A、B、C、D、E、F表示); • (2)求首场比赛出场的两个队都是部队文工团的概 率P
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 2 为已知, 关于的检验(U 检验)
上节讨论中都是利用 H0 为真时服从 N (0,1) 分布
的统计量 U X 0 来确定拒绝域的, 这种 / n
检验法称为U 检验法. 拒绝域分别为
U 检验 检验统计量的观察值u x 0 / n
H0
0 0 0
H1
0 0 0
H

k Sw
1 n1
1 n2
ta
2
(n1
n2
2)
例3 对用两种不同热处理方法加工的金属材料做抗 拉强度试验,得到的试验数据如下:
方法Ⅰ:31,34,29,26,32,35,38,34,30, 29,32,31
方法Ⅱ:26,24,28,29,30,29,32,26,31, 29,32,28
设两种热处理加工的金属材料的抗拉强度都服从 正态分布,且方差相等.比较两种方法所得金属 材料的平均抗拉强度有无显著差异.( 0.05 )
一、 均值的假设检验
设 总 体X ~ N (, 2 ) , 未 知 , 2已 知 或 未 知 ,
X1 , X 2 , , X n是 来 自 总 体X的 样 本 , 来 检 验 关 于
均 值的 假 设 ( 显 著 性 水 平 为 ) :
1) 假设检验 H0 : 0 , H1 : 0 ; 2) 假设检验 H0 : 0 , H1 : 0 . 3) 假设检验 H0 : 0 , H1 : 0 ;
由第六章第四节例2的结果知:
(X
Y) Sw
(1 11 n1 n2
2)
~
t(n1
n2
2)
S
2 w
(n1
1)S12
(n2
1)S
2 2
n1 n2 2
当H0成立时,统计量
T X Y
Sw
11 n1 n2
~ t(n1 n2 2)
由 a P X Y k PT
k
Sw
1 n1
1 n2
设总体
X
~
N (1,12 ), Y
~
N
(2
,
2 2
)
X ,Y 独立,
2 1
2 2
2
未知
X1,…,Xn 取自总体X 1
其样本均值为 X 样本方差为 S12
Y1,…,Yn 取自总体Y 2
其样本均值为
Y
,样本方差为
S
2 2
给定显著水平,检验假设 H0 : 1 2
H1 : 1 2
拒绝域形式为 | x y | k (k待定)
t
x 0
s/ n
t (n 1)
计算统计值
x 70 s2 10
t 1.162
查t分布表,得 t (n 1) t0.05 (5) 2.015
统计判决 t 1.162 2.015 t (n 1)
故接受H0,即不能认为该厂广告有欺骗消费者 之嫌疑
下面求两个正态总体均值相等性检验的拒绝域。
解 记两总体的正态分布为 N(1, 2 ), N(2 , 2 ) 本题是要检验假设 H0 : 1 2 , H1 : 1 2
检验统计量为 T X Y
Sw
11 n1 n2
拒绝域为
| t | | x y |
Sw
11 n1 n2
t 2 (n1 n2 2)
计算统计值
n1 n2 12 , x 31.75 , y 28.67
69,68,72,70,66,75
设手机的待机时间 X ~ N (, 2 ) ,由这些数据能
否说明其广告有欺骗消费者之嫌疑?( 0.05)
解 问题可归结为检验假设
H0 : 71.5 ,
H1 : 71.5
由于方差 2未知,用t 检验。
检验统计量 T X 0 ~ t(n 1)
S/ n
拒绝域
即采用 t X 0 来作为检验统计量.
S/ n
t 检验 检验统计量的观察值t x 0
s/ n
H0
0 0
H1
0 0
H
的拒绝域
0
t t (n 1)
t t (n 1)
上述利用 t 统计量 得出的检验法称为
0
0
| t | t / 2 (n 1) t 检验法.
例2 一手机生产厂家在其宣传广告中声称他们生产 的某种品牌的手机的待机时间的平均值至少为71.5 小时,一质检部门检查了该厂生产的这种品牌的 手机6部,得到的待机时间为
(n1 1)s12 112.25 (n2 1)s22 66.64 sw 2.85
| t | | x y | | 31.75 28.67 | 2.647
的拒绝域
0
u u
u u | u | u / 2
下面求两个正态总体均值差检验的拒绝域。
设总体 X
~
N
(1
,
2 1
)
Y
~
N
(
2
,
2 2
)X与Βιβλιοθήκη 相互独立2 1,2 2
已知
从两总体中分别取容量为n1、n2的样本
用X , Y分别表示样本均值、给定显著水平
检验假设 H0 : 1 2 , H1 : 1 2
解 按题意需检验假设 H0 : 0 98.0 H1 : 0
检验统计量 U X 0 ~ N (0,1)
/ n
拒绝域(参阅表8-1) U u
查正态分布表得 u u0.05 1.645
计算统计值 u x 0 97.7 98.0 1.875 / n 0.8 / 25
执行统计判决 u 1.875 1.645 u 故拒绝H0,即认为新油的辛烷平均等级比原燃料辛 烷的平均等级确实偏低.
2 2
/ n2

k u
2
2 1
2 2
n1 n2
拒绝域为
| u |
| x y|
2 1
/
n1
2 2
/
n2
u
2
(3)
例1 一种燃料的辛烷等级服从正态分布N (, 2 ),其
平均等级 98.0,标准差 0.05 .现抽取25桶新
油,测试其等级,算得平均等级为97.7.假定标准 差与原来一样,问新油的辛烷平均等级是否比原 燃料的辛烷平均等级偏低?( 0.8)
二、 t 检验法(方差未知)
设总体 X ~ N (, 2 ), 2未知
对显著水平 检验假设
H0 : 0
拒绝域形式
H1 : 0
| x 0 | k (k待定)
设 X1, X 2 , , X n 为来自总体 X 的样本, 因为 2 未知,不能利用 X 0
/ n
来确定拒绝域, 因为 S 2 是 2 的无偏估计, 故用 S 来取代 ,
1 2 的无偏估计分别为 X , Y
显然,H0的拒绝形式应为| x y | k(k待定)
由于
( X Y ) (1 2 ) ~ N (0,1)
2 1
2 2
n1 n2
若H0真,则统计量
U
X Y
2 1
2 2
n1
n2
~ N (0,1)

P(| X Y | k) P| U |
k
2 1
/ n1
相关文档
最新文档