概率论与数理统计第八章汇总
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计第8章(公共数学版)

P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
概率论与数理统计8-2

X 0
/
X 0 z / 2 ,即 ~ N (0, 1) . 所以, P n / n
即
P X 0 z / 2 . n
n
( x)
1 (| z |) ( | z |) 2[1 (| z |)] ;
2
( x)
2
Z /2
如果是右侧检验,则
p = P { X | Z |} 1 (| z |) ;
O
Z /2
x
如果是左侧检验,则
p = P { X | Z |} ( | z |) 1 (| z |) .
临界值法的基本步骤 例 8.4 单边检验 例 8.5 例 8.6
8.2.2 单个正态总体方差的 2 检验 检验几种类型 同步练习 1,2,3 例 8.8 小结 例 8.9
8.2.1. 单正态总体 N ( , ) 均值 的假设检验
2
1.双侧检验 H 0 : 0 ; H 1 : 0
t / 2 ( n 1) 0 .1 6
可作出判断,接受原假设 H0,认为该厂生产的电阻均值确 实等于 10 欧姆.
8.2.1. 单正态总体 N ( , ) 均值 的假设检验
2
临界值法进行假设检验的基本步骤如下: 步骤一:针对具体问题,做出一个合理的原假设和备 择假设,选择原假设的原则是:事先有一定的信任度或出 于某种考虑要加以保护; 步骤二:构造一个统计量; 步骤三:根据统计随机变量的分布类型、原假设与备 择假设、显著性水平确定拒绝域; 步骤四:将样本值带入统计随机变量得到统计值,若 统计值在拒绝域内,拒绝原假设,否则,接受原假设.
概率论与数理统计第8章

实验目的
通过实际数据验证概率论与数理统计中的理论 和方法,提高对理论知识的理解和应用能力。
01
1. 数据收集
从相关领域获取实际数据,确保数据 质量和代表性。
03
3. 理论应用
根据实验目的选择合适的理论和方法,进行 数据分析和解读。
05
02
实验方法
收集相关领域的实际数据,运用概率论与数 理统计中的理论和方法进行分析,如概率分 布、参数估计、假设检验等。
无偏性、有效性和一致性。
有效性
在所有无偏估计量中,有效性 是指方差最小的估计量。
点估计
用样本统计量来估计未知参数 的过程。
无偏性
估计量的期望值等于被估计的 参数值。
一致性
随着样本容量的增加,估计量 的值应趋近于被估计的参数值。
区间估计
区间估计
根据样本数据推断未知参数的可能取值范围。
置信区间和置信水平
本章内容主要包括贝叶斯推断的基本概念、贝叶斯推断的数学基础、贝叶斯推断 在参数估计和假设检验中的应用,以及贝叶斯推断的优缺点和与其他统计方法的 比较。
学习目标
01
掌握贝叶斯推断的基本原理和方法,理解贝叶斯推 断的数学基础。
02
学会使用贝叶斯方法进行参数估计和假设检验,了 解贝叶斯推断在实践中的应用。
案例总结
总结案例分析的成果,提炼出具有指导意义的结论和建议,为实际工 作提供参考和借鉴。
THANKS FOR WATCHING
感谢您的观看
置信区间是参数可能取值的范围,置信水平是该区间包含参数真 值的概率。
区间估计的步骤
确定置信水平、构造合适的统计量、计算置信区间。
假设检验的基本概念与步骤
假设检验
概率论和数理统计(第三学期)第8章参数估计

由契比雪夫不等式,有
P( S 2 ES2
n
n
)
DS
2
n
=
2 4
2 n 1 2
即 lim P( S 2 ES2 ) 0
n
n
n
(n 1)S 2
E
2
n n 1
ES2 2 n
故 lim P( S 2 2 ) 0
n
n
§8.3 参数的区间估计
定义
设是总体的未知参数,若 (1 1
6
S~2 1 1.20 0.162 0.85 0.162 0.30 0.162 6 0.45 0.162 0.82 0.162 0.12 0.162 1 1.042 0.692 0.142 0.612 0.982 0.282 6 1 2.99 6 0.498 2
n
p xi
1
p
1 xi
xi p i1
1
p
n
n xi
i1
i 1
n
令y xi,得: i 1 ln Lxi , p y ln p n yln1 p
由对数似然方程
d ln L y n y 0 dp p 1 p
解得
p
y n
1 n
n i 1
xi
x
因为这是惟一的解,所 以p的极大似然估计值为
二、顺序统计量法
定义
1
, 2
,
,
为总体
n
的一个样本,将它
们按大小次序排列,取 居中的一个数 (若n为偶
数时,则取居中两数的 平均值)记为~,称~为
样本中位数。
即
~
k
1
,
1 2
k
8概率论与数理统计(茆诗松)第二版课后第八章

∑ ⎪⎪⎧Yrij
⎨
= µ + ai ai = 0;
+ ε ij ,
i = 1, 2, L, r,
⎪ i=1
⎪⎩ε ij 相互独立,且都服从N (0, σ 2 ).
j = 1, 2, L, m;
检验的原假设与备择假设为 H0:a 1 = a 2 = … = a r = 0 vs H1:a 1 , a 2 , …, a r 不全等于 0.
i=1 j =1
∑ ∑ 1
σ2
r i =1
m
(Yij
j =1
− Yi⋅ ) 2
~ χ 2 (rm − r) ,
∑∑ 故 Se
σ2
=1 σ2
r i =1
m
(Yij
j =1
− Yi⋅ )2
~
χ 2 (n − r) ,即得 E(S e) = (n − r)σ 2;
4
r
r
r
r
r
∑ ∑ ∑ ∑ ∑ (2) S A = m (Yi⋅ − Y )2 = m (ai + εi⋅ − ε )2 = m ai2 + m (ε i⋅ − ε )2 + 2m ai (εi⋅ − ε ) ,
是第 i 个总体内样本均值与总样本均值的偏差,称为组间偏差,反映第 i 个总体的主效应. 三.偏差平方和及其自由度
∑ 在统计学中,对于
k
个独立数据
Y1 ,
Y2 ,
…,
Yk
,平均值 Y
=
1 k
k
Yi
i =1
,称
Yi 与 Y
之差为偏差,所有偏差
的平方和
k
∑ Q = (Yi − Y )2 i =1
《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第⼋章《概率论与数理统计》习题及答案第⼋章1. 设x.,x2,,%…是从总体X中抽岀的样本,假设X服从参数为兄的指数分布,⼏未知,给泄⼊〉0和显著性⽔平a(Ovavl),试求假设H o的⼒$检验统计量及否建域.解选统汁量*=2⼈⼯⼄=2如庆则Z2 -Z2(2n) ?对于给宦的显著性⽔平a,査z'分布表求出临界值加⑵",使加⑵2))=Q因z2 > z2 > 所以(F": (2/1)) => (/2 > /; (2n)),从⽽a = P{X2 > 加⑵“} n P{r > Za(2/0)可见仏:2>^的否定域为Z2>Z;(2?).2. 某种零件的尺⼨⽅差为O-2=1.21,对⼀批这类零件检查6件得尺⼨数据(毫⽶):,,,,,。
设零件尺⼨服从正态分布,问这批零件的平均尺⼨能否认为是毫⽶(a = O.O5).解问题是在/已知的条件下检验假设:“ = 32.50Ho的否定域为1“ l> u af2u0(n5 = 1.96 ,因1“ 1=6.77 >1.96,所以否泄弘,即不能认为平均尺⼨是亳⽶。
3. 设某产品的指标服从正态分布,它的标准差为b = 100,今抽了⼀个容量为26的样本,计算平均值1580,问在显著性⽔平a = 0.05下,能否认为这批产品的指标的期望值“不低于1600。
解问题是在b?已知的条件下检验假设://>1600的否定域为u < -u a/2,其中X-1600 r-r 1580-1600 c , “11 = ------------ V26 = ------------------- x 5.1 = —1.02.100 100⼀叫05 =—1.64.因为// =-1.02>-1.64 =-M005,所以接受H(>,即可以认为这批产品的指标的期望值“不低于1600.4. ⼀种元件,要求其使⽤寿命不低于1000⼩时,现在从这批元件中任取25件,测得其寿命平均值为950⼩时,已知该元件寿命服从标准差为o-=100 ⼩时的正态分布,问这批元件是否合格(<7=0.05)解设元件寿命为X,则X~N(“,IO。
概率论与数理统计第八章

问题1、2是参数检验
问题3 某电话交换台在一小时内接到电话用户的呼唤 次数按分钟统计得到记录 呼唤次数 0 1 2 3 4 5 6 ≥7 频 数 8 16 17 10 6 2 1 0 问电话呼唤次数X是否服从泊松分布? 总体的分布是否为泊松分布? 已知总体的样本资料,要求推断 该总体的均值(或方差)是否等于某值? 两总体的均值(或方差)是否相等? 该总体的分布是否为某种分布?
非参数检验
问题1 某车间用一台包装机自动包装葡萄糖,额定 标准为每袋净重0.5公斤.设每袋重量服从正态分布, 且=0.015.某天开工后,随机抽取9袋,称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512.问包装机的工作是否正常? 总体的均值是否等于额定值0.5?
第八章 假设检验
假设检验
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法.
参数估计 统计推断 假设检验 具体方法 统计分析方差分析 回归分析
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法. 两类假设检验问题 1. 总体分布类型已知,但含有未知 参数,对未知参数作某种假设, 参数检验 然后判断假设的正确性. 2. 总体分布类型未知,对总体的 分布类型等作某种假设,然后 判断假设的正确性.
0
引例: 某车间用一台包装机自动包装葡萄糖,额定标 准为每袋净重0.5公斤.设包装机包装的实际袋重服从 正态分布,且标准差 =0.015(公斤).某天开工后,为检验 包装机的工作是否正常,随机抽取9袋,称得净重为: 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问这天包装机的工作是否正常?
概率论与数理统计_第八章

χ2 检验法
2 H1 : 2 0
2 21 / 2 (n), 或 2 2 / 2 (n)
概率论与数理统计
二、双正态总体
设有两个正态总体 2 x ~ N (1 ,12 ), y ~ N (2 , 2 ),
x1 , x2 ,...,xn1 ; y1 , y2 ,, yn2 分别是来自两个正态总体的独立
尽管主观上希望犯两类错误的概率都很小。但 在样本容量一定的情况下,不能同时控制犯两类错误 的概率。 一般,称控制犯第一类错误概率的检验问题为 显著性检验问题。为此,给定一个较小的正数α (0< α <1),使有
P{拒绝H 0 | H 0为真}
在此条件下确定k的值.
概率论与数理统计
小概率 事件
左边检验 拒绝域
H 0 : 0 ;
H1 : 0
t t (n 1)
H 0 : 0 ; H1 : 0
右边检验 拒绝域
t t (n 1)
概率论与数理统计
2、方差检验( χ2 检验法) 均值未知,方差检验( 检验法) 设总体x~N(μ,σ2),其中μ , σ2均未知,在显著性水
第八章 参数假设检验
假设检验的思想 正态总体均值的检验
正态总体方差的检验
概率论与数理统计
简 介
参数估计的方法是通过分析样本而估计总体参数
的取值(点估计)或总体参数落在什么范围(区间估计),
而有些实际问题中,我们不一定要了解总体参数的取
值或范围,而只想知道总体的参数有无明显变化,或
是否达到既定的要求,或两个总体的某个参数有无明
2
平α(0< α<1)下求双边检验问题 2 2 H0 : 2 0 ; H1 : 2 0
概率论与数理统计同济大学第8章

8.3 设1(,...,)n X X 是取自总体X 的一个样本,X 的密度函数为22,0;()0,xx f x θθ⎧<<⎪=⎨⎪⎩其余.其中θ未知,θ>0.试求θ的矩估计.8.4 设1(,...,)n X X 是取自总体X 的一个样本,()X P λ ,其中λ未知,0λ>.试求(0)P X =与(1)P X ≥的极大似然估计.8.5 设1(,...,)n X X 是取自总体X 的一个样本,X 服从参数为p 的几何分布,即X 的概率函数为()P X k ==1(1)k p p --,1,2,...k =.其中p 未知,01p <<.试求p 的极大似然估计.8.7设1(,,)n X X 是取自总体X 的一个样本, X 分布函数为-1-,1()0,1x x F x x θ⎧≥=⎨<⎩,其中θ未知,1θ>.试求θ的矩估计与极大似然估计.8.9设1(,...,)n X X 是取自总体X 的一个样本,X分布的函数为1-,()0,x F x x x θθθ⎧≥⎪=⎨⎪<⎩,其中θ未知,0θ>.试证θ的极大似然估计为(1)1min i i nX X ≤≤=.8.10 设1(,...,)n X X 是取自总体X 的一个样本,(1,)X B p ,其中p 未知,01p <<.试证(1)1X 是p 的无偏估计;(2)21X 不是2p 的无偏估计;(3)当2n ≥时,12X X 是2p 的无偏估计.8.11设1(,...,)n X X 是取自总体X 的一个样本,()2D X σ=未知。
试确定常数c ,使得()1211n i i i cX X -+=-∑称为2σ的无偏估计。
8.12 在习题8.3中,(1)求θ的极大似然估计,证明它不具有无偏性;(2)求常数c ,使得21ni i c X =∑成为2θ的无偏估计;(3)求θ的矩估计32X 的方差; (4)求(P X <的矩估计,证明当1n =时它不具有无偏性.8.13设1(,...,)n X X 是取自总体X 的一个样本,X 的密度函数为()()36 00 xx x f x θθθ⎧-<<⎪=⎨⎪⎩其余,其中0θθ>未知,。
概率论与数理统计第8章

(2)相容性 对m<n,有
Fm(x1, x2,...,xm;t1,t2,...,tm ) = Fn (x1, x2,...,xm,,...;t1,t2,...,tn )
X (t) =
t
当 = T ,t = 1,2,3,...
2. 例8.1.1的随机相位正弦波
X (t) = a cos(bt + )
3.某路公交车的客流情况{(X(t), Y(t));t0<t< t1}, (X(t), Y(t))表示t时刻起点与终点站的候车人数.
§8.2 随机过程的分布函数和数字特征
+
)]
2
= a2 cos2 (bt + x)
1
dx
0
2
= a2 2 2 cos(2bt + 2x) +1dx = a2
2 0
2
2
DX (t) =
X2
(t )
=
a2 2
设X(t1)和X(t2)是随机过程在任意二个时刻t1和t2 时的状态. 定义8.2.7 称X(t1)和X(t2)的二阶混合原点矩
RX (t1,t2 ) = E[X (t1)X (t2 )]
X
(1)
=
1
2
=H
,
=T
于是,X(0.5),X(1)的概率分布分别为
X (0.5) 0
1
Pk
1
1
22
X (1) -1
2
Pk
1
1
概率论与数理统计第八章

上式也可记为 PH0 {拒绝H 0}
本例中,上式应为
(x)
PH 0
X
/
0
n
u
2
/2
1
/2
u / 2 O
u / 2
x
b)第二类错误(取伪)
原假设H0事实上是假的,但是由于检验统计量的 观察值没有落在拒绝域中,从而导致接受H0.这时犯了 “取伪”的错误,即接受了错误的假设,这一类错误我
(2) 当H0不真时,作出接受H0的决策——称为第二 类错误(或称“存伪”错误)。
a)第一类错误(弃真)
原假设H0事实上是真的,但是由于检验统计量的观 察值落入拒绝域中,从而导致拒绝H0.这时犯了“弃真” 的错误,即将正确的假设摒弃了,将这一类错误称之为第
一类错误.记犯第一类错误的概率为 ,则有
PH0 {拒绝H0 H0为真}
们称之为第二类错误.记犯第二类错误的概率为 ,则
P{接受H0 | H0为假}
或者 PH1 {接受H 0} P{接受H 0 | H1为真}
在本例中,
PH1
X
/
0
n
u
2
(x)
/2
1
/2
u / 2 O
u / 2
x
可以看出假设检验中包含的两个重要的思想:
1)反证法思想
为了确定是否要拒绝原假设H0,首先是假定H0真,看
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
一般可以认为X1,…,X5是取自正态总体 N (, 2 ) 的样本,当生产比较稳定时, 2 是一个常数.
现在要检验的假设是:
H0: 0( 0 = 355)
概率论与数理统计第八章假设检验

对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
概率论与数理统计第八章资料

设(x1,..., xn )为总体的一组样本观察值。 要选取总体分布中未知参数的估计值, 使得 作为参数时,上述样本出现的可能性最大。 这种方法称为最大似然法。 若是离散型随机变量
P( xi ) p(xi, )
则样本x1,
...,
2
令 1=X 2
解得 = 2X 1 1 X
矩估计的优点:直接、简便
缺点:未充分利用分布信息
(二)最大似然法 两人射击,一人打中,一人没打中,认为打中者 技术较好。
某事件发生的概率为0.01或0.1,若一次试验中该 事件发生了,认为其概率为0.1 例5 在一个袋中有许多黑球与白球,其数量比为1:3 或3:1,通过抽样判断黑球多还是白球多。
解:有放回地抽取3个球, 若取到0个或1个白球,认为袋中黑球多。 若取到2个或3个白球,认为袋中白球多。
用表示取到的白球个数 若白球占1 4,则的分布为
0 1 2 3 P 27 27 9 1
64 64 64 64 若白球占3 4,则的分布为
0 1 2 3 P 1 9 27 27
64 64 64 64 可见,当=0或1时,认为白球占1 4
利用
ai2
a
2 j
2aia
有
j
3
ai
2
a1
a2
a3
2
i1
a12
a
2 2
a
2 3
2a1a 2
2a1a 3
2a 2a3
a12
a
2 2
a32
a12
a
2 2
a12 a32
a
2 2
a32
3
概率论与数理统计教程 第8章

MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。
概率论与数理统计-第八章

关键词: 原假设、备择假设 假设检验 检验统计量、 显著性水平、拒绝域 关于正态总体的假设检验 分布拟合检验、秩和检验
p 值法检验
1
假设检验的概念
对于总体X的分布函数未知,或只知其函数形式 而参数未知,提出关于总体的假设,如: (1) 总体X服从指数分布; (2) 总体X的数学期望 E(X) > 0.5; (3) 总体X和Y有相同的方差:Var(X)=Var(Y);
(4) 总体X的数学期望大于Y的数学期望:
E(X) > E(Y); ……
通过样本数据,判断是应当接受还是拒绝该假设。
2
应用举例 (1) 有人声称一根金条的重量为312.5克。现用一架天
平重复称量n次,得到结果M1,M2,…, Mn。已知该
天平的误差为0.5克。问:根据称量结果,如何判 断该重量是否真实。 原假设H0:真实 (M=312.5) ; 对立假设H1:虚假 (M≠312.5) (2) 某地人口中每年某疾病的发病人数服从泊松分布。 长期统计得到平均年发病人数为2.3人。最近4年发病 人数为:3, 4, 1, 5。问:能否认为近4年发病率上升? 原假设H0:没有 ;对立假设H1:上升
由于 拒绝域的形式为
36
对两个独立正态分布,有
如果假设H0成立,有
故得:检验统计量 拒绝域
F 检验法
37
例7:用两种方法测量冰从-0.720C到 00C水的吸收热。 测得数据为:(cal/g)
方法A:n1=13, 样本均值 80.02,样本方差 S2A=0.0242
方法B:n2 = 8, 样本均值 79.98,样本方差 S2B=0.0312 设两个样本独立,来自两个正态总体 和
4
对立假设H1:有差异(h1 ≠ h2 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H
真时
0
:
T
X S
0
n
~
t(n 1)
由p{|T|t0.025(n 1)} =0.05,
得水平为=0.05的拒绝域为 |T|t0.025(6)=2.4469
这里
| t || 112 .8 112 .6 | 0.466 1.135
2.4469
7
接受H0
·右边HT问题 H0: =0 ;H1: >0, 或 H0: 0 ;H1: >0,
解:H0:=10620;H1:>10620
H
真时
0
:
T
X S
0
n
~
t(n 1)
由p{Tt0.05(9)} =0.05, 得拒绝域为 Tt0.05(9)=1.8331
这里 t 10631 .4 10620 0.45 1.8331 81 10
接受H0
·左边HT问题 H0: =0 ;H1: <0, 或 H0: 0 ;H1: <0,
第二节 正态总体均值的假设检验
(Hypothesis Testing of a Mean of a Normal Population )
一、单个总体参数的检验
二、两个总体参数的检验 三、小结
一、单个正态总体均值的检验
1. 2为已知, 关于的检验(UZ 检验 )
在上节中讨论过正态总体 N (, 2 )
0时 :T
X S
0
n
~
t(n 1)
由p{Tt(n 1)} =,
得水平为的拒绝域为
Tt(n1),
EX 某厂生产镍合金线,其抗拉强度的均值为10620 (kg/mm2)
今改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度 (kg/mm2)为: 10512, 10623, 10668, 10554, 10776, 10707, 10557, 10581, 10666, 10670. 认为抗拉强度服从正态分布,取=0.05 ,问 新生产的镍合金线的抗拉强度是否比过去生产的合金线抗拉 强度要高?
H0: 0 , H1: 0
的拒绝域为W {Z z }.
说明:(1) H0:=0;H1:0称为双边HT问题;而 H0:=0;H1: >0(或< 0), 则称为单边问题;
(2) H0:0;H1:>0 或H0:0;H1: <0 也称为单边HT问题, 不过这是一个完备的HT问题。 (3)可证:完备的HT问题与不完备的HT问题有相同的拒 绝 域, 从而检验法一致。
检验假设H0 : 0, H1 : 0 .
设 X1, X2 ,, Xn 为来自总体 X 的样本,
因为 2 未知, 不能利用 X 0 来确定拒绝域. / n
因 S2 是 2 的 无偏估计,故用 S 取代 ,
即采用 T X 0 来作为检验统计量.
S/ n
根据抽样分布知
当H0为真时,
X S
接受H0
例1 某切割机在正常工作时, 切割每段金属棒的 平均长度为10.5cm, 标准差是0.15cm, 今从一批产 品中随机的抽取15段进行测量, 其结果如下:
0时 :T
X S
0
n
~
t(n 1)
由p{T - t(n 1)} =,
得水平为的拒绝域为
T - t(n 1)
EX 设正品镍合金线的抗拉强度服从均值不低于10620
(kg/mm2)的正态分布, 今从某厂生产的镍合金线中抽取10根,测 得平均抗拉强度10600 (kg/mm2) ,样本标准差为80.,问该厂的镍
来检验的方法称为Z检验法。
当 2为已知时, 关于 0的检验问题:
假设检验: H0: 0 , H1: 0
选择统计量
Z
X
/
0
n
,当H0成立时,Z
~
N (0, 1)
对于给定的检验水平 0 1,
由标准正态分布分位数定义知,PZ z ,
因此,检验的拒绝域为 W {Z z }. 类似地,可得左边假设检验问题:
当 2为已知时, 关于 0的检验问题:
假设检验 H0 : 0 , H1 : 0 ;
选择统计量UZ X 0 , / n
当H
成
0
立
时
,UZ
~
N (0,1)
对于给定的检验水平 0 1
由标准正态分布分位数定义知,
P Z z / 2
因此,检验的拒绝域为 W1 { z z }, 2 或者记为 W1 { x1, x2 , , xn : z z } 2 其中 z为统计量Z的观测值。这种利用Z统计量
合金线的抗拉强度是否不合格? (=0.1)
解:H0:10620;H1:<10620
10620时:T X 10620 ~ t(9)
S 10
由p{T - t0.1(9)} =0.1, 得拒绝域为 T - t0.1(9) =-1.383
这里
t
10600 80
10620
0.79 1.8331
10
·先考虑不完备的右边HT问题的解
H0:=0;H1:>0,
H
下
0
Z X μ0 ~N( 0,1) σn
可得拒绝域:W {Z Z }
现考虑完备的右边HT问题 H0:0;H1:>0,
H
下
0
X μ ~N( 0,1) σn
若取拒绝域为 W { X k}
0
则犯第一类错误的概率为
P{ X
k
|
0}
X
/
0
n
~
t(n 1),
当H0为真时,
X 0 ~ t(n 1),
S/ n
由t分布分位数的定义知
P
X 0
S/ n
t / 2 (n 1)
拒绝域为
W1 { t
x 0
s/ n
t / 2 (n 1)}
上述利用 t 统计量得出的检验法称为t 检验法.
在实际中, 正态总体的方差常为未知, 所以常用 t 检验法来检验关于正态总体均值的检验问题.
P0 {
0
k
0 }
n
n
X
P0 {
k
0 }
n
n
于是: k 0
z
得k 0
பைடு நூலகம்
n z
n
即 得 检 验 的 拒 绝 域 为x 0
n z
即 :z
x 0
z
故
n
W {Z Z } 是H0:0;H1:>0,
的水平为的拒绝域。
2. 2为未知, 关于 的检验( t 检验)
设总体 X ~ N(, 2 ), 其中, 2 未知, 显著性水平为 .
EX 用热敏电阻测温仪间接温量地热勘探井底温度,重 复测量7次,测得温度(℃): 112.0 113.4 111.2 112.0 114.5 112.9 113.6 而用某种精确办法测得温度为 112.6(可看作真值),试问用热敏电阻测温仪间接测温有 无系统偏差(设温度测量值X服从正态分布,取 =0.05 )?