概率论与数理统计第八讲
北京理工大学《概率论与数理统计》课件-第8章
数学期望和方差是两个重要的数字特征,分别表示单个随机变量的平均值和离散程度;而对于多维随机变量,不仅能够确定边缘分布,还包含各分量之间关系的信息.刻划两个r.v.间相互关系的一个重要数字特征:协方差和相关系数若DX 、DY 存在,则有D (X ±Y )=DX +DY ±2E [(X−EX )(Y−EY )]这说明E [(X −EX )(Y −EY )]表达了X 与Y 之间的某种关系.且当X 和Y 独立时,有D (X ±Y )=DX +DY即:若X 和Y 独立,从而有结论:若E [(X −EX )(Y −EY )]≠0,则X 和Y 不独立.则有E [(X−EX )(Y−EY )]=0协方差1.定义设:二维随机变量(X ,Y ),它的分量的数学期望为E (X )和E (Y ),若E [(X −E (X ))(Y −E (Y ))]存在,则称它为X ,Y 的协方差,记为Cov (X ,Y ),即一、协方差(Covariance )()(,)(())(())Cov X Y E X E X Y E Y =--协方差为正说明同向变化程度更高;协方差为负说明反向变化程度更高2.计算(1)若二维离散型随机变量(X ,Y )的联合分布律为P (X =x i ,Y =y j )=p ij i,j =1,2,…(2)若二维连续型随机变量(X ,Y )的密度函数为f (x ,y )且Cov (X,Y )存在,则E [g (X ,Y )] E [g (X ,Y )] (,)[(())(())]Cov X Y E X E X Y E Y =--11(())(())i j iji j x E X y E Y p ∞∞===--∑∑(,)[(())(())]Cov X Y E X E X Y E Y =--(())(())(,)x E X y E Y f x y dxdy+∞+∞-∞-∞=--⎰⎰可见,若X 与Y 独立,Cov (X ,Y )=0.Cov (X ,Y )=E {[X -E (X )][Y -E (Y )]}=E (XY )-E (X )E (Y )-E (Y )E (X )+E (X )E (Y )=E (XY )-E (X )E (Y )=E {XY -XE (Y )-YE (X )+E (X )E (Y )}(3)Cov (X ,Y )=E (XY )-E (X )E (Y )证明:(5)Cov (X 1+X 2,Y )=Cov (X 1,Y )+Cov (X 2,Y )(2)Cov (X ,Y )=Cov (Y ,X )3.简单性质(4)Cov (aX ,bY )=abCov (X ,Y )a ,b 是常数(6)若X ,Y 的协方差Cov (X ,Y )存在,则E (XY )=E (X )E (Y )+Cov (X ,Y )(3)Cov (X ,X )=D (X )(1)Cov (X ,a )=0若X 1,X 2,…,X n 两两独立,则有D (X +Y )=D (X )+D (Y )+2Cov (X ,Y )4.随机变量和的方差与协方差的关系11()()n ni i i i D X D X ===∑∑11()()2(,)n ni i i j i j i i D X D X Cov X X <===+∑∑∑∑例1.设:随机变量X 和Y 的联合概率分布为求X 和Y 的协方差.解:,()[()](,)i j iji j E Z E g X,Y g x y p ==∑YX−1 0 1 010.06 0.18 0.160.080.32 0.20Cov (X ,Y )=E (XY )-E (X )E (Y )E (XY )=0×(−1)×0.06+0×0×0.18+0×1×0.16+1×(−1)×0.08+1×0×0.32+1×1×0.20=0.12另外,X 和Y 的边缘分布律分别为所以YX−1 0 1 010.06 0.18 0.160.080.32 0.20X 0 1P 0.4 0.6Y−1 0 1 P 0.14 0.5 0.36EY =−1×0.14+0×0.5+1×0.36=0.22EX =0×0.4+1×0.6=0.6E (XY )=0.12Cov (X ,Y )=E (XY )-E (X )E (Y )Cov (X ,Y )=E (XY )-E (X )E (Y )=0.12-0.6×0.22=-0.012例2.设:(X,Y)在圆域D={(x,y):x2+y2≤r2(r>0)}上服从均匀分布,求Cov(X,Y).解:易知(X,Y)的联合概率密度为所以22222221,(,)0,x y r f x y rx y rπ⎧+≤⎪=⎨⎪+>⎩22221x y ry dxdyrπ+≤=⋅⎰⎰=22221x y rx dxdyrπ+≤=⋅⎰⎰=(,)EX xf x y dxdy+∞+∞-∞-∞=⎰⎰(,)EY yf x y dxdy+∞+∞-∞-∞=⎰⎰所以E (X )=E (Y )=0Cov (X ,Y )=E (XY )-E (X )E (Y )=0此题表明,Cov (X ,Y )等于0,但X 与Y 不独立,.22222221, (,)0,x y r f x y r x y r π⎧+≤⎪=⎨⎪+>⎩(,)EXY xyf x y dxdy +∞+∞-∞-∞=⎰⎰22221x y r xy dxdy r π+≤=⋅⎰⎰0=协方差衡量了X和Y之间同向或反向的变化趋势。
概率论与数理统计第8章(公共数学版)
P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
概率论与数理统计第8章
实验目的
通过实际数据验证概率论与数理统计中的理论 和方法,提高对理论知识的理解和应用能力。
01
1. 数据收集
从相关领域获取实际数据,确保数据 质量和代表性。
03
3. 理论应用
根据实验目的选择合适的理论和方法,进行 数据分析和解读。
05
02
实验方法
收集相关领域的实际数据,运用概率论与数 理统计中的理论和方法进行分析,如概率分 布、参数估计、假设检验等。
无偏性、有效性和一致性。
有效性
在所有无偏估计量中,有效性 是指方差最小的估计量。
点估计
用样本统计量来估计未知参数 的过程。
无偏性
估计量的期望值等于被估计的 参数值。
一致性
随着样本容量的增加,估计量 的值应趋近于被估计的参数值。
区间估计
区间估计
根据样本数据推断未知参数的可能取值范围。
置信区间和置信水平
本章内容主要包括贝叶斯推断的基本概念、贝叶斯推断的数学基础、贝叶斯推断 在参数估计和假设检验中的应用,以及贝叶斯推断的优缺点和与其他统计方法的 比较。
学习目标
01
掌握贝叶斯推断的基本原理和方法,理解贝叶斯推 断的数学基础。
02
学会使用贝叶斯方法进行参数估计和假设检验,了 解贝叶斯推断在实践中的应用。
案例总结
总结案例分析的成果,提炼出具有指导意义的结论和建议,为实际工 作提供参考和借鉴。
THANKS FOR WATCHING
感谢您的观看
置信区间是参数可能取值的范围,置信水平是该区间包含参数真 值的概率。
区间估计的步骤
确定置信水平、构造合适的统计量、计算置信区间。
假设检验的基本概念与步骤
假设检验
《概率论与数理统计》第八章 讲义
在统计学中把平方和中独立偏差个数称为该平方 和的自由度,常记为f,如Q的自由度为fQ=k1。 自由度是偏差平方和的一个重要参数。
Page 19
Chapter 8 方差分析与回归分析
四、总平方和分解公式
各yij间总的差异大小可用总偏差平方和 r m
ST ( yij y )2
Page 11
Chapter 8 方差分析与回归分析
单因子方差分析的统计模型:
yij i ij , i 1, 2,..., r , j 1, 2,..., m (8.1.3) 2 诸 相互独立,且都服从 N (0, ) ij
总均值与效应:
称诸
1 1 r i i 的平均 r (1 ... r ) r i 1
(8.1.19)
一般可将计算过程列表进行。
Page 27
Chapter 8 方差分析与回归分析
例8.1.2 采用例8.1.1的数据,将原始数据减去1000, 列表给出计算过程: 表8.1.4 例8.1.2的计算表
水 平 A1 A2 A3 73 107 93 数据(原始数据-1000) 9 92 29 60 1 2 90 22 12 74 32 9 122 29 28 1 48 Ti 194 585 354 1133 Ti
Page 6
Chapter 8 方差分析与回归分析
8.1.2 单因子方差分析的统计模型
在例8.1.1中我们只考察了一个因子,称其为 单因子试验。
通常,在单因子试验中,记因子为 A, 设其 有r个水平,记为A1, A2,…, Ar,在每一水平下 考察的指标可以看成一个总体 ,现有 r 个水 平,故有 r 个总体, 假定:
8概率论与数理统计(茆诗松)第二版课后第八章
∑ ⎪⎪⎧Yrij
⎨
= µ + ai ai = 0;
+ ε ij ,
i = 1, 2, L, r,
⎪ i=1
⎪⎩ε ij 相互独立,且都服从N (0, σ 2 ).
j = 1, 2, L, m;
检验的原假设与备择假设为 H0:a 1 = a 2 = … = a r = 0 vs H1:a 1 , a 2 , …, a r 不全等于 0.
i=1 j =1
∑ ∑ 1
σ2
r i =1
m
(Yij
j =1
− Yi⋅ ) 2
~ χ 2 (rm − r) ,
∑∑ 故 Se
σ2
=1 σ2
r i =1
m
(Yij
j =1
− Yi⋅ )2
~
χ 2 (n − r) ,即得 E(S e) = (n − r)σ 2;
4
r
r
r
r
r
∑ ∑ ∑ ∑ ∑ (2) S A = m (Yi⋅ − Y )2 = m (ai + εi⋅ − ε )2 = m ai2 + m (ε i⋅ − ε )2 + 2m ai (εi⋅ − ε ) ,
是第 i 个总体内样本均值与总样本均值的偏差,称为组间偏差,反映第 i 个总体的主效应. 三.偏差平方和及其自由度
∑ 在统计学中,对于
k
个独立数据
Y1 ,
Y2 ,
…,
Yk
,平均值 Y
=
1 k
k
Yi
i =1
,称
Yi 与 Y
之差为偏差,所有偏差
的平方和
k
∑ Q = (Yi − Y )2 i =1
概率论与数理统计第八讲
[(2
z)x
1
z 1
x2]
1
( z 2
4z
3)
20 2
2 z 3时 ,z 2 x 1;即 :
1
1
fz (z)
z2 f X ( x) fY (z x)dx
(2 z x)dx
z2
1 z2 3z 9
2
2
第八讲 二维变量函数的分布与期望
因 为1 z 2的 区 域 有2块 , 根 据fZ (z)
z
1 2
z2
z2
3z
3 2
综合以上几步,得:
f
Z
(z)
1 2
z2 z2
,
3z
3 2
,
0 z 1 1 z2
1 2
z
2 0,
3z
9 2
,
2 z 3 其它
第八讲 二维变量函数的分布与期望
例8-1-2(07数学一,11分)
已 知(
X ,Y
)的 概 率 密 度 为f
( x,
y)
2
x 0,
z 1
z1
2z z2
即:fZ (z) (2 z)2
0,
0 z 1 1 z2
其它
第八讲 二维变量函数的分布与期望
2. 平方和的分布
设二维连续随机变量 (X ,Y ) 的概率密度为 f (x, y), 寻求
Z X 2 Y 2 的分布。
考虑 Z 的分布函数:
FZ z PZ z PX 2 Y 2 z
第八讲 二维变量函数的分布与期望
FY1 ( y) P(Y1 y) P[min(X11, X12 , X13 ) y] 由 最 小 大 于 号 :FY1 ( y) 1 P[min(X11, X12 , X13 ) y]
8讲独立试验序列概型
伯努利定理) 定理 (伯努利定理 伯努利定理 设一次试验中事件A发生的概率 设一次试验中事件 发生的概率 重伯努利试验中, 为p(0<p<1), 则n重伯努利试验中 事 重伯努利试验中 恰好发生k次的概率用 表示, 件A恰好发生 次的概率用 n(k)表示 恰好发生 次的概率用p 表示 则
概率论与数理统计
第8讲 讲
2010-7-6
1
独立试验序列概型
2010-7-6
2
事件运算的最小项 任给n个事件 个事件A 取这n个事件 任给 个事件 1,A2,…,An, 取这 个事件 中的每一个,然后将其中的一些取逆 然后将其中的一些取逆, 中的每一个 然后将其中的一些取逆 则由 A1,A2,…,An产生的任何逻辑式都可由这 个 产生的任何逻辑式都可由这n个 事件中取逆的和不取逆的事件相交再相并 得到, 且称它们为这n个事件的一个最小项. 个事件的一个最小项 得到 且称它们为这 个事件的一个最小项 给定n个事件可产生多个不同的最小项 个事件可产生多个不同的最小项, 给定 个事件可产生多个不同的最小项 各 个最小项之间是互不相容的. 个最小项之间是互不相容的 而这n个事件能够逻辑上构成的任何事 而这 个事件能够逻辑上构成的任何事 可以由若干个最小项的并构成. 件, 可以由若干个最小项的并构成
P(B0 ) = P( ABC) = P( A)P(B)P(C) = 0.83 P(B ) = P( ABC + ABC + ABC ) 1 = P( ABC) + P( ABC) + P( ABC ) = 3×0.2×0.82 P(B2 ) = P( A BC + ABC + AB C ) = 3×0.2 ×0.8
概率论与数理统计课件8
8 (续)
(3)
P
arc
tgX
3
P
X
tg
3
P X 3
1 F 3
1 2 3
1 3
9、设随机变量 X 旳分布函数
0,
F
x
A
cos
x 2
,
1 ,
x0
0 x x
(1) 拟定 A ; (2) 求 X 旳密度函数 f ( x ) ;
(3) 计算
P
cos
X 2
1 2
解:
(1)
3
3
故 所以
Y
~
B
3,
1 3
P Y 1 1
P Y
0
1
1
1 3
3
19 27
3、假如在时间 t(分钟)内, 某纺织工人看守
旳织布机断纱次数服从参数与 t 成正比旳泊松
分布. 已知在一分钟内不出现断纱旳概率为
0.2,求在 2 分钟内至少出现一次断纱旳概率
解: 设 X 表达某纺织工人看守旳织布机断纱
32
解得
a1 , b5
6
6
7 (续) 故
0,
1
,
F
x
6 1 2
,
1,
(2) X 旳分布列为
x 1 1 x 1
1 x2 x2
X 1 1 2
P
111
632
8、设随机变量 X 具有概率密度
ax,
f
x
b 1 x2
,
0 ,
0 x1 x1
其它
又
P
X
1 2
7 8
求: (1) 常数 a , b ;
概率论与数理统计课件第8章
纵向个体间的差异称为随机误差(组内差异),由试验造 成;横向个体间的差异称为系统误差(组间差异),由因素的 不同水平造成。
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1 .X i~ Ni, 2,i 1 ,2 ,...r具有方差齐性。
i1
j1
要分析因素A,B的差异对试验结果是否有显著
影响,即为检验如下假设是否成立:
H 0 1:12 La 0 H 0 2:12 Lb 0
➢ 总离差平方和的分解定理
仿单因素方差分析的方法,考察总离差平方和
a b
* 标记( );
(4)若 F F0.10 ,则称因素A无显著影响(差异无
统计意义)。
单因素试验方差分析表
方差来源 平方和 自由度 均方和
组间
SS A
d fA
MSA
SS A df A
组内
SSE
d fE
MSE
SSE dfE
总和 S S T d f T
F值 F MSA
MSE
F 值临介值
Fr1,nr
简便计算公式:
若H0成立,则 X ij ij,j 1 ,2 ,...n i,i 1 ,2 ,...r
r
考察统计量 SST
ni
2
Xij X
总离差平方和
i1 j1
经恒等变形,可分解为: SSTSSASSE 见书P168
其中
r ni
S S A
2r
2
XiX ni ii
i 1j 1
i 1
组间平方和(系
a i1
b
ij
j 1
概率论与数理统计(第3版)第8章 假设检验(谢永钦)
(1)双边检验 设总体
, 未知时,检验假设
概率论与数理统计
概率论与数理统计
(2)单边检验(右检验或左检验)
设总体
, 未知时,检验假设
概率论与数理统计
概率论与数理统计
例题
零件直径xi 9.2 9.4 9.6 9.8 10.0 10.2 10.4 10.6 10.8
频数ni
1 1 3 67 5 4 2
概率论与数理统计
在已知总体分布形式情况下,对总体分布中的未知参数作 统计假设,这种仅涉及到总体分布之未知参数的统计假设称为 参数假设(parameter hypothesis)。而在未知总体分布形式情 况下,对总体分布形式作统计假设,这种直接对总体分布形式 所做的统计假设称为非参数假设(non-parameter hypothesis)。
概率论与数理统计
2. 假设检验的基本思想
概率论与数理统计
概率论与数理统计
概率论与数理统计
检验的基本步骤
概率论与数理统计
3. 两类错误
01 原假设H0实际是正确的,但是却被错误地拒绝了,就犯
了“弃真”的错误,通常称为第一类错误(type Ⅰerror). 由于仅当小概率事件A发生时才拒绝H0,所以犯第一类错
概率论与数理统计
如果一个统计假设完全确定总体的分布,则称此假设为简 单假设(simple hypothesis);否则就称之为复合假设 (complex hypothesis)。
建立统计假设并依据样本,采用相应的统计方法,经 过一定的程序,对零假设和备择假设作出取舍的过程就称 为假设检验(hypothesis testing)。
1
概率论与数理统计
解:要检验的假设是
因为 未知,所以选取统计量
概率论与数理统计第8章
(2)相容性 对m<n,有
Fm(x1, x2,...,xm;t1,t2,...,tm ) = Fn (x1, x2,...,xm,,...;t1,t2,...,tn )
X (t) =
t
当 = T ,t = 1,2,3,...
2. 例8.1.1的随机相位正弦波
X (t) = a cos(bt + )
3.某路公交车的客流情况{(X(t), Y(t));t0<t< t1}, (X(t), Y(t))表示t时刻起点与终点站的候车人数.
§8.2 随机过程的分布函数和数字特征
+
)]
2
= a2 cos2 (bt + x)
1
dx
0
2
= a2 2 2 cos(2bt + 2x) +1dx = a2
2 0
2
2
DX (t) =
X2
(t )
=
a2 2
设X(t1)和X(t2)是随机过程在任意二个时刻t1和t2 时的状态. 定义8.2.7 称X(t1)和X(t2)的二阶混合原点矩
RX (t1,t2 ) = E[X (t1)X (t2 )]
X
(1)
=
1
2
=H
,
=T
于是,X(0.5),X(1)的概率分布分别为
X (0.5) 0
1
Pk
1
1
22
X (1) -1
2
Pk
1
1
第8讲连续型随机变量-概率统计
(2)落入区间内的概率:
知道密度函数求 分布函数,一定 要画图。
(3)分布函数为:
例1 设连续型随机变量X具有概率密度
kx 1 p x 0 0 x 2, 其他.
(1)确定常数a, b
(2)求X的密度函数.
(3)求P(1 X 1), P( X 1).
2
解
(1)根据分布函数的性质有
π F lim (a b arctan x) a b 1, x 2 π F lim (a b arctan x) a b 0. x 2 1 1 此分布称为柯西分布 故 a ,b . 2 π (2) 由(1)知 1 1 F ( x) arctan x ( x ), 2 π 1 故 p( x) F ( x) π (1 x 2 ) ( x ).
(1)确定常数k
(2)求X的分布函数F x
(3)求P 3 X 5 2 2
解:(1) 由 p( x)dx 1, 得 (kx 1)dx 1 0
解得k 1/ 2
2
(2) X的分布函数为
x x0 0dt 0, 0 x x 1 1 2 F x p t dt 0dt ( t 1)dt x x, 0 x 2 0 2 4 2 x 1 0 0dt ( t 1)dt 0dt 1, x2 0 2 2 5/2 5 3 3 5 (3) P X = p( x)dx F F 2 2 3/2 2 2 1 0.9375 0.0625
概率论与数理统计第8讲
小结
本讲介绍了二维随机向量的基本概念,包 括联合分布函数及其性质,二维离散型随机向 量的联合概率分布及其性质,二维连续型随机 向量的概率密度及其性质;此外,还介绍二维 均匀分布和二维正态分布等。
2 2
,
其中 1 , 2 ,1 , 2 , 为常数,且 1 0, 2 0,
则称 ( X ,Y )为 服从参数 1, 2 ,1, 2 , 的正态分布,
记成 ( X ,Y ) N( 1, 2 ,1, 2 , )。
正态分布(X,Y)的概率密度函数 f(x,y)图像:
a b
连续型随机向量 (X,Y) 的联合概 率密度:
P{( x, y ) A} f ( x, y )dxdy.
A
f ( x) 0, f ( x)dx 1.
f ( x, y ) 0, f ( x, y )dxdy 1.
练习:
1、袋中有1个红球,2个黑球,3个白球, 从中有放回抽取2个球,令X,Y分别表示 所取得的红球、黑球个数, 求随机向量(X,Y)的联合分布律。
2、将2封信任意地投到3个号码分别为1,2,3 的3个信箱中,用X和Y分别表示投入到 第1,2号信箱中信的数目, 求随机向量(X,Y)的联合分布律。
练习:
设试验E的样本空间为Ω,X=X()与Y= Y()是定义在Ω上的两个随机变量, 由它们构 成的向量 (X, Y) 称为二维随机向量。 首先引入二维随机向量(X, Y)的分布函数 的概念。
定义二维随机向量(X, Y) 的联合分布函数为
F ( x, y ) P( X x, Y y ), x , y .
二维分布函数 F(x, y)的三条基本性 质 (1).x, yR, 有 0≤F(x, y)≤1; (2).F(x, y)是变量 x,y 的非减函数; 即 yR 给定,当 x1< x2 时, F(x1, y)≤F(x2, y). 同样, xR 给定,当y1≤y2时, F(x, y1)≤F(x, y2).
概率论与数理统计-第八章
关键词: 原假设、备择假设 假设检验 检验统计量、 显著性水平、拒绝域 关于正态总体的假设检验 分布拟合检验、秩和检验
p 值法检验
1
假设检验的概念
对于总体X的分布函数未知,或只知其函数形式 而参数未知,提出关于总体的假设,如: (1) 总体X服从指数分布; (2) 总体X的数学期望 E(X) > 0.5; (3) 总体X和Y有相同的方差:Var(X)=Var(Y);
(4) 总体X的数学期望大于Y的数学期望:
E(X) > E(Y); ……
通过样本数据,判断是应当接受还是拒绝该假设。
2
应用举例 (1) 有人声称一根金条的重量为312.5克。现用一架天
平重复称量n次,得到结果M1,M2,…, Mn。已知该
天平的误差为0.5克。问:根据称量结果,如何判 断该重量是否真实。 原假设H0:真实 (M=312.5) ; 对立假设H1:虚假 (M≠312.5) (2) 某地人口中每年某疾病的发病人数服从泊松分布。 长期统计得到平均年发病人数为2.3人。最近4年发病 人数为:3, 4, 1, 5。问:能否认为近4年发病率上升? 原假设H0:没有 ;对立假设H1:上升
由于 拒绝域的形式为
36
对两个独立正态分布,有
如果假设H0成立,有
故得:检验统计量 拒绝域
F 检验法
37
例7:用两种方法测量冰从-0.720C到 00C水的吸收热。 测得数据为:(cal/g)
方法A:n1=13, 样本均值 80.02,样本方差 S2A=0.0242
方法B:n2 = 8, 样本均值 79.98,样本方差 S2B=0.0312 设两个样本独立,来自两个正态总体 和
4
对立假设H1:有差异(h1 ≠ h2 )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 某车间用一台包装机包装葡萄糖。包得的 袋装糖重是一个R.V,它服从正态分布N(μ, 0.0152)。当机器正常时,其均值为0.5kg,随 机地抽取它所包装的糖9袋,称得净重(kg), 分别为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问包装机工作是否正常?
2
( n 1) s 未 2 2 知 2 2 2 2 0 0 0 时
2
2 2 0
μ
2
2 { 2 ( n 1)}
( n 1)
2
2
2 { 2 (n 1)}
2
2 2 0
2 0
{ 2 12 (n 1)}
0
给定显著性水平α,
1)双边检验
PH0 {
2
2 2 1 (n 1) 2
2
(n 1)}
2
2
2
2 2 2 拒绝域C { 2 1 ( n 1 )} { ( n 1)}
2)右边检验
PH0 { (n 1)}
本例中 PH1{ x 0
n
k} .
原则 在控制第一类错误的概率α的条件下,使犯 第二类错误的概率β尽量小。 这样的假设检验问题称为显著性检验问 题,概率α称为显著性水平 (evidence level).
1) 反证法思想
2) 小概率原理 概率很小的事件在一次试验中实际上是 不会发生的。
取统计量
Z
X 0
,
n
1) PH 0 { z Z } 2 拒绝域 C { z Z }
2
当H0为真时,Z ~ N (0,1), 给定显著性水平 α,有
即当 z Z 时,拒绝H 0 , 接受H1.
2
2) PH0 {z Z }
拒 绝 域 C {z Z }
2 2
2 拒绝域C { 2 (n 1)}
3)左边检验
PH0 {
2
2
2 1 (n 1)}
2 1 (n 1)}
拒绝域C {
原假设
备择假 设
2 0
检验统计 量
H0为真 拒绝域C 时检验 统计量 的分布
{ 2 12 ( n 1)}
内容
总体分布参数的假设检验
总体分布的χ2检验
学习目标 1.假设检验,原假设、备择假设
2.两类错误 3. 显著水平,拒绝域 4. 正态总体均值或方差的假设检验
§8.1 假设检验的基本概念
数理统计的基本任务是根据对样本的考察来 对总体的某些情况作出判断。采用先对总体X 的分布或未知参数作某种假设,再运用统计 分析的方法来检验这一假设是否正确,从而作 出接受或拒绝的决定。这就是假设检验问题。
z
xy
2 1
n1
2 2
,
n2
当H0为真时,
z ~ N (0,1),
C { z Z }
2 2
PH 0 { z Z }
拒绝域
2)右边检验
H 0 : 1 2 0 H1 : 1 2 0 取检验统计量 x y , z 2 12 2 n1 n2
H0,称为原假设(或零假设)(null hypothesis)
H1,称为备择假设.(alternative hypothesis) H0为真时,统计量
X 0 Z ~ N(0,1). n
两类错误: ⑴第一类错误 在原假设为真时,决定拒绝原假设,称 为第一类错误,其出现的概率通常记作α;
当H0为真时,
z ~ N (0,1),
给定显著性水平α
P H 0 {z Z }
拒绝域 C {z Z }
3)左边检验
H 0 : 1 2 0 H1 : 1 2 0 取检验统计量 x y , z 2 12 2 n1 n2
P H 0 {z Z } 拒绝域 C {z Z }
2 关于σ2的假设检验 对σ2常见的假设检验问题:
1) H 0 : 2) H 0 : 3) H 0 :
2 2 2
2 0 2 0 2 0
H1 : H1 : H1 :
2 2 2
2 0 2 0 2 0
双边检验
右边检验
左边检验
由于样本方差s2是总体方差σ2的无偏估计, 当H0为真时, 2 ( n 1) s 2 2 ~ ( n 1 ), 2
P{拒绝H 0 H 0为真} 或记为 PH0 {拒绝H 0 }
本例中 PH 0 {
x 0
n
k} .
⑵第二类错误 在原假设不真时,决定接受原假设, 称为 第二类错误,其出现的概率通常记作β。
P{接受H 0 H 0为假}
或记为 PH1 {接受H 0 }
当H0为真时, u ~ N (0ห้องสมุดไป่ตู้1), 给定显著性水平α
2. 未知时,1 2的假设检验
2 1 2 2 2
双边检验
H 0 : 1 2 0 H1 : 1 2 0
取检验统计量
t sw
x y 1 1 n1 n2
2 2 ( n 1 ) s ( n 1 ) s 2 1 1 2 2 其中s w n1 n2 2
取检验统计量
F
给定显著性水平α
2
2 s1 2 s2
PH 0 { F F1 ( n1 1, n2 1)或 F F ( n1 1, n2 1)}
拒绝域
2
C { F F1 ( n1 1, n2 1)或
2
F F ( n1 1, n2 1)}
( x
i 1
n
i
x) .
2
1 关于μ的假设检验
对μ常见的假设检验问题:
1) H 0 : 0 H1 : 0 双边检验 2) H 0 : 0 H1 : 0 右边检验 3) H 0 : 0 H1 : 0
左边检验
(1)σ2已知
3) PH0 {z Z }
拒绝域 C {z Z }
例 在正态总体 N ( ,1)中取 100个样品,计算得 x 5.32,
(1) 试 在 显 著 性 水 平 0.01下 检 验 假 设 H 0 : 5, H 1 : 5. ( 2) 如 果 需 在 0.01 下检验假设 H 0 : 5, H1 : 4.8.
2
( n 1) s 2
2 0
,
由观测值及 196,n 10,
2 0
计算得 (n 1)s 2 218.1, 2 1.113,
由查 分布表,自由度为 9,
2
2 1
(9)
2 0.95
( 9 ) 3.33,而 3.33,
2 2
因此拒绝H 0 , 认为 196.
假设检验的步骤如下: ⑴ 建立H0和H1; ⑵ 选定统计量并分析拒绝域的形式; ⑶ 给定显著性水平 α,并确定出拒绝域C;
⑷ 根据样本观测值作出判断是否拒绝H0。
§8.2 单个正态总体参数的假设检验
设(x1,x2,…,xn)是正态总体X~N(μ,σ2) 的样本。
1 x n
2
x
i 1
n
i
1 s n 1
例 测得两批电子器件的样品,电阻(Ω)为
A批(x) 0.140 0.138 0.143 0.142 0.144 0.137 B批(y) 0.135 0.140 0.142 0.136 0.138 0.140 设这两批器件的电阻值分别服从N(μ1,σ12), N(μ2,σ22)且两样本独立。 1)检验假设(α=0.05)
例《品种提纯》一个混杂的小麦品种, 其株高的标准差为14cm,经提纯后随机地 抽出10株,它们的株高(单位:cm)为90, 105,101,95,100,100,101,105,93,97,试 检验提纯后的群体是否比原来的群体较为 整齐,α=0.05。 解:提纯后的群体应该比原来的群体 较为整齐,故设 H0为σ2=196,H1为σ2<196,
2
2) PH 0 {t t ( n 1)}
拒 绝 域 C {t t ( n 1)}
3) PH 0 {t t ( n 1)}
拒 绝 域 C {t t ( n 1)}
例《作物栽培》已知豌豆百粒重X(单位:g) 服从正态分布N(37.72,0.1089),在改善栽 培条件后随机抽出9粒,平均重量=37.92,问 改善栽培条件是否显著地提高了豌豆的百粒 重,α=0.05。 解:因为改善栽培条件不会降低豌豆籽的 百粒重,所以设 H0为μ=37.72,H1为μ>37.72
原假设H0和备择假设H1,可有如下的形式:
H 0 : 0 H1: 1 ( 0和1非空且不相交 )
参数假设检验: 对未知参数提出假设,再根据样本进行检验。
非参数假设检验: 常见是对总体的未知分布提出假设,再根据 样本进行检验。
拒绝域: 当样本观测值(x1,x2,…,xn)落在某区域C时我们 拒绝原假设,则称区域C为拒绝域,拒绝域的 边界点称为临界点。
当H0为真时, t ~ t ( n1 n2 2)
给定显著性水平α
PH0 { t t (n1 n2 2)}
2
拒绝域 C { t t (n1 n2 2)}
2
3. 1及2未知时, 的假设检验