概率论与数理统计第8章1--20091122
合集下载
概率论与数理统计第8章(公共数学版)
则犯弃真错误的概率为
P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
概率论与数理统计第8章
实验目的
通过实际数据验证概率论与数理统计中的理论 和方法,提高对理论知识的理解和应用能力。
01
1. 数据收集
从相关领域获取实际数据,确保数据 质量和代表性。
03
3. 理论应用
根据实验目的选择合适的理论和方法,进行 数据分析和解读。
05
02
实验方法
收集相关领域的实际数据,运用概率论与数 理统计中的理论和方法进行分析,如概率分 布、参数估计、假设检验等。
无偏性、有效性和一致性。
有效性
在所有无偏估计量中,有效性 是指方差最小的估计量。
点估计
用样本统计量来估计未知参数 的过程。
无偏性
估计量的期望值等于被估计的 参数值。
一致性
随着样本容量的增加,估计量 的值应趋近于被估计的参数值。
区间估计
区间估计
根据样本数据推断未知参数的可能取值范围。
置信区间和置信水平
本章内容主要包括贝叶斯推断的基本概念、贝叶斯推断的数学基础、贝叶斯推断 在参数估计和假设检验中的应用,以及贝叶斯推断的优缺点和与其他统计方法的 比较。
学习目标
01
掌握贝叶斯推断的基本原理和方法,理解贝叶斯推 断的数学基础。
02
学会使用贝叶斯方法进行参数估计和假设检验,了 解贝叶斯推断在实践中的应用。
案例总结
总结案例分析的成果,提炼出具有指导意义的结论和建议,为实际工 作提供参考和借鉴。
THANKS FOR WATCHING
感谢您的观看
置信区间是参数可能取值的范围,置信水平是该区间包含参数真 值的概率。
区间估计的步骤
确定置信水平、构造合适的统计量、计算置信区间。
假设检验的基本概念与步骤
假设检验
概率论与数理统计同济大学第8章
2
8.14 在习题 8.8 中,(1)试证, X (1) 不是 的无偏估计,但是 的渐进无偏估计,而 X (1)
D( X (1) ) ;(3)试证, X (1) 与 X (1)
1 是 的无偏估计;(2)试求 X (1) 的方差 n
8.18
已知某种油漆的干燥时间(单位:小时)服从正态分布 N ( , 2 ) ,其中 与 均未知,0 , 0 .现在抽
8.12 估计
在习题 8.3 中,(1)求 的极大似然估计,证明它不具有无偏性;(2)求常数 c ,使得 c X i2 成为 的无偏估计;(3)求 的矩
2
i 1
n
3 X 的方差; (4)求 P ( X ) 的矩估计,证明当 n 1 时它不具有无偏性. 2
第八章 参数估计
1- x - , x 1 ,其中 未知, 1 .试求 的矩估计 x 1 0,
8.4
设 ( X 1 ,..., X n ) 是取自总体 X 的一个样本, X P ( ) ,其中 未知, 0 .试求 P( X 0) 与 P( X 1) 的极大似然估计.
估计。
6x x 8.13 设 ( X 1 ,..., X n ) 是取自总体 X 的一个样本, X 的密度函数为 f x 3 0
0 x 其余
,其中
ˆ; ˆ 是 的无偏估计,并求出它的方差 D ˆ 。 未知, 0 。 (1) 试求 的矩估计 (2)试证
2
8.19
设 ( X 1 ,..., X n ) 是取自正态总体 N ( , 2 ) 的一个样本.其中 未知( 0 )但 已知.试问,样本大小 n 至少取
概率论与数理统计教案第八章
其中, 是已知常数.试求拒绝域 .
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,
或
;
;
未知
;
当 时,
或
;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,
或
;
;
未知
;
当 时,
或
;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表
概率论与数理统计课后习题答案 第八章
3. 甲,乙两台机床加工某种零件,零件的直径服从正态分布,总体方差反映了加工精度.为比较两台机床
的加工精度有无差别,现从各自加工的零件中分别抽取 7 件产品和 8 件产品,测得其直径为
X(机床甲) 16.2 16.4 15.8 15.5 16.7 15.6 15.8
Y(机床乙) 15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0
(kg),样
本标准差
(kg).设产品质量服从正态分布,这两个样本相互独立.问能否认为使用 B 原料生产的
产品平均质量较使用原料 A 显著大?(取显著性水平
).
解:检验假设
选取检验统计量
查表知
由于
故接受
即使用 B 原料生产的产品平均质量于使用原料 A 生产的产品平均质量无显著大.
自测题 8
一、,选择题
已知元件电阻服从正态分布,设
问
(1) 两批电子元件电阻的方差是否相等;
(2) 两批元件的平均电阻是否有差异.
解: (1)检验假设
经计算
由
查表得
无法查
对应值,故无法做.
习题 8.4
某厂使用两种不同的原料生产同一类产品,随机选取使用原料 A 生产的产品 22 件,测得平均质量为
(kg),样本标准差
(kg).取使用原料 B 生产的样品 24 件,测得平均质量为
在假设检验问题中,显著性水平 的意义是 A .
A. 在 成立的条件下,经检验 被拒绝的概率
B. 在 成立的条件下,经检验 被接受的概率
C. 在 不成立的条件下,经检验 被拒绝的概率
D. 在 不成立的条件下,经检验 被接受的概率
二、,填空题
1. 设总体 X 服从正态分布
概率论与数理统计第八章
问题2 在十块土地上试种甲,乙两品种作物,所得产 量分别为(x1,x2,…,x10),(y1,y2,…,y10),假设作物产量 服从正态分布,问这两个品种的产量有无差别? 两总体的均值是否相等?
问题1、2是参数检验
问题3 某电话交换台在一小时内接到电话用户的呼唤 次数按分钟统计得到记录 呼唤次数 0 1 2 3 4 5 6 ≥7 频 数 8 16 17 10 6 2 1 0 问电话呼唤次数X是否服从泊松分布? 总体的分布是否为泊松分布? 已知总体的样本资料,要求推断 该总体的均值(或方差)是否等于某值? 两总体的均值(或方差)是否相等? 该总体的分布是否为某种分布?
非参数检验
问题1 某车间用一台包装机自动包装葡萄糖,额定 标准为每袋净重0.5公斤.设每袋重量服从正态分布, 且=0.015.某天开工后,随机抽取9袋,称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512.问包装机的工作是否正常? 总体的均值是否等于额定值0.5?
第八章 假设检验
假设检验
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法.
参数估计 统计推断 假设检验 具体方法 统计分析方差分析 回归分析
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法. 两类假设检验问题 1. 总体分布类型已知,但含有未知 参数,对未知参数作某种假设, 参数检验 然后判断假设的正确性. 2. 总体分布类型未知,对总体的 分布类型等作某种假设,然后 判断假设的正确性.
0
引例: 某车间用一台包装机自动包装葡萄糖,额定标 准为每袋净重0.5公斤.设包装机包装的实际袋重服从 正态分布,且标准差 =0.015(公斤).某天开工后,为检验 包装机的工作是否正常,随机抽取9袋,称得净重为: 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问这天包装机的工作是否正常?
问题1、2是参数检验
问题3 某电话交换台在一小时内接到电话用户的呼唤 次数按分钟统计得到记录 呼唤次数 0 1 2 3 4 5 6 ≥7 频 数 8 16 17 10 6 2 1 0 问电话呼唤次数X是否服从泊松分布? 总体的分布是否为泊松分布? 已知总体的样本资料,要求推断 该总体的均值(或方差)是否等于某值? 两总体的均值(或方差)是否相等? 该总体的分布是否为某种分布?
非参数检验
问题1 某车间用一台包装机自动包装葡萄糖,额定 标准为每袋净重0.5公斤.设每袋重量服从正态分布, 且=0.015.某天开工后,随机抽取9袋,称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512.问包装机的工作是否正常? 总体的均值是否等于额定值0.5?
第八章 假设检验
假设检验
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法.
参数估计 统计推断 假设检验 具体方法 统计分析方差分析 回归分析
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法. 两类假设检验问题 1. 总体分布类型已知,但含有未知 参数,对未知参数作某种假设, 参数检验 然后判断假设的正确性. 2. 总体分布类型未知,对总体的 分布类型等作某种假设,然后 判断假设的正确性.
0
引例: 某车间用一台包装机自动包装葡萄糖,额定标 准为每袋净重0.5公斤.设包装机包装的实际袋重服从 正态分布,且标准差 =0.015(公斤).某天开工后,为检验 包装机的工作是否正常,随机抽取9袋,称得净重为: 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问这天包装机的工作是否正常?
概率论与数理统计(第3版)第8章 假设检验(谢永钦)
(1)双边检验 设总体
, 未知时,检验假设
概率论与数理统计
概率论与数理统计
(2)单边检验(右检验或左检验)
设总体
, 未知时,检验假设
概率论与数理统计
概率论与数理统计
例题
零件直径xi 9.2 9.4 9.6 9.8 10.0 10.2 10.4 10.6 10.8
频数ni
1 1 3 67 5 4 2
概率论与数理统计
在已知总体分布形式情况下,对总体分布中的未知参数作 统计假设,这种仅涉及到总体分布之未知参数的统计假设称为 参数假设(parameter hypothesis)。而在未知总体分布形式情 况下,对总体分布形式作统计假设,这种直接对总体分布形式 所做的统计假设称为非参数假设(non-parameter hypothesis)。
概率论与数理统计
2. 假设检验的基本思想
概率论与数理统计
概率论与数理统计
概率论与数理统计
检验的基本步骤
概率论与数理统计
3. 两类错误
01 原假设H0实际是正确的,但是却被错误地拒绝了,就犯
了“弃真”的错误,通常称为第一类错误(type Ⅰerror). 由于仅当小概率事件A发生时才拒绝H0,所以犯第一类错
概率论与数理统计
如果一个统计假设完全确定总体的分布,则称此假设为简 单假设(simple hypothesis);否则就称之为复合假设 (complex hypothesis)。
建立统计假设并依据样本,采用相应的统计方法,经 过一定的程序,对零假设和备择假设作出取舍的过程就称 为假设检验(hypothesis testing)。
1
概率论与数理统计
解:要检验的假设是
因为 未知,所以选取统计量
概率论与数理统计 8
从数据来看,新药似乎有一定疗效,但效果不明显,服药者 在这次试验中的情况比未服药者好,完全可能是随机因素造成的。 对于新药上市这样关系到千万人健康的事,一定要采取慎重的态度。 这就需要用一种统计方法来检验药效,假设检验就是在这种场合下 的常用手段。
具体来说,我们先不轻易地相信新药的作用,因此可以提出假设 “新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不 能认为新药有明显的疗效。
这种提出假设然后做出否定或不否定的判断通常称为假设检验。
在假设检验中,常把一个被检验的假设称为原假设或零假设,并以 H0表示,而其对立面就称为对立假设或者备择假设,并以H1表示。
在假设检验中,检验的目的就是通过实测资料来判断是接受还是拒 绝这个原假设,这种假设检验也称为显著性测验。如果检验的结果否 定了原假设,就说(假设与实际)差异显著;如果检验的结果不能否 定原假设,就说(假设与实际)无差异显著。
二、假设检验的思想方法
如何利用从总体中抽取的样本来检验一个关于总体的假设是否成 立呢?由于样本与总体分布相同,样本包含了总体的信息,因而也包 含了原假设H0是否成立的信息,如何来获取并利用样本信息是解决问 题的关键.统计学中常用“小概率原理”和“概率反证法”来解决这 一问题。
小概率原理 概率很小的事件在一次试验中不会发生.如果小概率 事件在一次试验中竟然发生了,则属于不正常现象,有理由怀疑试验 的原定条件不成立。
如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货 物是要被拒收的。但是厂家有理由反对用这种方法验收。他们认为, 由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这 批产品的次品率p(概率)超过了3%。就如同说掷一枚钱币,正反两 面出现的概率各为0.5,但若掷两次钱币,不见得正、反面正好各出现 一次一样。也就是说,即使该批货的次品率为3%,仍有很大的概率使 得在抽检43件货物时出现2个以上的次品,因此需要用别的方法.如果 百货商店也希望在维护自己利益的前提下,不轻易地失去一个有信誉 的货源,也会同意采用别的更合理的方法。
概率论与数理统计第8章
Fn (x1, x2,...,xn;t1,t2,...,tn ) = Fn (xt j1 , xt j2 ,...,xt jn ;t j1 , t j2 ,...,t jn )
(2)相容性 对m<n,有
Fm(x1, x2,...,xm;t1,t2,...,tm ) = Fn (x1, x2,...,xm,,...;t1,t2,...,tn )
X (t) =
t
当 = T ,t = 1,2,3,...
2. 例8.1.1的随机相位正弦波
X (t) = a cos(bt + )
3.某路公交车的客流情况{(X(t), Y(t));t0<t< t1}, (X(t), Y(t))表示t时刻起点与终点站的候车人数.
§8.2 随机过程的分布函数和数字特征
+
)]
2
= a2 cos2 (bt + x)
1
dx
0
2
= a2 2 2 cos(2bt + 2x) +1dx = a2
2 0
2
2
DX (t) =
X2
(t )
=
a2 2
设X(t1)和X(t2)是随机过程在任意二个时刻t1和t2 时的状态. 定义8.2.7 称X(t1)和X(t2)的二阶混合原点矩
RX (t1,t2 ) = E[X (t1)X (t2 )]
X
(1)
=
1
2
=H
,
=T
于是,X(0.5),X(1)的概率分布分别为
X (0.5) 0
1
Pk
1
1
22
X (1) -1
2
Pk
1
1
(2)相容性 对m<n,有
Fm(x1, x2,...,xm;t1,t2,...,tm ) = Fn (x1, x2,...,xm,,...;t1,t2,...,tn )
X (t) =
t
当 = T ,t = 1,2,3,...
2. 例8.1.1的随机相位正弦波
X (t) = a cos(bt + )
3.某路公交车的客流情况{(X(t), Y(t));t0<t< t1}, (X(t), Y(t))表示t时刻起点与终点站的候车人数.
§8.2 随机过程的分布函数和数字特征
+
)]
2
= a2 cos2 (bt + x)
1
dx
0
2
= a2 2 2 cos(2bt + 2x) +1dx = a2
2 0
2
2
DX (t) =
X2
(t )
=
a2 2
设X(t1)和X(t2)是随机过程在任意二个时刻t1和t2 时的状态. 定义8.2.7 称X(t1)和X(t2)的二阶混合原点矩
RX (t1,t2 ) = E[X (t1)X (t2 )]
X
(1)
=
1
2
=H
,
=T
于是,X(0.5),X(1)的概率分布分别为
X (0.5) 0
1
Pk
1
1
22
X (1) -1
2
Pk
1
1
概率论与数理统计第八章
上式也可记为 PH0 {拒绝H 0}
本例中,上式应为
(x)
PH 0
X
/
0
n
u
2
/2
1
/2
u / 2 O
u / 2
x
b)第二类错误(取伪)
原假设H0事实上是假的,但是由于检验统计量的 观察值没有落在拒绝域中,从而导致接受H0.这时犯了 “取伪”的错误,即接受了错误的假设,这一类错误我
(2) 当H0不真时,作出接受H0的决策——称为第二 类错误(或称“存伪”错误)。
a)第一类错误(弃真)
原假设H0事实上是真的,但是由于检验统计量的观 察值落入拒绝域中,从而导致拒绝H0.这时犯了“弃真” 的错误,即将正确的假设摒弃了,将这一类错误称之为第
一类错误.记犯第一类错误的概率为 ,则有
PH0 {拒绝H0 H0为真}
们称之为第二类错误.记犯第二类错误的概率为 ,则
P{接受H0 | H0为假}
或者 PH1 {接受H 0} P{接受H 0 | H1为真}
在本例中,
PH1
X
/
0
n
u
2
(x)
/2
1
/2
u / 2 O
u / 2
x
可以看出假设检验中包含的两个重要的思想:
1)反证法思想
为了确定是否要拒绝原假设H0,首先是假定H0真,看
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
一般可以认为X1,…,X5是取自正态总体 N (, 2 ) 的样本,当生产比较稳定时, 2 是一个常数.
现在要检验的假设是:
H0: 0( 0 = 355)
概率论与数理统计教程 第8章
fe=nr
MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。
MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。
概率论与数理统计第八章
其中c Z /2 (0.1/ 10)
现在让我们分析一下: 取上述c后,如果假设H0是正确的,却被我们拒 绝了,即犯第一类错误的概率是多少.
分析: ∵当原假设 H0:μ=10 成立时,有:
X 10 ~N (0,1) 0.1/ 10
从而P X 10 Z / 2 (0.1/ 10)
也就是P 拒绝H0 : 10
第一节 基本概念
在本讲中,我们将讨论不同于参数估计
的另一这类类重问要题的称统作计假推设断检问验题问. 题这.就是根据 样本的信息检验关于总体的某个假设是否
正确.
参数假设检验
假设检验
总体分布已知,
非参数假设检验
总体分布未知时的
检验关于未知参数 的某个假设
假设检验问题
这一讲我们讨论对参数的假设检验 . 让我们先看一个例子.
P X 10 Z /2 (0.1/ 10)
∵相当小.这就是说:如果H0这个假设 是正确的话,检验统计量落入拒绝域就是一个 发生的概率很小的事件.
过去我们提到过,通常认为:小概率事件在 一次试验中基本上是不会发生的.
(我们把它称做实际推断原理.)
那么如果小概率事件发生了,即:
X 10 Z /2 (0.1/ 10)发生了.
说明 上面,我们假定12=22.当然,这是个不
得已加上去的条件.但如果不加此条件,就无法
使用简单易行的t检验了. 在实用中,只要我们有理由认为12和22相
差不是太大就可以使用上面方法.通常是如果方 差比检验未被拒绝(见下节),就认为12和22相 差不是太大.
注 如果根据旧经验我们很相信H0是对
的.要使人乐意放弃这个信念就要有十分过硬
的依据,此时应取得很小.
第八章 第二节 正态总体均值的假设检验
现在让我们分析一下: 取上述c后,如果假设H0是正确的,却被我们拒 绝了,即犯第一类错误的概率是多少.
分析: ∵当原假设 H0:μ=10 成立时,有:
X 10 ~N (0,1) 0.1/ 10
从而P X 10 Z / 2 (0.1/ 10)
也就是P 拒绝H0 : 10
第一节 基本概念
在本讲中,我们将讨论不同于参数估计
的另一这类类重问要题的称统作计假推设断检问验题问. 题这.就是根据 样本的信息检验关于总体的某个假设是否
正确.
参数假设检验
假设检验
总体分布已知,
非参数假设检验
总体分布未知时的
检验关于未知参数 的某个假设
假设检验问题
这一讲我们讨论对参数的假设检验 . 让我们先看一个例子.
P X 10 Z /2 (0.1/ 10)
∵相当小.这就是说:如果H0这个假设 是正确的话,检验统计量落入拒绝域就是一个 发生的概率很小的事件.
过去我们提到过,通常认为:小概率事件在 一次试验中基本上是不会发生的.
(我们把它称做实际推断原理.)
那么如果小概率事件发生了,即:
X 10 Z /2 (0.1/ 10)发生了.
说明 上面,我们假定12=22.当然,这是个不
得已加上去的条件.但如果不加此条件,就无法
使用简单易行的t检验了. 在实用中,只要我们有理由认为12和22相
差不是太大就可以使用上面方法.通常是如果方 差比检验未被拒绝(见下节),就认为12和22相 差不是太大.
注 如果根据旧经验我们很相信H0是对
的.要使人乐意放弃这个信念就要有十分过硬
的依据,此时应取得很小.
第八章 第二节 正态总体均值的假设检验
概率论与数理统计第8章
列方差分析表
方差来源 平方和 自由度 均方和 F 值
F 值临介值
组间
934.73 2 组内 90.17 6
467.36
F0.052,65.14
31.10**
F0.012,610.92
15.03
总和 1024.89 8
不同的饲料对猪的体重的影响极有统计意义。
.
例2的上机实现步骤
1、输入原始数据列,并存到A,B,C列;
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 . 1570 1680 1600
将
SST
2
,
SSA
2
,
SSE
2
的自由度分别记作
dfT , dfA, dfE
则 FSSA dfA~Fr1,nr
SSE dfE
(记 S S Ad fA M S A ,S S Ed fE M S E ,称作均方和)
.
则 FSSA dfA~Fr1,nr M S A
SSE dfE
M SE
(记 S S Ad fA M S A ,S S Ed fE M S E ,称作均方和)
1 1 4 9 7 1 1 4 0 6 .8 3
S S T S S A S S E 1 1 4 9 7 1 0 4 7 2 . 1 1 1 0 2 4 . 8 9
MSA934.732467.36 MSE 90.17615.03
概率论与数理统计(茆诗松)第二版课后第八章习题参考答案
1 n (X i − X )2 就 ∑ n − 1 i =1
S T = ∑∑ (Yij − Y ) 2 ,fT = rm − 1 = n − 1;
i =1 j =1
r
m
组内偏差平方和记为 Se 或 SSE,其自由度记为 fe ,有
S e = ∑∑ (Yij − Yi⋅ ) 2 ,fe = r (m − 1) = n − r;
i =1
k
称为这 k 个数据的偏差平方和,反映这 k 个数据的分散程度.由于所有偏差之和
∑ (Yi − Y ) = ∑ Yi − kY = 0 ,
i =1 i =1
k
k
即这 k 个偏差由 k 个独立数据受到一个约束条件形成,可以证明它们与 k − 1 个独立(随机)变量可以相互 线性表示,称之为等价于 k − 1 个独立(随机)变量.一般地,若 k 个独立数据受到 r 个不相关的约束条件, 则它们等价于 k − r 个独立(随机)变量.在统计学中,把形成平方和的变量所等价的独立变量个数,称为 该平方和的自由度,通常记为 f.如上述偏差平方和 Q 的自由度为 k − 1,即 fQ = k − 1. 由于平方和的大小与变量个数(或自由度)有关,为了对偏差进行比较,通常考虑偏差平方和与其自 由度之商,称为均方和,记为 MS,反映一组数据的平均分散程度,如样本方差 S 2 = 是样本数据偏差的均方和. 四.总平方和分解公式 总偏差平方和记为 ST 或 SST,其自由度记为 fT ,有
其中
Yij − Yi⋅ = ( µ i + ε ij ) − ( µ i + ε i⋅ ) = ε ij − ε i⋅
是第 i 个总体内数据与该总体内样本均值的偏差,称为组内偏差,反映第 i 个总体内的随机误差;
概率论与数理统计 (姚孟臣) 课件 第八章
中国人民大学出版社
设在一项试验中,所考察的因素只有一个,即只有一 个因素在改变,而其他因素保持不变,则称其为单因 素试验;而多于一个因素在改变的试验称为多因素 试验. 因素可分为两类: 可控因素,如反应温度、原料配量、溶液浓度等; 不可控因素,如测量误差、气象条件等. 以下我们所说的因素都是指可控因素,称因素所处 的各种状态为该因素的各个水平. 试验中变化的因素用A,B,C,…表示, 因素A的p个不同水平分别用A1,A2,…,Ap表示.
2
ST
( Xij X ) ,(4)
j1 i1
1 s m
X n j1 i1 X ij , (5)
X 是数据的总平均.ST 能反映全部试验数据之间的差异,故又
称总变差.再记水平 Aj 下的样本平均值为 X j ,即
H0 : 1 2 H1 : 1, 2 ,
S
不全S相, 等,(2)
(2)作出未知参数1, 2, , s及 2的估计.
中国人民大学出版社
(一)
数学模型
为讨论方便,我们记均值的总平均为 ,且有
1 n
s
m j
j 1
m n
s
j
j 1
1 s
s
j (3)
j 1
s
s
再令a j j , j 1, 2, , s,易见 aj j s 0,a j 表示
中国人民大学出版社
例1 设有三台机器,用来生产厚度为1/4厘米的铝 合金板. 今要了解各机器产品的平均厚度是否相同, 取样测量精确至千分之一厘米,得结果如表8—1所 示.
表8—1 铝合金板的厚度
机器Ⅰ 0.236 0.238 0.248 0.245 0.243
中国人民大学出版社
机器Ⅱ 0.257 0.253 0.255 0.254 0.261
设在一项试验中,所考察的因素只有一个,即只有一 个因素在改变,而其他因素保持不变,则称其为单因 素试验;而多于一个因素在改变的试验称为多因素 试验. 因素可分为两类: 可控因素,如反应温度、原料配量、溶液浓度等; 不可控因素,如测量误差、气象条件等. 以下我们所说的因素都是指可控因素,称因素所处 的各种状态为该因素的各个水平. 试验中变化的因素用A,B,C,…表示, 因素A的p个不同水平分别用A1,A2,…,Ap表示.
2
ST
( Xij X ) ,(4)
j1 i1
1 s m
X n j1 i1 X ij , (5)
X 是数据的总平均.ST 能反映全部试验数据之间的差异,故又
称总变差.再记水平 Aj 下的样本平均值为 X j ,即
H0 : 1 2 H1 : 1, 2 ,
S
不全S相, 等,(2)
(2)作出未知参数1, 2, , s及 2的估计.
中国人民大学出版社
(一)
数学模型
为讨论方便,我们记均值的总平均为 ,且有
1 n
s
m j
j 1
m n
s
j
j 1
1 s
s
j (3)
j 1
s
s
再令a j j , j 1, 2, , s,易见 aj j s 0,a j 表示
中国人民大学出版社
例1 设有三台机器,用来生产厚度为1/4厘米的铝 合金板. 今要了解各机器产品的平均厚度是否相同, 取样测量精确至千分之一厘米,得结果如表8—1所 示.
表8—1 铝合金板的厚度
机器Ⅰ 0.236 0.238 0.248 0.245 0.243
中国人民大学出版社
机器Ⅱ 0.257 0.253 0.255 0.254 0.261
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
22 November 2009
第八章 方差分析与回归分析
第20页
四、总平方和分解公式
各yij间总的差异大小可用总偏差平方和
ST =
∑∑
i =1
r
m
j =1
( y ij − y ) 2
表示,其自由度为fT=n−1; 仅由随机误差引起的数据间的差异可以用 组内偏差平方和
Se =
∑ ∑ ( yij − yi. )
22 November 2009
第八章 方差分析与回归分析
第19页
在构成偏差平方和Q的k个偏差y1− y , …, yk− y k 间有一个恒等式 ∑ ( y i − y ) = 0 ,这说明在Q中独 i =1 立的偏差只有k−1个。 在统计学中把平方和中独立偏差个数称为该平 方和的自由度,常记为f,如Q的自由度为 fQ=k−1。自由度是偏差平方和的一个重要参数。
8.1.1 问题的提出
实际工作中我们经常碰到多个正态总体 均值的比较问题,处理这类问题通常采 用所谓的方差分析方法。
22 November 2009
第八章 方差分析与回归分析
第3页
ANOVA 由英国统 计学家R.A.Fisher首 创,为纪念Fisher, 以F命名,故方差分析 又称 F 检验 (F test)。用于推断多 个总体均值有无差异
表8.1.3 单因子方差分析表
来源 平方和 自由度 因子 误差 总和 SA Se ST fA=r−1 均方和 MSA= SA/fA MSe= Se/fe F比 F= MSA/ MSe
fe=n−r
fT=n−1
22 November 2009
第八章 方差分析与回归分析
第28页
对给定的α,可作如下判断: 如果 F ≥ F1−α (fA ,fe),则认为因子A显著; 若F< F1−α (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(Y≥F)。
表示,也称为因子A的偏差平方和,其自 由度为 fA=r−1;
22 November 2009
第八章 方差分析与回归分析
第22页
定理8.1.1 在上述符号下,总平方和ST可以 分解为因子平方和SA与误差平方和Se之和, 其自由度也有相应分解公式,具体为: ST =SA +Se , fT =fA +fe (8.1.16)
所以yij - yi. 仅反映组内数据与组内平均的随机误 差,称为组内偏差;而 yi. − y = ( μi + ε i. ) − ( μ + ε ) = ai + ε i. − ε (8.1.12)
yi. − y 除了反映随机误差外,还反映了第i个水
平的效应,称为组间偏差。
22 November 2009
22 November 2009
第八章 方差分析与回归分析
第11页
在水平Ai下的试验结果yij与该水平下的指标 均值 μi 一般总是有差距的,记 εij = yij−μi,
εij 称为随机误差。于是有 yij = μi +εij
(8.1.2)
(8.1.2)式称为试验结果 yij 的数据结构式。
22 November 2009
22 November 2009
第八章 方差分析与回归分析
第25页
定理8.1.2 在单因子方差分析模型 (8.1.8) 及前述 符号下,有 (1) Se /σ 2 ~ χ 2(n−r) ,从而E(Se ) =(n−r) σ 2 (2)
E(SA ) = (r −1)σ + m∑ a
2 i =1
r
2 i
22 November 2009
(8.1.1)
第八章 方差分析与回归分析
第10页
为对假设(8.1.1)进行检验,需要从每一水 平下的总体抽取样本,设从第i个水平下的总 体获得m个试验结果,记 yij 表示第i个总体的 第j次重复试验结果。共得如下n=r×m个试验 结果: yij, i=1, 2,…, r , j=1, 2, …, m, 其中r为水平数,m为重复数,i为水平编号, j 为重复编号。
(8.1.16)式通常称为总平方和分解式。
22 November 2009
第八章 方差分析与回归分析
第23页
注:在偏差平方和分解公式中 (1)SA显著地大于 Se,说明各总体样本均值之间的 差异显著地大于重复试验中随机误差的大小,则拒 绝H0 ,从而认为因素影响是显著的. (2)否则接受H0.认为因素影响是不显著的. 这也是方差分析的由来.
Ti = ∑ yij
j =1 r
yi . =
m
i = 1, 2,
,r
T T = T = ∑ Ti y= r ⋅m n i =1 n = r ⋅ m = 总试验次数
22 November 2009
第八章 方差分析与回归分析
第15页
表8.1.2 单因子方差分析试验数据
因子水平 A1 A2 ┆ Ar 试验数据 y11 y12 … y1m y21 y22 … y2m ┆ yr1 yr2 … yrm 和 T1 T2 ┆ Tr T
第八章 方差分析与回归分析
第1页
第八章 方差分析与回归分析
§8.1 §8.2 §8.3 §8.4 §8.5 方差分析 多重比较 方差齐性分析 一元线性回归 一元非线性回归
22 November 2009
第八章 方差分析与回归分析第 Nhomakorabea页§8.1 方差分析 Analysis of Variance (ANOVA )
记
1 m ε i. = ∑ ε ij , m j =1
22 November 2009
1 r 1 r m ε = ∑ ε i. = ∑∑ ε ij r i =1 n i =1 j =1
第八章 方差分析与回归分析
第17页
由于
yij − yi. = ( μi + ε ij ) − ( μi + ε i ) = ε ij − ε i (8.1.11)
22 November 2009
1 1 r μ = ( μ1 + ... + μr ) = ∑ μi r r i =1
为总均值.
第八章 方差分析与回归分析
第13页
模型(8.1.3)可以改写为
⎧ yij = μ + ai + εij , i = 1,2,..., r, j = 1,2,..., m ⎪r ⎪ (8.1.8) ai = 0 ⎨∑ ⎪ i=1 ⎪ε 相互独立,且都服从N(0,σ 2 ) ⎩ ij
22 November 2009
第八章 方差分析与回归分析
第24页
8.1.4 检验方法
偏差平方和Q的大小与自由度有关,为了便于在 偏差平方和间进行比较,统计上引入了均方和 的概念,它定义为MS=Q/fQ ,其意为平均每个 自由度上有多少平方和,它比较好地度量了一 组数据的离散程度。 如今要对因子平方和 SA 与误差平方和 Se 之间进 行比较,用其均方和 MSA= SA /fA , MSe= Se /fe 进行比较更为合理,故可用 F = MS A = S A / f A 作 MS e Se / fe 为检验H0的统计量。
i = 1 j =1
r
m
2
表示,
也称为误差偏差平方和,其自由度为 fe=n−r ;
22 November 2009
第八章 方差分析与回归分析
第21页
由于组间差异除了随机误差外,还反映了 效应间的差异,故由效应不同引起的数据 差异可用组间偏差平方和
S A = m ∑ ( yi . − y ) 2
i =1 r
22 November 2009
第八章 方差分析与回归分析
第29页
常用的各偏差平方和的计算公式如下:
T2 2 ST = ∑∑ yij − n i =1 j =1
22 November 2009
平均
y1 y2
┆
yr y
第八章 方差分析与回归分析
第16页
二、组内偏差与组间偏差
数据间是有差异的。数据yij与总平均 y 间 的偏差可用yij − y 表示,它可分解为二个 偏差之和
yij − y = ( yij − yi. ) + ( yi. − y )
(8.1.10)
22 November 2009
第八章 方差分析与回归分析
第9页
我们要比较各水平下的均值是否相同, 即要对如下的一个假设进行检验: H0 :μ1 =μ2 =…=μr 备择假设为H1 :μ1, μ2, …, μr 不全相等 在不会引起误解的情况下, H1 通常可省略不写。 如果H0成立,因子A的r个水平均值相同,称因子A 的r个水平间没有显著差异,简称因子A不显著; 反之,当H0不成立时,因子A的r个水平均值不全 相同,这时称因子A的不同水平间有显著差异,简 称因子A显著。
进一步,若H0成立,则有SA/σ 2 ~χ 2(r−1) (3) SA与Se独立。
22 November 2009
第八章 方差分析与回归分析
第26页
由定理8.1.2,若H0成立,则检验统计量F服从自由度为 fA和fe的F分布,因此拒绝域为W={F≥F1−α (fA ,fe)},通常 将上述计算过程列成一张表格,称为方差分析表。
第八章 方差分析与回归分析
第18页
三、偏差平方和及其自由度
在统计学中,把k个数据y1 , y2 , …, yk分别对其均 值 y =(y1+ …+ yk )/k 的偏差平方和
Q = ( y1 − y ) +
2
+ ( yk − y ) = ∑ ( yi − y )2