概率论统计第八章
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论第8章

三、极大似然估计法(最先出现的是概率最大的)
定义
总体 的概率函数为 f x , 为未知参数
。
x1 , x 2 , , x n 是取自总体
的一个样本观察值,
如 = ˆ时, x1 , x 2 , , x n 被取到的概率最大,
即使似然函数
L 取到极大值。则称
ˆ为 的
x 1 x
, x 0 ,1
p 的似然函数为 L xi , p
i 1
n
p
xi
1 p 1 x
i
p
xi
i 1
n
1 p n x
i 1
n
i
令y
n
x i,得:
i 1
ln L x i , p y ln p n y ln 1 p 由对数似然方程 d ln L dp y p n y 1 p 0
参数估计
在实际问题中,对于一个总体ξ往往是 仅知其分布的类型,而其中所含的一个或 几个参数的值却是未知的,因此只有在确 定这些参数后,才能通过其分布来计算概 率,如何确定这些参数的数值呢?这就是 统计推断中的“参数估计”问题。
本章只研究总体分布是连续型或离散型两种情
形。为简便起见,我们引入一个对这两种情形通
2
这说明 是 的无偏估计
. S 是 的无偏估计。
2 2
~2 2 2 2 但 S 不是 的无偏估计。因此,一 般用 S 作为 的估计, ~2 2 但在 n 很大时, S 与 S 相差不大,这时二者就 不加以 区别了。
例2
设总体 有 E , D
2
, 1 , 2 , , n 是 的样本,
概率论与数理统计第8章

实验目的
通过实际数据验证概率论与数理统计中的理论 和方法,提高对理论知识的理解和应用能力。
01
1. 数据收集
从相关领域获取实际数据,确保数据 质量和代表性。
03
3. 理论应用
根据实验目的选择合适的理论和方法,进行 数据分析和解读。
05
02
实验方法
收集相关领域的实际数据,运用概率论与数 理统计中的理论和方法进行分析,如概率分 布、参数估计、假设检验等。
无偏性、有效性和一致性。
有效性
在所有无偏估计量中,有效性 是指方差最小的估计量。
点估计
用样本统计量来估计未知参数 的过程。
无偏性
估计量的期望值等于被估计的 参数值。
一致性
随着样本容量的增加,估计量 的值应趋近于被估计的参数值。
区间估计
区间估计
根据样本数据推断未知参数的可能取值范围。
置信区间和置信水平
本章内容主要包括贝叶斯推断的基本概念、贝叶斯推断的数学基础、贝叶斯推断 在参数估计和假设检验中的应用,以及贝叶斯推断的优缺点和与其他统计方法的 比较。
学习目标
01
掌握贝叶斯推断的基本原理和方法,理解贝叶斯推 断的数学基础。
02
学会使用贝叶斯方法进行参数估计和假设检验,了 解贝叶斯推断在实践中的应用。
案例总结
总结案例分析的成果,提炼出具有指导意义的结论和建议,为实际工 作提供参考和借鉴。
THANKS FOR WATCHING
感谢您的观看
置信区间是参数可能取值的范围,置信水平是该区间包含参数真 值的概率。
区间估计的步骤
确定置信水平、构造合适的统计量、计算置信区间。
假设检验的基本概念与步骤
假设检验
概率论和数理统计(第三学期)第8章参数估计

由契比雪夫不等式,有
P( S 2 ES2
n
n
)
DS
2
n
=
2 4
2 n 1 2
即 lim P( S 2 ES2 ) 0
n
n
n
(n 1)S 2
E
2
n n 1
ES2 2 n
故 lim P( S 2 2 ) 0
n
n
§8.3 参数的区间估计
定义
设是总体的未知参数,若 (1 1
6
S~2 1 1.20 0.162 0.85 0.162 0.30 0.162 6 0.45 0.162 0.82 0.162 0.12 0.162 1 1.042 0.692 0.142 0.612 0.982 0.282 6 1 2.99 6 0.498 2
n
p xi
1
p
1 xi
xi p i1
1
p
n
n xi
i1
i 1
n
令y xi,得: i 1 ln Lxi , p y ln p n yln1 p
由对数似然方程
d ln L y n y 0 dp p 1 p
解得
p
y n
1 n
n i 1
xi
x
因为这是惟一的解,所 以p的极大似然估计值为
二、顺序统计量法
定义
1
, 2
,
,
为总体
n
的一个样本,将它
们按大小次序排列,取 居中的一个数 (若n为偶
数时,则取居中两数的 平均值)记为~,称~为
样本中位数。
即
~
k
1
,
1 2
k
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
《概率论与数理统计》习题及答案第八章

《概率论与数理统计》习题及答案第⼋章《概率论与数理统计》习题及答案第⼋章1. 设x.,x2,,%…是从总体X中抽岀的样本,假设X服从参数为兄的指数分布,⼏未知,给泄⼊〉0和显著性⽔平a(Ovavl),试求假设H o的⼒$检验统计量及否建域.解选统汁量*=2⼈⼯⼄=2如庆则Z2 -Z2(2n) ?对于给宦的显著性⽔平a,査z'分布表求出临界值加⑵",使加⑵2))=Q因z2 > z2 > 所以(F": (2/1)) => (/2 > /; (2n)),从⽽a = P{X2 > 加⑵“} n P{r > Za(2/0)可见仏:2>^的否定域为Z2>Z;(2?).2. 某种零件的尺⼨⽅差为O-2=1.21,对⼀批这类零件检查6件得尺⼨数据(毫⽶):,,,,,。
设零件尺⼨服从正态分布,问这批零件的平均尺⼨能否认为是毫⽶(a = O.O5).解问题是在/已知的条件下检验假设:“ = 32.50Ho的否定域为1“ l> u af2u0(n5 = 1.96 ,因1“ 1=6.77 >1.96,所以否泄弘,即不能认为平均尺⼨是亳⽶。
3. 设某产品的指标服从正态分布,它的标准差为b = 100,今抽了⼀个容量为26的样本,计算平均值1580,问在显著性⽔平a = 0.05下,能否认为这批产品的指标的期望值“不低于1600。
解问题是在b?已知的条件下检验假设://>1600的否定域为u < -u a/2,其中X-1600 r-r 1580-1600 c , “11 = ------------ V26 = ------------------- x 5.1 = —1.02.100 100⼀叫05 =—1.64.因为// =-1.02>-1.64 =-M005,所以接受H(>,即可以认为这批产品的指标的期望值“不低于1600.4. ⼀种元件,要求其使⽤寿命不低于1000⼩时,现在从这批元件中任取25件,测得其寿命平均值为950⼩时,已知该元件寿命服从标准差为o-=100 ⼩时的正态分布,问这批元件是否合格(<7=0.05)解设元件寿命为X,则X~N(“,IO。
《概率论与数理统计》第八章1假设检验的基本概念

2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
概率论与数理统计第八章

问题1、2是参数检验
问题3 某电话交换台在一小时内接到电话用户的呼唤 次数按分钟统计得到记录 呼唤次数 0 1 2 3 4 5 6 ≥7 频 数 8 16 17 10 6 2 1 0 问电话呼唤次数X是否服从泊松分布? 总体的分布是否为泊松分布? 已知总体的样本资料,要求推断 该总体的均值(或方差)是否等于某值? 两总体的均值(或方差)是否相等? 该总体的分布是否为某种分布?
非参数检验
问题1 某车间用一台包装机自动包装葡萄糖,额定 标准为每袋净重0.5公斤.设每袋重量服从正态分布, 且=0.015.某天开工后,随机抽取9袋,称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512.问包装机的工作是否正常? 总体的均值是否等于额定值0.5?
第八章 假设检验
假设检验
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法.
参数估计 统计推断 假设检验 具体方法 统计分析方差分析 回归分析
所谓假设检验就是对总体X作某种假设,然后 利用概率论的知识和从总体中抽取样本而获得 的信息,判定假设是否成立的推断方法. 两类假设检验问题 1. 总体分布类型已知,但含有未知 参数,对未知参数作某种假设, 参数检验 然后判断假设的正确性. 2. 总体分布类型未知,对总体的 分布类型等作某种假设,然后 判断假设的正确性.
0
引例: 某车间用一台包装机自动包装葡萄糖,额定标 准为每袋净重0.5公斤.设包装机包装的实际袋重服从 正态分布,且标准差 =0.015(公斤).某天开工后,为检验 包装机的工作是否正常,随机抽取9袋,称得净重为: 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512 问这天包装机的工作是否正常?
概率论与数理统计 --- 第八章{假设检验} 第六节:假设检验的两类错误

假设检验的两类错误
实际情况
数理统计
决定 拒绝H0
接受H0
H0为真
H0不真
第一类错误
正确
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α, P{接受H0|H0不真}=β. 显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
X 0
n
u0.05 1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值: u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件, 测得 X =21.55公斤.
u=2.51>2.33
落入否定域
故拒绝原假设H0 , 即新生产织物比过去的织物的强力有提高。
小结:
提出 假设
根据统计调查的目的, 提出原假设H0 和备选假设H1 作出 决策
数理统计
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率, W--为拒绝域
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
两类错误的概率的关系
两类错误是互相关联的, 当样本容量固定时, 一类错误概率的减少导致另一类错误概率的增加. 要同时降低两类错误的概率 α, β 或者 要在 α不变的条件下降低 β, 需要增加样本容量.
概率论与数理统计第8章

(2)相容性 对m<n,有
Fm(x1, x2,...,xm;t1,t2,...,tm ) = Fn (x1, x2,...,xm,,...;t1,t2,...,tn )
X (t) =
t
当 = T ,t = 1,2,3,...
2. 例8.1.1的随机相位正弦波
X (t) = a cos(bt + )
3.某路公交车的客流情况{(X(t), Y(t));t0<t< t1}, (X(t), Y(t))表示t时刻起点与终点站的候车人数.
§8.2 随机过程的分布函数和数字特征
+
)]
2
= a2 cos2 (bt + x)
1
dx
0
2
= a2 2 2 cos(2bt + 2x) +1dx = a2
2 0
2
2
DX (t) =
X2
(t )
=
a2 2
设X(t1)和X(t2)是随机过程在任意二个时刻t1和t2 时的状态. 定义8.2.7 称X(t1)和X(t2)的二阶混合原点矩
RX (t1,t2 ) = E[X (t1)X (t2 )]
X
(1)
=
1
2
=H
,
=T
于是,X(0.5),X(1)的概率分布分别为
X (0.5) 0
1
Pk
1
1
22
X (1) -1
2
Pk
1
1
概率论与数理统计第八章

上式也可记为 PH0 {拒绝H 0}
本例中,上式应为
(x)
PH 0
X
/
0
n
u
2
/2
1
/2
u / 2 O
u / 2
x
b)第二类错误(取伪)
原假设H0事实上是假的,但是由于检验统计量的 观察值没有落在拒绝域中,从而导致接受H0.这时犯了 “取伪”的错误,即接受了错误的假设,这一类错误我
(2) 当H0不真时,作出接受H0的决策——称为第二 类错误(或称“存伪”错误)。
a)第一类错误(弃真)
原假设H0事实上是真的,但是由于检验统计量的观 察值落入拒绝域中,从而导致拒绝H0.这时犯了“弃真” 的错误,即将正确的假设摒弃了,将这一类错误称之为第
一类错误.记犯第一类错误的概率为 ,则有
PH0 {拒绝H0 H0为真}
们称之为第二类错误.记犯第二类错误的概率为 ,则
P{接受H0 | H0为假}
或者 PH1 {接受H 0} P{接受H 0 | H1为真}
在本例中,
PH1
X
/
0
n
u
2
(x)
/2
1
/2
u / 2 O
u / 2
x
可以看出假设检验中包含的两个重要的思想:
1)反证法思想
为了确定是否要拒绝原假设H0,首先是假定H0真,看
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
一般可以认为X1,…,X5是取自正态总体 N (, 2 ) 的样本,当生产比较稳定时, 2 是一个常数.
现在要检验的假设是:
H0: 0( 0 = 355)
概率论与数理统计第八章假设检验

对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
《概率论与数理统计教学课件》8第八章—正态总体均值和方差的假设检验

真)
P1 2
(
x y
11
k)
k t (n1 n2 2)
sw
n1 n2
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11
t (n1 n2 2)
2
n1 n2
注:
当
2 1
2 2
2
未知时
检验假设
或
H0 : 1 -2 (或1 2 ), H0 : 1 2 (或1 2 ),
2
概率统计
所以拒绝H 0 ,可认为这两种轮胎的耐磨性有显著差异。
注: ▲ 用两种不同的方法得到了两种不同的结论,那么
究竟应该采取哪一个结论比较合理呢?
显然,应该采取第二种方法得出的结论是合理的
因为数据配对的方法是针对同一架飞机的,它是 排除了因飞机之间的试验条件的不同而对数据产 生的干扰,所以它是直接反映了这两种轮胎的耐 磨性的显著差异的情况,因此,应采取第二种方 法得出的结论,即可认为这两种轮胎的耐磨性有 显著差异。
概率统计
按单个正态总体中当 2 未知时,关于 的假设检验
的计算公式,可得 H0 的拒绝域为:
C { t t t (n 1)}
2
经计算 d 320 , s2 89425 ,
t
d s
320 2.83 89425
n
8
t (n 1) t0.05 (7) 2.365
2
2
因为: t 2.83 t0.05 (7) 2.365
为已知常数,显著水平为
概率统计
Q 检验统计量
(X Y)
~ N (0,1)
2 1
2 2
n1 n2
《概率论与数理统计教学课件》8第八章置信区间与假设检验之间的关系及p值

H0 : 0, H1 : 0 也有类似的对应关系 . 若已求得单侧置信区间 ( ( X1, X2, , Xn ), ), 则当0 ( ( x1, x2, , xn ), ) 时接受 H0;
当0 ( ( x1, x2, , xn ), ) 时拒绝 H0 . 反之, 若已求得检验问题 H0 : 0 , H1 : 0
若 0 ( , ), 则接受 H0; 若 0 ( , ), 则拒绝 H0 .
反之 ,对于任意的0 , 考虑显著性水平为 的假设检验问题:
H0 : 0, H1 : 0 .
假设它的接受域为
( x1, x2, , xn ) 0 ( x1, x2, , xn ). 即有 P0 { ( X1, X2 , , Xn ) 0 ( X1, X2 , , Xn )} 由0 的任意性,
要
拒绝H
,再
0
取
0.01也要拒绝H0,但不
能知道将再降低一些是否也要拒绝H0. 而p值法
给出了拒绝 H0的最小显著性水平 . 因此p值法比
临界值法给出了有关拒绝域的更多的信息.
二、典型例题
例2 用p值法检验本章第一节例2 的检验问题
H 0 : 0 0.545, H1 : 0 0.05 解 用Z检验法 , 现在检验统计量Z x 0 的观察
(, ( X1, X2 , , Xn ))与显著水平为 的左边检 验问题 H0 : 0, H1 : 0 有类似的对应关系. 若已求得单侧置信区间 (, ( X1 , X2 , , Xn )),
则当0 (, ( x1, x2, , xn ))时接受 H0; 当0 (, ( x1, x2, , xn ))时拒绝 H0.
那么在检验问题
H0 : 0, H1 : 0中 p值 P0 {t t0 } t0右侧尾部面积, 如图3;
概率论与数理统计第八章资料

设(x1,..., xn )为总体的一组样本观察值。 要选取总体分布中未知参数的估计值, 使得 作为参数时,上述样本出现的可能性最大。 这种方法称为最大似然法。 若是离散型随机变量
P( xi ) p(xi, )
则样本x1,
...,
2
令 1=X 2
解得 = 2X 1 1 X
矩估计的优点:直接、简便
缺点:未充分利用分布信息
(二)最大似然法 两人射击,一人打中,一人没打中,认为打中者 技术较好。
某事件发生的概率为0.01或0.1,若一次试验中该 事件发生了,认为其概率为0.1 例5 在一个袋中有许多黑球与白球,其数量比为1:3 或3:1,通过抽样判断黑球多还是白球多。
解:有放回地抽取3个球, 若取到0个或1个白球,认为袋中黑球多。 若取到2个或3个白球,认为袋中白球多。
用表示取到的白球个数 若白球占1 4,则的分布为
0 1 2 3 P 27 27 9 1
64 64 64 64 若白球占3 4,则的分布为
0 1 2 3 P 1 9 27 27
64 64 64 64 可见,当=0或1时,认为白球占1 4
利用
ai2
a
2 j
2aia
有
j
3
ai
2
a1
a2
a3
2
i1
a12
a
2 2
a
2 3
2a1a 2
2a1a 3
2a 2a3
a12
a
2 2
a32
a12
a
2 2
a12 a32
a
2 2
a32
3
概率论与数理统计教程 第8章

MSe= Se/fe
总和
ST
fT=n1
对给定的,可作如下判断:
若F F1 (fA ,fe) ,则说明因子A不显著。 该检验的p值也可利用统计软件求出,若 以Y记服从F(fA ,fe)的随机变量,则检验的 p 值为 p=P(YF)。
如果 F >F1 (fA ,fe),则认为因子A显著;
由定理8.1.2,若H0成立,则检验统计量F服从自由度为fA和fe的F分布,因此拒绝域为W={FF1 (fA ,fe)},通常将上述计算过程列成一张表格,称为方差分析表。
表8.1.3 单因子方差分析表
来源
平方和
自由度
均方和
F比
因子
SA
fA=r1
MSA= SA/fA
F= MSA/ MSe
误差
Se
第八章 方差分析与回归分析
§8.1 方差分析 §8.2 多重比较 §8.3 方差齐性分析 §8.4 一元线性回归 §8.5 一元非线性回归
§8.1 方差分析
8.1.1 问题的提出 实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。
例8.1.1 在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选 24 只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:
模型(8.1.3)可以改写为 (8.1.8) 假设(8.1.1)可改写为 H0 :a1 =a2 =…=ar =0 (8.1.9)
8.1.5 参数估计
在检验结果为显著时,我们可进一步求出总均值 、各主效应ai和误差方差 2的估计。
概率论与数理统计第八章课后习题及参考答案

概率论与数理统计第八章课后习题及参考答案1.设某产品指标服从正态分布,它的均方差σ已知为150h ,今从一批产品中随机抽查26个,测得指标的平均值为1637h .问在5%的显著性水平,能否认为这批产品的指标为1600h ?解:总体X ~)150,(2μN ,检验假设为0H :1600=μ,1H :1600≠μ.采用U 检验法,选取统计量nX U /00σμ-=,当0H 成立时,U ~)1,0(N ,由已知,有1637=x ,26=n ,05.0=α,查正态分布表得96.1025.0=u ,该检验法的拒绝域为}96.1{>u .将观测值代入检验统计量得2577.142.293726/150********==-=u ,显然96.12577.1<=u ,故接受0H ,即可认为这批产品的指标为1600h .2.正常人的脉搏平均为72次/min ,现某医生从铅中毒患者中抽取10个人,测得其脉搏(单位:次/min)如下:54,67,68,78,70,66,67,70,65,69设脉搏服从正态分布,问在显著性水平05.0=α下,铅中毒患者与正常人的脉搏是否有显著性差异?解:本题是在未知方差2σ的条件下,检验总体均值72=μ.取检验统计量为nS X T /0μ-=,检验假设为0H :720==μμ,1H :72≠μ.当0H 成立时,T ~)1(-n t ,由已知,有4.67=x ,93.5=s ,05.0=α,查t 分布表得262.2)9(025.0=t ,将观测值代入检验统计量得45.288.16.410/93.5724.67/0-=-=-=-=n s x t μ,显然)9(262.2447.2025.0t t =>=,故拒绝0H ,即铅中毒患者与正常人的脉搏有显著性差异.3.测定某溶液中的水分,得到10个测定值,经统计%452.0=x ,22037.0=s ,该溶液中的水分含量X ~),(2σμN ,μ与2σ未知,试问在显著性水平05.0=α下该溶液水分含量均值μ是否超过5%?解:这是在总体方差2σ未知的情况下,关于均值μ的单侧检验.检验假设为0H :%5.0≤μ,1H :%5.0>μ.此假设等价于检验假设0H :%5.0=μ,1H :%5.0>μ.由于2σ未知,取检验统计量为nS X T /0μ-=.当0H 成立时,T ~)1(-n t ,拒绝域为)}1(/{0-≤-n t n s x αμ,将观测值代入检验统计量得709.1)5.052.0(10/0=-=-=ns x t μ,由05.0=α,查t 分布表得833.1)9(05.0=t ,显然)9(833.1709.105.0t t =<=,所以接受0H ,即该溶液水分含量均值μ是否超过5%.4.甲、乙两个品种作物,分别用10块地试种,产量结果97.30=x ,79.21=y ,7.2621=s ,1.1222=s .设甲、乙品种产量分别服从正态分布),(21σμN 和),(22σμN ,试问在01.0=α下,这两种品种的产量是否有显著性差异?解:这是在方差相等但未知的情况下检验两正态总体的均值是否相等的问题.检验假设为0H :21μμ=,1H :21μμ≠.由题可知,22221σσσ==未知,因此取检验统计量nm n m mn S n S m YX T +-+-+--=)2()1()1(2221,当0H 为真时,T ~)2(-+n m t ,该检验法的拒绝域为)}2({2/-+>n m t t α.由题设,10==n m ,97.30=x ,79.21=y ,7.2621=s ,1.1222=s .将其代入检验统计量得n m n m mn S n S m yx t +-+-+--=)2()1()1(222166.4201810101.1297.26979.2197.30=⨯⨯⨯+⨯-=,由01.0=α,查t 分布表得878.2)18()2(005.02/==-+t n m t α.显然)18(878.266.4005.0t t t =>=,因此,拒绝0H ,即这两种品种的产量有显著性差异.5.某纯净水生产厂用自动灌装机装纯净水,该自动灌装机正常罐装量X ~)4.0,18(2N ,现测量某厂9个罐装样品的灌装量(单位:L)如下:0.18,6.17,3.17,2.18,1.18,5.18,9.17,1.18,3.18在显著性水平05.0=α下,试问:(1)该天罐装是否合格?(2)罐装量精度是否在标准范围内?解:(1)检验罐装是否合格,即检验均值是否为18,故提出假设0H :18=μ,1H :18≠μ,由于方差224.0=σ已知,取检验统计量为nX U /00σμ-=,当0H 为真时,U ~)1,0(N ,该检验法的拒绝域为}{2/αu u ≥.由题可知,9=n ,18=x ,将其代入检验统计量得09/4.01818/00=-=-=n x u σμ,由05.0=α,查标准正态分布表得96.1025.0=u ,显然,025.096.10u u =<=,故接受0H ,即该天罐装合格.(2)检验罐装量精度是否在标准范围内,即检验假设0H :224.0≤σ,1H :224.0>σ,此假设等价于0H :224.0=σ,1H :224.0>σ.由于18=μ已知,选取检验统计量为∑=-=n i i X12202)18(1σχ,当0H 为真时,2χ~)(2n χ,该检验法的拒绝域为)}({22n αχχ≥.由已知计算得625.6)18(112202=-=∑=n i i x σχ,查2χ分布表得307.18)10(205.0=χ,由此知)10(307.18625.6205.02χχ=<=,故接受0H ,即罐装量精度在标准范围内.6.某厂生产某型号电池,其寿命长期以来服从方差221600h =σ的正态分布,现从中抽取25只进行测量,得222500h s =,问在显著性水平05.0=α下,这批电池的波动性较以往有无显著变化?解:这是在均值未知的条件下,对正态总体方差的检验问题.检验假设为0H :202σσ=,1H :202σσ≠,其中160020=σ,取检验统计量为222)1(σχS n -=.当0H 为真时,2χ~)(2n χ,对于给定的显著性水平,该检验法的拒绝域为)}1({22/12-≤-n αχχ或)}1({22/2-≥n αχχ.将观测值25002=s 代入检验统计量得5.371600250024)1(222=⨯=-=σχs n .对于05.0=α,查2χ分布表得401.12)24()1(2975.022/1==--χχαn ,364.39)24()1(2025.022/==-χχαn ,由于)24(364.395.37401.12)24(2025.022975.0χχχ=<=<=,故接受0H ,即这批电池的波动性较以往无显著变化.7.某工厂生产一批保险丝,从中任取10根试验熔化时间,得60=x ,8.1202=s ,设熔化时间服从正态分布),(2σμN ,在01.0=α下,试问熔化时间的方差是否大于100?解:本题是在均值未知的条件下,检验2σ是否大于100,是关于2σ的单侧检验问题.检验假设为0H :1002≥σ,1H :1002<σ,此假设等价于0H :1002=σ,1H :1002<σ,这是左侧检验问题,取检验统计量为2022)1(σχS n -=,当0H 为真时,2χ~)(2n χ,该检验法的拒绝域为)}1({212-≤-n αχχ.将10=n ,10020=σ,8.1202=s ,代入上述统计量得87.101008.1209)1(2022=⨯=-=σχs n .对于01.0=α,查2χ分布表得0879.2)9(299.0=χ,显然)9(0879.287.10299.02χχ=>=,接受0H ,即熔化时间的方差大于100.本题如果将检验假设设为0H :1002≤σ,1H :1002>σ,即进行右侧检验,统计量得选取如上,则该检验法的拒绝域为)}1({22-≥n αχχ.对于01.0=α,查2χ分布表得666.21)9(201.0=χ,显然)9(666.2187.10201.02χχ=<=,接受0H ,即熔化时间的方差不大于100.注:若选取的显著性水平为3.0=α,用MATLAB 计算得6564.10)9(23.0=χ,从而有)9(6564.1087.1023.02χχ=<=,则应拒绝原假设,即熔化时间的方差大于100.上述结果说明了在观测值接近临界值时,原假设不同的取法会导致检验结果的不一样,如果用-p 值检验法则可避免上述矛盾.8.设有两个来自不同正态总体的样本,4=m ,5=n ,60.0=x ,25.2=y ,07.1521=s ,81.1022=s .在显著性水平05.0=α下,试检验两个样本是否来自相同方差的总体?解:记两正态总体为),(211σμN 和),(222σμN ,其中1μ和2μ未知.检验假设为0H :2221σσ=,1H :2221σσ≠.取检验统计量为2221S S F =,当0H 为真时,F ~)1,1(--n m F ,该检验法的拒绝域为)}1,1({2/1--≤-n m F F α或)}1,1({2/--≥n m F F α.由题可知,05.0=α,4=m ,5=n ,将观测值代入检验统计量得39.181.1007.152221===s s F ,查F 分布表得98.9)4,3()1,1(025.02/1==---F n m F α,066.010.151)3,4(1)4,3()1,1(025.0975.02/====--F F n m F α.由此知)4,3(98.939.1066.0)4,3(025.0975.0F F =<<=,观测值没有落入拒绝域内,接受0H ,即两个样本来自相同方差的总体.9.某厂的生产管理员认为该厂第一道工序加工完的产品送到第二道工序进行加工之前的平均等待时间超过90min .现对100件产品的随机抽样结果的平均等待时间为96min ,样本标准差为30min .问抽样的结果是否支持该管理员的看法?(05.0=α).解:这是非正态总体均值的检验问题,用X 表示第一道工序加工完的产品送到第二道工序进行加工之前的等待时间,设其均值为μ,依题意,检验假设为0H :90≤μ,1H :90>μ.由于100=n 为大样本,故用U 检验法.总体标准差σ未知,用样本标准差S 代替.取检验统计量为100/90S X U -=,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{αu u >.由题可知,96=x ,30=s ,100=n .对于05.0=α,查标准正态分布表得645.105.0==u u α.将观测值代入检验统计量得2100/309096100/90=-=-=s x u ,显然,05.0645.12u u =>=,故拒绝0H ,即平均等待时间超过90分钟,也即支持该管理员的看法.10.一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8h 电视.”她认为她所领导的学校,学生看电视时间明显小于该数字.为此,她向学校的100名初中学生作了调查,得知平均每周看电视的时间5.6=x h ,样本标准差为2=s h ,问是否可以认为校长的看法是对的?(05.0=α)解:初中生每周看电视的时间不服从正态分布,这是非正态总体均值的假设检验问题.检验假设为0H :8=μ,1H :8<μ.由于100=n 为大样本,故用U 检验法,取检验统计量为nS X U /μ-=,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{αu u -<.由题可知,5.6=x ,2=s ,100=n .对于05.0=α,查标准正态分布表得645.105.0==u u α.将观测值代入检验算统计量得5.7100/285.6-=-=u ,显然,05.0645.15.7u u -=-<-=,故拒绝0H ,即初中生平均每周看电视的时间少于8小时,这位校长的看法是对的.11.已知某种电子元件的使用寿命X (单位:h)服从指数分布)(λE .抽查100个元件,得样本均值950=x h .能否认为参数001.0=λ?(05.0=α)解:X ~)(λE ,λ1)(=X E ,21)(λ=X D ,由中心极限定理知,当n 充分大时,近似地有n X n X U )1(/1/1-=-=λλλ~)1,0(N .由题可知001.00=λ,检验假设可设为0H :0λλ=,1H :0λλ≠.取检验统计量为n X n X U )1(/1/1000-=-=λλλ,当0H 为真时,近似地有U ~)1,0(N ,该检验法的拒绝域为}{2/αu u ≤.由题知,100=n ,950=x ,05.0=α,查标准正态分布表知96.1025.02/==u u α.将观测值代入检验统计量得5.0-=u ,显然,025.096.15.0u u =<=,故接受0H ,即可以认为参数001.0=λ.12.某地区主管工业的负责人收到一份报告,该报告中说他主管的工厂中执行环境保护条例的厂家不足60%,这位负责人认为应不低于60%,于是他在该地区众多的工厂中随机抽查了60个厂家,结果发现有33家执行了环境保护条例,那么由他本人的调查结果能否证明那份报告中的说法有问题?(05.0=α)解:设执行环境保护条例的厂家所占的比率为p ,则检验假设为0H :6.0≥p ,1H :6.0<p ,上述假设等价于0H :6.0=p ,1H :6.0<p .引入随机变量⎩⎨⎧=.,0,,1条例抽到的厂家为执行环保例抽到的厂家执行环保条X 则X ~),1(p B ,p X E =)(,)1()(p p X D -=,由中心极限定理,当0H 为真时,统计量60/)6.01(6.06.0/)1(000--=--=X n p p p X U 近似地服从)1,0(N .对于显著性水平05.0=α,查标准正态分布表得645.105.0==u u α,由此可知05.0}645.160/)6.01(6.06.0{≈-<--X P .以U 作为检验统计量,该检验法的拒绝域为}645.1{05.0-=-<u u .将55.06033==x 代入上述检验统计量,得791.060/)6.01(6.06.055.0/)1(000-=--=--=n p p p x u ,显然,05.0645.1791.0u u -=->-=,故接受0H ,即执行环保条例的厂家不低于60%,也即由他本人的调查结果证明那份报告中的说法有问题.13.从选取A 中抽取300名选民的选票,从选取B 中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所选候选人,试在显著性水平05.0=α下,检验两个选区之间对候选人的支持是否存在差异.解:这是检验两个比率是否相等的问题,检验假设为0H :21p p =,1H :21p p ≠.取检验统计量为⎪⎭⎫ ⎝⎛+--=m n p p p pU 11)ˆ1(ˆˆˆ21,其中)(1ˆ2121m n Y Y Y X X X mn p ++++++++= 是21p p p ==的点估计.当0H 为真时,近似地有U ~)1,0(N .由题可知300=n ,168=n μ,200=m ,96=m μ,又56.0300168ˆ1==p ,48.020096ˆ2==p ,528.0500264ˆ==++=m n p m n μμ.由此得统计量的观测值为755.11201472.0528.048.056.0=⨯⨯-=u ,由05.0)96.1(==>αU P ,得拒绝域为}96.1{>u ,因为96.1755.1<=u ,故接受0H ,即两个选区之间对候选人的支持无显著性差异.。
概率论与数理统计第8章假设检验习题及答案

62第8章 假设检验一、填空题1、 对正态总体的数学期望m 进行假设检验,如果在显著性水平0.05下,接受假设00:m m =H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为a ,则犯第一类错误的概率是a 。
3、设总体),(N ~X 2s m ,样本n 21X ,X ,X ,2s未知,则00:H m =m ,01:H m <m 的拒绝域为 )}1(/{0--<-n t nS X a m ,其中显著性水平为a 。
4、设n 21X ,X ,X 是来自正态总体),(N 2s m 的简单随机样本,其中2,sm 未知,记å==n1i i X n 1X ,则假设0:H 0=m 的t 检验使用统计量=T Qn n X )1(-.二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2s m N X05.016==a n 4252==S X(1)检验假设250:0=m H 250:1¹m H , 因为2s 未知,在0H 成立下,)15(~/250t nS X T -=拒绝域为)}15(|{|025.0tT >,查表得1315.2)5(025.0=¹t由样本值算得1315.22<=T ,故接受0H (2)检验假设9:20=s H9:201>s H因为m 未知,选统计量 222)1(s S n x -=在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x ,现算得966.24667.26916152>=´=x 拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25 件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=s 小时正态分布, 试在显著性水平0.05下确定这批产品是否合格. 解:设元件寿命),(~2s m N X ,2s 已知10002=s,05.0,950,25===a X n检验假设1000:0=m H1000:1<m H在2s 已知条件下,设统计量)1,0(~/1000N nX s m -=拒绝域为}{05.0mm<,查表得645.195.005.0-=-=m m而645.15.2205025/1001000950-<-=-=-=m拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 a , 检 验假 设 H 0 ; m = m 0, H 1 ; m ¹ m 0, 问当 m 0, m , a 一定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 b减 少 对 吗 ?并 说 明 理 由 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计(理工类)作业 班级: 学号: 姓名:
第八章 假设检验
1. 已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含碳量为4.484,如果方差没有变化,可否认为现在生产之铁水平均含碳量仍为4.55(取0.05a =)?
2. 有一批枪弹,出厂时测得枪弹射出枪口的初速度V 服从),950(2σN (单位:s m /),在储存较长时间后取出9发进行测试,得样本值:914、920、910、934、953、945、912、924、940. 假设储存后的枪弹射出枪口的初速度V 仍服从正态分布,可否认为储存后的枪弹射出枪口的初速度V 已经显著降低(取0.05α=)?
概率论与数理统计(理工类)作业集 周钢 编写
3. 某批导线的电阻)005.0,(~2μN R (单位:Ω),从中随机地抽取9根,测得其样本标准差Ω=008.0s ,
可否认为这批导线电阻的标准差仍为Ω005.0(取05.0=α)?
4.机器包装食盐,假设每袋盐的净重服从2
~(,)X N μσ正态分布,规定每袋标准重量为1μ=kg,方差220.02σ≤。
某天开工后,为检验其机器工作是否正常,从装好的食盐中随机抽取抽取9袋,测得净重(单位:kg )为:0.994,1.014,1.02,0.95,1.03,0.968,0.976,1.048,0.982算得上述样本相关数据为:均值为
0.998x =,标准差0.032s =,9
21
()0.008192i i x x =-=∑,
问:(1)在显著性水平0.05α=下,这天生产的食盐的平均净重是否和规定的标准有显著差异?
(2) 在显著性水平0.05α=下,这天生产的食盐的净重的方差是否符合规定的标准?。