北京工业大学《概率论与数理统计》课件 第8章 正态总体均值的假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
● 建立一个假设:H0: μ =10。并且要经过样 本来检验该假设是否成立(其实为可以接受)。
在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
如果μ =μ0,即原假设成立,则
就
不应太大;反之,如果
过大,就认为
H0不成立,而 H1成立。
在2已知情况下,根据定理6.3.1,知:
当 H0 成立时,
在2未知情况下,当原假设成立时,有 由此可推出 所以,对给定的显著水平 α, H0的拒绝域为
例8.2.2 某厂生产一种工业用绳,其质量 指标是绳子所承受的最大拉力。假定该指标
服从正态分布。该厂原来生产的绳子平均最
大拉力μ0=15千克。现在采用了一种新的原材
料,厂方称这种原材料提高了绳子的质量,
也就是说绳子所承受的平均最大拉力 μ 比15
千克大了。为了检验该厂的结论是否真实, 从其新产品中随机抽取50件,测得它们所承
检验的显著性水平,简称水平。
犯第二类错误的概率的计算超出了课程 的学习范围。因此,不作讨论。
例8.1.1(续) 分析该例的显著性水平。
H0: μ =10,
现在我们来分析:取上述 c 后,如果 H0 是正确的,却被我们拒绝了。这时,犯第一 类错误的概率是多少呢?
分析 因为当 H0: μ =10成立时,有
可见:用该方法进行检验时,犯第一类
错误的概率等于 显著性水平 。
§8.2 正态总体均值的假设检验
8.2.1 单正态总体N( , 2)均值的检验
1. 双边检验 假设 2已知,根据上节中的例8.1.1,当
原假设 H0: μ=μ0 成立时,有
所以,对给定的显著水平 α,H0的拒绝域为
以上检验法称作 U 检验法。 在应用上,2未知的情况是常见的。此
(1) 双边检验 H0: 1= 2 ↔ H1: 1≠2 .
当 12 和 22 已知时,根据定理7.5.1,有
进一步,当 H0: 1=2为真时,
于是,显著性水平为α 的H0的拒绝域为
当 12=22 =2,2未知时,据定理7.5.1,有
进一步,当 H0: 1=2 成立时,有
从而,显著性水平为α 的H0的拒绝域为
1.76, 1.41, 1.87, 1.49, 1.67, 1.81. 假定这两组观测值分别抽自方差相同的两个正
态总体,试在显著性水平 =0.10下,检验病人
血液中药物的浓度是否显著的不同?
解 问题就是从总体 N(1, 2)和N(2, 2)
中分别抽取样本X1, X2,…, X8 和Y1, Y2,…, Y6, 样本均值和样本方差分别为:
受的最大拉力的平均值为15.8千克,样本标
准差S=0.5千克。取显著性水平 =0.01。问从
这些样本看:能否接受厂方的结论,即新的
原材料确实提高了绳子的质量。
解 问题归结为检验如下假设
H0: μ =15 ↔ H1: μ >15 (2未知).
于是,
从而,拒绝原假设,即认为新的原材料确实 提高了绳子所能承受的最大拉力。
《概率论与数理统计》
第八章 正态总体均值的假设检验
北京工业大学 第二十讲
第八章 假设检验
统计推断的另一种形式是假设检验。
所谓假设检验,就是根据样本的信息检 验总体的分布参数或分布形式是否具有某些 特征。例如,对一个正态总体,检验其均值
是否为某一给定的 (已知) 常数0,或检验其标
准差是否小于等于某一给定的 (已知) 常数0; 以及检验总体的分布是否为正态分布,是非 为指数分布,等等。
2. 单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
上一段中,H0:μ=μ0‹–›H1: μ≠μ0 的对立 假设为 H1: μ≠μ0 , 称其为双边对立假设。
现在要处理的对立假设为 H1: μ >μ0, 称 为右边对立假设。
类似地,H0: μ=μ0 ‹–› H1: μ<μ0 中的对立 假设H1: μ<μ0,称其为左边对立假设。
§8.1 基本概念
参数检验 假设检验
非参数检验
在总体分布已知情形 下,检验未知参数的 某个假设是否接受。
研究总体分布未知情 形下的假设检验问题。
我们先通过一个例子,来引进假设检验 中的一些重要概念。
例8.1.1 某工厂生产10欧姆的电阻。根据 以往生产的电阻实际情况,可以认为: 电阻值
X服从正态分布N(, 0.12)。现在随机抽取10个
8.2.2 两个正态总体 N(1, 12) 和 N(2, 22)
均值的比较
在应用上,经常会遇到两个正态总体均 值的比较问题。
例如,比较甲、乙两厂生产的某种产品 的质量。将两厂生产的产品的质量指标分别
看成正态总体 N(1, 12) 和 N(2, 22)。比较它
们的产品质量指标的问题,就变为比较这两
个正态总体的均值 1和 2的问题。
故,接受原假设。即, 认为病人血液中药浓
度无显著差异。
(2) 单边检验 H0: 1≥2 ↔ H1: 1<2
与 (1) 的分析完全类似,可以得到: ● 在12和22已知情况下,H0的拒绝域为
● 在12与22未知,但二者相等情况下,H0的 拒绝域为
(3) 单边检验 H0: 1≤2 ↔ H1: 1>2
发生,就认为 H0 不真,即认为 H0不成立。
IV. 两类错误与显著性水平
当我们检验一个假设 H0 时,有可能犯以 下两类错误之一:H0 是正确的,但被我们拒 绝了,这就犯了“弃真”的错误,即抛弃了 正确假设;H0 是不正确的,但被我们接受了, 这就犯了“取伪”的错误,即采用了伪假设。
因为检验统计量总是随机的,所以,我 们总是以一定的概率犯以上两类错误。
通常用 α 和 β记犯第一、第二类错误的概 率,即
在检验问题中,犯“弃真”和“取伪” 两类错误都总是不可避免的,并且减少犯第 一类错误的概率,就会增大犯第二类错误的 概率;反之亦所然以。,犯两类错误的概率不能同 时得到控制。
在统计学中,通常控制犯第一类错误的
概概率。一般事先选定一个数 (0< <1),要 求犯第一类错误的概率不超过。称 为假设
为原假设H0 的拒绝域。
用以上检验准则处理问题, 所以,接受原假设 H0: μ =10。
III. 方法原理 因为,当原假设是 H0: μ =10 成立时,
所以,当 很小时,若 H0为真(正确),检验统
计量落入拒绝域是一小概率事件 (概率很小,
为 )。前面我们曾提到:“通常认为小概率
事件在一次试验中基本上不会发生”。 那么,如果小概率事件发生,即:
例8.2.3 假设有A、B两种药,试验者欲比 较服用2小时后它们在患者血液中的含量是否 一样。为此, 对药品A, 随机抽取8个病人服药, 服药2小时后, 测得8个病人血液中药物浓度 (用 适当的单位) 分别为:
1.23, 1.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76. 对药品B, 随机抽取6个病人服药, 服药2小时后, 测得血液中药的浓度分别为:
与 (1) 的分析完全类似,可以得到: ● 在12和22已知情况下,H0的拒绝域为
● 在12与22未知,但二者相等情况下,H0的 拒绝域为
小结
本讲首先介绍假设检验的基本概念;然 后讨论正态总体均值的各种假设检验问题, 给出了检验的拒绝域及相关例题。
作业:p173,单 边对立假设,它们的检验称为单边检验。
单边假设检验有实用意义。例如,工厂生
产的产品的某项质量指标服从均值为μ0的正态
分布;采用新技术或新配方后,产品的质量指
标应该随之上升,服从均值为 的正态分布。 我们的问题就是检验 H0: =μ0,即新技术或新 配方对提高产品质量无效果,还是H1: >μ0,
时,和前面不同的是:常用样本方差S2代替 未知的2 ,这时
所以,对给定的显著水平 α,有
假设检验 H0的拒绝域为 此检验法称作 t 检验法。
例8.2.1(续例8.1.1) 假设2未知,检验
解 n=10, =0.05, 0=10, t10-1( /2)=t9(0.025)=2.2622,
所以,接受原假设 H0: μ =10.
电阻,测得它们的电阻值为
9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10.0, 10.5, 10.1, 10.2.
问,从样本来看,我们能否认为该厂生产的电
阻的平均值 =10欧姆?
I. 如何建立检验模型
● 确定总体:记 X为该厂生产电阻的测值,则
X~N(, 0.12);
● 明确任务:通过样本推断(判断) “X的均值 μ 是否等于10欧姆”;
原假设的对立面是 “X的均值 μ ≠10”,称 为 “对立假设” 或 “备择假设”, 记成 “H1:
μ把≠原10假”。设和对立假设合写在一起,就是
II. 解决问题的思路
因样本均值是 μ 的一个很好的估计。所
以,当μ =10,即原假设 H0 成立时,
应比较小;如果该值过大, 想必 H0不成立。
于是,我们就用
在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
如果μ =μ0,即原假设成立,则
就
不应太大;反之,如果
过大,就认为
H0不成立,而 H1成立。
在2已知情况下,根据定理6.3.1,知:
当 H0 成立时,
在2未知情况下,当原假设成立时,有 由此可推出 所以,对给定的显著水平 α, H0的拒绝域为
例8.2.2 某厂生产一种工业用绳,其质量 指标是绳子所承受的最大拉力。假定该指标
服从正态分布。该厂原来生产的绳子平均最
大拉力μ0=15千克。现在采用了一种新的原材
料,厂方称这种原材料提高了绳子的质量,
也就是说绳子所承受的平均最大拉力 μ 比15
千克大了。为了检验该厂的结论是否真实, 从其新产品中随机抽取50件,测得它们所承
检验的显著性水平,简称水平。
犯第二类错误的概率的计算超出了课程 的学习范围。因此,不作讨论。
例8.1.1(续) 分析该例的显著性水平。
H0: μ =10,
现在我们来分析:取上述 c 后,如果 H0 是正确的,却被我们拒绝了。这时,犯第一 类错误的概率是多少呢?
分析 因为当 H0: μ =10成立时,有
可见:用该方法进行检验时,犯第一类
错误的概率等于 显著性水平 。
§8.2 正态总体均值的假设检验
8.2.1 单正态总体N( , 2)均值的检验
1. 双边检验 假设 2已知,根据上节中的例8.1.1,当
原假设 H0: μ=μ0 成立时,有
所以,对给定的显著水平 α,H0的拒绝域为
以上检验法称作 U 检验法。 在应用上,2未知的情况是常见的。此
(1) 双边检验 H0: 1= 2 ↔ H1: 1≠2 .
当 12 和 22 已知时,根据定理7.5.1,有
进一步,当 H0: 1=2为真时,
于是,显著性水平为α 的H0的拒绝域为
当 12=22 =2,2未知时,据定理7.5.1,有
进一步,当 H0: 1=2 成立时,有
从而,显著性水平为α 的H0的拒绝域为
1.76, 1.41, 1.87, 1.49, 1.67, 1.81. 假定这两组观测值分别抽自方差相同的两个正
态总体,试在显著性水平 =0.10下,检验病人
血液中药物的浓度是否显著的不同?
解 问题就是从总体 N(1, 2)和N(2, 2)
中分别抽取样本X1, X2,…, X8 和Y1, Y2,…, Y6, 样本均值和样本方差分别为:
受的最大拉力的平均值为15.8千克,样本标
准差S=0.5千克。取显著性水平 =0.01。问从
这些样本看:能否接受厂方的结论,即新的
原材料确实提高了绳子的质量。
解 问题归结为检验如下假设
H0: μ =15 ↔ H1: μ >15 (2未知).
于是,
从而,拒绝原假设,即认为新的原材料确实 提高了绳子所能承受的最大拉力。
《概率论与数理统计》
第八章 正态总体均值的假设检验
北京工业大学 第二十讲
第八章 假设检验
统计推断的另一种形式是假设检验。
所谓假设检验,就是根据样本的信息检 验总体的分布参数或分布形式是否具有某些 特征。例如,对一个正态总体,检验其均值
是否为某一给定的 (已知) 常数0,或检验其标
准差是否小于等于某一给定的 (已知) 常数0; 以及检验总体的分布是否为正态分布,是非 为指数分布,等等。
2. 单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
上一段中,H0:μ=μ0‹–›H1: μ≠μ0 的对立 假设为 H1: μ≠μ0 , 称其为双边对立假设。
现在要处理的对立假设为 H1: μ >μ0, 称 为右边对立假设。
类似地,H0: μ=μ0 ‹–› H1: μ<μ0 中的对立 假设H1: μ<μ0,称其为左边对立假设。
§8.1 基本概念
参数检验 假设检验
非参数检验
在总体分布已知情形 下,检验未知参数的 某个假设是否接受。
研究总体分布未知情 形下的假设检验问题。
我们先通过一个例子,来引进假设检验 中的一些重要概念。
例8.1.1 某工厂生产10欧姆的电阻。根据 以往生产的电阻实际情况,可以认为: 电阻值
X服从正态分布N(, 0.12)。现在随机抽取10个
8.2.2 两个正态总体 N(1, 12) 和 N(2, 22)
均值的比较
在应用上,经常会遇到两个正态总体均 值的比较问题。
例如,比较甲、乙两厂生产的某种产品 的质量。将两厂生产的产品的质量指标分别
看成正态总体 N(1, 12) 和 N(2, 22)。比较它
们的产品质量指标的问题,就变为比较这两
个正态总体的均值 1和 2的问题。
故,接受原假设。即, 认为病人血液中药浓
度无显著差异。
(2) 单边检验 H0: 1≥2 ↔ H1: 1<2
与 (1) 的分析完全类似,可以得到: ● 在12和22已知情况下,H0的拒绝域为
● 在12与22未知,但二者相等情况下,H0的 拒绝域为
(3) 单边检验 H0: 1≤2 ↔ H1: 1>2
发生,就认为 H0 不真,即认为 H0不成立。
IV. 两类错误与显著性水平
当我们检验一个假设 H0 时,有可能犯以 下两类错误之一:H0 是正确的,但被我们拒 绝了,这就犯了“弃真”的错误,即抛弃了 正确假设;H0 是不正确的,但被我们接受了, 这就犯了“取伪”的错误,即采用了伪假设。
因为检验统计量总是随机的,所以,我 们总是以一定的概率犯以上两类错误。
通常用 α 和 β记犯第一、第二类错误的概 率,即
在检验问题中,犯“弃真”和“取伪” 两类错误都总是不可避免的,并且减少犯第 一类错误的概率,就会增大犯第二类错误的 概率;反之亦所然以。,犯两类错误的概率不能同 时得到控制。
在统计学中,通常控制犯第一类错误的
概概率。一般事先选定一个数 (0< <1),要 求犯第一类错误的概率不超过。称 为假设
为原假设H0 的拒绝域。
用以上检验准则处理问题, 所以,接受原假设 H0: μ =10。
III. 方法原理 因为,当原假设是 H0: μ =10 成立时,
所以,当 很小时,若 H0为真(正确),检验统
计量落入拒绝域是一小概率事件 (概率很小,
为 )。前面我们曾提到:“通常认为小概率
事件在一次试验中基本上不会发生”。 那么,如果小概率事件发生,即:
例8.2.3 假设有A、B两种药,试验者欲比 较服用2小时后它们在患者血液中的含量是否 一样。为此, 对药品A, 随机抽取8个病人服药, 服药2小时后, 测得8个病人血液中药物浓度 (用 适当的单位) 分别为:
1.23, 1.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76. 对药品B, 随机抽取6个病人服药, 服药2小时后, 测得血液中药的浓度分别为:
与 (1) 的分析完全类似,可以得到: ● 在12和22已知情况下,H0的拒绝域为
● 在12与22未知,但二者相等情况下,H0的 拒绝域为
小结
本讲首先介绍假设检验的基本概念;然 后讨论正态总体均值的各种假设检验问题, 给出了检验的拒绝域及相关例题。
作业:p173,单 边对立假设,它们的检验称为单边检验。
单边假设检验有实用意义。例如,工厂生
产的产品的某项质量指标服从均值为μ0的正态
分布;采用新技术或新配方后,产品的质量指
标应该随之上升,服从均值为 的正态分布。 我们的问题就是检验 H0: =μ0,即新技术或新 配方对提高产品质量无效果,还是H1: >μ0,
时,和前面不同的是:常用样本方差S2代替 未知的2 ,这时
所以,对给定的显著水平 α,有
假设检验 H0的拒绝域为 此检验法称作 t 检验法。
例8.2.1(续例8.1.1) 假设2未知,检验
解 n=10, =0.05, 0=10, t10-1( /2)=t9(0.025)=2.2622,
所以,接受原假设 H0: μ =10.
电阻,测得它们的电阻值为
9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10.0, 10.5, 10.1, 10.2.
问,从样本来看,我们能否认为该厂生产的电
阻的平均值 =10欧姆?
I. 如何建立检验模型
● 确定总体:记 X为该厂生产电阻的测值,则
X~N(, 0.12);
● 明确任务:通过样本推断(判断) “X的均值 μ 是否等于10欧姆”;
原假设的对立面是 “X的均值 μ ≠10”,称 为 “对立假设” 或 “备择假设”, 记成 “H1:
μ把≠原10假”。设和对立假设合写在一起,就是
II. 解决问题的思路
因样本均值是 μ 的一个很好的估计。所
以,当μ =10,即原假设 H0 成立时,
应比较小;如果该值过大, 想必 H0不成立。
于是,我们就用