假设检验的基本思想与概念
假设检验的基本概念
![假设检验的基本概念](https://img.taocdn.com/s3/m/3bbdbd4bcd7931b765ce0508763231126fdb774f.png)
第二章
I型错误和II型错误
假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。详见表8-1。
01
P122 例8-3
02
两均数之差的标准误的估计值
03
01
P122 例8-3
02
两均数之差的标准误的估计值
由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2, 得P<0.01,按α=0.05水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间: 天,给出了两总体均数差别的数量大小。
1- :检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。
a 与 b 间的关系
a
b
减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b
B
D
A
C
减少I型错误的主要方法:假设检验时设定 值。
提高检验效能的最有效方法:增加样本量。
若 ,不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。
第三节 大样本均数的假设检验
单样本数据,每组例数等于或大于60例;两样本数据,两组例数的合计等于或大于60例,而且基本均等。
两总体方差已知。
样本数据不要求一定服从正态分布总体。
另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。
4 假设检验和t检验
![4 假设检验和t检验](https://img.taocdn.com/s3/m/31e0f4aa3968011ca200916f.png)
t
2.671
17905113912 /11101971 9462 / 9 ( 1 1)
11 9 2
11 9
=n1+n22=11+9-2=18
(3)确定P值,作出推断结论
以=18,查 t 界值表得 0.01<P<0.02。按=0.05 水
准,拒绝 H0,接受 H1,差异有统计学意义。可以认为 两种饲料对小鼠的体重影响不同。
(2)计算检验统计量
本例n=12,d=53,d2=555,
d d 53 4.42 n 12
sd
d2 (
d)2 / n
555 (53)2 /12 5.40
n 1
12 1
t d 4.42 2.83 sd / n 5.40 / 12
12 1 11
(3)确定P值,作出推断结论
(1)建立检验假设,确定检验水准
H0:1=2 即两组小鼠的体重总体均数相同 H1:1 2 即两组小鼠的体重总体均数不相同 =0.05
(2)计算检验统计量
126.45 105.11
t
2.671
(111)17.762 (9 1)17.802 ( 1 1)
11 9 2
11 9
126.45 105.11
型)选择相应的检验统计量。 如 t 检验、z检验、 F检验和 2 检验等。
本例采用t检验方法 t X X X 0 , n 1
SX S n S n
本例t值为1.54
3. 确定P值,做出推断结论
是指查根表据得所到计检算验的用检的验临统界计值量,确然定后H将0成算立得的可 能性的大统小计,量即与确拒定绝在域检的验临假界设值条作件比下较由,抽确样定误P差引 起差值别。的如概对率双。侧 t 检验 | t | ,则 tα/2(ν) P α ,按检
假设检验的基本思想
![假设检验的基本思想](https://img.taocdn.com/s3/m/6626bba359f5f61fb7360b4c2e3f5727a4e92461.png)
(1)假设H0:= 0=4.55,H1:≠4.55;
(2)选择检验用统计量 ;
(3)对于给定小正数,如=0.05,查标准正态分表得到临界值z/2 =z0.025 =1.96;
因为| z|=3.9>1.96,所以拒绝H0,接受H1,即认为新工艺改变了铁水的平均含碳量。
以上两例都是科技领域中常见的假设检验问题。 我们把问题中涉及到的假设称为原假设或称待检假设,一般用H0表示。而把与原假设对立的断言称为备择假设,记为H1。
如例1,若原假设为H0:= 0=4.55,则备择假设为H1:≠4.55。 若例2的原假设为H0:X服从正态分布,则备择假设为H1:X不服从正态分布。
例如,在100件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。 因为此事件发生的概率=0.01很小,因此,从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有理由怀疑这“100件产品中只有一件次品”的真实性。 那么取值多少才算是小概率呢?这就要视实际问题的需要而定,一般取0.1,0.05,0.01等。
一、假设检验问题的提出
统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望μ0的假设等。
这里,先结合例子来说明假设检验的基本思
二、假设检验的基本思想
假设检验的一般提法是:在给定备择假设H1下,利用样本对原假设H0作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则,就接受原假设H0。 换句话说,假设检验就是要在原假设H0和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓小概率原理,即 概率很小的事件在一次试验中是几乎不可能发生
茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】
![茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】](https://img.taocdn.com/s3/m/571bb0b7f8c75fbfc77db264.png)
,xn;
)
0
2.分类数据的χ2 拟合优度检验
定理:在实际观测数与期望观测数相差不大的假定下,在 H0 成立时,对统计量
2
r i 1
(ni
npi0 )2 npi0
有 2
L 2 (r 1) 。
根据定理,采取显著性水平为α 的显著性检验:检验统计量为:
2
r i 1
(ni
npi0 )2 npi0
,拒绝域为W
{ 2
2 1
(r
1)} 。
五、正态性检验 1.W 检验 W 统计量
3 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
W
n
(ai
i 1
a
)( x ( i )
x
)
2
n
n
(ai a )2 (x(i) x )2
i 1
i 1
拒绝域{W≤Wa}。
2.比率 p 的检验(见表 7-1-2)
表 7-1-2 比率 p 的检验
2 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
四、似然比检验与分布拟合检验
1.似然比检验的思想
假设的似然比
sup p(x1,K ,xn; )
( x1,K
,xn
)
sup
p( x1,K
+(n)}。
7.2 课后习题详解
习题 7.1
1.设 x1,…,xn 是来自 N(μ,1)的样本,考虑如下假设检验问题
4 / 117
圣才电子书 十万种考研考证电子书、题库视频学习平台
H0:μ=2 vs H1:μ=3
若检验由拒绝域为 W {x 2.6}确定。
假设检验的基本原理
![假设检验的基本原理](https://img.taocdn.com/s3/m/a5b85e5f172ded630a1cb631.png)
假设检验的基本原理
一、假设检验的基本原理
参数估计是当总体的参数不明确时, 根据数据找出参数的估计,以确定相应的 总体。而当对参数的信息有所了解,但存 在某种怀疑或猜测而需要证实时,则应用 假设检验的方法来处理。
一、假设检验的基本原理
一、 假设检验的概念
统计假设(简称假设)的实 质是施加于一个或多个总体的概 率分布或其参数的假设。所做的 假设可以是正确的,也可以是不 正确的。
一、假设检验的基本原理
反证法是假设检验所采用的逻辑推理方 式,为了检验某个假设是否成立,先假设它 是正确的,然后根据抽样理论和样本信息计 算样本特征值。如果样本特征值在小概率范 围内,就拒绝假设;如果样本特征值在大概 率范围内,就接受假设。
一、假设检验的基本原理
四、 假设检验的两类错误与功效
1. 假设检验的两类错误
一、假设检验的基本原理
假设检验过程中可能发生以下两类错误: (1)第Ⅰ类错误(type Ⅰ error)。当原假设为 真时拒绝原假设所犯的错误称为第Ⅰ类错误,又称弃 真错误。犯第Ⅰ类错误的概率记为α。 (2)第Ⅱ类错误(type Ⅱ error)。当原假设为假 时没有拒绝原假设所犯的错误称为第Ⅱ类错误,又称 取伪错误。犯第Ⅱ类错误的概率记为β。
一、假设检验的基本原理
二、 原假设和备择假设
在假设检验中,首先需要提出两种假设,即原假设和备择假 设。在统计学中,把统计假设称为原假设或零假设(null hypothesis),记为H0。原假设通常是研究者想收集证据予以反对 的假设。与原假设对立的是备择假设(alternative hypothesis) ,记为H1。备择假设通常是研究者想收集证据予以支持的假设, 也称研究假设。备择假设通常用于支持研究者的看法,比如,研 究者正在做一项研究,并想使用假设检验来支持自己的看法,就 应该把自己认为正确的看法作为备择假设。
假设检验的基本概念
![假设检验的基本概念](https://img.taocdn.com/s3/m/1467a482cc22bcd126ff0c9f.png)
一、假设检验的基本原理 二、假设检验的基本概念 三、假设检验的一般步骤
回
停 下
一、假设检验的基本原理
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或
观测ห้องสมุดไป่ตู้得到统计样本,构造统计方法进行判断,以
决定是否接受这个假设.
假设检验就是这样一种统计推断方法,
根据样本提供的信息对所提出的假设作出 判断: 是接受, 还是拒绝.
1. 基本原理 小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
分析 设该厂生产的猪肉罐头平均重量 μ = 500 g
则问题变为检验假设H0: μ = 500是否成立?
由以往经验可知, 标准差 σ = 2 ,
则X ~ N ( μ,22 ), 其中μ未知.
问题: 根据样本值判断 μ = 500 解 1° 提出两个对立假设 还是 μ ≠ 500?
H 0 : μ μ0 500 , H1 : μ μ0 ;
/ n
u / 2 , 则称x与0差异是显著的 , 则
我们拒绝 H0;
反之,如果 | u | | x 0 |
/ n
u / 2 , 则称 x与0差异是不
显著的,则我们接受 H0 ;
上述 x与0有无显著差异的判断是 在显著性水平
之下做出的 .
2. 检验统计量 用于检验假设的统计量,称为检验统计量. 如:对于例2, X μ0 ______ 统计量U 检验统计量 σ/ n 3. 原假设与备择假设 假设检验问题通常叙述为: “在显著性水平 下,
概率论与数理统计第八章假设检验
![概率论与数理统计第八章假设检验](https://img.taocdn.com/s3/m/16a7d36755270722182ef716.png)
对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
假设检验。《统计学》
![假设检验。《统计学》](https://img.taocdn.com/s3/m/7c8ddcb71ed9ad51f11df288.png)
在规定了检验的显著性水平α后,根据容量为n 的样本,按照统计量的理论概率分布规律,可 以确定据以判断拒绝和接受原假设的检验统计 量的临界值。
临界值将统计量的所有可能取值区间分为两个 互不相交的部分,即原假设的拒绝域和接受域。
对于正态总体,总体均值的假设检验可有如下 图示:
第二,假设检验采用的反证法带有概率性质。所谓假 设的不合理不是绝对的,而是基于实践中广泛采用的 小概率事件几乎不可能发生的原则。至于事件的概率 小到什么程度才算是小概率事件,并没有统一的界定 标准,而是必须根据具体问题而定。如果一旦判断失 误,错误地拒绝原假设会造成巨大损失,那么拒绝原 假设的概率就应定的小一些;如果一旦判断失误,错 误地接受原假设会造成巨大损失,那么拒绝原假设的 概率就应定的大一些。
假 设 检验
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
参数估计和假设检验
参数估计和假设检验是统计推断的两个 组成部分,都是利用样本对总体进行某 种推断,但推断的角度不同。参数估计 讨论的是用样本统计量估计总体参数的 方法。假设检验讨论的是用样本信息去 检验对总体参数的某种假设是否成立的 程序和方法。
>X0),那么对于前者当X<X0时,对于后者当X>X0 时,可以否定原假设。这种假设检验称为单侧检验。可以分 为左侧检验和右侧检验。
双侧检验与单侧检验 (假设的形式)
假设
H0 H1
研究的问题(总体均值检验) 双侧检验 左侧检验 右侧检验 X= X0 X X 0 X X 0 X ≠ X 0 X < X 0 X > X 0
a和的关系就像 翘翘板,a小就 大, a大就小
假设检验的基本思想
![假设检验的基本思想](https://img.taocdn.com/s3/m/aefa083e10661ed9ad51f3d8.png)
㈡ 检验的逻辑过程 例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 要点: 某考试 (所有) 成绩是总体, 任意抽取的36人的成绩为 样本. 欲通过样本信息推断总体分布中的 m 是否为70分? 检验依据: 小概率事件在一次试验中一般不发生,若发生了,则认为
② 选择统计量
③ 确定拒绝域
选统计量 U
X m
/
~ N ( 0 ,1) .
n
由 P { | U | u a } a 0 .0 5, 查 表 得 拒 绝 域 为
2
U< -1.96 或 U>1.96 . ④ 计算统计量的值 统 计 量 的 值 为
U x m
完整解答…
/
75 70 20 / 6 1 .5 . n
《概率统计》 返回 下页 结束
例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 检验过程(形而下): ① H0: m =m0=70, 即总体X~N(70 , 202), 从而知
一、假设检验的基本思想 例1. 设某厂生产一种灯管, 其寿命 X~N (m , 200 2), 原来灯管
的平均寿命为m = 1500小时. 现在采用新工艺后, 在所生产的灯管 中抽取25只, 测得平均寿命为1675小时. 问采用新工艺后, 灯管寿
命是否有显著提高 ?
问题表现为:判断 m >1500 ? 例2. 某种农作物的农药残留量 X 是否服从正态分布 ?
假设检验的基本思想和有关概念的教学设计
![假设检验的基本思想和有关概念的教学设计](https://img.taocdn.com/s3/m/e4bdbb1711661ed9ad51f01dc281e53a580251e4.png)
㊀㊀㊀㊀㊀假设检验的基本思想和有关概念的教学设计假设检验的基本思想和有关概念的教学设计Һ魏满满1㊀李石虎2∗㊀周㊀勤2㊀(1.江苏师范大学科文学院,江苏㊀徐州㊀221116;2.江苏师范大学数学与统计学院,江苏㊀徐州㊀221116)㊀㊀ʌ摘要ɔ本文主要探究了假设检验的基本思想和有关概念的教学设计.首先,通过 女士品茶 的故事引入,提炼出假设检验的基本思想;其次,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,并介绍了假设检验的两类错误和p值的概念;最后,融入思政的元素,丰富了课堂教学内容.ʌ关键词ɔ假设检验;教学设计ʌ基金项目ɔ江苏师范大学课程思政专项研究(KCSZY17);江苏师范大学数学与统计学院思政示范课程(XYKCSZ01)一㊁引㊀言概率论与数理统计课程是各个高校理工科的基础必修课,它在理工科及经管类各专业被广泛应用.假设检验是概率论与数理统计中的重要知识点,是统计推断的主要方法之一,在概率统计的理论研究与实际应用中都占有极其重要的地位.2019年3月18日,在学校思想政治理论课教师座谈会上,习近平总书记明确提出[1]:要坚持灌输性和启发性相统一,注重启发性教育,引导学生发现问题㊁分析问题㊁思考问题,在不断启发中让学生水到渠成得出结论.近年来,各大高校都十分重视思政建设,通过教师培训㊁专家讲座㊁示范课程等多种方式来加深教师对课程思政的理解.教师是高校的 第一主角 ,作为专业课教师,也有责任和义务认真挖掘所授课程的 思政元素 .例如,2021年,李晨和陈丽萍[2]在研究概率统计的思政元素时,以概率学者的文化素养和科学治学精神为切入点,通过多个实际案例剖析全概率公式的应用,潜移默化地引入诸多思政元素来激发学生的学习兴趣.受此启发,本文着重从概率论与数理统计课程中 假设检验 这一角度思考,通过教学设计来探索课程思政理念进概率统计课堂的实践方法,目的就是同大家交流如何上好 假设检验 这一知识点的教学课.首先,我们通过 女士品茶 这一广为流传且富有趣味性的故事引入,启发学生思考,从中提炼出假设检验的基本思想.其次,我们通过分析项链含金量这一实际案例总结出假设检验的基本步骤.接着,我们介绍假设检验的两类错误和p值的概念,并介绍假设检验的一些应用.最后,我们融入思政的元素,以我国著名数学家严加安院士的‘悟道诗“为结尾,阐述了概率统计的基本思想,同时激励学生向老一辈科学家学习,树立正确的价值观,从而丰富了课堂教学内容.二㊁教学过程(一)问题引入首先,我们从一个经典故事出发,来体会假设检验的基本思想.例1[3]㊀(女士品茶试验)故事发生在英国剑桥大学,那是20世纪20年代,一群大学精英们正在品茶.该茶是由牛奶和茶水混合而成的.在品茶过程中,一位女士宣称:先加入牛奶还是先加入茶,不同的顺序会使茶的口感不同.周围人都认为这位女士简直是在胡言乱语,这是不可能的啊!然而在场的统计学家Fisher却对这个话题很感兴趣,他请人端来10杯调制好的茶让该女士品尝,其中有的是先加的牛奶,有的是先加的茶.结果,这位女士正确地鉴别出每一杯茶的制作顺序.该如何判断该女士是否有鉴别能力呢?Fisher的想法:假设该女士没有鉴别能力,这个时候她只能靠猜,从而她猜对的概率为12.因此,她能同时判断出10杯茶的概率为2-10<0.001,这个概率非常非常小,仅仅做一次试验是几乎不会发生的,可是,它却发生了!这表明原假设不恰当,应予以拒绝,认为该女士有鉴别能力!假设检验的基本思想:小概率反证法思想.先提出假设,然后设计试验,在原假设成立的条件下计算概率,依据小概率原理来判断是否拒绝原假设.那么多大的概率属于小概率呢?对于不同的问题,会有不同的标准,在统计学中,这个小概率称为显著性水平,常取0.05或0.01.接下来,我们就通过生活中的一个实际案例来探索一下假设检验的奥秘.(二)实例分析在生活中,经常会遇到一组数据,我们来看下面的例子.例2[4]㊀质检部门接到投诉后,对某金店进行调查,从标有18K的一批项链中抽取20条,测得其含金量如下:表1㊀某金店项链含金量数据单位:K17.618.117.918.318.017.417.518.617.317.817.317.818.117.417.618.017.218.318.317.5∗通信作者:李石虎,男,讲师,博士,就职于江苏师范大学,研究方向为概率论与数理统计.联系方式:江苏省徐州市江苏师范大学泉山校区数学与统计学院;电话邮编:221116;E-mail:shihuli@jsnu.edu.cn.㊀㊀㊀㊀㊀㊀问:如何判断这批项链有没有达到标准呢?(显著性水平α=0.05)分析:观察表1中的数据,我们可以发现:有的含金量大于18K,有的含金量小于18K,还有的恰好等于18K.那么我们能否直接说和标准值18K有显著差别呢?根据所学的统计学思想方法,我们已经了解到答案是否定的,因为这里看到的只是样本数据,我们无法直接做出判断.那么应该如何判断呢?我们的思路如下:首先,计算出这20条项链含金量的平均值为17.8,它与标准值18存在0.2的差值.这0.2的差值是由抽样引起的误差,还是有本质的差别?我们利用上述思想来检验一下.令ξ表示这批项链的含金量,由中心极限定理可知ξ ㊃N(μ,σ2),我们要检验均值是否为μ=18,具体步骤如下:1.建立假设.原假设H0:μ=18,表示这批项链符合标准;与之对立的备择假设H1:μʂ18,表示这批项链不符合标准.2.在H0成立时,由Fisher定理可知统计量T= x-μSnnt(n-1)=t(19).3.由T分布图像(如图1)可以看出:T的取值集中在零点附近.这表明:|T|越大,对应的概率就越小.从而存在临界值C,使得|T|大于或等于C是一个小概率事件,则C要满足P(|T|ȡC|H0成立)=α,再由T分布图像的对称性可知C=t0.975(19)ʈ2.093.图1㊀T分布图像从而,当|T|ȡ2.093时,非常小的概率事件在此就发生了,只能拒绝原假设H0.我们将W={(ξ1,ξ2, ,ξn)||T|ȡ2.093}这一集合称为拒绝域,如果样本的观测值落到W中,则原假设应被拒绝.4.代入样本均值和样本标准差进行计算,得到所观测的样本统计量t的值:|t|=|17.8-18|0.4039320ʈ2.214>2.093,其落到拒绝域W中,因此原假设被拒绝,故这批项链没有达到标准.为了更直观地理解拒绝域的含义,同学们可以参考T分布图像.小结㊀本案例利用假设检验思想得出了该金店项链的含金量不符合标准的结论,启发我们对待任何事情都不要抱有侥幸心理,不要弄虚作假,要诚信做人做事,方能赢得大家的信任.项链含金量不达标可能只是使消费者金钱方面的利益受损.试想一下:如果是某大型婴儿奶粉企业检测出质量不达标的产品呢?再或者是婴儿霜经检测含有毒物质呢?抑或是我们服用的某种药物检测出有危害健康的成分呢?这些案例都不是捕风捉影,均上过各大网站热搜,引起了消费者的恐慌.利用假设检验这个工具,有助于我们全面地认识这类事件,既可以让我们避免无谓的损失,又可以帮助我们找到有利的取舍依据.(三)假设检验的基本步骤通过对上述案例的分析,我们可以归纳出求解假设检验的基本步骤:第一步:从要研究的实际问题引入,先提出一个假设,一般称之为原假设,记为H0,与其对立的假设称为备择假设,记为H1.例如,在上述案例中,原假设为 这批项链符合标准 ,备择假设为 这批项链不符合标准 .第二步:依据所研究总体服从的分布,我们来构造合适的检验统计量,并通过所学知识来确定统计量服从的分布.第三步:接下来,我们需要确定检验的拒绝域W使得P((ξ1,ξ2, ,ξn)ɪW|H0成立)ɤα.第四步:根据样本数值计算统计量所对应的观测值.如果计算所得观测值落进了W中,则说明原假设不当,应予以拒绝,否则原假设不可以被拒绝.(四)假设检验的两类错误在 女士品茶 的例子中,如果该女士本来就没有鉴别能力,但是她运气好,每次都猜对了,这时候我们的推断就出错了.事实上,在假设检验问题中,我们由样本提供的信息来推断总体信息,由于样本只包含总体的一部分信息,这就不可能保证从来不会犯错误.假设检验可能犯的错误有如下两类:(Ⅰ)是否在 拒绝假设H0 时用了 小概率原理 .注意小概率事件并非不可能事件,如果原假设本为真,但由于样本值落进了拒绝区域内而得出 拒绝 的结论,这里犯的错误为弃真错误,通常称为第一类错误,记为α,即P(拒绝H0|H0为真)=α.(Ⅱ)反之,如果原假设H0本来是不成立的,却由于样本值未落进拒绝区域而得出 不能拒绝 的结论.这里的错误是纳伪错误,一般称为第二类错误,记作β,即P(接受H0|H0不真)=β.根据检验法则知:当H0成立时,拒绝H0的概率小于或等于显著性水平α,但是显著性水平α取得越小越好,因为㊀㊀㊀㊀㊀此时拒绝域也会相应地减小,从而导致犯第二类错误的概率增大.这是一个矛盾的双方,类似于区间估计时的做法,我们需要先固定显著性水平α,再选择合理的检验统计量来适当地减小β的值.下面我们再结合一个实际例子来理解两类错误:在新冠肺炎疫情发生初期,新闻报道中时常会出现 假阳 的检测结果.我们可以从假设检验的两类错误的角度来理解:事实上,任何检验方法都会存在犯错误的可能性,理想的试剂应是 假阴 和 假阳 出现的概率都越小越好,但当样本量有限㊁检测技术没有明显优化提升时,一类错误概率的减少必会导致另一类错误概率的增加,因此处理原则是:人为限定犯第一类错误的概率α,为降低犯第二类错误的概率,我们可以增大样本容量.所以,从统计学的观点看,新闻报道中的 假阴 假阳 患者出现并不奇怪.启发:小概率事件虽然在一次试验中不易发生,但绝非不可能事件,重复次数多了,发生的可能性也就增大了.这说明做任何事情都不要存在投机取巧的心理,俗话说 常在河边走,哪有不湿鞋 勿以恶小而为之,勿以善小而不为 .反之,再困难的事情,只要我们持之以恒,总是可以成功的,正所谓 锲而不舍,金石为开 !(五)假设检验的p值可以看出,显著性水平α变小,对应的拒绝域也会变小;当显著性水平α取得足够小时,使得样本值不落在相应的拒绝域中,从而在此显著性水平α下不能拒绝假设H0.当显著性水平α由上述足够小的值不断增大时,对应的拒绝域也会变大,当显著性水平α大到一定程度时,便可以使样本值落入相应的拒绝域中,从而在此显著性水平α下可以拒绝假设H0.对于一个确定的样本值,存在一个实数p(0<p<1),当显著性水平α=p时可以拒绝H0,而当α<p时原假设H0不可以被拒绝.可见,p是使依据给定样本数值做出 拒绝H0 的最小的那个显著性水平,我们称之为检验的p值.在例2中,我们也可以通过统计软件计算t统计量的值和p值:表2㊀某金店项链含金量检验结果检验值=18tdfp值均值差值项链含金量-2.214190.039-0.20000给定显著性水平α为0.05,由表2可知p值0.039<0.05,原假设应被拒绝,认为项链含金量与18K之间有显著的统计差异,从而得出 项链不符合标准 的结论.(六)课堂小结与思政本节课我们主要通过 女士品茶 的案例引入假设检验的基本思想,通过分析项链含金量这一实际案例总结出假设检验的基本步骤,也给出了假设检验的两类错误和p值的含义,这为接下来进一步学习不同类型的㊁具体的假设检验打下了必要的基础.假设检验不仅是一种重要的统计方法,更是一种思维方式,告诉我们用数据来说话,理性地看待问题.正因为如此,假设检验在我们的现实生活中有着十分重要的应用.比如,专家利用假设检验,结合临床数据分析不同采样点㊁人群㊁年龄的新冠病毒核酸检测的结果,给有关部门的决策提供参考.假设检验的理论方法不仅被广泛应用于医学检验㊁生物制药等诸多领域,在我们的生产生活,特别是工业产品的质量判断中也有着十分广泛的应用[5],因为在工厂的实际生产过程中,产品的尺寸总是左右浮动的,存在一定的误差,那么如何判断这些误差是否在允许的范围内?这就要用到假设检验的思想方法.不仅如此,假设检验的理论还可应用于文学研究.例如,东南大学韦博成教授在2009年[6]利用假设检验的理论方法分析了‘红楼梦“前80回与后40回的某些文风差异,得到的结论是 这两部分内容在写作风格方面存在明显的差异 ,给关于‘红楼梦“作者的论断提供了一个强有力的证据.在现实生活中,数据是无处不在的,学习假设检验的思想方法有助于我们正确地挖掘数据背后的规律,做出更客观的判断.如今,我们身处一个大数据时代,通过学习假设检验,更重要的是培养透过现象看本质这一统计思维.这里,调查得来的数据是现象,规律是从数据中探索出来的本质属性.我们需要借助数学模型,并结合统计方法来寻找这其中的规律和随机性,在潜移默化中培养统计思维.正如我国著名的数学家严加安院士在‘悟道诗“中所题:随机非随意,概率破玄机;无序隐有序,统计解迷离.注:课后同学们若想进一步了解统计学的发展历程,可以读一读‘20世纪统计怎样变革了科学:女士品茶“[7]这一科普著作.ʌ参考文献ɔ[1]习近平主持召开学校思想政治理论课教师座谈会[N].新华社,2019-03-18,20:57.[2]李晨,陈丽萍.概率论与数理统计课程教学中思政元素的挖掘与实践[J].大学教育,2021(9):104-106.[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程:第3版[M].北京:高等教育出版社,2019.[4]朱元泽,李贤彬.概率论与数理统计[M].上海:上海交通大学出版社,2015.[5]乔静.假设检验在工业产品质量判断中的应用[J].机电信息,2020(27):142-143.[6]韦博成.‘红楼梦“前80回与后40回某些文风差异的统计分析(两个独立二项总体等价性检验的一个应用)[J].应用概率统计,2009(4):441-448.[7]萨尔斯伯格.20世纪统计怎样变革了科学:女士品茶[M].北京:中国统计出版社,2004.。
假设检验
![假设检验](https://img.taocdn.com/s3/m/f0ce6d8071fe910ef12df8ac.png)
假设检验这里将涉及到统计学分析最为主要的理论前提:假设检验。
假设检验思想是构建统计理论,分析统计数据的决策支持的基石。
这里将首先介绍假设检验的相关思想、理论基础、分析步骤等,然后分别叙述几个比较重要的分布类型检验——正态分布检验、二项分布检验以及游程检验,并借此使同学们更加熟悉假设检验基本思想的具体应用。
一、假设检验的概念与原理1、假设检验的思维逻辑为了直观地介绍假设检验及其原理,这里不妨以实际生活为背景虚构一个例子:某商家宣称他的一大批鸡蛋“坏(变质)蛋率为1%”。
为了对这批鸡蛋的质量(即“坏蛋率为1%”还是“坏蛋率高于1%”)做出判断,顾客与商家约定,从中随机抽取5个作检查。
结果为4个“好蛋”,1个“坏蛋”。
根据这一检查结果,几乎任何一位顾客都会对“这批鸡蛋坏蛋率为1%”的广告词发生怀疑。
在“坏蛋率为1%”的前提下,5个鸡蛋样品中出现一个“坏蛋”的机会是很小的(应用二项分布的原理可以计算出,在这种前提下5个鸡蛋中出现1个或更多变质蛋的概率为0.049)。
发生机会理应很小的事件竟然在一次抽样中出现了?! 人们不禁怀疑前提条件(如“坏蛋率为1%”)的真实性。
这一思维逻辑上升到统计理论便是“小概率事件在一次随机试验中不(大)可能发生”的推断原理。
当然这样推断也可能出错, 因为在“坏蛋率为1%”的前提下, 毕竟还有4.9%的可能真的出现5个鸡蛋有1个“坏蛋”, 甚至更多坏蛋的情形。
本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。
需要通过假设检验来处理的问题一般具有两个特点:一是需要从全局的范围,即从总体上对问题作出判断;二是不可能或者不允许对研究总体的每一个个体均做观察。
例如,某工厂生产了一批炮弹,需要检测它们的质量是否合格;某药厂生产了一批用安瓿瓶封装的注射药物,需要检测它们的质量是否合格;某种治疗高血压的新药的疗效是否优于常规药物等等。
假设检验的基本思想
![假设检验的基本思想](https://img.taocdn.com/s3/m/63e0010ba22d7375a417866fb84ae45c3b35c2ae.png)
例8.2 某预制品厂生产的混凝土制件,由于原料和生产过程的种种
随机因素,各制件的抗压强度一般是不完全相同的,为了研究混 凝土制件抗压强度的分布,随机抽样试验了200件混凝土制件的抗 压强度,以分组的形式给出如下数据:
问:能否认为这种混凝土制件的抗压强度服从正态分布? 与上例相似,先建立假设:假设混凝土制件的抗压强度服从正 态分布,然后通过抽取样本的信息来推断这种假设的正确性。这 种类型的假设检验一般称为非参数假设检验。
因为X ~ N ( μ , σ2),当 H0 : μ = μ0 = 355为真时,X ~ N ( μ , σ2),
于是
1 n
X = n i1 X i
N
(
0
,
2
n
)
Z X 0 X 0 N (0,1) , 2 n n
给定一个小概率 α ,存在一个分位数 z 2 ,
使得
P{| Z | z 2} .
例8.1 机器罐装的牛奶每瓶标明为355毫升,设 X 为实际容量,由过
去的经验知道,在正常生产情况下,X ~ N ( μ , σ2)。根据长期的经 验知其标准差 σ =2毫升。为检验罐装生产线的生产是否正常,某 日开工后抽查了12瓶,其容量为:
350,353,354,356,351,352, 354,355,357,353,354,355
若取 α =0. 05,则 P{| Z | 1.96} 0.05 ( 查附表2标准正态分布
表可得 z 0.025=1. 96 ) 将样本观测值代入 Z 得
Z X 0 353.67 355 =2.3>1.96 .
n
2 12
因为 α = 0.05 很小,根据实际推断原理,即“小概率事件在一 次试验中几乎是不可能发生 的”,当 H0 为真时,事件 P{|Z| >1.96} = 0.05 是小概率事件,实际上是不可能发生的。现在抽样的结果是: |Z| =2. 3 >1. 96,也就是说,小概率事件 P{|Z| >1.96} = 0.05居然在 一次抽样中发生了,这是一个几乎矛盾的结果,因而不能不使人 怀疑假设 H0 的正确性,所以在显著性水平 α = 0.05下,我们拒绝 H0 ,接受 H1 ,即认为这一天罐装生产线的生产是不正常的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1) 是参数估计问题吗?
(2) 回答“是”还是“否” ,假设检验问题。
(3) 命题“合金平均强度不低于110Pa”正确 与
否仅涉0 及{如:下 1两10个} 参数集1 合 {: : 110}
这两个非空参数集合都称作统计假设, 简称假设。
(4) 我们的任务是利用样本去判断假设(命题) “ 0 ”是否成立。这里的“判断”在统
正如在数学上我们不能用一个例子去证明一个 结论一样,用一个样本(例子)不能证明一个 命题(假设)是成立的,但可以用一个例子 (样本)推翻一个命题。因此,从逻辑上看, 注重拒绝域是适当的。事实上,在“拒绝原假 设”和“拒绝备择假设(从而接收原假设)” 之间还有一个模糊域,如今我们把它并入接收 域,所以接收域是复杂的,将之称为保留域也 许更恰当,但习惯上已把它称为接收域,没有 必要再进行改变,只是应注意它的含义。
二、选择检验统计量,给出拒绝域形式
由样本对原假设进行判断总是通过一个统计量 完成的,该统计量称为检验统计量。使原假设 被拒绝的样本观测值所在区域称为拒绝域,一
般用W 表示,在例7.1.1中,样本均值 x愈大,
意味着总体均值 也大,因此,合理的拒绝域
形如 W {(x1,L , xn ) : x c} {x c}
计学中 称为检验或检验法则。
7.1.2 假设检验的基本步骤
一、建立假设
在假设检验中,常把一个被检验的假设称为 原假设,用 H0表示,通常将不应轻易加以否 定的假设作为原假设。当 H0被拒绝时而接收 的假设称为备择假设,用 H1表示,它们常常 成对出现。
在例7.1.1中,我们可建立如下两个假设:
H0 : 110 vs H1 : 110
三、选择显著性水平
检验可能犯以下两类错误:
➢ 其一是 H0为真但样本观测值落在拒绝域中, 从而拒绝原假设 H0,这种错误称为第一类错 误,其发生的概率称为犯第一类错误的概率, 或称拒真概率,通常记为 .
➢ 其二是 H0不真(即 H1为真)但样本观测值落 在接受域中,从而接受原假设 H,0 这种错误称 为第二类错误,其发生的概率称为犯第二类错 误的概率,或称受伪概率,通常记为 。
观测数 据情况
总体情况
H 0为真
H1为真
(x1,L , xn ) W
犯第一类 错误
正确
(x1,L , xn ) W c 正确
犯第二类 错误
犯第一类错误的概率 和犯第二类错误的概率 可以用同一个函数表示,即所谓的势函数。势函 数是假设检验中最重要的概念之一,定义如下:
定义7.1.1 设检验问题 H0 : 0 vs H1 : 1
§7.1 假设检验的基本思想与概念
7.1.1 假设检验问题
例7.1.1 某厂生产的合金强度服从 N( ,,16其) 中
的设计值 为不低于110(Pa)。为保证质量,该
厂每天都要对生产情况做例行检查,以判断生 产是否正常进行,即该合金的平均强度不低于
110(Pa)。某天从生产中随机抽取25块合金,
测得强度值为x1, x2 , …, x25,其均值为 x 108 (Pa),问当日生产是否正常?
说明:在样本量一定的条件下不可能找到一
个使 和 都小的检验。
英国统计学家 Neyman 和 Pearson 提出水平
为 的显著性检验的概念。
定义7.1.2 对检验问题 H0 : 0 对 H1 : 1
如果一个检验满足对任意的 0, 都有 g( ) ,
则称该检验是显著性水平为 的显著性检 验,简称水平为 的检验。
四、给出拒绝域
确定显著性水平后,可以定出检验的拒绝域W。
在例7.1.1中,若取=0.05,
由于g()关于 单调减,只需要
g (110)
5(c
110) 4
0.05
成立即可。这给出c 的值为
c 110 0.8u0.05 110 0.81.645 =108.684 检验的拒绝域为 W {x 108.684}
g( )
P ( /5
c
4/5
这个势函数是 的减函数
利用这个势函数容易写出犯两类错误的概率
分别为
(
)
c
4/5
,
0
和
(
)
1
c
4/5
,
1,
由此可得如下结论:
➢ 当 减小时,c 也随之减小,必导致的增大; ➢ 当 减小时,c 会增大,必导致 的增大;
若令 u x 110 4/5
则拒绝域有另一种表示: W {u u0.05} {u 1.645}
五、作出判断
在有了明确的拒绝域后,根据样本观测值 我们可以做出判断:
➢ 当 x 108.684 或 u 1.时64,5 则拒绝 H0
即接收 H1 ;
➢ 当 x 108.684 或 u 1.645时,则接收 H0
的拒绝域为W,则样本观测值落在拒绝域内 的概率称为该检验的势函数,记为
x g( ) P ( W ), 0 1 (7.1.3)
势函数 g( )是定义在参数空间 上的一个函数。 犯两类错误的概率都是参数 的函数,并可由势
函数算得,即:
( ), g( ) 1 ( ),
0 1
对例7.1.1,其拒绝域为W {x,c由} (7.1.3)可以算出 该检验的势函数
在例7.1.1中,由于 x 108 108.684
因此拒绝原假设,即认为该日生产不正常。