neymanpearson基本引理
模式识别-模式识别-N-P(Neyman—Pearson)判决

4·4 N-P(Neyman—Pearson)判决
1
在某些实际问题中,可能存在以下几种情况:
⑴ 不知道各类的先验概率 P(wi ) ; ⑵ 难于确定误判的代价 l ij ; ⑶ 某一种错误较另一种错误更为重要。
针对⑴,可以采用最小最大损失准则或令各类概 率相等的办法克服;
针对⑵,如果允许的话,可以避开使用损失函数 而采用最小误判概率准则 ;
W1 如前定义
W11 W1
W12
W
2
于是在 W11 上有
r
r
p(x w ) lp(x w ) 0
1
2
在W12上有
r
r
p(x w ) lp(x w ) 0
1
2
这时的 y 值为
r
rr
r
rr
y
=
(1
l0
)
W1 W11
(
p(x
w 1
)
lp(x
w 2
)
)d
x
(
W12
p(x
w) 1
lp(x
w 2
)
)
dx
= y
(
r p(x
w
) lp(xr w
r ))d x
(
r p(x
w
) lp(xr w
r ))d x
1
2
1
2
W11
W12
,
上式中第二项的积分为正值,第三项的积分为负值。
显然 y y
8
因此选择满足条件
r p(x
w
Pearson相关系数简介资料PPT课件

16
例13-1
测得某地15名正常成年人的血铅X和24小 时的尿铅Y,试分析血铅与24小时尿铅之 间是否直线相关。
2021
17
15名自愿者的血铅和24小时尿铅测量值(μmol/L)
编号 X
Y 编号 X
Y
1 0.11 0.14 9 0.23 0.24
2 0.25 0.25 10 0.33 0.30
3 0.23 0.28 11 0.15 0.16
适用条件 1、两变量均应由测量得到的连续变量。 2、两变量所来自的总体都应是正态分布, 或接近正态的单峰对称分布。 3、变量必须是成对的数据。 4、两变量间为线性关系。
Hale Waihona Puke 202114Pearson相关系数的计算
r
XXYY lXY
2
2
XX YY
lXlX YY
X 的离均差平方和:
2
2021
20
相关系数的假设检验
步骤 1.提出假设
H0 : p=0 无关 H1 : p≠0
相关
2.确定显著性水平 =0.05
如果从相关系数ρ=0的总体中取得某r值的概率P>0.05,我们就接受假 设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关 系;
如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或 α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自 ρ≠0的另一个总体,因此就判断两变量间有显著关系。
2021
7
它的形状象一块橄榄状
的云,中间的点密集,边沿 的点稀少,其主要部分是一 个椭圆。
2021
8
2.相关类型:
2021
9
pearson相关分析

pearson相关分析【摘要】本文介绍了Pearson相关分析的基本原理和应用方法。
首先,解释了Pearson相关系数的定义和计算方法。
然后,介绍了相关分析的主要应用领域和意义。
接着,详细阐述了Pearson相关分析的步骤和注意事项。
最后,总结了Pearson相关分析的优缺点,并展望了相关分析在未来的发展前景。
【关键词】Pearson相关分析;相关系数;应用领域;步骤;优缺点一、引言Pearson相关分析是一种常用的统计分析方法,用于研究两个变量之间的线性相关性。
该方法由卡尔·皮尔森于19世纪末提出,经过不断的发展和改进,成为现代统计学中最重要的方法之一。
Pearson相关分析广泛应用于心理学、教育学、医学、社会科学等领域的研究中,具有重要的意义和应用价值。
二、Pearson相关系数的定义和计算方法Pearson相关系数是衡量两个变量之间线性相关程度的统计量,可以表示为r。
其取值范围为-1至+1,当r为正数时表示正相关,r为负数时表示负相关,r接近于0时表示无相关性。
Pearson相关系数的计算方法如下:r = Cov(X, Y) / (SD(X) * SD(Y))其中,Cov(X, Y)表示X和Y的协方差,SD(X)和SD(Y)分别表示X和Y 的标准差。
三、相关分析的应用领域和意义Pearson相关分析具有广泛的应用领域,可以应用于以下方面的研究:1. 心理学研究:通过Pearson相关分析可以研究人类行为和心理状态之间的相关性,揭示出人们在不同情境下的行为和心理表现。
2. 教育学研究:Pearson相关分析可用于分析不同教育因素对学生成绩的影响,帮助教育者改进教学方法和提高教育质量。
3. 医学研究:研究疾病与生活方式、遗传因素等之间的相关关系,可以通过Pearson相关分析揭示疾病的潜在风险因素,为疾病预防和诊断提供依据。
4. 社会科学研究:Pearson相关分析可以用于分析社会经济数据之间的相关关系,比如收入与教育水平、失业率与犯罪率之间的关系,从而为社会政策的制定提供科学依据。
N-P(Neyman—Pearson)判决

上式中,l 是判决阈值。
可以看出,N-P判决规则的形式和最小误判 概率准则及最小损失准则的形式相同,只是似然 比阈值不同。
9
这里
l
是由下列关系式确定:
rr
21
=
p(x
w 2
)d
x
= 0
W1
即适当地选取 l 以保证使 21 = 0 ,因此
l 的值决定着类域 W1
为求 l ,令
r l(x) =
、W
r
1
2
在W12上有
r
r
p(x w ) lp(x w ) 0
1
2
这时的 y 值为
r
rr
r
rr
y
=
(1
l0
)
W1 W11
(
p(
x
w) 1
lp(
x
w 2
)
)d
x
(
W12
p(x
w 1
)
lp(x
w 2
)
)
d
x
= y
r
r
r
( p(x w ) lp(x w ))dx
r
r
r
( p(x w ) lp(x w ))dx
固定0反求l
24
例:在军事目标识别中,假定有灌木丛和坦克两种
类型,它们的先验概率分别是0.7和0.3,损失函数如
下表所示,其中,类型w1和w2分别表示灌木和坦克, 判决1=w1,2=w2,3表示拒绝判决。现在做了四 次试验,获得四个样本的类概率密度如下:
问:P(x|w1):0.1, 0.15, 0.3, 0.6, P(x|w2):0.8, 0.7, 0.55, 0.3
Neyman-Pearson基本引理

给定(0,1),有且只有下列两种情况: i) 存在00,使G(0)=
0
G ( )
ii) 存在00,使G(0)< G(0-0)
chap7
i 1
W {x | xi c}.
i 1
n
H0 : 1 ,
H1 : 1.
( ) P ( X W ),
50
犯第一类错误的概率
(n ) k n ( ) P ( X W ) P (T c) e , 1. k! k c
1.
由以上两式可知 n 固定时不可能使得犯两类错的概率都减少.
(n ) k n P(T k ) e , k 0,1, chap7 k!
6
4.势函数的定义: 称样本观察值落在拒绝域的概率为检验的势函数(功效函数), 记为
g ( ) P ( X W ),
0 1
p( x; 0 )
dP 0 d
, p( x;1 )
dP 1 d
则对检验问题
Radon-Nikodym导数(p5) a.s.[]
H0 : 0 ,
H1 : 1 (0 1 )
(1)对给定的(0<<1)存在一个检验函数(x)及常数k≥0,使
E0 [ ( x)]
在满足(I)的前提下尽可能 使势函数g()大一些,即相 当于尽可能使()小一些
设n=10,=0.05.取使g(1)满足(I),且尽可能大的 c=16,(g(1)=0.048740)
水没有被“足量”地使用.
W {x | xi 16}
i 1
10
chap7
6. 检验函数和随机化检验
线性回归模型检验方法拓展-三大检验

线性回归模型检验⽅法拓展-三⼤检验第四章线性回归模型检验⽅法拓展——三⼤检验作为统计推断的核⼼内容,除了估计未知参数以外,对参数的假设检验是实证分析中的⼀个重要⽅⾯。
对模型进⾏各种检验的⽬的是,改善模型的设定以确保基本假设和估计⽅法⽐较适合于数据,同时也是对有关理论有效性的验证。
⼀、假设检验的基本理论及准则假设检验的理论依据是“⼩概率事件原理”,它的⼀般步骤是(1)建⽴两个相对(互相排斥)的假设(零假设和备择假设)。
(2)在零假设条件下,寻求⽤于检验的统计量及其分布。
(3)得出拒绝或接受零假设的判别规则。
另⼀⽅⾯,对于任何的检验过程,都有可能犯错误,即所谓的第⼀类错误P(拒绝H|H0为真)=α和第⼆类错误P(接受H|H0不真)=β在下图,粉红⾊部分表⽰P(拒绝H0|H0为真)=α。
黄⾊部分表⽰P(接受H0|H0不真)=β。
⽽犯这两类错误的概率是⼀种此消彼长的情况,于是如何控制这两个概率,使它们尽可能的都⼩,就成了寻找优良的检验⽅法的关键。
下⾯简要介绍假设检验的有关基本理论。
参数显著性检验的思路是,已知总体的分布(,)F X θ,其中θ是未知参数。
总体真实分布完全由未知参数θ的取值所决定。
对θ提出某种假设001000:(:,)H H θθθθθθθθ=≠><或,从总体中抽取⼀个容量为n 的样本,确定⼀个统计量及其分布,决定⼀个拒绝域W ,使得0()P W θα=,或者对样本观测数据X ,0()P X W θα∈≤。
α是显著性⽔平,即犯第⼀类错误的概率。
既然犯两类错误的概率不能同时被控制,所以通常的做法是,限制犯第⼀类错误的概率,使犯第⼆类错误的概率尽可能的⼩,即在0()P X W θα∈≤ 0θ∈Θ的条件下,使得()P X W θ∈,0θ∈Θ-Θ达到最⼤,或1()P X W θ-∈,0θ∈Θ-Θ达到最⼩。
其中()P X W θ∈表⽰总体分布为(,)F X θ时,事件W ∈{X }的概率,0Θ为零假设集合(0Θ只含⼀个点时成为简单原假设,否则称为复杂原假设)。
广义似然比检验(GeneralizedLikelihoodRatioTest)

1
2
n i1
(Xi
0 )2
n i1
(Xi
X
)2
广义似然比检验: 方差未知正态总体的均值检验
n
n
利用恒等式 ( Xi 0 )2 ( Xi X )2 n( X 0 )2
i 1
i 1
可知在 - 2 ln n( X 0 )2 / 2比较大的时候应该拒绝H0
• 假定c=1。则判别规则如下:
X 6,则接受H0; X 6,则拒绝H0
• 因为结果有随机性,这个规则导致错判 • 错误分成两类:H0为真的时候拒绝H0, H0
为假的时候接受H0
P(拒绝H0 | H0 ) P( X 6 | H0 ) 0.18
P(接受H0 | H1) P( X 6 | H1) 0.35
错误的概率,通常记为
• 第II类错误(Type I Error),H0为假的时候接受 H0,其概率记为
• 检验的功效(power), H0为假的时候拒绝H0, 其概率记为
• 检验统计量(test statistics) • 拒绝域(rejection region)和接受域
(acceptance region) • 原分布(null distribution),在原假设为真的条
Bacterial Clump
观测值 期望值 卡方项
56 104 80 62 42 27 9 20 34.9 85.1 103.8 84.4 51.5 25.1 10.2 5.0 12.8 4.2 5.5 5.9 1.8 0.14 0.14 45.0
2
75.4,自由度为6,
北航多源信息融合总复习课

21
.
2.3 分布式融合检测系统
应用贝叶斯法则:
P(H i/u)P(u/P H (iu )P )(H i),(i0,1)
故:
P(H1/u)P(u/H1)P(H1) P(H0/u) P(u/H0)P(H0)
从而最大后验概率融合检测准则也可写为:
P P((uu//H H1 0))P P((H H1 0))?H1:H0
表决融合检验准则
在具有n个传感器的检测网络中,设定一个阈值k, 当存在k个以上的传感器支持某一假设时,则判定 该假设成立。融合准则如下:
u 0
1, 0,
N
i1 N
i1
u u
i i
k k
其中,1k n 法;
当
19
.
k 1
。当 k n 时,为“与”方 时,为“或”方法。
2.3 分布式融合检测系统
.
P ( D1 / H 0 ) p0 ( y )dy R1
P ( D1 / H 1 ) p1 ( y )dy R1
P(D0/H0)1P(D1/H0) P(D0/H1)1P(D1/H1)
2.3 分布式融合检测系统
代入可得平均代价函数如下:
C P 0 C 0 0 P 1 C 0 1 [ P 0 ( C 1 0 C 0 0 ) p 0 ( y ) P 1 ( C 0 1 C 1 1 ) p 1 ( y ) ] d y R 1
分布式检测结构是目前多传感器检测的主要结构模型
12
.
2.3 分布式融合检测系统
现现象象
Y1
Y1
S1
S1
Y2
Y3
Y2
……
现象
YN
S2
S3
2012年北京工业大学研究生复试方案

复试组别
应用统计
专业硕士
复试考生
吴杭(推免)、白月明
复试具体安排
时间
地点
内容及注意事项
交验本人相关证件
2012年4月8日8:00-11:30
数理楼2308
见北工大研招网《北京工业大学2012年硕士生复试录取工作安排》
体检
2012年4月8日
13:00-14:00
校医院
见北工大研招网通知
笔试
面试
2012年4月9日16:10-18:30
数理楼3411
学科综合,专业基础,个人规划
心理测试
2012年4月9日10:00-15:00
数理楼3411
学院统一安排
备注
复试结果公示时间:2012年4月10日上午9:00,地点:数理楼3411
2012年应用数理学院(所)各学科(小组)复试方案
第三复试小组
复试组别
校医院
见北工大研招网通知
笔试
2012年4月9日8:00-9:30
数理楼2415
固体物理
面试
2012年4月9日9:30-11:30
数理楼2415
英语口语
专业综合:物理综合知识、专业理论基础
心理测试
2012年4月9日10:00-15:00
数理楼3411
学院统一安排
备注
复试结果公示时间:2012年4月9日下午4:00,地点:数理楼3501
心理测试
2012年4月9日10:00-15:00
数理楼3411
学院统一安排
备注
复试结果公示时间:2012年4月10日;地点:数理楼2213室,微纳信息光子技术研究所公告栏。
2012年应用数理学院(所)各学科(小组)复试方案
5.4奈曼-皮尔逊引理

奈曼-皮尔逊引理及似然比检验从1928年开始的大约10年时间里,Neyman 和Pearson 合作发表了一系列有关假设检验的论文,从而建立了最大势检验理论(最优检验理论,MP 检验)。
本节介绍的奈曼-皮尔逊引理是这一理论的基本结果。
这一定理证明了当原假设和备择假设都是简单假设时,MPT 检验一定存在,并可求出检验函数的具体形式。
5.4.1 似然比,似然比检验与一致最优检验(一致最大势检验)设(连续型或离散型)总体X 的概率函数是);(θx f ,参数θ的参数空间},{10θθ=Θ, n X X X ,...,,21是总体X 的一个样本,考虑假设检验问题1100::θθθθ=>--<=H H 。
(8.1)定义1 (1)称n X X X ,...,,21的联合概率函数的比值∏∏=Λ==ni i ni i n x f x f x x 1011101);();(),;,,(θθθθ为似然比函数(或概率比函数),并规定当0);(0);(1110>∏=∏==ni i ni i x f x f θθ且时似然比为∞+,当0);(0);(1110=∏=∏==ni i ni i x f x f θθ且时似然比为0。
此外,称∏∏=Λ==ni i ni i n X f X f X X 1011101);();(),;,,(θθθθ为似然比统计量。
(2)若对假设检验问题(8.1)的检验函数有如下形式⎩⎨⎧<Λ>Λ=010101011),;,,(0),;,,(,1),,(λθθλθθφn n n x x x x x x , 其中0λ是某个非负常数,则相应的检验法称为似然比检验(或概率比检验)。
注:请联系最大似然原理,理解似然比检验的直观合理性。
例 设总体~X ),1(p B ,321,,X X X 是总体X 的一个样本,要检验假设:4.0:2.0:10=>--<=p H p H 。
非参数统计(R软件)参考答案

非参数统计(R软件)参考答案内容:A.3, A.10, A.12A.3 上机实践:将MASS数据包用命令library(MASS)加载到R中,调用自带“老忠实”喷泉数据集geyer,它有两个变量:等待时间waiting和喷涌时间duration,其中…(1) 将等待时间70min以下的数据挑选出来;(2) 将等待时间70min以下,且等待时间不等于57min的数据挑选出来;(3) 将等待时间70min以下喷泉的喷涌时间挑选出来;(4) 将喷涌时间大于70min喷泉的等待时间挑选出来。
解:读取数据的R命令:library(MASS);#加载MASS包data(geyser);#加载数据集geyserattach(geyser);#将数据集geyser的变量置为内存变量(1) 依题意编定R程序如下:sub1geyser=geyser[which(waiting<70),1];#提取满足条件(waiting<70)的数据,which(),读取下标sub1geyser[1:5];#显示子数据集sub1geyser的前5行[1] 57 60 56 50 54(2) 依题意编定R程序如下:Sub2geyser=geyser[which((waiting<70)&(waiting!=57)), 1];#提取满足条件(waiting<70& (waiting!=57)的数据. Sub2geyser[1:5];#显示子数据集sub1geyser的前5行[1] 60 56 50 54 60 ……原数据集的第1列为waiting喷涌时间,所以用[which(waiting<70),2](3)Sub3geyser=geyser[which(waiting<70),2];#提取满足条件(waiting<70)的数据,which(),读取下标Sub3geyser[1:5];#显示子数据集sub1geyser的前5行[1] 4.000000 4.383333 4.833333 5.450000 4.866667……原数据集的第2列为喷涌时间,所以用[which(waiting<70),2](4)Sub4geyser=geyser[which(waiting>70),1];#提取满足条件(waiting<70)的数据,which(),读取下标Sub4geyser[1:5];#显示子数据集sub1geyser的前5行[1] 80 71 80 75 77…….A.10如光盘文件student.txt中的数据,一个班有30名学生,每名学生有5门课程的成绩,编写函数实现下述要求:(1) 以data.frame的格式保存上述数据;(2) 计算每个学生各科平均分,并将该数据加入(1)数据集的最后一列;(3) 找出各科平均分的最高分所对应的学生和他所修课程的成绩;(4) 找出至少两门课程不及格的学生,输出他们的全部成绩和平均成绩;(5) 比较具有(4)特点学生的各科平均分与其余学生平均分之间是否存在差异。
皮尔森相关系数计算原理解读

皮尔森相关系数计算原理解读
皮尔森相关系数是一种最简单的反应特征
和响应之间关系的方法。
Origin起源
Pearson相关系数(Pearson Correlation Coefficient)是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。
这个相关系数也称作“皮尔逊积矩相关系数”(Pearson product-moment correlation coefficient)。
Function功能
用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。
Pearson formula 皮尔森相关系数公式:
Covariance formula 协方差:
note 注意:
Standard deviation (SD) 标准差:
有5个国家的国民生产总值分别为10、20、30、50 、80 亿美元。
假设这5个国家(顺序相同) 的贫困百分比分别为11%、12%、13%、15%、18%(使用0.11、0.12、0.13、0.15、0.18)。
皮尔逊相关系数计算过程如下:
Covariance:
So, the covariance:
Standard deviation:
So, the standard deviation:
Pearson
So, positive correlation正相关
下一期介绍如何在R中进行皮尔森相关性分析。
严加安测度论的答案

cooperation and understanding between nations. we will begin to responsibly leave iraq to its people, and forge a hard-earned peace in afghanistan. with old friends and former foes, we will work tirelessly to lessen the nuclear threat, and roll back the specter of a warming planet. we will not apologise for our way of life, nor will we waver in its defence, and for those who seek to advance their aims by inducing terror and slaughtering innocents, we say to you now that our spirit is stronger and cannot be broken; you cannot outlast us, and we will defeat you.
严加安测度论的答案

【篇一:数理统计】
>考试大纲
二级学科:概率论与数理统计考试科目:数理统计考试时间:180分钟
------------------------------------------------------
考试形式:数理统计专业硕转博资格考试综卷由两部分组成,总分为150分,其中概率论部分满分50分,数理统计部分满分100分。
to do as we please. instead, they knew that our power grows through its
prudent use; our security emanates from the justness of our cause, the force of our example, the tempering qualities of humility and restraint.
recall that earlier generations faced down fascism and communism not just with missiles and tanks, but with sturdy alliances and enduring convictions. they understood that our power alonecannot protect us, nor does it entitle us
as for our common defence, we reject as false the choice between our safety and our ideals. our founding fathers, faced with perils we can scarcely imagine, drafted a charter to assure the rule of law and the rights of man, a charter expanded by the blood of generations. those ideals still light the world, and we will not give them up for expediences sake. and so to all other peoples and governments who are watching today, from the grandest capitals to the small village where my father was born: know that america is a friend of each nation and every man, woman and child who seeks a future of peace and dignity, and that we are ready to lead once more.
neymanpearson准则 统计决策

neymanpearson准则统计决策neyman-pearson准则是一种常用的统计决策准则,用于在两个假设之间进行选择。
它的目的是在给定一定的显著性水平下,根据观察到的数据,判断哪个假设更为可信。
本文将介绍neyman-pearson准则的基本原理和应用。
neyman-pearson准则的基本原理是基于假设检验的思想。
在进行统计决策时,我们通常会有两个互斥的假设,即原假设H0和备择假设H1。
原假设通常是我们要验证的假设,备择假设则是与之相对的假设。
neyman-pearson准则的目标是选择一个合适的统计量,并设定一个临界值,当统计量的值超过临界值时,我们拒绝原假设,接受备择假设。
为了选择合适的统计量,neyman-pearson准则引入了一个重要的概念,即功效函数。
功效函数用于衡量当备择假设为真时,我们正确拒绝原假设的概率。
通常情况下,我们希望这个概率越大越好,因为这意味着我们能够更准确地识别出真实情况。
因此,neyman-pearson准则的核心思想是在给定一定的显著性水平下,选择使功效函数最大化的统计量。
在neyman-pearson准则中,显著性水平通常由研究者事先设定,代表了犯第一类错误的概率。
犯第一类错误是指在原假设为真的情况下,错误地拒绝了原假设。
通常情况下,我们希望显著性水平越小越好,因为这意味着我们犯第一类错误的概率越低。
选择合适的临界值是neyman-pearson准则的另一个重要步骤。
临界值的选择要根据实际问题和样本数据来确定。
一般情况下,我们会根据显著性水平和备择假设的特点来选择临界值。
如果我们希望更加保守,即降低犯第一类错误的概率,我们可以选择较小的临界值;如果我们希望更加激进,即提高功效函数的值,我们可以选择较大的临界值。
neyman-pearson准则在实际应用中有着广泛的应用。
例如,在医学研究中,我们可以使用neyman-pearson准则来判断某种药物是否对疾病有治疗效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
g()=1-()
在0 时,g()≤ 的检验称为水平为的检验,记为(,0, 1)检验.
常取0.1,0.05,0.01等值.
chap7
根据检验的水平确定临界值c
例1中 g() (n)k en
kc k!
g ( )
0
则 E0 [ ( X )] P0 { p( X ;1) 0 p( X ;0 )} G(0 )
G() P0 { p( X ;1) p( X ;0 )}
1
G()
P0
{
p( X ;1) } p( X ;0 )chap7
ii) 存在00,使G(0)< G(0-0)
(a.e.[]). 测度为零的集合外
chap7
(1)对给定的(0<<1)存在一个检验函数(x)及常数k≥0,使 14
E0 [ (x)]
(I)
(x)
1, 0,
p(x;1) kp(x;0 ) p(x;1) kp(x;0 )
(II)
证明: 要证,存在形如(II)的检验函数,使(I)成立.
P (T
c)
k c
(n ) k
k!
9
e n
是的严格增函数.
给定,在≤1(H0)时控制犯第一类错的概率 g()
g()是的严格增函数, 要在范围≤1中选取使g() 最大的,即为=1,由
g(1) nk en
kc k! 确定拒绝域中临界值c:
}
是
p( X ;1) p(X ;0)
的分布函数,
是非降,右连续.
chap7
所以G()非增,右连续,且
G() 0, G(0 - 0) 1,
G() 要证E0 [ (x)] 15
G(
0)
G(
)
P0
p( X p( X
;1 ) ;0 )
c)
c1 k 0
(n)k en ,
k!
1.
() 1- () 不同
由以上两式可知 n 固定时不可能使得犯两类错的概率都减少.
P(T k) (n)k en , k 0,1,
k!
chap7
6
4.势函数的定义:
称样本观察值落在拒绝域的概率为检验的势函数(功效函数),
拒绝域
c 称为临界值.
i 1
T 的观测值.
chap7
3. 两类错误
H0: 0,H1: 1 X W W 4
当原假设H0为真时,样本观测值却落在拒绝域W 中,从而使 我们拒绝原假设.这种错误称为第一类错误,犯第一类错误
的概率为
( ) P ( X W ), 0
6. 检验函数和随机化检验
(x)实际用的不多,理论上有用处10.
检验函数定义:设(x)为定义在样本空间X上的可测函数,满 足条件0≤(x)≤1.在有了样本x后,计算(x),然后以概率(x) 拒绝原假设,以概率1- (x)接受原假设, 则称(x)为一检验(检 验函数).若(x)能取(0,1)内之值,称(x)为随机化检验. 若(x) 仅取0,1两个值,则称(x)为非随机化检验,其拒绝域由满足 条件(x)=1的那些x构成. 势函数可写为
为单位时间内接到的平均呼唤次数.为考察该台的是否不超
过1,考虑检验问题 H0 : 1 , H1 换台的n次记录,即来自P()的样本 拒绝域的
X=(X1,…,Xn)的一个观测值.
统计量称
取(检验)统计量(通常从参数的估计出发寻找检验统计量) 为检验统
关于参数的原假设与备择假设记为 H0: 0,H1: 1
0 与 1 是 的互不相交的非空子集.
给定H0和H1就等于给定检验问题,记为检验问题(H0,H1).
2. 定义:在检验问题(H0,H1)中,检验法则(简称检验法或检验) 就是设法把样本空间X划分为互不相交的两个可测集:
X W W
记为 由定义知
g( ) P ( X W ),
注意: 取值
在全空间
在0 时,g()= () 是犯第一类错的概率. 在1 时,g()=1-(), 1-g()是犯第二类错的概率.
势函数是假设检验中最重要的概念之一.因为同一个原假设可以 有许多检验法,其中自然有优劣之分.这区分的依据,就取决于 检验的势函数.
n
T X i — 的充分,完备的统计量.
计量
i 1
ˆ X T / n 是的MLE.如H0成立,则的估计量 X不应太大,
于是T也不应太大.因此,当T≥c (c是某个常数)时,就要拒绝H0 . 拒绝域可用检验统计量T 表示为
n
W {x | T c} {x | xi c}.
— (III)
给定(0,1),有且只有下列两种情况:
i) 存在00,使G(0)=
ii) 存在00,使G(0)< G(0-0)
G()
0
在第i)种情况下定义
(x)
1, 0,
p(x;1) 0 p(x;0 ) p(x;1) 0 p(x;0 )
并规定:
当观测值xW时,就拒绝原假设H0,认为备择假设H1成立. 当观测值xW时(即 x W ),就不拒绝H0,认为原假设H1成立, 称W为检验的拒绝域.
选定了检验法确定了拒绝域
chap7
怎样选检验法,即怎样确定拒绝域?
X W W3
例1. 电话交换台单位时间内接到的呼唤次数X~P(), >0.
已知X1,…,Xn独立,且n 都服从P().由卷积公式,
i 1
T X i ~ P(n)
i 1
即
P(T k) (n)k en , k 0,1,
k!
chap7
H0 : 1 , H1 : 1.
犯第一类错误的概率
( ) P ( X W ),
kc k!
() c1 (n)k en , 1.
k0 k!
Neyman和Pearson的假设检验理论基本思想:
寻找先控制犯第一类错误的概率在某一个范围内,然后寻 找使犯第二类错误的概率尽可能小的检验.
即 对选定的一个较小的数 (0<<1)
在满足
g( ) P ( X W ) , 0
n
T X i ~ P(n) i 1
原假设H0: 1成立时,犯第一类错误的概率为
()
E[(X )]=1g
k =16
(10 )k
k!
e10
(10 )15
+rg 15!
e10
+0
(10)k
e10
+r
(10)15 g
e10 =0.048740+rg0.034718,
E0 [ (x)]
(I)
(x)
1, 0,
p(x;1) kp(x;0 ) p(x;1) kp(x;0 )
(II)
(2)由(I)和(II)确定的检验函数(x)是水平为的MPT.反之,如果 (x)是水平为的MPT,则一定存在常数k≥0,使(x)满足(II)式
1
k =16 k !
15!
为使得水平=0.05被“足量”地使用,令
1,T 16
0.048740+0.034718 r=0.05 r=0.036 即 (x) 0.036,T 15
0,T 14
chap7
§7.2 Neyman-Pearson基本引理
g( ) E [( X )] , 120
当原假设H0不真时,样本观测值却没落在拒绝域W 中,而落 在接受域 W 中,从而使我们没有拒绝原假设.这种错误称为
第二类错误.犯第二类错误的概率为
( ) P ( X W ) 1 P ( X W ), 1
例1中的检验犯两类错误的概率?
n
W {x | xi c}.
即通过c,可使势函数减小或增大.
chap7
g ( )
P ( X
W )
P
(T
c)
k c
(n ) k
k!
en ,
是的严增函数
P (T
c)
k c
(n )k
k!
e n
1 n t c e 1 t dt,
(c) 0
(0, )
1
基本概念 Neyman-Pearson基本引理 一致最优势检验
统计推断的三个方面: 抽样分布,参数估计与假设检验
根据样本的信息检验关于总体的某个假设是否成立的问题 称为假设检验问题.
比如, 总体X的均值是否等于0; 总体X是否服从正态分布等.
chap7
2
§7.1 基本概念
1.关于分布p的原假设与备择假设记为 H0: pP0, H1: pP1 P0与P1 是分布族P的互不相交的非空子集.
( I ) 这是根据N-P基本思想,
在满足(I)的前提下尽可能
使势函数g()大一些,即相 当于尽可能使()小一些
设n=10,=0.05.取使g(1)满足(I),且尽可能大的
c=16,(g(1)=0.048740)
水平没有被“足量”地使用.
10
W {x | xi 16} i 1
chap7
个不同的概率测度,关于某个有限的测度,有
p(x;0 )
dP0
d
,
p( x;1 )