贝叶斯假设检验与经典假设检验的对比研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
}
其中 ε>0 的选择是认为 H1:θ1 - θ2 > ε H2:| θ1 - θ2 | ε , θ θ | 1 - 2 | ε 为两种药是等效的。经典假设检验中常处理 的情况是非此即彼, 对这类问题无法定义 p 值; 另外, 当检 验涉及三个及三个以上的多重比较问题, 经典的检验将增 加犯第一类错误的概率, 所以, 经典假设检验方法亦不宜 处理多重假设问题, 而贝叶斯假设检验通过计算每一个假 设的后验概率, 接受后验概率最大的假设。因此, 贝叶斯 方法更易处理多个假设的检验问题。 5 结论 无论是经典假设检验, 还是贝叶斯假设检验, 人们关 心的问题是假设检验的结果是否真能反应原假设的真伪, 但以 “显著水平” 为中心的经典假设检验理论并不能直接 回答这个问题。本文通过对两种检验方法的对比研究, 指 出了经典检验方法存在的一些问题, 以及贝叶斯检验方法 在解决这些问题时的优势。
36
统计与决策201 2 年第 9 期·总第 357 期
从表中的数据可以看出若由观测值得 z=1.96,意味经 典检验中拒绝 H 0 的显著水平是 0.05, 由于 0.05 够小, 拒绝 所以结论是拒绝原假设。然而, H 0 的证据看似足够充分, 从小的 n 时的 1/3, 到大的 n 时接 H 0 的后验概率是很大的, 近 1。即当 p 值为 0.05 时几乎不提供拒绝 H 0 的证据。同 时可以证明, 对任何合理的先验, 在同一组样本数据下, 经 典检验中的较小的 p 值都对应较大的后验概率 α 0 。于是, 出现了经典犯错误的概率或 p 值对否定 H 0 的根据进行完 全错误的描述[1]。 3 经典最优与贝叶斯方法的等价性 假设观测样本 X1, X2,⋯, X n 来自分布 N (θ, σ 2) ,σ 2
n n dx i (t ) = - c i (t ) x i (t ) + ∑ a ij (t ) f j ( x j (t )) + ∑b ij (t )u j (t ) + I i dt j=1 j=1
0 引言 细胞神经网络是由 Chua 和 Yang 于 1988 年提出的一 种人工神经网络, 它的应用非常广泛。目前关于神经网络 模型稳定性的研究已经有很多结果。但为了更好地刻画 现实世界, 不得不考虑模糊因素对模型的影响。1996 年, 文[1]提出了如下的模糊神经网络。
Z(p 值) 1.65(0.1) 1.96(0.05) 2.576(0.01) 3.291(0.001) n 1 0.42 0.35 0.21 0.086 5 0.44 0.33 0.13 0.026 10 0.49 0.37 0.14 0.024 20 0.56 0.42 0.16 0.026 50 0.65 0.52 0.22 0.034 100 0.72 0.60 0.27 0.045 1000 0.89 0.80 0.53 0.124
已知, 考虑检验 H 0:θ θ 0, H1:θ < θ 0 , 若 π(θ) ~ N ( μ, τ 2) ,
{
以 “0— K i ” 为损失函数, 则可得贝叶斯检验的拒绝域为:
2 K1 12 x ˉ < θ 0 + σ 2 (θ 0 - μ) - σ 2 ρ z( ˉ - θ0 | ) , 其中 z= n | x K 0 + K1 τ 一致最大功效检验的拒绝域 /σ ) 与 经 典 的 α 水 平 、
(责任编辑/亦 民)
37
统计与决策201 2 年第 9 期·总第 357 期
参考文献:
ì ü ˉ < θ 0 + σ .z αý 具有相同的形式。在经典检验中拒绝域 íx n þ î 的临界值由 α 决定, 而在贝叶斯检验中则由损失和先验信 息决定。结论是: (1) 经典检验中 α 选取没有准则, 通常为
0.05 或 0.01, 但这个惯例并没有严格地被大多数统计学家 α 的选择具有主观性; 严格遵守, (2) 经典犯第一类错误概 率 α 不能说明犯错误时所产生的损失的大小; (3) 每一 α 水平的最大功效检验相对应一个贝叶斯检验, 即或者对假 设的先验及损失做主观选择或者对 α 水平做主观选择; (4) 贝叶斯方法充分运用了合理的先验信息及抽样信息, 并且给出决策错误时的损失, 其结论更加可靠, 因而贝叶 斯方法可以看作是提供了一个选择检验的显著水平大小 的合理方法。 4 经典检验不宜处理多个假设的情况 对 于 问 题 H 0:θ ∈ Θ 0 ↔ H1:θ ∈ Θ1 若 Θ 0 ⋃ Θ1 ≠ Ω( Ω 为参数空间) , 假设检验中常常存在两者皆可的区域, 即产 θ 生第三个假设 ∈ Θ2 。例如, 若要求检验两种药物的治愈 率 ,合 理 的 方 法 是 三 个 假 设 : H 0:θ1 - θ2 < - ε ,
理论新探
贝叶斯假设检验与经典假设检验的对比研究
张 静
(兰州商学院 统计学院, 兰州 730030)
摘 要: 文章基于对经典假设检验和贝叶斯检验的对比研究, 指出了经典假设检验在使用中存在的一些问 题, 给出了贝叶斯统计对这些问题的处理方法。 关键词: 经典检验; 贝叶斯检验; 显著水平 中图分类号: O212 文献标识码: A 文章编号: 1002-6487 (2012) 09-00j (t ) f j ( x j (t - τ j (t ))) + ∨ β ij (t ) f j ( x j (t - τ j (t ))) + ∧ T ij j=1 j=1 j=1 (t )u j (t ) + ∨ H ij (t )u j (t ) (i = 1,⋯, n)
理论新探
一类具有时滞的模糊神经网络的指数稳定性
景妮琴
(北京电子科技职业学院 电信工程学院, 北京 100029)
摘 要: 文章利用 Lyapunov 直接法, 讨论了一类非自治模糊神经网络的指数稳定性, 给出了此类系统指数 稳定的判据, 所得结果是新的, 并且是已有结果的补充。 关键词: 模糊神经网络; 全局指数稳定性; 非自治 中图分类号: O159 文献标识码: A 文章编号: 1002-6487 (2012) 09-0037-03
到确切的检验结果, 即检验结果是稳定的。 0 引言 2 经典检验中显著水平的误导 显著性检验在经典统计中作为统计推断重要内容之 一, 被广泛应用在各个领域。显著性检验是通过样本信息 对总体的某个假设做出拒绝或不拒绝的决策, 是用推断的 方法解决决策的问题, 不能给出决策错误时所产生的损失 大小, 并且在使用显著检验过程中出现一系列问题。相比 之下贝叶斯检验方法能较好的处理这些检验问题。 1 经典检验结果的不确定性 经典假设检验首先根据问题的要求提出假设, 通过给 定的显著水平确定检验的拒绝域, 然后根据样本是否落入 拒绝域来判断拒绝还是接受原假设。但是, 在实践中由于 α 假设的建立不同、 显著水平 大小不同, 往往会出现同一 问题和同一组样本数据得到完全相反的检验结果, 使得检 验所得的 “显著” 结果在实际中并无重大意义。 假如有一组调研人员做了一个关于总体均值在 0.12 处 的 单 侧 Z 检 验, 显 著 水 平 α =0.05, 获 得 抽 样 结 果 z= 0.015, 若假设为 H 0:μ 0.12, H1:μ > 0.12 , 由于拒绝域为 在经典假设检验中, p值越小, 意味拒绝 H 0 的证据越充 分。但事实上经典检验中 p 值常常是高估拒绝 H 0 的证据。 当样本容量很大时, 抽样结果与 H 0 的微小差别, 总能得到一 个极小的p值, 导致拒绝 H 0 的结论, 然而这个结论并没有实 际意义。即便是在中等样本量时, 一个小的p值也几乎不提 供拒绝 H 0 的证据, 即经典的犯错误的概率或显著性水平, 把 原假设是否有效引导到完全错误的印象中去。 例 如 ,假 设 观 测 样 本 X1, X2,⋯, X n 来 自 分 布 N (θ, σ 2) , σ 2 已知。检验假设 H 0:θ = θ 0, H1:θ ≠ θ 0 , 采用贝 θ θ θ 叶斯方法进行检验。给 先验分布为: 在 = 0 时 π0 = 在 θ ≠ θ 0 时 π(θ) = π1 g1(θ) , 其中 π1 = 1 - π 0 =1/2, π(θ 0) =1/2, 当给出先验的具体值 μ = θ 0, τ = σ 时, 可给 g1 为 N ( μ, τ 2) , 出不同样本容量 n 及不同抽样结果下的 p 值及 α 0 如下表。
[1][美]James O.Berger.统计决策论及贝叶斯分析 [M].北京: 中国统计 [2]傅军和.经典检验 p 值的若干问题[J].统计与决策, 2009,(1). [3]茆诗松.贝叶斯统计[M].北京: 中国统计出版社, 1999. [4]韦博成.参数统计教程[M].北京: 高等教育出版社, 2006. 出版社,1998.
j=1 n
n
n
n
(1)
其中 α ij (t ) 、β ij (t ) 、 T ij (t ) 和 H ij (t ) 分别是模糊后 MIN、 MAX 反馈和模糊前 MIN、 MAX 反馈; a ij (t ) 和 b ij (t ) 分别表
作者简介: 景妮琴 (1979-) 女, 山西临汾人, 硕士, 讲师, 研究方向: 微分方程与动力系统。
{z 1.645} , 而 z=0.015<1.645,z 值没有落入拒绝域故认为
总 体 均 值 不 大 于 0.12。 然 而 若 假 设 变 为 其拒绝域为 {z -1.645} , 而 H 0:μ 0.12, H1:μ < 0.12 时, z=0.015>-1.645,z 值没有落入拒绝域, 即认为总体均值不 小于 0.12, 与上述的结论是相反的。 一个双尾检验变为单尾时, 检验结果有可能超越 “统计 显著” 的界限。假如我们做了一个双尾 Z 检验, 获得抽样结 果 z=1.85,检验 p 值≈0.06, 当 α =0.05 时检验结果是不拒绝 原假设, 即不显著。将检验改为单尾时, 单尾检验 p 值比双 尾检验 p 值缩小一半, 检验结果立即变为显著的了。若将 α 显著水平 增大到 0.07 时双尾 Z 检验又变为显著了。 相比之下, 贝叶斯检验中, 无论如何建立假设, 也无需 给出显著水平, 只要给出参数的后验分布, 通过计算各假 设的后验概率, 对假设的后验概率大小的比较, 就可以得