单侧假设检验中备择假设的设定依据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一次试验时它就不该发生,现在仅做一次试验, 事 件 H 就发生了, , 这与小概率事件原理相矛盾 , 从而 拒绝 H. o 假设检验的基本原理与哲学上的证伪主义在 逻辑论证的思想上具有相似的一面。证伪主义认 为: 知识就是假设。科学的精神是批判, 即证伪。科 学与非科学的“ 划界标准” 不是逻辑实证主义的“ 可 证实性” 判据, 而应是“ 可证伪性” 判据。“ 可证实性” 判据不仅不合理, 而且不可能, 因为它的工具即归 纳法是不可能的。 相比之下, 证伪主义认为他的“ 可 证伪性判据”不仅合理, 而且可能。他的工具是否 定式假言直言三段论演绎法。因为据之可借助“ 判 决性实验” 从单称陈述的真论证作为科学知识的全 称陈述的假。简单地说: 要证明作为科学知识的全 称陈述的真,需要枚举命题所包含的所有个体的
一问题在教学过程中尤甚。因此, 原假设和备择假 设不能随意提出, 在假设检验的过程中最重要也是
最困难的一步就是如何写出原假设和备择假设。 这 在教材和一些文章中都有提及。在两个对立假设
中, 我们究竟应该用哪一个作为原假设 H, o 哪一个 作为备选假设 H 呢? , 抑或对这一问题采取一些原则 性的提法, 如不轻易拒绝原假设, 或者说根据问题 的性质和研究的目的来确定, 缺乏操作性; 有些教 材则仅仅给出原假设和备择假设的定义, 对如何作 原假设和备择假设避而不谈, 似乎原假设和备择假 设的设定是随意的, 以致学生在学习过程中产生诸
1 2
统计与决策
述 了 双
, 一 1 裸访新探
20 年第a 总第 2 1 06 期( 1
在许多流行的教科书和研究文章 定道理的。 因为在实际工作中, 人们发现 中, 对假设检验都有这样的表述: 对每一 某种现象的样本均值大于( 或小于) 预先 个假没检验问题, 一般可同时提出两个 指定的某个标准值, 从而提出检验总体 相互对立的假设: 原假设和备择假设。 抽 均值是否确实大于 ( 或小于) 这个标准值 取样本检验的结果必然接受一方必然拒 的猜想。这样做与我们上述结论不谋而 绝另一方。其实这种表述是对假设检验 合。 但这种做法只看到了事物的表象, 没 的结果没有正确理解, 是错误的, 它误导 有从实质上去阐述, 从实际工作看, 这也 了初学者。既然接受一方必然拒绝另一 可能是本末倒置。样本的均值明显比希 方, 就毫无必要区分哪个陈述作为原假 望证明的总体均值大, 却要去检验总体 设, 哪个陈述作为备择假设了。 由以上分 水平比希望证明的总体均值小, 确实不 mn a) 和皮尔生外rn s) o 认为, 在实际问题 析可知, 原假设和备择假设是不对称的, 容易理解( 这也不用证明, 肯定接受原假 中,为了通过样本观测值对某一陈述取 假设检验的结论只有接受 H ,拒绝 H ; 设) , o 。其实样本值与临界值相差越大, 不 得强有力的支持, 通常把这种陈述本身 没有接受 H, o 拒绝 H。后者的说法是错 是正好说明检验的效果越好, , 结论的可 作为备择假没,而将这一陈述的否定作 误的。 也就是说, 假设检验是针对备择假 靠性越强吗? 另一方面, 做习题与实际工 为原假设。这样如果 H 为真, ; 即希望证 没的,结论的正确表述应该针对备择假 作有本质的差别。 在习题中, 样本的均值 明的这一陈述为真时, 发生接受 H 的错 设。 。 如果在一次试验中, 样本落人原假设 与希望证明的总体均值都是己知的, 对 误概率很小, 几乎不可能发生。 因此有充 区域, 统计结论为接受原假设, 不能说拒 练习者来说没有先后之分, 但在实际工 分的理由相信和接受这一陈述。也就是 绝备择假设 , 经营管理决策的结论应是: 作中, 先必须明确提出希望证明什么, 即 说若检验结果否定原假设 H, o 则说明否 在现有显著性水平下,尚不能认为备择 希望得到什么结论,然后抽取样本进行 定的理由是充分的。 反之, 若接受原假设 假设是对的 ( 错误或不严格但又极易引 检验, 这有一个先后的问题, 须知任何假 H, o 则认为没有充分的理由拒绝 H 这一 起初学者误解的表述为:在现有显著性 设检验都不是盲目 , 进行的。 况且, 即使用 陈述。 水平下, 可以认为原假设是对的) 接受原 此方法进行了检验,也不一定能达到检 二、 几种错误的认识 假设 ,只是因为根据现有样本数据没有 验的目的,因为它不一定将把希望证明 ( 统计学中关于假设检验的定义 充足的理由拒绝它, 一) 并非肯定原假设是 的命题放在了备择假设上。 同时, 这是一 和假设设定方法错误 对的; 相反, 只要样本落人备择假设区域 种从内部( 如企业管理部门) 提出问题的 流行的教科书对假设检验是这样定 内, 结论为接受备择假设 , 拒绝原假设 , 方法。 假如从外部( 如市场检查人员或消 义的: 所谓假设检验, 就是事先对总体参 经营管理决策的结论是:在现有显著性 费者) 提出问题就不一定了, 因为他们事 数或总体分布形式作出一个假设,然后 水平下, 可以认为备择假设是对的。 这就 先并没有样本资料。 利用样本信息来判断原假设是否合理, 很好地解释了“ 对于同样一个检验模型, ( 用两类错误的后果选择原假设 四) 即判断样本信息与原假设是否有显著差 交换原假设和备择假设可以得到完全相 和备择假设 异, 从而决定应接受或否定原假设。所 反的结论”似乎不同假设得到不同结论 , 统计学中, 第一类错误是指 H 为真 。 以, 假设检验也称为显著性检验。 这里有 的这个令许多初学者白思不得其解的问 时, 由于样本的随机性, 样本落入 H, , 这 两个错误: 其一, 假设检验不是利用样本 题。其实两种做法的结论由于都是接受 时我们拒绝 氏, 接受 H 的概率 a 即把 , , 信息来判断原假设是否合理,而是利用 H ,它并不代表 H 是对的, , o 。 H 是错的, 真看作假的概率; 相应地, 第二类错误是 样本信息来判断备择假设是否合理; 只是说在现有显著性水平下,根据现有 指 H 为假时, 其 。 由于样本的随机性, 样本 二, 假设检验的结果不是决定应接受或 样本数据没有充足的理由拒绝它,并非 落人 H, o 这时我们拒绝 H, 瑞 的概 , 接受 即把假看作真的概率 p 。 否定原假设,而是决定应接受或否定备 肯定 H 是对的, 。 因此, “ 对于同样一个检 率, 择假设。 另外教科书“ 通常把需要通过样 验模型, 交换原假设和备择假设可以得 有文章认为:) ( 当产品的质量指标 1 本去推断其正确与否的命题称为零假设 到完全相反的结论”的提法本身就是错 并非关键性指标,且对我们的生活不会 ( 或原假设) H 表示; , 。 用 与零假设相反的 误的, 至少是不准确的。 造成危害( 如产品包装的重量指标) 我 时, ( 用抽样的结果倒推原假设或称 们既可以将对方所陈述的指标作为原假 三) 假设便是对立假设( 或备择假设) H , , 用 表示。人们想当然将原始主张当作零假 “ 取直观判断现象的相反情况作为原假 设, 也可以以 此作为备择假设。(当 2 产品 ) 设 H” o 可见教科书对假设检验假设设定 设 ” 的质量指标非常重要 ( 如电器绝缘指标、 方法与假设检验的原理是背道而驰的。 有些读者在学习的过程中, 通过学 药品的有效率等) 则我们将对对方不 时, 应该用 如面向2 世纪课程教材《 1 统计学》 中例 习总结,发现大部分习题中通过样本均 利的指标作为原假设。换句话说, 题采用的是将希望证明的命题放在备择 值与希望证明的总体均值的比较来提出 两类错误的后果选择原假设和备择假设。 假设上, 但在讲解假设检验的步骤时却 原假设和备择假设, 样本的均值大, 即为 我们知道显著性水平实际上是犯第一类 错误地认为 “ 原假设被称为正待检验的 右侧检验, 我们当然希望犯一类错误的 反之, 为左侧检验 , 即用抽样 错误的概率, 假没,备择假设是拒绝原假设后可供选 均值的结果倒推假设检验中的原假设和 概率小一些, 但在样本容量不变的前提 择的假设” 。 减小 a 水平会增加犯第二类错误的 备择假设, 也有学者认为应“ 取直观判断 下, 水平, 在经营管理的实践中, 犯第 〔 结论的表述错误 二) 现象的相反情况作为原假设”这是有一 概率 日
理论新辉1-' 1' .4 11
年第4 总第2, 期( 1 期)
单 侧 假 设 检 验 中 备 择 假 设 的 设 定 依 据
. 黄 发 贵
假设检验是统计推断的重要内容之一, 对每一 个假没检验问题, 一般需要同时提出两个相互对立 的 假设: 原假设和备择假设。 在实际工作中, 原假设 和备择假设的确定非常重要, 有时候对于同样一个 检验模型, 如交换原假设和备择假设似乎可以得到 完全相反的结论, 特别是对单侧假设检验, 问题更 为明显, 甚至有人据此怀疑假设检验的科学性, 这
相反 , 工作人员如果随机抽出的 1 件是次品, 则有 充分的理由认为产品的合格率不是 9% 道理很简 9。 究者不愿接受而期待拒绝的假设应构造成原假设 H; o 研究者希望去证实并且期待接受的假设应构造
, 在一次试验中 原假设就有绝 单, 0 件产品中 9 件为正品, 10 0 有90 在一次试验中 成备择假设H。这样, 而备择假设在一次试验中则不易发生 本来正品就有绝对优势, 竟没有发生, 倒抽出了仅 对优势出现, 有 1 件中的 1 , 0 件 你不奇怪吗? 根据这一原理, ( 在 或几乎不可能发生) 。由于把希望证明的命题放在 数理统计的假设检验中, 我们的做法是, 在假设“ 了备择假设上,只要检验样本落人备择假设区域 原 结论为接受备择假设, 拒绝原假没, 这时我们就 假设 H 成立” o 的条件下, 构造某个事件 H( , 备择假 内, 设) , 它在H 为真的条件下发生的概率很小。 。 现在进 有足够理由认为证明了备择假没的真,原假设的 行一次试验,如果事件 H 发生了,则拒绝原假设 假, , 这样就可达到检验之目的‘ 相反, 如果把希望证 抽取样本落入原假设区 H。 o 为什么拒绝H 呢? o 这是因为: H 是对的, 明的命题放在了原假设上, 如果 。 则 H 一定是小概率事件, H是小概率事件, 、 既然 、 在做 域, 统计结论为接受原假设, 但并不能拒绝备择假
它不可以证明 H 的真, , , o H 的假 在这里逻辑是不对 前者可能犯的 过大和过小都不符合要求, 或证明总体某个参数是 称的。从可能犯两类错误的角度讲, 其概率为 a 而 。是可以控 , 否等于某个特定值。 假设的基本设定方法是等号放 错误称为第一类错误, 其概率 在原假设, 其基本形式为: 原假设H: o oLF, F L备择假 制的。后者可能犯的错误称为第二类错误, =
为写出假设的依据。 笔者认为统计教育有必要探讨建立统计假设 的原则与基础, 纠正一些不正确甚至错误的认识。 假没检验分为双侧假设检验和单侧假设检验。 双侧假设检验所针对的问题是指一些客体的指标
不易发生( 或几乎不可能发生) 的事件。假设检验能 做的事情是, 如果样本落人 H 的范围内, , 它可以证 明H 的真,。 , H 的假; 但如果样本落人 H 的范围内, 。
真, 这是不可能的; 而要证明作为科学知识的全称 陈述的假, 只需举一个反例就够了。 这个反例即“ 判
决性实验” 就是小概率事件。 由假设检验基本原理及原假设和备择假设构 造过程可以看出:原假设 H 是在一次试验中有绝 。 对优势出现的事件,而备择假设 H 在一次试验中 ,
多误解。统计学者对此进行了很多很有意义的研 究, 但大多着眼于如何写出原假设或用两类错误作
wk.baidu.com
, 通常是不可控制 设 H: o , 0w。 w 这里只谈单侧假设检验中 假设的 设定 为R 其概率的具体大小不知道, 的, 样本落入 H 的范围内, 。 仅仅意味着原假设可能 依据。 为真, 该结论正确的概率为未知的 1(更准确的结 -, 3 一、 假设检验的基本原理及其逻辑哲学基础 假设检验的基本原理是: 在一次试验中, 小概 论是凭此样本不足以进行推断,即什么都没有证 假设检验中如何作假设的问题重点 率事件不易发生域几乎不可能发生)通俗地说, 明。由此可见, 。 在 一次试验中, 假定某一事件发生的概率较大, 这一 应放在备择假设而不是原假设上。由假设检验基本 在进行单侧 事件发生了, 人们认为这是正常的; 反过来, 某一事 原理推出假没检验的基本原则应该是: 最好把原假设 H 取为预想结果的反面, 。 即 件发生的概率较小, 这一事件发生了, 人们认为这 检验时, 命题 ( 研究人员所提出的研究假设或 就不正常了。例如, 某商家声称某产品的合格率为 把希望证明的 放在备 9%, 10 件产品, 9 现有 01 〕 商检局厂作人员在检查中 者说希望得到样本数据强有力支持的陈述) 因为研究的目的就是要 随机抽出 1 发现其为正品, 件, 工作人员认为这是 择假设上。在科学研究中, 研 应该的, 但这并不意味着产品的合格率就是9%; 确定数据是否支持研究假设有足够把握,因此, 9