P值检验和假设检验

P值检验和假设检验
P值检验和假设检验

反证法假设检验P值与统计思维

反证法、假设检验、P值与统计思维 一、反证法的实质 目的:证明A为真; 办法:证明A逆否为假。 二、假设检验的实质 目的:证明A(原假设)为真; 办法:正面A逆否(备择假设)为小概率事件。 三、关于P值的讨论 (一)不拒绝零假设意味着什么(By 郑冰) 由一道试题引发的一点思考:2008年统计学考研真题第四题“食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验” (1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并说明理由。 (2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则假设?并说明理由。 …… 作为统计专业的学生来说,熟悉得不能再熟悉了。但是,通过做上面的题目,我发现自己在理解假设检验的问题上犯了一个十分严重的错误。这个问题主要是由于我们学的教材上面写着:“假设检验要么P-value小于a拒绝原假设,P-value大于a接受原假设……”。后来再看看其他教材,发现绝大多数都是这样写的。其实“P-value大于a接受原假设”这种说法是错误的。 P-value大于a的时候,结论到底是什么呢? 最早提出这个问题的是E·皮尔逊。E·皮尔逊问耶日·奈曼,在检验一组数据是否为正态分布时,如果没能得到一个显著性的 P值,那么能否认为这组数据服从正态分布呢?

费歇尔其实已经间接地回答了这个问题。费歇尔把比较大的 P 值(代表没有找到显著性证据)解释为:根据该组数据不能做出充分的判断。依据费歇尔的解释,我们绝对不会得出这样的推理,即没有找到显著性的证据,就意味着待检验的假设为真。这里引用费歇尔的原话:“相信一个假设已经被证明是真的,仅仅是由于该假设与已知的事实没有发生相互矛盾,这种逻辑上的误解,在统计推断上是缺乏坚实根基的,在其它类型的科学推理中也是如此。当显著性检验被准确使用时,只要显著性检验与数据相矛盾,这个显著性检验就能够拒绝或否定这些原假设;但是,该显著性检验永远不能确认这些原假设一定是真的,……” 所以,假设检验的目的在于试图找到证据拒绝原假设,而不在于证明原假设是正确的。当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。 举个例子来说:比如原假设为H0:u=10,从该总体中抽出一个随机样本,得到X=9.8,在α=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意味着样本提供的证据已经证明u=10是正确的。如果我们将原假设改为H0:u=10.5,同样,在α=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?我们不知道。 总之,假设检验的主要目的是为了拒绝而不是接受。 (二)不得不提的P值(By郑冰) P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解p值的由来、计算和意义很有必要。 1、P值的由来 R·A·Fisher作为一代假设检验理论的创立者,在假设检验中首先提出P值的概念。他认为假设检验是一种程序,研究人员依照这一程序可以对某一总体参数形成一种判断。也就是说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息。(当时这一观点遭到了

假设检验中的P值

假设检验中的P值 假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。 P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。P < 0.01 时样本间的差异比P < 0.05 时更大,这种说法是错误的。统计结果中显示Pr > F,也可写成Pr( >F),P = P{ F0.05 > F}或P = P{ F0.01 > F}。 1、P值由来 从某总体中抽 ⑴、这一样本是由该总体抽出,其差别是由抽样误差所致; ⑵、这一样本不是从该总体抽出,所以有所不同。 如何判断是那种原因呢?统计学中用显著性检验来判断。其步骤是: ⑴、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。 ⑵、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。 ⑶、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。如果P>0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P<0.05或P <0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受另一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。 2、数学应用 数据解释 P值碰巧的概率对无效假设统计意义 P>0.05 碰巧出现的可能性 大于5% 不能否定无效假 设 两组差别无 显著意义 P<0.05 碰巧出现的可能性 小于5% 可以否定无效假 设 两组差别有 显著意义 P <0.01 碰巧出现的可能性 小于1% 可以否定无效假 设 两者差别有 非常显著意 义 注意要点 理解P值,下述几点必须注意:

相关文档
最新文档