统计假设检验中小概率原理的辨析_吴启富

合集下载

概率论与数理统计课件:假设检验

概率论与数理统计课件:假设检验

假设检验
首页 返回 退出
五、假设检验的两类错误
由于样本具有随机性,因此,当我们利用样本判断时, 可能会犯两类错误:
所作决策
真实情况
(未知)
样本未落入拒绝域 样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页 返回 退出
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算,得 x 100.104 计算统计量Z的观测值,得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
要检验的假设为
H0 : 100, H1 : 100
(2)未知σ2 ,选择检验统计量
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分 布X~N(40,22),现在采用技术研发部设计的新方法 生产了一批推进器,随机测试25只,测得燃烧率的 样本均值为 x 41.25 ,假设在新方法下σ=2,问用 新方法生产的推进器的燃烧率是否有显著的提高?

概率论和数理统计假设检验课件

概率论和数理统计假设检验课件

随机变量的分类
随机变量的分布函数
描述随机变量取值范围的函数,其值 域为[0,1]。
离散型随机变量和连续型随机变量。
数理统计基础
参数估 计
参数估计的概念
参数估计是根据样本数据 推断总体参数的过程。
点估计
通过样本数据直接得到一 个具体的数值作为总体参 数的估计值。
区间估计
根据样本数据计算出一个 区间,该区间包含总体参 数的可能性较高。
假设检验与回归Байду номын сангаас析的比较
目的和方法不同
假设检验的主要目的是判断一个 或多个零假设是否成立,而回归 分析是通过建立数学模型来描述
因变量和自变量之间的关系。
应用场景不同
假设检验常用于检验关于参数的 假设是否成立,而回归分析则广
泛应用于预测和解释数据。
侧重点不同
假设检验侧重于参数的点估计和 推断,而回归分析侧重于描述和
详细描述
在两独立样本的假设检验中,我们需要确保两组样本是相互 独立的,然后使用适当的统计量来比较两组样本的平均值或 比例。常见的两独立样本假设检验包括t检验、Z检验和卡方 检验等。
两相关样本的假设检验
总结词
两相关样本的假设检验是用来比较两个相关样本的平均值或比例是否相等。
详细描述
在两相关样本的假设检验中,我们需要确保两组样本是相关的,然后使用适当的统计量来比较两组样本的平均值 或比例。常见的两相关样本假设检验包括配对t检验和威尔科克森符号秩检验等。
预测变量之间的关系。
习题与思考题
基础概念题
题目1
假设检验的基本概念是什么?请 简述其步骤。
题目4
什么是第一类和第二类错误?如 何避免它们?
题目2

概率论与数理统计 8.1(假设检验的思想方法和基本概念)

概率论与数理统计 8.1(假设检验的思想方法和基本概念)
于是可以选定一个适当的正数k,
x 0 当观察值 x 满足 k时, 拒绝假设H 0 , / n x 0 反之, 当观察值 x 满足 k时, 接受假设H 0 . / n
X 0 因为当H 0为真时 Z ~ N (0,1), / n
于是,当原假设 H0:μ =0.5 成立时,有:

带概率性质的反证法的逻辑是: 即如果假设H0是正确的话,出现一个概率很 小的事件,则以很大的把握否定假设H0.
8.1.1 假设检验的思想方法
下面分别推出这两种检验的拒绝域: (1) 右边检验: H0: 0 H1: > 0
对于给定的小概率 , 由图8-2易知
/ n
由于X~N(, 2) ,所以 Z X ~ N (0,1)
左侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平

1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
H0 : p 0.03
1 [(1 p)10 10 p(1 p)9 ]
d f ( p) 8 90 p(1 p) 0 dp
当 p 0.03 时,f ( p)单调增加
当 p 0.03 时,
f ( p) P{Y 2; p} 1 [(1 p)10 10 p(1 p)9 ] f (0.03) P{Y 2; 0.03} 0.035 0.05
当样本容量固定时 , 选定后, 数 k 就可以确 x 0 定, 然后按照统计量 Z 的观察值的绝对 / n 值大于等于 k 还是小于 k 来作决定.

试述假设检验中的小概率原理

试述假设检验中的小概率原理

试述假设检验中的小概率原理假设检验是统计学中的一种常用方法,用于判断某一假设是否成立。

在假设检验中,小概率原理是指:如果某一假设成立,则在该假设下得到的样本结果是不可能出现的概率很小。

具体来说,在假设检验中,我们会根据某一统计量的分布情况,计算出在某一假设下得到该统计量的概率。

如果这个概率很小(通常认为小于0.05),则我们认为该假设不成立。

举个例子,假设我们想要检验一组样本的平均数是否与某一数值相等。

我们可以计算出在假设平均数与该数值相等的情况下,得到这组样本的平均数的概率。

如果这个概率很小,则我们认为平均数与该数值不相等。

总的来说,小概率原理是假设检验的重要依据,用于判断某一假设是否成立。

在假设检验中,通常认为在假设成立的情况下得到的样本结果是不可能出现的概率小于0。

《概率论与数理统计》第七章_假设检验

《概率论与数理统计》第七章_假设检验

第七章 假设检验学习目标知识目标:理解假设检验的基本概念小概率原理;掌握假设检验的方法和步骤。

能力目标:能够作正态总体均值、比例的假设检验和两个正态总体的均值、比例之差的假设检验。

参数估计和假设检验是统计推断的两种形式,它们都是利用样本对总体进行某种推断,然而推断的角度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。

而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。

当然由于样本的随机性,这种推断只能具有一定的可靠性。

本章介绍假设检验的基本概念,以及假设检验的一般步骤,然后重点介绍常用的参数检验方法。

由于篇幅的限制,非参数假设检验在这里就不作介绍了。

第一节 假设检验的一般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误一、假设检验的基本概念(一)原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。

例7.1 某厂生产一种日光灯管,其寿命X 服从正态分布)200 ,(2μN ,从过去的生产经验看,灯管的平均寿命为1550=μ小时,。

现在采用新工艺后,在所生产的新灯管中抽取25只,测其平均寿命为1650小时。

问采用新工艺后,灯管的寿命是否有显著提高?这是一个均值的检验问题。

灯管的寿命有没有显著变化呢?这有两种可能:一种是没有什么变化。

即新工艺对均值没有影响,采用新工艺后,X 仍然服从)200 ,1550(2N 。

另一种情况可能是,新工艺的确使均值发生了显著性变化。

这样,1650=X 和15500=μ之间的差异就只能认为是采用新工艺的关系。

究竟是哪种情况与实际情况相符合,这需要作检验。

假如给定显著性水平05.0=α。

在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。

第一个统计假设1550=μ表示采用新工艺后灯管的平均寿命没有显著性提高。

医学假设检验课件

医学假设检验课件
例:比较来自中国广东省与河北省的一年级 男大学生身高。以在武汉大学和华中科技大 学的两省男生为样本,得出样本均值分别为 168.2cm与169.9cm,推测总体均值是否相 等
3
例 根据大量调查,已知健康成年男子脉搏 的均数为72次/分,某医生在一山区随机调查 了30名健康成年男子,求得其脉搏数为74.2 次/分,标准差为6.0次/分,能否据此认为该山 区成年男子的脉搏数与一般成年男子的脉搏 数相同?
假设两种处理的效应相同,即µ1= µ2 ,理论上
差值的总体均数应为0,即可看成是差值的样本均
数所代表的未知总体均数µd 与已知总体均数µ0=0 的比较,可套用前述t检验的公式。
td0 d0
Sd
Sd n
d:差值的均数 Sd:;差值的标准差; Sd :差值均数的标准n:误 对; 子数
29
例 应用某药治疗8例高胆固醇患者,观察治疗前 后血浆胆固醇变化情况,如下表,问该药是否对 患者治疗前后血浆胆固醇变化有影响?
2、配对设计的差值均数与总体均数0比 较的t检验
常见的配对设计主要有以下情形: ①自身比较:同一受试对象处理前后或不同部位测
定值的比较。 ②同一受试对象(或样品)分别接受两种不同的处理。 ③成对设计:将条件近似的观察对象两两配成对子,
对子中的两个个体分别给予不同的处理。
28
配对t检验的基本原理:
现|x -μ0|≥k,从而导致错误的推断结论
故 为把犯这种错误的概率控制在一定的范 围内(可接受的范围),指定一个常数 α(0<α<1),使得在H0成立的条件下,
p{| x -μ0|≥k}≤α,一般取α=0.05或0.01
7
本假均设数H0成应立服,从如从正已态知分总布体(μ如0总中体抽标样准,则差得为到未的知样时

统计学基础(吴启富)PPT全套课件

统计学基础(吴启富)PPT全套课件

• 统计学的定义
统计是关于数据的一门科学,它阐明了关于数据的基
本概念、原则和方法。
在《大不列颠百科全书》(1993年第15版卷28,217
页)定义:统计学是搜集、分析数据,并从中作出推断的
艺术和科学。
而该书2007年电子版的定义是:统计学搜集、分析数
据,并从中作出推断的科学。
可见,统计学的定义并不一致。实际上,关于统计学
查总体。
调查单位是组成调查对象的个体,是调查中所要登记项
目的承担者或载体。
3.调查项目
调查项目就是调查中需要登记的调查单位的具体内容,
解决“调查什么”的问题。
统计学
调查项目
STATISTICS
• 调查项目一般表现为调查单位的各种标志或特征。
在确定调查项目时,要注意以下三个问题:
第一,设计调查项目时,要紧紧围绕调查目的,并要考
1.总体、个体与样本
总体是指我们在研究中所感兴趣的客观现实。
具体可以表现为所研究对象的整体或表现客观现
实的数据组成的整体。组成总体的数据个数叫做
总体单位数,表明总体规模的大小,总体单位数
一般用 N表示。
组成总体的单个事物称为个体。具体表现为
要研究对象中的某一个对象或体现这一对象特征
的数据。
从总体中抽取出来的一部分单位就是样本。
本时不是依据随机原则,而是根据研究的目的和调查对象
的特征,采用某种方式从总体中抽取部分单位进行调查。
非概率抽样在抽样中不讲求某单位被抽中的概率,不存在
抽样分布,抽样结果不能用于推断总体。常用的非概率抽
样方法主要有方便抽样、自愿样本、判断抽样、配额抽样
和滚雪球抽样等。
统计学
抽样调查

概率论课件假设检验

概率论课件假设检验

确定临界值
根据研究目的和精度要求,选择合适 的显著性水平,以平衡第一类错误和 第二类错误的发生概率。
做出决策
决策准则
根据样本数据和临界值, 做出是否拒绝零假设的决 策。
结果解释
对决策结果进行合理解释, 说明拒绝或接受零假设的 原因和意义。
结果应用
将决策结果应用于实际问 题中,为后续研究和应用 提供依据。
双侧检验
对两个方向上的差异都进行检验,例如检验平均值是否与某 个值相等。
参数检验与非参数检验
参数检验
基于总体参数的假设进行检验,例如检验总体均值或比例。
非参数检验
不基于总体参数的假设进行检验,例如中位数或众数检验。
独立样本检验与配对样本检验
独立样本检验
对两个独立样本进行比较,例如比较 两个不同群体的平均值。
感谢您的观看
05 实际应用案例
医学研究中的假设检验
总结词
医学研究中的假设检验是评估新药物、治疗方法或诊断技术有效性的关键步骤。
详细描述
在医学研究中,研究者通过假设检验来比较新药物或治疗方法与现有标准之间的差异,以评估其疗效和安全性。 假设检验通过统计方法对数据进行处理,根据预设的显著性水平判断假设是否成立,从而为医学决策提供依据。
假设检验的优点与局限性
01
局限性
02
03
04
假设检验依赖于样本数据的代 表性,如果样本不具有代表性 ,则推断结果可能存在误差。
假设检验的结果受到样本量大 小的影响,样本量过小可能导
致推断结果不稳定。
在某些情况下,假设检验可能 无法给出明确的结论,导致决
策者难以做出判断。
未来研究方向
探索更有效的假设检验方法

概率统计 假设检验 ppt课件

概率统计  假设检验  ppt课件
为检验的接受域 (实际上没理由拒绝), 现 x 68 .5落入接受域,则接受原假设
H 0: = 68
由引例可见,在给定的前提下, 接受还是拒绝原假设完全取决于子样 值, 因此所作检验可能导致以下两类 错误的产生:
第一类错误 第二类错误
弃真错误 取伪错误
假设检验的两类错误
所作判断 接受 H0 真实情况
19.8 20.0 20.3 20.8 20.9 m = 15 20.9 21.0 21.0 21.0 21.2 21.5 22.0 22.0 22.1 22.3
.05 . 问两子样方差是否有显著差异?0
解 作假设 H0: 12=22 ;H1: 1222
取统计量 FS / S ~F ( 14 , 8 )
H0 为真
正确 第二类错误
(取伪)
拒绝 H0
第一类错误
(弃真)
H0 为假
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
任何检验方法都不能完全排除犯错 误的可能性.理想的检验方法应使犯两类 错误的概率都很小,但在子样容量给定的 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 假设检验的指导思想是控制犯第一类 错误的概率不超过, 然后使得犯第二类 错误的概率β 尽量的小。 若有必要,通过增大子样容量的方法 来减少 .
y 21.12 s 22 0.5689
19.8 20.0 20.3 20.8 20.9 m = 15 20.9 21.0 21.0 21.0 21.2 21.5 22.0 22.0 22.1 22.3
试判别两个子样均值的差异是仅 由随机因素造成的还是与来自不同的 鸟巢有关 ( 0 .05). 解 H0 : 1 = 2 ; H1 : 1 2

如何理解统计学中的“小概率事件”

如何理解统计学中的“小概率事件”

如何理解统计学中的“小概率原理”?朱继民博士统计学是一门处理数据的收集、整理与分析的艺术,是指导人们如何对科学探索活动进行严密地设计、获取可靠的数据、正确地归纳分析与推理判断的科学。

医学统计学在医学研究中帮助揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

学过统计学的同学多有这样的体会:刚刚开始的前前几节课感觉很轻松,可是学着学着就开始犯糊涂了,晕车现象较为严重。

原因在哪里呢?许多人给出的答案是数学基础差,而我却认为症结不在这里。

统计学的概念与统计思维较为抽象,不易理解;方法丰富、适用范围与对数据的要求不尽相同,掌握起来困难,实际应用时常有无从下手的困惑;统计学内容的连贯性很强,环环相扣,而且前一环恰是下一环的基础;如果中间环节脱落,对后面内容的学习往往会有超出想象的影响。

现从统计学中的一个概念谈谈如何理解统计学的概念,并从应用层面看其与其他知识点的融合。

概率是统计学的一个重要的基本概念,它反映事件或现象发生可能性的大小,用P表示;当P=1时,表示肯定发生,即为必然事件,P=0时,肯定不会发生,即为不可能事件,P介于0与1之间,可能发生也可能不发生,即为随机事件。

统计学重点关注的是随机事件在一次试验中发生的概率。

掷币的结果有两种可能,要么正面朝上,要么反面朝上,概率均为0.5;如果只进行一次掷币试验,那么在掷币前我们无法确定掷币的结果到底是哪种情况,即朝上的面是正还是反。

掷币的结果就是一种随机事件。

小概率事件即发生概率很小的事件(通常指P≤0.05或0.01)在统计学中有着重要的应用。

对于小概率事件,很容易理解;即这样的事件理论上可以发生但发生的概率较小,在一次试验中发生的可能性则几乎为零。

如买彩票中大奖就是典型的小概率事件。

也许每一期均会有大奖开出(概率超低),但对于某一个彩民来说他买一注就中大奖的可能性(小概率事件在一次试验中就发生的概率)几乎没有。

其实这就是小概率事件在统计学上应用的重要理论依据——小概率原理,即小概率事件在一次试验中发生的可能性很小,如果真的发生了,统计学则怀疑其真实性。

心理统计学第08讲 假设检验_Password_Removed

心理统计学第08讲  假设检验_Password_Removed

n
=a
Z
n
n
(Z Z )2 (0 -a )2
2
3、样本容量的估计
I型错误说明,如果货物中电池寿命 均值为=120时,那么我们愿冒=.05 的风险概率拒绝这批货物。
假定货物中电池寿命的均值比规格要求 少5小时(也就是能允许的误差) 那么,我们愿冒多大的风险 接受这批均值可能不足120的货物呢? 如果我们能承受的 风险概率为0.10(即=0.10) 那么所需样本容量为多少呢?
解: H0:μ1= μ2
SED
2 1
2 2
n1 n2
(或SED
S12 S22 ) n1 n2
Z ( X1 X 2 ) (1 2 ) SED
X1 X 2 D1 X1 X 2 D2 ……
X1 X 2 Dk
学Ha: μ1≠ μ2
Z ( X1 X 2 ) (1 2 ) (82 78.2) 0 3.185
n
(Z Z )2 2 (0 2 (120 115)2
49.3

一、总体服从正态分布
教 第二节 单总体均值的假设检验
(一)大样本的情形( n≥30 ):Z检验
1、双侧检验
(1)假设形式: H0:μ=μ0 Ha:μ≠ μ0
危机域
(2)理论模型:正态分布
/2
/2
学(3)检验统计量:σ已知:Z
X
/
0 n
Z / 2
Z / 2
σ未知:Z X 0 S/ n
(4)统计决策:Z>Zα/2或Z<-Zα/2 ,则拒绝H0 ,否则无充分理
由拒绝H0
资 (5)示例
一、总体服从正态分布
料 一、总体服从正态分布
2、单侧检验

《概率统计教学资料》第7章假设检验

《概率统计教学资料》第7章假设检验
置信区间可以给出更全面的信息,因为它同时给出了估计值的可能范围和置信水平。但是,置信区间 的计算比假设检验更为复杂,且在某些情况下可能无法给出明确的结论。
THANKS
感谢观看
《概率统计教学资料》 第7章 假设检验
目录
• 假设检验的基本概念 • 参数假设检验 • 非参数假设检验 • 假设检验的注意事项
01
假设检验的基本概念
定义与原理
定义
假设检验是一种统计推断方法, 通过样本数据对总体参数作出假 设,然后利用适当的统计量进行 检验,以决定假设是否成立。
原理
假设检验基于概率原则,通过比 较样本数据与理论分布或预期结 果,对假设作出接受或拒绝的决 策。
的统计量。
双参数假设检验
双参数假设检验是在单参数假设检验的基础上发展而来的,它主要针对 两个参数进行检验,判断这两个参数是否符合预期或是否具有显著性差 异。
常见的双参数假设检验方法包括配对样本T检验、相关性检验、回归分析 等,这些方法在处理具有两个变量的问题时非常有用。
双参数假设检验的步骤与单参数假设检验类似,也需要提出假设、构造 检验统计量、确定临界值、做出推断结论等步骤,但在实际应用中需要 注意处理两个参数之间的关系。
02
参数假设检验
单参数假设检验
单参数假设检验是假设检验中最基础和 最常用的类型,它主要针对单一参数进 行检验,判断该参数是否符合预期或是
否具有显著性差异。
常见的单参数假设检验方法包括t检验、 Z检验、卡方检验等,这些方法在统计 学教材和实际应用中均有广泛应用。
单参数假设检验的步骤包括提出假设、 构造检验统计量、确定临界值、做出推 断结论等步骤,其中构造检验统计量是 关键步骤,需要根据具体问题选择合适

概率论与数理统计课件 假设检验共64页

概率论与数理统计课件 假设检验共64页


27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰

28、知之者不如好之者,好之者不如乐之者。——孔子

29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇

30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
64
概率论与数理统计课件 假设检验

26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索

27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克

28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯

29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•Leabharlann 30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭

浅谈小概率事件原理及其应用

浅谈小概率事件原理及其应用

浅谈小概率事件原理及其应用什么是小概率事件?小概率事件是指发生概率非常小的事件,通常被定义为小于某个特定临界值的概率事件。

根据具体情况,这个临界值通常在10的负几次方到10的负六、七次方之间,这意味着这类事件发生的可能性极小。

一个常见的小概率事件是中彩票。

以双色球为例,中得一等奖的概率是1/11,801,632,这是一个小概率事件。

另一个例子是地震,尽管发生地震的可能性随地区而异,但在大多数情况下,发生地震的概率也相对较小。

这些事件往往具有不可预测性,不能以准确的方式进行预测或控制。

小概率事件原理小概率事件原理是指,尽管小概率事件的发生概率非常小,但它们仍然会发生。

这个原理基于概率论的基础,在概率不为0的情况下,即便是小概率事件,也有可能会出现。

尽管频率非常低,但只要尝试足够多次,总有一次会出现。

一个常用的例子是抛硬币。

即使抛100次硬币,极有可能出现50次正面和50次反面,但也有可能出现40次正面和60次反面,或者其他不同的组合。

尽管某个事件的发生概率非常小,但由于有多种可能性,只要尝试次数足够多,这种小概率事件最终也会出现。

小概率事件的应用小概率事件在许多领域都有应用,包括统计学、风险评估、金融和保险等。

以下是一些具体应用:统计学在统计学中,小概率事件往往与极值问题相关。

例如,在金融市场中,极端事件如黑天鹅事件可能会影响股票或债券的价格。

为了处理这种风险,统计学家们会使用极值理论,即对极端事件的概率进行建模,并开发出相应的风险管理策略。

风险评估在风险评估领域,小概率事件通常意味着不可预测或难以预测的风险。

这类事件往往具有极高的代价,因此需要制定风险管理策略。

例如,在医学领域,小概率事件包括手术失误、药物过敏等,这些事件可能会对病人的健康产生重大影响。

医院和医生通常会通过短期和长期的风险评估来管理这些风险。

金融在金融领域,小概率事件通常意味着市场波动性增加。

例如,在某一天内出现大宗交易的情况,可能会导致市场价格的短暂变化。

概率论与数理统计81假设检验的基本原理课件

概率论与数理统计81假设检验的基本原理课件

假设检验的推断方法
显著性水平
显著性水平是假设检验中判断假 设是否成立的临界值,通常取 0.05或0.01。
拒绝域与接受域
拒绝域是当样本数据落在该区域内 时,拒绝原假设的区域;接受域是 当样本数据落在该区域内时,接受 原假设的区域。
两类错误
在假设检验中,可能会犯两类错误 ,即第一类错误(拒真)和第二类 错误(受假)。
概率论与数理统计81 假设 检验的基本原理
目录
• 假设检验的基本概念 • 假设检验的统计推断 • 参数假设检验 • 非参数假设检验 • 假设检验的常见问题
01
假设检验的基本概念
定义与原理
定义
假设检验是一种统计推断方法,其基 本原理是利用样本数据对未知的总体 参数进行判断。
原理
假设检验基于概率原则,通过样本数 据对总体做出推断,利用小概率事件 的不易发生性进行假设检验。
秩和检验
定义
原理
应用
秩和检验是一种非参数假设检 验方法,用于比较两个独立样 本的中位数差异是否显著。
秩和检验基于秩和统计量,该 统计量是通过对两个独立样本 的观测值进行排序并赋予秩值 来计算差异的度量。如果差异 显著,则认为两个独立样本的 中位数存在显著差异。
秩和检验在处理独立样本数据 时非常有用,例如在医学中对 两种药物的效果进行比较、在 社会科学中对两组公司的销售 额进行比较等。
多参数假设检验
确定原假设和备择假设:与单 参数假设检验相同。
构造检验统计量:根据样本数 据和原假设,构造多个统计量 ,用于检验原假设是否成立。
确定临界值:根据样本数据和 备择假设,确定多个临界值, 用于判断原假设是否成立。
做出推断:根据检验统计量和 临界值,做出是否拒绝原假设 的推断。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计与决策2012年第17期·总第365

统计假设检验中小概率原理的辨析
吴启富,张玉春
(首都经济贸易大学统计学院,北京100070)
摘要:假设检验是统计学的核心内容之一,其基本逻辑就是小概率原理,文章从观察数据与原假设的差
异与相应概率的联系分析中,阐述了统计假设检验的小概率原理,揭示了假设检验的内在方法论基础。

关键词:假设检验;差异;小概率原理中图分类号:O211文献标识码:A 文章编号:1002-6487(2012)17-0070-02
作者简介:吴启富(1966-),山西汾阳人,硕士,教授,研究方向:统计基本理论、社会统计。

张玉春(1974-),山西灵丘人,博士,副教授,研究方向:统计基本理论、金融工程。

0引言
统计假设检验是经典统计学的核心内容,也是现代统计学各种方法的基础,广泛应用在医药、工程、经济学等众多领域。

但其哲学方法论基础和数学原理是人们理解该方法的难以逾越的门槛,使得统计假设检验成为学习概率论与数理统计课程的难点之一,对其基本思想的不正确理解,造成许多统计方法的滥用。

本文将重点从假设检验的基本逻辑角度分析其小概率原理。

对于假设检验的研究是统计教学研究的重点内容之一。

但更多的学者是从检验假设的建立或针对检验中的两类错误等展开研究,如王静等分析了原假设与备择假设的辩证关系,杨少华等研究了原假设与备择假设的交换问题,甘伦知探讨了第二类错误的控制问题。

樊明智等则从区间估计角度分析了假设建立的方法。

而对于假设检验中最基本的小概率原理探讨比较少,从仅有的文献看多是从具体应用方面或公式验证角度分析,如史智才等从经济学角度分析了小概率事件的收敛性,徐波研究了小概率事件的概率分布。

从现有《统计学》教材看,大多侧重于假设检验的操作和检验结果的正确理解方面。

如国内比较通用的贾俊平编著的《统计学》主要介绍了假设的建立、统计量的计算和软件的操作。

另一本常用教材吴喜之编著的《统计学:从数据到结论》在简要介绍了假设检验的基本逻辑之后,主要讲解了各种情况的软件操作,而对统计假设检验的最基本原理——小概率原理论述不够深入。

本文主要结合笔者多年统计学教学体会从样本观察数据与原假设之差异及其对应概率的联系方面讨论统计假设检验的小概率原理。

1小概率的本质含义
统计假设检验就是针对所研究的问题,提出一个“命
题”或曰“假设”,然后抽取样本,观察样本数据与所提出的假设的不一致程度,如果二者相差甚远,即二者差异已经达到“足够大”的程度,就说明原来提出的假设是不成立的。

这种判断假设真伪的思路实际上就是我们要探讨的“小概率原理”。

所谓“小概率原理”就是某个事件如果在随机试验中发生的概率很小,那么该事件在一次随机试验中是不应该出现的(本应该说出现的概率很小,但如果小到一定程度,就可以说在很大程度上是不会发生的)。

利用小概率原理来判断是否应该拒绝所提出的假设即原假设,主要在于判断所抽取的样本数据与原假设的差异是否足够大,对于二者差异大小的判断有两个表象不同但本质一致的尺度:统计量和概率。

统计量是由随机抽样所得的样本数据构造的函数,可以测度来自某总体的样本长远而稳定的信息,如样本均值、样本方差、样本比率等,以及在此基础上构造的t 、χ2、F 等统计量。

统计量是由样本数据构造的,而样本
数据是随机抽取的,所以样本数据是不确定的、随机的,由其计算所得的统计量也就是随机的。

而总体参数是确定但未知的,假设的命题即原假设中关于总体参数的假定是确定而且明确的,一般来讲二者是不一致的。

造成样本统计量数值与假定的总体参数数值不一致的原因有两个:随机差异和条件差异。

不同的原因产生的差异程度不同,一般情况下,随机差异经常存在,但差异程度不大,条件差异不一定存在,但一旦存在,造成的差异就会比较大。

所以,统计量数值与假定总体参数数值差异较小时,不能判定原假设有错(注意不是说判定原假设是对的),如果二者差异较大,说明除随机差异外还有其他原因造成的条件差异,即说明原来的假定存在问题,也就是说根据样本数据可以否定原假设。

但是直接根据统计量的数值与原假设中假定的总体参数的数值比较,很难断定差异的程度大小,比如推断某
70
统计与决策2012年第17期·总第365

次学生考试的平均成绩,提出原假设:μ=80。

为了验证该假设是否确实,随机抽取36名学生的考试成绩,计算的平均成绩为70分,二者相差10分,这10分的差异算不算大呢?这就需要借助概率来分析。

在正常条件下,即原假设成立的前提下,样本统计量与总体参数之间的差异比较小,即该差异较小的概率较大,而该差异较大的概率很小,也就是说在一次试验中,样本统计量与假定的总体参数的差异如果较大,则说明产生差异的原因不只是随机因素,应该还有其他原因。

但这种判断不是绝对正确,有可能是错误的。

犯这种错误的可能性大小取决于事先规定的小概率事件“小”的程度。

这种判断小概率的标准就是统计假设检验中所谓的显著性水平。

这种显著性水平就为我们判定差异的大小提供了标准。

这样就产生了判断差异大小的第二个尺度——概率。

如果在原假设成立的前提下计算的出现样本数据的概率(即统计检验中所谓的P 值)小于所规定的显著性水平(一般用α表示),即P<α,表明在原假设成立的前提下,出现样本这种情况的的可能性很小,产生差异的原因不只是随机误差,应该还存在其他条件差异,说明原假设不正确,即我们有足够的证据否定原假设。

如果P>α,表明在原假设成立的前提下,出现样本这种情况是很正常的,二者的差异仅仅是由于随机原因产生的,样本数据不足以否定原假设,我们不能说原假设是错的。

差异大小与
相应概率的关系如下图所示:
在实际抽样中,我们抽到的是对客观现象度量的客观数据,如上例所说的考试分数,或者其他的如重量(千克)、距离(cm )等等,并不是概率。

为了将观察到的数据即统计量的数值转换成能够判断差异大小的概率,需要将其标准化,如上例学生考试的成绩,我们假定总体平均成绩为80分,而抽样的样本平均成绩为70分,二者相差10分,如果原假设是正确的,那么样本均值离开总体均值达到10分及10以上差距的概率多大呢?为求其概率,我们首先要将该差异标准化,即:
z =
x 其中,x ˉ为样本均值,即x ˉ=70;μ0为假定的总体均值,即μ0=80;n 为样本容量,即n =36;σ为总体数据的标准差,若σ未知时可用样本标准差s 替代。

如果假设s =30,
则:z
=x ˉ-μ
==2
由抽样分布的知识可知z 为服从标准正态分布的统计量,即z ~N (0,σ2
n
),由此可知:
p (||z >2)=p (z >2)+p (z <-2)=1-95.45%=4.55%
上式表明,样本均值离开总体均值的距离达到或超过10分的概率仅为4.55%,也就是说如果总体均值确实是80分的话,我们重复抽取100个样本,仅有4到5个样本的均值会达到相差10分的程度。

如果我们规定5%为小概率的标准,那么4.55%就为小概率,据此我们就可以说如果原假设正确,即总体均值确实为80分,出现这样的样本是小概率事件,在一次抽样中是不应该出现的,但现实是我们确实抽到了这样的样本,在此情况下,我们是相信原先的假定呢,还是相信眼前的事实呢?很显然我们只能相信事实,即认为原先的假定是不成立的,理所当然做出否定原假设的结论。

2结论
综上所述,假设检验的依据是小概率原理,其具体判断方法有两种:一是直接根据样本观测值与假设之间的距离大小判断,距离越大,拒绝原假设的理由越充分;二是将二者之间的距离转换成概率来判断,概率越小,拒绝原假设的理由越充分。

那么根据样本数据我们否定原假设是不是100%的正确呢?不是,因为正如上文所言,样本数据是随机抽取的,是不确定的,有其偶然性。

即即使关于总体参数的原假设是正确的,远离其假定值的样本数据也有可能出现,只不过是在一次抽样中出现的可能性很小,我们根据样本数据做出拒绝原假设的结论是有可能犯错误的,但犯这种错误的概率很小,小到我们所认为的“小的程度”。

如果出现了小概率事件而我们不拒绝原假设,那么犯错误的概率就会
很大,两害相权取其轻,我们自然会选择拒绝原假设的结论。

由此也可以发现,对于统计检验的结论,只有在概率的意义上是成立的,不能教条地理解,要灵活的应用。

参考文献:
[1]王静,史济洲.设立原假设中的辩证分析[J].统计研究,2010,(6).[2]杨少华,杨林涛.参数假设检验中原假设与备择假设的交换问题[J].统计与决策,2009,(5).[3]甘伦知.假设检验中控制第二类错误的探讨[J].统计与决策,2011,(22).
[4]樊明智,王芬玲.区间估计与假设检验[J].统计与决策,2006,(12).
[5]史智才,肖诗顺.基于小概率事件的方法论[J].统计与决策,2012,(1).[6]徐波.假设检验中的小概率事件[J].黔西南民族师范高等专科学校学报,2009,(3)
[7]贾俊平.统计学(第3版)[M].北京:中国人民大学出版社,2008.[6]吴喜之.统计学:从数据到结论(第2版)[M].北京:中国统计出版
社,2006.
(责任编辑/亦民)
71。

相关文档
最新文档