第六章 假设检验(Hypothesis test)
第六章 假设检验2006
第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。
假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。
本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。
第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。
例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。
上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。
假设检验(Hypothesis
假设检验(Hypothesis Test)假设检验是数理统计中按照⼀定的假设条件由样本推断总体的⼀种⽅法,因此假设检验也成为“显著性检验(Test of statistical significant)”,是研究样本与样本之间、样本与总体之间的误差是由抽样误差引起的还是本质误差的统计推断⽅法。
它的基本思想是在假设成⽴的条件下,根据某个统计⽅法(如Z检验、卡⽅检验等)的⽅法估计输⼊数据的统计特性,根据统计特性和输⼊数据的分布估计假设成⽴的概率⼤⼩,如果⼩于某⼀个预先设定的“显著性⽔平(significant level)”则说明假设不成⽴,反之则说明假设成⽴。
假设检验所定义的假设成为零假设,数学上⼀般写成H0(念:H-nought)。
与H0对⽴的假设,即对⽴假设,也称为备择假设。
由于我们对于假设的判断是基于概率统计所作出的判断,那么我们就很有可能(⼀定的概率)做出错误的判断。
错误分两种,第⼀类错误为H0假设成⽴,但是我们却认为它不成⽴,第⼆类错误是说H0不成⽴,但是我们却认为它成⽴。
⼀般⽽⾔,第⼀类错误更难为⼈所忍受,所以在判断时,允许犯这种错误的可能性必须要极低——即犯第⼀类错的事件应该是⼀个⼩概率事件。
假设检验就是基于这种⼩概率原理,即事先确定的作为判断的标准,即允许犯错的⼩概率标准,这种⼩概率标准就是统计学上定义的“显著性⽔平-α”,如果根据假设计算出来的概率⼩于这个显著性⽔平,则拒绝原假设,反之,如果⼤于这个标准,则承认原假设。
因此,⼀般把1-α称为“置信区间”或者“接收区间”,⼩于α的区间称为“拒绝区间”。
举个例⼦来说明,⼀个⼈被控诉犯罪,陪审团根据现有的条件做出对这个⼈有罪还是⽆罪的判断。
事实上,陪审团就是进⾏⼀个假设检验。
假设H0:被告⽆罪假设H1:被告有罪当然,陪审团现在还不知道哪个假设是成⽴的,他们必须根据控辩双⽅的证词做出判断,判断的结果只有两种,⼀种是被告⽆罪释放,⼀种是被告罪名成⽴。
06.假设检验基础
个统计量落入区域 拒绝域 是个小概率事件。
如果该统计量的实测值落入拒绝域,也就是说,
H0 成立下的小概率事件发生了,那么就认为H0
不可信而否定它。否则我们就不能否定H0 (只
好接受它).
假设检验的基本步骤:
1. 建立检验假设,确定检验水准;
H0:零假设、无效假设。是与研究假设有关的、被推断特 征某种确定的关系; H1:备择假设、对立假设。是被推断总体特征的另一种关 系或状况,与H0既有联系又互相对立。 检验水准,将小概率事件具体化,即规定概率不超过 就是小概率。
应用条件:差值服从正态分布!
假设检验的步骤
1. 建立检验假设,确定检验水准;
H 0 : d 0, H 1 : d 0,
0.05(双侧)
2. 计算统计量;
d 0 ~ t , n 1 Sd n
t
X 0 X 0 t , n 1 SX S n
假设检验
——通过对假设作出取舍抉择来达到解决问题的目的
A.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数相等无差异假设、零假设 H0(null hypothesis)
B.东北某县儿童囱门闭和月龄的总体均数与北方一般儿
童的均数不相等对立假设、备择假设H1(alternative
hypothesis)
单样本t检验
One sample t-test
试验设计
一组样本均数(代表未知总体均数)与已知总 体均数(一般为理论值、标准值或经过大量
观察所得稳定值等)的比较。
X 0 X 0 t , n 1 SX S n
应用条件:样本来自正态分布的总体 且为随机样本!
例:根据大量调查,已知健康成年男子的脉
第6章假设检验
H0: 1000
H1: 1000
27
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
研究的问题
假设
双侧检验 H0 H1 = ≠ 左侧检验 < 右侧检验 >
28
All rights reserved
建立的原假设与备择假设应为 H0: 10 H1: 10
23
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
单侧检验
备择假设具有特定的方向性,并含有符号“>”或 “<”的假设检验,称为单侧检验或单尾检验(onetailed test) 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
14
All rights reserved
假设的陈述(续)
南审数统学院
零假设的提出
所假设的总体参数值为研究者认为不对的总 体参数值 实质:科学研究中的保守主义 比如:新的工艺或技术没有造成任何改变, 新药没有任何疗效,变量间没有联系
15
All rights reserved
假设的陈述(续)
24
All rights reserved
南审数统学院
双侧检验和单侧检验(续)
例析:
一项研究表明,采用新技术生产后,将会使产品的 使用寿命明显延长到1500小时以上。检验这一结论 是否成立 研究者总是想证明自己的研究结论(寿命延长) 是正确的 备择假设的方向为“>”(寿命延长) 建立的原假设与备择假设应为 H0: 1500 H1: 1500
(卫生统计学)第六章 假设检验基础
药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
编号 1 2 3 4 5 6 7 8 9 10 11 12
用药前 1206.4 921.69 1294.08 945.36 721.36 692.32 980.01 691.01 910.39 568.56 1105.52 757.43
用药后 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
目的
H0
H1
双侧检验 是否μ1≠μ2
μ1=μ2
μ1≠μ2
单侧检验 是否μ1>μ2
μ1=μ2
μ1>μ2
或是否μ1<μ2
μ1=μ2
μ1<μ2
返回
选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如 成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本), 两样本方差的比较用F检验。
(卫生统计学)第六章 假设检验基础
第一节、假设检验的概念与原理 一、假设检验的思维逻辑
1.小概率原理 小概率事件在一次随机试验中几乎是不可能发生
2.假设检验处理问题的特点 ⑴从全局的范围,即从总体上对问题作出判断 ⑵不可能对总体的每个个体均作观察
二、假设检验步骤
例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名 儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月 龄的均数是否大于一般儿童?
四、方差齐性检验 homogeneity of variance test
Chapter 6 假设检验
α/2
拒绝H0
1-α 接受H0
α/2
拒绝H0
II类(取伪):即P(接受H0|
),常为ß
6.4单侧检验问题
单侧问题:一批产品,供给方称其平均寿命 不小于1000小时。抽样,验证是否可信 标准值为“效益”类:越大越好 标准值为“成本费用”类:越小越好 难点:如何定
368 gm.
H0: m = 368 H1: m 368
Steps of Hypothesis Test 假设检验的步骤 提出原假设H0与备选假设H1; 选择检验统计量;
给定显著性水平α,确定拒绝域;
由样本值计算统计量的值;
作判断,确定接受还是拒绝H0。
H0: m = 386 H1: m 386
又Za=1.96,-Za=-1.96(临界点) 由1.25>-1.96 故接受H0,即认为可以相信已达标
2: H0: μ μ 0 =1000 H1: μ > μ 0 =1000 有统计量:
Z =
X m
1010 1000 = = 1Байду номын сангаас25 80 n 100
又Za=1.646 故应取H0,即认为未能达标
思考:如何处理为好?如何理解矛盾的结论?
区间估计
对m无先验信息
假设检验
有经验值或标准值
抽样定区间
理论严格
抽样看是否差不多
不严格,不能避免犯错误
3、对
的进一步理解
“=”表示差异不大、不明显、差不多; “≠”表示有显著差异。 这里的“=”与“≠”仅有形式上等与不 等的逻辑互补关系,但只能借其形式表达 “差不多”与“差异显著”两种倾向。
假设检验
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
第六章 假设检验
Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布
假设检验(Hypothesis Testing)
假设检验(HypothesisTesting)假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。
当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。
假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。
假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。
假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
2.假设的形式H0——原假设,H1——备择假设双尾检验:H0:μ = μ0,单尾检验:,H1:μ < μ0,H1:μ > μ0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
假设检验
例2:某种零件的尺寸,要求其平均长度为4厘米,大于或小于4 厘米均属于不合格。该企业生产的零件平均长度是4厘米吗?
提出原假设 H0: = 4厘米
提出备择假设 H1: 4厘米
单边检验
例1:某灯泡制造商声称,该企业所生产的灯泡的平均使用 寿命在1000小时以上。该批产品的平均使用寿命超过1000小 时吗?
x 0 t ~ t (n 1) s n
正态总体、方差未知、小样本情况下,样本统计量的抽样分布
t
正态 分布
X S n
~ t (n 1)
正态分布 t (df = 13) t (df = 5)
t 分布
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
总体均值的检验—— t 检验(双边)
提出原假设H0: 1000 选择备择假设 H1: < 1000
例2:学生中通宵上网的人数超过25%吗?
提出原假设H0: 25%
选择备择假设 H1: 25%
例3:消费者协会接到消费者投诉,指控某品牌纸包装饮料 容量不足,有欺骗消费者之嫌。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,包装上标明的容量为250毫升, 但测试发现平均含量为248毫升,小于250毫升。这是生产中 正常的波动,还是厂商的有意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了消费者呢?
2 2
Z 1.96
2
决策准则
当 Z Z ,即Z Z 或Z Z 时 拒绝H 0
2 2 2
当 Z Z ,即 Z Z Z 时 接受H 0
假设检验(hypothesis testing)
假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOV A)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
第六章-假设检验(Hypothesis-test)
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
➢ 根据α值和抽样分布,确定临界值。 ➢ 将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。 ➢ 或以检验统计量计算p值,确定是否拒绝H0 。
Back
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。
统计软件给出检验统计量的数值时,一般都给出该
Back
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
➢ 是决策中的风险。主观确定。 ➢ α一般取0.05或0.01。
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
➢ 假设检验也是从抽样分布出发,借由样本数据 计算检验统计量的数值进行推断。
检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs)
右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
以p值进行假设检验:
α/2
1 -α
α/2
p值>α,接受H0
-1.96
1.96(临界值)
计算的检验统计量数值
p值<α ,拒绝H0
Back
第6章 假设检验
二、 假设检验的步骤 提出原假设和备择假设 /备择假设 确定适当的检验统计量 规定显著性水平: 根据显著性水平α及检验
统计量的查找临界值,并确定拒绝域。注 意是单侧检验还是双侧检验
计算检验统计量的值: 从总体中抽取某一样 本,据样本资料计算检验统计量的值 作出统计决策: 若检验统计量的值落在拒绝 域内就拒绝H0,否则接受H0
置信水平
拒绝域
a/2
1 - 接受域
H0值
a/2
临界值
临界值
样本统计量
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1 - 接受域 H 0值 样本统计量 置信水平 拒绝域 a/2
临界值
临界值
例如 ,一个灯光厂需要生产平均使用寿命 µ = 1000小时的灯泡。为了观察生产工艺过程是否正常, 从一批产品中抽取150个进行检验,得到平均使用 寿命980小时,能否断定这个厂生产的灯泡平均使 用寿命为1000小时?为什么? 不希望在1000小时任何一边超越太多,假设: H0: µ = 1000 (平均使用寿命为1000) H1: µ ≠ 1000 (平均使用寿命不是1000) 我们在这里提出的原假设是µ =1000,所以只要 µ >1000或µ <1000二者中有一个成立就可以否定原假 设(平均使用寿命为1000)。
标准误计算公式
σ已知: σ未知: S
X
n
X
S n
实例:如某年某市120名12岁健康男孩,已求 得 均数为143.07cm,标准差为5.70cm,按公 式计算,则标准误为:
SX
5 . 70 120
0 . 52
标准误的应用
假设检验(HypothesisTesting)
假设检验(HypothesisTesting)假设检验的定义假设检验:先对总体参数提出某种假设,然后利⽤样本数据判断假设是否成⽴。
在逻辑上,假设检验采⽤了反证法,即先提出假设,再通过适当的统计学⽅法证明这个假设基本不可能是真的。
(说“基本”是因为统计得出的结果来⾃于随机样本,结论不可能是绝对的,所以我们只能根据概率上的⼀些依据进⾏相关的判断。
)假设检验依据的是⼩概率思想,即⼩概率事件在⼀次试验中基本上不会发⽣。
如果样本数据拒绝该假设,那么我们说该假设检验结果具有统计显著性。
⼀项检验结果在统计上是“显著的”,意思是指样本和总体之间的差别不是由于抽样误差或偶然⽽造成的。
假设检验的术语零假设(null hypothesis):是试验者想收集证据予以反对的假设,也称为原假设,通常记为 H0。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值。
备择假设(alternative hypothesis):是试验者想收集证据予以⽀持的假设,通常记为H1或 Ha。
例如:备择假设是测试版本的指标均值⼤于原始版本的指标均值。
双尾检验(two-tailed test):如果备择假设没有特定的⽅向性,并含有符号“=”,这样的检验称为双尾检验。
例如:零假设是测试版本的指标均值等于原始版本的指标均值,备择假设是测试版本的指标均值不等于原始版本的指标均值。
单尾检验(one-tailed test):如果备择假设具有特定的⽅向性,并含有符号 “>” 或 “<” ,这样的检验称为单尾检验。
单尾检验分为左尾(lower tail)和右尾(upper tail)。
例如:零假设是测试版本的指标均值⼩于等于原始版本的指标均值,备择假设是测试版本的指标均值⼤于原始版本的指标均值。
检验统计量(test statistic):⽤于假设检验计算的统计量。
例如:Z值、t值、F值、卡⽅值。
显著性⽔平(level of significance):当零假设为真时,错误拒绝零假设的临界概率,即犯第⼀类错误的最⼤概率,⽤α表⽰。
06参数估计与假设检验(医学统计学)
三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。
假设检验名词解释
假设检验名词解释假设检验(HypothesisTesting)是统计学的一个重要的研究方式,也是利用统计分析处理潜在关系的有效方法。
它可以对两个或以上未知概率分布里的统计差异进行验证,以确定它们之间是否有实质性差异。
下面是一些关于假设检验的常见术语。
检验假设(HypothesisTesting):检验假设是一种统计分析方法,可以通过收集数据并进行检验,以确定两个或多个未知概率分布之间是否存在实质性差异。
研究假设(ResearchHypothesis):研究假设是在开展假设检验之前需要设立的假设性断言,以指导研究过程。
一般情况下,在研究假设中,应参考变量和观察变量之间的关系,以确定受试者在某个环境下,是否表现出某种特定效应或变化。
零假设(NullHypothesis):零假设是研究假设的反义词,针对研究假设,它先假定比较变量之间没有实质性差异。
而研究假设表示,两个变量之间存在某种实质性差异。
显著性水平(Significance Level):显著性水平是研究中的概念,用于衡量统计检验的可靠程度。
它表示统计检验的结果,是一种对研究假设或零假设的支持程度,用于衡量受试者的行为差异的实质性和可靠性。
拒绝域(Rejection Region):拒绝域是统计检验中的概念,用于衡量检验假设与零假设之间差异的大小,以决定是否拒绝零假设。
拒绝域表明,在满足特定显著性水平的情况下,多少次试验结果就足以表明两个变量之间存在某种实质差异。
样本大小(SampleSize):样本大小是指在进行统计检验时,受试者的数量。
样本越大,获得更多有意义结论的可能性就越大,但是样本越大,所需时间就越长。
p值(pValue):p值是一个概念,用于衡量统计检验结果的可靠性,它表示有多少可能性发生统计检验中参与变量之间存在的差异是由于随机性,而不是真实差异。
p值用于确定零假设是否应被拒绝,只有当p值小于显著性水平,才能够拒绝零假设。
假设检验是一种有效的统计分析方法,在决策过程中有许多应用,比如市场营销决策、投资决策、政策决策等。
第6章 假设检验基础
5
配对设计资料的 t 检验
n 配对设计(paired design)是一种特殊的设计方式,能够 很好地控制非实验因素对结果的影响,有自身配对和异 体配对之分。
n 配对设计资料的分析着眼于每一对观察值之差,这些差 值构成一组资料,用 t 检验推断“差值的总体均数是否为 0”。
3.48
3.50
0.02
…
…
…
…
12
2.69
2.66
0.03
13
3.09
3.20
0.11
14
2.98
2.92
0.06
15
2.65
2.60
0.05
8
1. 建立检验假设,确定检验水准
H 0 : md = 0 ,即差值的总体均数为 0 H 1 :md ¹ 0 ,即差值的总体均数不为 0
2. 计算统计量 n=15, d =0.06, sd = 0.10
X1 ~ N( m1 ,s 2 ), X2 ~ N( m2 ,s 2 )
1. 建立检验假设,确定检验水准
H0: m1 = m2 , 或 m1 - m2 = 0 H1: m1 ¹ m2, 或 m1 - m2 ¹ 0
a =0.05
4
2. 计算统计量
X1
~
N(
m1
s2
, n1
)
,
X2
~
N(
m2
s2
, n2
小结(Summary)
1. t 检验是以 t 分布为基础的一类比较均数的假设检验方法。 2. t 检验的应用条件为随机样本、来自正态总体、方差齐性。 3. 单样本 t 检验是推断该样本所属总体的均数与已知的某一 数值有无差别。配对设计资料的 t 检验着眼于差值的总体均 数是否为0。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0:
Back 11
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
平均数的差异性 t 检验
主讲人:朱
丹
假设检验
你相信他们的说法吗? 你要如何去证明这些说法 是正确或是错误?
对总体参数、分布形式、相互关系等提出假 设,然后利用样本数据来判断该假设论述的 合理性。
• 假设来西藏旅游的外国旅客平均消费支出8000元。 • 有人提出拉萨市民人均月收入是2500元。 • 有人提出西藏大学学生的平均IQ测验分数是110。
足以拒绝它而已。
故常用“拒绝H0”或“不拒绝H0”的表述方式。
Back 22
第二节 单一总体均值的假设检验
单一总体,关于定量数据的检验。
西藏外国旅客平均旅游消费支出5000元? 经管学院毕业生平均起薪为每月2500元? 女性消费者每年在化妆品的平均支出3500元? 2010级统计学平均成绩为70分?
Back 16
三、两类错误
弃真错误
如前例,厂商声称产 品合格率是99%。100 件中确实只有1件次品。 进行抽样时,刚好1次 被抽到次品,这种错 误称弃真错误(第Ⅰ 类错误),错误概率 是1%(α)。
取伪错误
厂商声称产品合格率 是99%,实际上仅有 90%,表示100件中有 10件次品。为了检验 厂商宣称是否真实, 我们随机抽取20件产 品,结果都是合格品, 于是我们推断厂商宣 称是真实的。犯第二 类错误,错误概率β。
Back 21
计算的检验统计量数值
六、正确表述统计决策结果
统计决策得出:拒绝或不拒绝H0。
“不拒绝H0”不等同于“接受H0”
“不拒绝H0”只是说明根据现有样本不能认为H0
有问题,但重新抽取一个样本就有可能推翻H0。
如果说成“接受H0”,就等于认为H0在任何条件
下都是成立的。
没能拒绝H0,只是表示现有样本提供的证据还不
Back 17
四、假设检验的步骤
Step1:提出原假设 H0 和备择假设 H1
例如:H0:μ=μ0;H1:μ≠μ0
Step2:确定显著性水平α
是决策中的风险。主观确定。 α一般取0.05或0.01。
18
四、假设检验的步骤
Step3:选择检验统计量(Test Statistic)
假设检验也是从抽样分布出发,借由样本数据
Back5
一、建立假设
原假设/虚无假设(null hypothesis):H0
研究者要收集证据予以反对的假设。 将研究结果无效的说法作为原假设。
设定总体参数等于某一数值。
认为两个或两个以上总体参数相等。
H0:μ=2500 H 0 : μ 1 = μ2
OR
H0:μ≥2500 (收入)
计算检验统计量的数值进行推断。
确定H0为真时,检验统计量服从的抽样分布。
• 例如:总体服从正态分布,且σ已知,则构 造检验统计量Z,在H0为真的情况下,有
X 0 Z ~ N 0,1 n
可以确定临界值,构 造拒绝域和接受域。
19
四、假设检验的步骤
Step4:计算检验统计量的数值
根据样本数据计算检验统计量的数值。
此时,H0:员工满意度和性别无关
7
一、建立假设
备择假设(alternative hypothesis) :H1
研究者要收集证据予以支持的假设。 将研究结果有效的假设作为备择假设。
与原假设对立,是要研究的问题。
强调差异或方向性。
例如,某品牌洗涤剂的产品, H1:μ<500
例如, H1:员工满意度和性别有关
检验统计量所有可能取值分两为部分,可以拒绝H0 的检验统计量取值的集合称拒绝域。反之,称接受 域,不拒绝H0。划分的数值称临界值。
接受域的区间概率1-α,拒绝域的区间概率α。
如何定义接受域和拒绝域?
13
双侧假设检验的拒绝域定义:
H0:μ=μ0; H1:μ≠μ0
•只要μ>μ0或μ<μ0,二者 之一成立,就可以否定H0。
31 Back
3.小样本的正态总体,σ未知
检验统计量:
X t ~ t n 1 S n
临界值
z
右侧检验图
×
右侧假设检验拒绝域在右边, 左侧假设检验拒绝域在左边。 右侧检验拒绝域:Z
0 0
Z
Back 15
左侧检验拒绝域: Z
Z
三、两类错误
以样本统计量推论总体参数,因为样本数据具随机性, 存在判断正确和错误的四种概率:
判 断 接受 H 0 拒绝 H 0
实
际
1 (正确判断) (弃真错误)
统计软件给出检验统计量的数值时,一般都给出该 检验统计量数值的p值。
以Zobs表示Z统计量的观测值: 双侧检验時p值=P(|Z|≥ Zobs) 右侧检验时p值=P(Z≥ Zobs)
p值/2
p值/2
α/2
-1.96
1 -α
α/2
1.96(临界值)
以p值进行假设检验: p值>α,接受H0 p值<α ,拒绝H0
23
第二节 单一总体均值的假设检验
1. 大样本
2. 小样本的正态总体,σ已知
3. 小样本的正态总体,σ未知
假设检验步骤相同,主要区别在于选择适当的 检验统计量,以利确定临界值和定义拒绝域。
Back 24
1.大样本
检验统计量:
X Z ~ N 0,1 n
X Z ~ N 0,1 S n
在H0为真的情况下,构造检验统计量:
X Z ~ N (0,1) n
由样本数据计算检验统计量的数值:
69 65 Z 4 10 100
决策规则(如图),如果 Z>Z0.05 拒绝H0
z 0.05 1.64
Z 4 Z0.05 1.64
因为检验统计量Z的数值落在拒绝域,所以拒绝H0。 证据显示,参加培训后可以提高词汇记忆任务的成绩。
(1会计,2企管,统计学成绩)
“等号”始终在H0。
6
一、建立假设
例如:你对某品牌洗涤剂的产品标签中声称: “平均净含量不低于500克”,感到质疑。
你想要证实“平均净含量不足500克”。即你想
要推翻的是μ≥500克,要证实μ<500克。
此时,H0:μ≥500
例如:你研究认为员工满意度和性别有关,你 想要以样本数据来支持你的论点。
由样本数据计算检验统计量的数值:
554 500 Z 2.16 100 16 决策规则(如图),如果 Z>Z0.01 拒绝H0
z 0.01 2.33
Z 2.16 Z0.01 2.33
因为检验统计量Z的数值落在接受域,所以不拒绝H0。 证据显示,参加辅导班对学生的SAT分数没有影响。
z
×
2
×
z
2
z
2
•它有两个拒绝域,两个临界值, 每个拒绝域的概率α/2 。 •在抽样分布两端各α/2位置上 确定拒绝域边界的临界值。
临界值
拒绝域: Z Z 0 or
2
Z 0 Z
2
14
样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。
单侧假设检验的拒绝域定义:
•单侧检验有一个拒绝域,一个 临界值,拒绝域的概率α 。 •在抽样分布某一端的α位置上 确定拒绝域边界的临界值。
8
一、建立假设
H0和H1是互斥的,主要有三种情况:
双侧或双尾假设检验(two-tailed test)
H0:μ=2500 ,H1:μ≠2500 ≤2500 ,H1:μ>2500
单侧或单尾假设检验(one-tailed test)
右侧假设检验: H0:μ
左侧假设检验:
H1: μ ≥2500 ,H1:μ<2500
如果有人对用户说:灯泡的平均使用寿命低于1600hr。 此时,用户要研究的是μ是否会小于1600hr。
提出假设:
H0:μ=1600; H1:μ<1600
10
思考题:
想要检验女性职员平均体重是否大于55公 斤,如何提出原假设和备择假设?
H0:μ=55; H1:μ>55 μ≦55;H1:μ>55
或
Step5:建立决策准则,进行判断
根据α值和抽样分布,确定临界值。
将检验统计量的数值与临界值相比较,做出
是否拒绝H0的判断。
或以检验统计量计算p值,确定是否拒绝H0 。
Back 20
五、p值(p-value)
p值:H0为真时,由样本数据给出的犯第Ⅰ类错误 的概率的精确数值(观察到的显著性水平)。
为检验此论述,进行随机抽样调查, 以样本数据检验此假设是否成立。
2
假设检验
Байду номын сангаас
产生假设检验的原因大致有两个:
当对总体参数的真实性感到怀疑,需要通过 样本来考察其正确与否时,往往借助于假设 检验做出判断(决策)。 当对变量间存在某种关系的证据(平均值之 差、方差之比等)怀疑时,也会要求进行假 设检验。
3
第六章 假设检验
第一节 假设检验原理 第二节 单一总体均值的假设检验 第三节 两个总体均值差的假设检验 第四节 总体比例与方差的假设检验 第五节 SPSS在假设检验中的应用