卫生统计学_第七章_假设检验基础
卫生统计学-假设检验

H 0 : 0
0
显然包括
H1 : 0
0.05
0 0
故称双侧检验(two-sided test)
若检验假设如下:
H 0: 0 H1: 0
或
H 0: 0 H1: 0
称单侧检验(one-sided test)
123.5与125不同的原因何在?
来自于总体均数为125g/L 的总体,差别由抽样误 差导致。
25名1岁婴儿 血红蛋白浓度 X
0 125
0 125
来自另一总体,这个 总体的血红蛋白均数 未知,差别不仅是抽 样误差,主要是本质 的不同。
先假设 0 125,原当前的 X 与0 的差异ห้องสมุดไป่ตู้是抽样误差——提出原假设 接下来验证假设,如何验证? 根据 X 0 的大小,如果 X 0 较小可以认为 当前的差异是抽样误差,反之如果 X 0 较大 就怀疑当前的差异不仅仅是抽样误差(反证法)
问题
(1)该结论是否正确? (2)应该如何解决诸如此类的问题?
采用假设检验的方法予以解决
1.假设检验(hypothesis testing)的
基本思想
应用反证法和小概率原理,先对总体的参
数或分布作出某种假设,再用适当的方法根
据样本对总体提供的信息,推断此假设应当
拒绝或不拒绝。这个过程即为假设检验。
Chapter 7
假设检验
Hypothesis test
主要内容
假设检验的基本原理和步骤 Ⅰ型错误与Ⅱ型错误
单侧检验与双侧检验
假设检验应注意的事项 假设检验与区间估计的联系 (自学)
§1 假设检验的基本思想 和步骤
卫生统计学-第七章 假设检验基础

一:单样本t检验(one sample t-test) 即样本均数代表的未知总体均数与已知总体 均数差异的比较
样本均数与总体均数比较,其分析目的是推断
样本所代表的未知总体均数与已知总体均数 0有无差别。
例1据大量调查知,健康成年男子脉搏的均数 为72次/分,某医生在山区随机调查了25名健 康成年男子,其脉搏均数为74.2次/分,标准 差为6.5次/分,能否认为该山区成年男子的脉 搏高于一般人群?
1- :检验效能(power):当两总体确有差别,
按检验水准 所能发现这种差别的能力。
减少I型错误的主要方法:假设检验时设定 值。
减少II型错误的主要方法:提高检验效能。
提高检验效能的最有效方法:增加样本量。 如何选择合适的样本量:实验设计。
与 间的关系
减少(增加)I型错误,将会 增加(减少)II型错误
理解二: 单次试验(抽样)观测到的事件不应该 是小概率事件。
假设检验的思路
根据背景建立假设 根据样本得到某些特征 推断该样本特征在假设下的概率 根据‘否定小概率事件’思想做出推断
假设检验的思路分析 数学上的反证法原理进行分析
先假设要比较的事物是相同的 再在这种假设成立的情况下,进行逻辑推理 如果推理出发生的事是一个小概率事件,一般
第七章 假设检验基础
吴立娟 流行病与卫生统计学系
假设检验的概念和原理
同一总体
样本1 样本2
差异 抽样误差引起 P>0.05
无统计学意义
总体甲
样本1
(本质不同)
总体乙
样本2
差异 本质不同引起 P<0.05
有统计学意义 不能用抽样误差来解释
假设检验的原理/思想
07《卫生统计学》第七章_假设检验基础(6版) (1)

sd t
n 1
n
2 7950 8832500
10 1
10
528.336IU / g
d d d 795.0 4.785 sd s d n 528.336 10
确定概率P:按ν =9查t 界值表,得P<0.01 判断结果:在α=0.05的水准上,拒绝H0,接受H1,可以认为 维生素E缺乏组大鼠肝脏维生素A含量低于正常饲料组。
二、 假设检验的基本步骤
• 确定检验水准: 检验水准(size of a test),亦称为 显著性水准(significance level),符号 为α,即拒绝或不拒绝H0所要冒出错的风 险大小。一般取α=0.05或α= 0.01。
二、 假设检验的基本步骤
• 确定单侧检验(one sided test)还是双侧检验(two sided test): 如果根据现有的专业知识无法预先判断该病 病人的脉搏是高于还是低于一般健康成年男,两 种可能性都存在,研究者对这两种可能性同等关 心,那么,就是要推断两总体均数有无差别,应 当采用双侧检验;如果根据专业知识,已知病人 的脉搏不会低于一般人,或是研究者只关心病人 的脉搏是否高于一般,而不关心是否低于一般, 则应当采用单侧检验(one sided test)。
二、 假设检验的基本步骤
本例的资料符合t 检验的应用条件,已知 μ=72次/min , x =75.572次/min ,s=5.0次/min , n=25,代入公式计算t 值,结果:
x x 75.5 72.0 t 3.50 sx s n 5.0 25
3. 确定P值
第二节 t 检验
1. 一组样本资料的 t 检验
卫生统计学:第7-8章 假设检验与t检验

反证法
当一件事情的发生只有A、B两种可能的时候,为了肯 定其中的一种情况A,但又不能直接证实A,这时否定 了另一种情况B,则间接肯定了A。 证明A还是证明B? 抗氧化剂 • 在H0成立的条件下,均数之间的差异是由抽样误差
引起的,有规律可循; • 在H1成立的条件下,均数间的不同包含种种未知情
形,无规律可循。 • 故从H0成立的角度出发,寻求其成立的概率。
分布。
数理统计的中心极限定理表明:从正态总体N ( , ) 中抽取例数均为n 的样 本,样本均 数也服从正态分布N( , X )。
Gosset 将此时的 u 转换:
X
定义为t 转换: t sX
u X X
并将t 值的分布命名为t 分布。
t 分布的图形及特征
• 单峰分布,以0为中心,左右对称 • t分布是一簇曲线,其形状与自由度υ(υ=n-1)
基本原则——小概率事件在一次试验中是不可能发生的。
建立检验假设,确定检验水准
假 设 检 验 步 骤
P≤α
计算检验统计量
确定P值
作推断结论
P>α
拒绝H0,接受H1
不拒绝H0
为了解某地1岁婴儿的血红蛋白浓度,某医 生从该地随机抽取了1岁婴儿25名,测得其血红 蛋白浓度的平均数为123.5g/L,标准差为11.6 g/L, 而一般正常小儿的平均血红蛋白浓度为125 g/L, 故认为该地1岁婴儿的平均血红蛋白浓度低于一 般正常小儿的平均血红蛋白浓度。
│t│值越大,则 P 值越小;反之,│t│值 越小,P 值越大。根据上述的意义,在同 一自由度下,│t│≥ tα ,则P≤ α ; 反之, │t│<tα,则P>α。
t 检验的应用条件:
单样本t 检验中,σ未知且样本含量较小 (n<50)时,要求样本来自正态分布总体;
《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
医学统计学第七、八章 假设检验的基本概念和t检验

S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX
假设检验的基本概念

客观实际
可能发生的两类错误
假设检验的结果
拒绝 H0
“接受”H0
H0 成立
H0 不成立 即 H1 成立
I 型错误( ) 推 断 正 确 (1 )
推断正确(1 ) II 型错误( )
第四军医大学卫生统计学教研室 2020年3月20日
H1: <0
成立
1
1
界值 0
图8-2 I型错误与II型错误示意图(以单侧u检验为例)
降低。
第四军医大学卫生统计学教研室 2020年3月20日
二、两个率比较的u检验 推断两个总体率是否相同
u
p1 p2
·pc )(
1 n1
1 n2
)
P124例8-5
第四军医大学卫生统计学教研室 2020年3月20日
例8–5 某医院用黄芪注射液和胎盘球蛋白进行穴 位注射治疗小儿支气管哮喘病人,黄芪注射液 治疗117例,有效103例;胎盘球蛋白治疗55例, 有效49例。试比较两种疗法有效率有无差别
第四军医大学卫生统计学教研室 2020年3月20日
③ H1的内容直接反映了检验单双侧。若H1
中只是 0 或 <0,则此检验为单侧检验。
它不仅考虑有无差异,而且还考虑差异的方向。
④ 单双侧检验的确定,首先根据专业知识, 其次根据所要解决的问题来确定。若从专业上 看一种方法结果不可能低于或高于另一种方法 结果,此时应该用单侧检验。一般认为双侧检 验较保守和稳妥。
二 、 两 样 本 比 较 的 u 检 验 (two-
sample u-test) 适用于两样本含量较大(如 n1>30且n2>30)时。检验统计量为
u X1 X2 X1 X2
S X1X 2
卫生统计学基础流行病学数据的假设检验与置信区间计算

卫生统计学基础流行病学数据的假设检验与置信区间计算在卫生统计学中,流行病学数据的假设检验与置信区间计算是常见的分析方法。
通过这些方法,我们可以对流行病学数据进行有效的推断和判断。
本文将介绍基本的假设检验和置信区间计算的原理和应用。
一、假设检验假设检验是指通过收集样本数据,对总体的某个参数提出假设,并利用样本统计量对该假设进行验证的统计方法。
常见的假设检验有单样本均值检验、两样本均值检验和相关性检验等。
1. 单样本均值检验假设我们有一组样本数据,想要判断该样本的均值是否等于某个给定的值。
首先我们提出原假设(H0)和备择假设(H1),然后计算样本均值和标准误差,接着利用标准正态分布或t分布进行判断。
2. 两样本均值检验在两个独立的样本群体中,我们想要判断两个群体均值是否存在显著差异。
同样,我们提出原假设(H0)和备择假设(H1),计算两个样本的均值和标准误差,并利用t分布进行判断。
3. 相关性检验当我们需要了解两个变量之间是否存在相关性时,可以进行相关性检验。
常见的方法有Pearson相关系数和Spearman等级相关系数。
通过计算相关系数的置信区间,我们可以判断两个变量之间的相关程度。
二、置信区间计算置信区间是指对总体参数的一个区间估计,通常用一个上限值和一个下限值表示。
置信区间计算可以帮助我们确定总体参数的范围。
在流行病学数据分析中,我们常用置信区间来估计疾病的患病率、死亡率等指标。
置信区间的计算方法与假设检验类似,根据所需的置信水平和样本数据,计算样本均值和标准误差,再利用正态分布或t分布确定置信区间。
除了单个参数的置信区间计算外,对于两个参数之间的差异,也可以计算置信区间。
例如,在两组样本数据中,我们希望确定两个样本均值之间的差异是否显著。
通过计算差异的置信区间,可以得出结论。
三、数据分析示例为了更好地理解假设检验和置信区间计算的应用,我们以某疾病的发病率为例进行说明。
假设我们有两组样本数据,分别为疫苗接种组和非接种组的患病人数。
最新假设检验基础 卫生统计学 中山大学医学统计与流行病学教材PPT课件

假定干预前后血色素差值服从正态分布
: d 0 H1 : d 0
2. 计算统计量
= 0.05
n=12, d =10.67, Sd 11.18
t
d 0 Sd / n
10.67 -0 = 11.18 / 12 =3.305 ,
n 112 1 11
3. 确定 P 值,作出推断
例如,把有病说成没病,把有效说成无效等
表 7-1 统计推断的两类错误及其概率
统计推断
实际情况
拒绝 H 0 , 有差异
不拒绝 H 0 , 无差异
H 0 成立,无差异
第 I 类错误(假阳性) 概率=
正确 概率=1-
H1 成立,有差异
正确
概率=1-
第 II 类错误(假阴性)
概率=
概率 1 1
第二节 t 检验
试验组:10.2 ,8.9, 10.1, 9.2,-0.8, 10.6, 6.5, 11.2, ,9.3, 8.0, 10.7, 9.5, 12.7, 14.4, 11.9
对照组:5.0, 6.7, 1.4, 4.0, 7.1, 0.6, 2.8, 4.3, 3.7, 5.8, 4.6, 6.0, 4.1, 5.1, 4.7
区贫血儿童血色素(%)总体平均水平有无变化?
序号
1 2 3 4 5 6 7 8 9 10 11 12
表 7-2 健康教育三个月前后血色素(%)
教育前
教育后
差值 d
36
45
9
46
64
8
53
66
13
57
57
0
65
70
5
60
55
-5
42
医学统计学假设检验基础

(三)选择检验(jiǎnyàn)方法,计算检验(jiǎnyàn)统计量
• 应根据研究目的、资料类型、设计类型及样 本含量大小等因素选择合适(héshì)的假设检验方 法;
• 在H0成立的前提下,由样本已知信息构造检 验统计量;
• 通常根据构造的检验统计量来命名假设检验 方法。
• 不同的统计量涉及的统计分布不同
S / n 6.5 / 25
4、按 =25-1=24查附表2 t界值表
P=P(|t|≥1.69) ?
共八十七页
自由度
单侧 双侧
1
2 3 4 5
6 7 8 9 10
21 22 23 24 25
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
族足月正常产男性新生儿临产前双顶径(BPD)是否大于一般新生 儿?
共八十七页
• 例3 已知北方农村(nóngcūn)儿童前囱门闭合月龄为14.1
月。某研究人员从东北某县抽取36名儿童,得前囱门闭 合月龄均值为14. 3月,标准差为5.08月。问该县儿童前 囟门闭合月龄的均数是否大于一般儿童?
共八十七页
共八十七页
单样本 t检验 (yàngběn)
• 设计类型 : (lèixíng)
例2 大量研究表明汉族足月正常产男性新生儿临产前双顶径(BPD)
均数为9.3cm,某医生记录了某山区12名汉族足月正常产男性新 生儿临产前双顶径(BPD)资料如下:9.95、9.33、9.49、9.00、 10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区汉
0.686 0.686 0.685 0.685 0.684
医学统计学第3版 第7章 假设检验课件

• •
首利先 用对样总本总体信体参息数判参或断数分假布设分形是布式否形做成出立式某。种假设;
PPT学习交流
4
假设检验的分类
• 根据假设的对象
• 参数检验—对总体参数提出假设 • 非参数检验—对总体分布提出假设
PPT学习交流
5
假设检验的基本思想
• 小概率反证法
• 在一次研究或观察中,如果出现了假设成立情况下的小 概率事件,由于推理过程是严密的,就只能认为假设不 成立,应予拒绝或否定,并接受它的对立面。
?
一般
0=140g/L
随机抽样
n=60
样本
x =155g/L s = 24g/L
统计推断
统计 描述
PPT学习交流
2
假设检验的原因
• 造成0与x不等的可能原因:
• =0 ,抽样误差造成 • >0 ,差异客观存在
• 判断方法:假设检验
PPT学习交流
3
假设检验(Hypothesis test)
• 假设检验是统计推断的另一个重要方面:
• 探索性研究—双侧检验 • 验证性研究—单侧检验
PPT学习交流
10
建立检验假设,确定检验水准
• 样 双本 侧均 检数验与假已设知的总形体式均数0的比较中,单侧检验和
检验形式 双侧检验
单侧检验
目的
是否0 是否>0 是否<0
H0
=0 =0 =0
H1
0 >0 <0
PPT学习交流
11
建立检验假设,确定检验水准
还不足以拒绝H0
• 统统计 计学学结意论义:P>,按=0.05水准,不拒绝H0,差异无
• 专业结论:尚不能认为高原地区成年男子平均Hb量高 于一般人群
[医学]假设检验与t检验-卫生统计学
![[医学]假设检验与t检验-卫生统计学](https://img.taocdn.com/s3/m/fe85f86a43323968011c92ca.png)
0.906 0.896 0.889 0.883 0.879
0.859 0.858 0.858 0.857 0.856
0.10 0.20
3.078 1.886 1.638 1.533 1.476
1.440 1.415 1.397 1.383 1.372
1.323 1.321 1.319 1.318 1.316
第七章 假设检验
第一节 假设检验的原理与步骤
第一节 假设检验的原理与步骤
例1 某医生在某山区随机抽取25例健康成年女性,测得她们 的血红蛋白均数为150g/L,标准差为16.5g/L,而已知一般 健康成年女性血红蛋白均数为132g/L,问:该山区健康成年女 性血红蛋白均数是否与一般健康女性不同?
1. 建立假设(H0和H1) ,确定检验水准α 2. 选择检验方法,计算检验统计量 3. 确定 P 值,作出推断结论
第一节 假设检验的原理与步骤
例1 某医生在某山区随机抽取25例健康成年女性,测得她们 的血红蛋白均数为150g/L,标准差为16.5g/L,而已知一般 健康成年女性血红蛋白均数为132g/L,问:该山区健康成年女 性血红蛋白均数是否与一般健康女性不同?
1.假设某地35岁以上正常成年男性收缩压总体均数 120.2mmHg 。从该地随机抽取20名35岁以上正常成年男 性,测得平均收缩压为112.8 mmHg,又从该地随机抽取 10名7岁正常男孩,测得平均收缩压为90.5mmHg,则下 列说法正确的是
雷静《卫生统计学》第七章 假设检验基础一PPT课件

4
假设检验的基本步骤
☆建立检验假设和确定检验水准 ☆选定检验方法和计算检验统计量 ☆确定P值和做出统计推断结论
13.08.2020
西安医学院公共卫生系
5
建立假设
假设: H0(零假设) μ1=μ2 H1(备择假设)μ1≠μ2或μ1>μ2
(根据研究目的、设计类型及资料特点将需要推断的问题 表述为关于总体特征的一对假设)
13.08.2020
西安医学院公共卫生系
8
统计推断结论应包括统计结论和专业结论两 部分。统计结论只说明有无统计学意义,而不 能说明专业上的差异大小,专业结论须结合专 业知识才能得出。
***注意:假设检验的结论是具有概率性的,
不论是拒绝H0或不拒绝H0,都有可能发生错 误,即第一类错误或二类系
9
第一类错误与第二类错误
指假设检验中作出的推断结论可能发生两类错误 ☆I类错误:拒绝了真实的H0 。 (拒绝了实际上成立的H0),概率用α表示。 ☆II类错误:接受了实际上不成立的H0 。 (拒绝了真实的H1),概率用β表示,
β值的大小很难确切估计。 一般,样本例数确定时,α愈大,β愈小;
sx1x2 (n11 n)1s1 2 n2(n 221)s2 2n 11n12
• 如果样本含量足够大n1 n2 均大于 50或100时,可将t检验简化为u检验
• 计算检验统计量Ζ :
Ζu
x1 x2
s
2 1
s
2 2
n1 n2
13.08.2020
西安医学院公共卫生系
16
4.两独立样本资料的方差齐性检验
课程或者工作有什么建议和意见,也请写在上边
19
感谢观看
The user can demonstrate on a projector or computer, or print the presentation and make it into a film
7.假设检验基础

单侧检验和双侧检验
研究者可能有两种目的: ①推断两总体均数有无差别。不管是山区高于一 般,还是山区低于一般,两种可能性都有,研究 者都同样关心,应当用双侧检验。 ②根据专业知识,已知山区不会低于一般,或者
研究者只关心山区是否高于一般,不关心山区是
否低于一般,应当用单侧检验。
一般双侧检验较常用,如比较两种药物 的疗效时,研究者可能有一定理由认为新药 不会比旧药差,但不能绝对排除相反的可能 性,不宜用单侧检验,而应用双侧检验。再 如:预实验,有探索性质,对结果的考虑以 思路宽些为好,多用双侧检验。
t0.05,7=2.365 t0.01,7 =3.499 P<0.01
d
=546.25
今P<0.01, 在=0.05的水准上,拒绝H0,接受H1,差异有 高度显著性,认为不同饲料组的大白鼠肝中维生素A含量有差 别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
用两总体均数差的可信区间的方法:
n=8,
解:H0:d =0
H1:d ≠0 =0.05
n=8,
d=6500, d2=7370000,d=812.50
d2-(d)2/n 2 737000-6500 /8 7
Sd= n-1 = Sd = Sd /n =546.25/8 =193.13
t= d - 0 = 812.5/193.13=4.207 S
选用不同的方法。
检验统计量是用于抉择是否拒绝H0的统
计量。
t=
x-0
Sx
= 74.2-72 =1.833
6.0/25
4.确定P值和作出结论
P值是指由H0规定的总体中作随机抽样,获
得等于及大于(和/或等于及小于)现有样本检验统计 量值的概率。 t(u)>t,(u) P<
06 假设检验

魏永越
23
假设检验的基本步骤
建立检验假设
确定检验水准 计算检验统计量,界定P值
推断性结论
当P≤ 时,拒绝H0,接受H1,差别有统计学意义。 当P> 时,不拒绝H0,差别尚无统计学意义。
统计学意义。
可以认为该单位食堂成年男性炊事员血清总胆
固醇与健康成年男子不同。
魏永越
30
配对设计定量资料的t检验
配对设计是研究者为了控制可能存在的主要的非处理
因素而采用的一种实验设计方法。 自身配对
同一对象接受两种处理,如同一标本用两种方法进行检验, 同一患者接受两种处理方法;
异体配对
假设检验
hypothesis test
南京医科大学 卫生统计学
主要内容
假设检验的基本思想 假设检验的基本步骤 均数的假设检验 均数的假设检验应用条件 假设检验中的一些概念
魏永越
2
某同学从来没有上过统计课。 但在末考中10道判断题全部答对。
问:他(她) 是瞎猜的还是有真才实学?
魏永越
15
理论基础:t 分布
P ( 2.064 t 2.064) 0.95
P ( t 2.064) P ( t 2.064) 0.05 P ( t 5.4545) P ( t 5.4545) 0.05
v=25-1=24
-2.064
魏永越
0
2.064
16
-t
0
t
附表2 t 界值表
自由度
1 2 3 4 5 6 7 8 9 10 21 22 23 24 25
《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=0.05
33
(2)计算检验统计量
本例 n=35, X =3.42kg,S=0.40kg, 0 =3.30kg。 按公式 X 0 3.42 3.30 t 1.77 S/ n 0.4 / 35
(1)选择检验方法,建立检验假设,确定检验水准
H 0: μ μ 0 ; H1 : μ μ 0 ,α 0.05
(2)计算统计量 (3)确定P值
P
P
做推断结论 不拒绝H0, 可能 犯Ⅱ类错误
28
拒绝H0,接受H1 可能犯Ⅰ类错误
第二节
t检验(t –test)
29
一、单样本资料的t检验
已知 0 14.1 s 5.08 的比较
n 36 X 14.3
是单一样本与一已知总体
22
第二步
选择适当的假设检验方法,
计算相应的统计量
本
例
X 0 14.3 14.1 t 0.236 / n 5.08 / 36
n 1 36 1 35
23
⑶同一受试对象处理前后,数据作对比。
37
将10只小白鼠按配对设计分成两组,
分组方法见下表:
配对号 1 2 3 4 5
小白鼠 排序号
1 1
2 2
3 2 乙
4 1 甲
5 1 甲
6 2 乙
7 1 甲
8 2 乙
9 10 1 2
随机数 18 24 22 07
29 57 33
49 65 92
分 组 甲பைடு நூலகம்乙
甲 乙
前进
18
单、双侧检验
若H1为 0,则此检验为双侧检验 若H1只是 0或 0 , 则此检验为单侧检验
首先根据专业知识
单双侧检验的确定
其次根据研究者的目的
注意:一般认为双侧检验较保守和稳妥!
返回
19
本
例
H 0 : 0 14.1 (该县儿童前囟门闭合月龄
的平均水平与一般儿童的平均水平相同)
只能下"根据目前试验结果 ,尚不能认 为有差别 的结论. "
26
本 例
t=0.236 P>0.05
1.69
拒绝域
a=0.05
0
接受域
1.69
拒绝域
t
P 0.05, 不拒绝H 0 , 差别无统计学意义(统计结论) , 故还不能认为该县儿童前囟门闭合的平均月龄 与一般儿童不同(专业结论)。
27
表6-1
序号 2
用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
用药前 921.69 用药后 1293.36 差值d 371.67
1 1206.44 1678.44 472.00 例6-2 某儿科采用静脉注射人血丙种球蛋白治疗小儿
急性毛细支气管炎。用药前后患儿血清中免疫球蛋白 3 1294.08 1711.66 417.58
IgG(mg/dl)含量如表所示。试问用药前后IgG有无变 4 945.36 1416.70 471.34
5 化?
6 7 8 9 10 11 12
721.36
692.32 980.01 691.01 910.39 568.56 1105.52 757.43
1204.55
1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
13
例:某商家宣称他的一大批鸡蛋 “坏蛋” 率为1%,顾客与商家约定,从中抽取5个 做检查,来判断这一批蛋的质量。结果4 个好蛋,1个坏蛋。请问这批鸡蛋的“坏
蛋” 率为1%还是高于1%?
14
假设该批鸡蛋的坏蛋率为1%,(反证法)
以此为前提,计算5个鸡蛋中样品中出现1 个 或更多变质蛋的概率p(x≥1)=0.049,(小概率 事件)。
P488
38
成对样本均数比较的数据格式
对子号 1 2 3 4 5 . . 合计 对照组 . . . . . . . . 实验组 . . . . . . . . 差值d . . . . . . . .
39
配对设计检验统计量:
d d d 0 d t= , Sd Sd n Sd n
n 1
12
本
否
例
0的对立面 0 出发,间接判断是
从
0 .
假设 0,看 X 可能性P 有多大,用公式
0由于抽样误差造成的
X 0 t SX
计算t值
由t值求得P 值来判断。若P 值很小,则拒绝上述假 设( ),而接受其相互对立的假设( 0)。 0 反之亦然。
第三步
确定P值,做出推断
P值:是用计算出来的统计量查相应的界值表获 得。其意义是:P的含义是指从H0规定的总体随机
抽样,抽得等于及大于(或/和等于及小于)现有样 本获得的检验统计量(如t、u等)值的概率。
做出推断: (包括统计结论和专业结论)
P a, 拒绝H 0 , 接受H1 , 下"有差别 的结论。 "
但发生机会理应很小的事件竟然在一次抽样中 出现了,人们不竟怀疑前提条件的真实性,从 而认为该批鸡蛋的坏蛋率不应为1%,应高于1%. (小概率事件原理)
15
三、假设检验的基本步骤
建立假设,确定检验水准
选择适当的假设检验方法,计算相
应的统计量
确定P 值 做推断结论
16
例7-1 已知北方农村儿童前囟门闭合月龄为 14.1月。某研究人员从东北某县抽取36名儿 童,得囟门闭合月龄均值为14.3月,标准差 为5.08月。问该县儿童前囟门闭合月龄的均 数是否大于一般儿童?
式中, d 为每对数据的差值, d 为差值的样本均数,
S d 为差值的标准差,S d 为差值样本均数的标准误, 为对 n
子数。
40
例7-2
某儿科采用静脉注射人血丙种球蛋白
治疗小儿急性毛细支气管炎。用药前后患儿血 清中免疫球蛋白IgG(mg/dl)含量如表6-1所
示。试问用药前后IgG有无变化?
41
1、设计:单样本与一已知总体均数的
比较
单样本均数:平时抽样或观察所得,其
总体均数 是未知的。
已知总体均数 0 :指已知的理论值、标
准值、或经大量观察所得到的稳定值。
30
2、目的:
推断样本均数 X 代表未知总体均数 ( )
和已知总体均数 0 (理论值、标准值、稳定
值)有无差别?
即推断是否 0 ?
P a , 不拒绝H 0 , 但不能下 无差别 的结论。 " " 只能下"根据目前试验结果 ,尚不能认 为有差别 的结论. "
24
立的条件下,得到现有检验结果的概率小于 ,因为 小概率事件不可能在一次试验中发生,所以怀疑 H 0 的真实性,从而做出拒绝 H 0 的决策。
若 P ,按所取检验水准 ,拒绝 H 0 ,接受 H1 ,差别有统计学意义。其统计学依据是,在 H 0 成
例 通过以往大量调查,已知某地一般新生
儿的头围均数为34.5cm,标准差为1.99cm。
为研究某矿区新生儿的发育情况,现从该地 某矿区随机抽取新生儿55人,测得其头围均 数为33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
9
0=34.50cm 0=1.99cm
=?
35
二、配对设计资料的t检验
配对设计:将受试对象按一定条件配成 对子,再将每对中的两个受试对象随机分 配到不同处理组。 为控制可能存在的主要非处理(非实 验)因素而采用的一种试验设计方法。
36
形式:
⑴异体配对:将受试对象配成特征相近的对子,同 对的两个受试对象随机分别接受不同处理; ⑵自身配对:同一受试对象的两个部位分别接受两 种处理;或同一样品分成两份,随机分别接受不同 处理(或测量)
同一总体 0 ,但有抽样误差
非同一总体 0
怎么判断? 利用反证法小概率事件原理
11
假设检验的基本原理:
反证法小概率事件原理:即首先假 设两总体无差别(反证法),然后根据 样本资料计算获得这样一份样本的概率 P值,当P值是一个小概率时,就拒绝 原假设(小概率事件在一次实验中不(大) 可能发生的推断原理),而认为 两 总体有差别。否则,就不能下有差别的 结论。
17
第一步
建立假设,确定检验水准
H0:原假设(无效假设、零假设)是对总体参数或 总体分布作出的假设,通常假设总体参数相等或 观察数据服从某一分布(如正态分布等). H1:对立假设(备择假设),与H0相对立又相联系
下一页
:检验水准,上述两种假设中,要作出抉择,
即是拒绝H0,还是不拒绝H0,需根据概率的大 小作出判断. 就是对H0假设作出抉择的一 个判定标准,通常 =0.05
H1 : 0 14.1 (该县儿童前囟门闭合月龄
的平均水平高于一般儿童的平均水平)
a 0.05
(单侧)
20
第二步
选择适当的假设检验方法,
计算相应的统计量
应根据资料类型,设计,分析目的 和各种假设检验方法的应用条 件加以选择。
21
第二步
选择适当的假设检验方法,
计算相应的统计量
本
例
n=55
已知总体 一般新生儿头围
X 33.89 未知总体 某矿区新生儿头围
10
该地某矿区的地理环境及生活条件并不影响 矿区的地理环境及生活条件确实对新生儿的 分 析 新生儿的头围大小,即本次调查的新生儿头 头围有影响,即本次调查的新生儿头围的总体 围的总体均数与一般新生儿头围的总体均数 目的:判断是否 0 ? 均数与一般新生儿头围的总体均数不同,亦 相同,亦即 X 0 仅由抽样误差造成, 即 X 不仅由抽样误差造成,而且是来自 现 这种差异无统计学意义。 X 0 0 原因有二: 不同的总体,这种差异有统计学意义。