医学统计学--第六章 几种离散型变量的分布及其应用

合集下载

医学统计学课件:第六章 几种离散型变量的分布及其应用

医学统计学课件:第六章  几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

06统计学第六章 几种离散型变量的分布及其应用

06统计学第六章  几种离散型变量的分布及其应用

(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
(1)出现“阳性”的次数至多为k次的概率为:
对于双侧检验而言, 对于双侧检验而言 , 由于要回答的是 有无差别” “有无差别 ” 即备择假设 H1:π ≠ π0 是否 , 成立,因此 ,所要计算的双侧检验概率 成立,因此,所要计算的双侧检验概率 P 值 应为实际样本( 阳性” 应为实际样本(记“阳性”次数为 k 次)出 现的概率与更背离无效假设的事件( 现的概率与更背离无效假设的事件(记“阳 出现的概率之和, 性”次数为 i 次,i ≠ k)出现的概率之和, 即
第一节 二项分布
二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性” 之一的n次独立 n 独立 独立重复试验(常常称为n重 n Bernoulli试验)中,当每次试验的“阳性” 概率保持不变时,出现“阳性”的次数X=0, 1,2,…,n的一种概率分布。
10! P ( X = 9) = 0.60 9 (1 − 0.60)10−9 = 0.040311 9!(10 − 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P ( X = i ) ≤ 0.040311 的 i(i ≠ 9)分别有:0、1、2、10。 分别有: 10。 因此, 因此 ,所要计算的双侧检验概率 P 值为
阳性数X
图 6-2.
π =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

[医学]医学统计学课件PPT

[医学]医学统计学课件PPT
• (1)、同质(homogeneity):根据研 究目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
2020/12/5
二、统计学中的几个基本概念
• (2)、变异 (variation)
• 变异 (variation):同质研究单位中变 量值间的差异。
二、统计学中的几个基本概念
变量值(value of variable) : 变量的观察结果。 例如:研究7岁男孩身高 变量值:测得的身高值 (
120.2cm,118.6cm,121.8cm,…) 研究某人群性别构成 变量值:男、女。
2020/12/5
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 ( variation)
医学统计学 Medical Statistics
2020/12/5
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图

研究水污染情况 水
研究细胞变性 胞
研究肝癌的地区分布
一个人 一只眼 一毫升 一个细 一个地区
2020/12/5
二、统计学中的几个基本概念
(2)变量(variable): 研究单位的研究特
征。
例如:研究7岁 男孩身高的正常值范围
变量:
身高
(3)变量值(value of variable

第六章 几种离散型变量的分布及其应用(正式)

第六章  几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X

6卡方检验2002

6卡方检验2002

H0:1


,任两对比组的总体有效率相等
2
H1: 1


,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =

k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n

2 c

(a

b)(c

d )(a
2 c)(b

d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt


0.20012
P(7)
7! 7!(10
0.707(1 7)!

0.7 0)1 0 7

0.26683
P(8)
8! 8!(10
0.708(1 8)!

0.70)1 0 8

0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!

医学统计学——变量的分类与统计资料的类型

医学统计学——变量的分类与统计资料的类型
医学统计学 Medical Statistics
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
同正常。 总体:1)某地所有的正常成年男子
2)某地所有的正常成年男子的 红细胞数
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的
• 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
• 2)无限总体(infinite population):研 究单位数是无限的
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
错单位等,亦称过失误差(gross error) • 这类误差应当通过认真检查核对予以清除,否
则将会影响研究结果的准确性。
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
为 什 么 要
学 医 学 统
计 统计知识 学 的运用 ?

离散型变量的分布及其应用

离散型变量的分布及其应用

【解】本例 n=13,X=6。查附表 6,取a=0.05 时,在
n=13(横行)与 X=6(纵列)的交叉处数值为 19–75,即该
吻合术妇女受孕率的 95%可信区间为(19%,75%)。
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.3 反查表求总体率的区间估计(P94)
23
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.4 正态近似法求总体率的区间估计(P94) 24
例 6-3 在观测一种药物对某种非传染性疾病的治疗效果 时,用该药治疗了此种非传染性疾病患者 100 人,发现 55 人有效,试据此估计该药物治疗有效率的 95%可信区间。 本例 n=100,X=55,经计算得 p=55/100=0.55,Sp=0.0497。
quant:发生数; n=实验次数; prob:发生率。
P(X=6)= PDF.BINOM(6, 10, 0.7).
When n is 1, this is the same as PDF.BERNOULLI.
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.55 例6-1 SPSS操作过程
n
且 P(X) 1。
X 0
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.4 二项系数的展开:杨辉三角
8
1
1次
11
2次
121
3次
1331
n 1, (1 )
X 1 X 0
4次 1 4 6 4 1 5次 1 5 10 10 5 1
n 2,( (1 ))2 2 2 (1 ) (1 )2

《医学统计学》基本统计学部分公式总结

《医学统计学》基本统计学部分公式总结

̅2 ������1 − ������ ������ 2 √ 1 ������1 +
2 ������2
������1 = ������1 − 1, ������2 = ������2 − 1
1 2 的双侧 1 置信区间为:
������2
X
1
X 2 t / 2, S X 1 X 2 , t 值 自 由 度 为
̅������ − ������ ̅0 ������ Dunnett − ������ = ,ν = ������误差 ������������ ̅ ������ −������ ̅������ ������������ ̅ ������ −������ ̅������ 1 1 = √������������误差 ( + ) ������������ ������0
������������组内 =
������������组内 ������组内
������ 2 ∑������ ������=1(������������ − 1) ln 1+
2 ������������ ������������2
������ =
������������组间 ������������组内
第二章 定量资料的统计描述 1.算术均数
X
S
2
fX
2
fX
n 1 n
2
X 或( X fX )
n n
8.变异系数
CV

2.几何均数
lg X G n X 1 X 2 X 3 X n 或 G lg 1 n f lg X G lg 1 n

离散型变量适合的分组方式

离散型变量适合的分组方式

离散型变量适合的分组方式离散型变量是指在一定范围内只能取有限个数值的变量,它的取值通常表示某种类别或状态。

离散型变量的分组方式是将变量的取值按照一定的规则进行划分,以便更好地理解和分析数据。

在本文中,将介绍离散型变量的常见分组方式及其适用场景。

1. 等距分组等距分组是将变量的取值范围按照一定的间隔进行划分,每个组的取值范围相等。

这种分组方式适用于变量的取值范围比较集中,且取值的间隔比较均匀的情况。

例如,对于身高这个离散型变量,可以按照每10厘米为一个组进行分组。

等距分组的优点是简单易懂,适用于初步了解数据分布情况。

2. 等频分组等频分组是将变量的取值按照频率进行划分,每个组包含相同数量的观测值。

这种分组方式适用于变量的取值分布不均匀,存在极端值的情况。

例如,对于成绩这个离散型变量,可以按照每个班级的前三名、中间三名和后三名为一组进行分组。

等频分组的优点是能够充分利用数据的分布特点,缺点是容易受到极端值的影响。

3. 自定义分组自定义分组是根据实际需求和数据特点,将变量的取值按照自己的规则进行划分。

这种分组方式适用于变量的取值范围比较广泛,且不符合等距或等频分组的情况。

例如,对于年龄这个离散型变量,可以按照儿童、青少年、成年人和老年人进行分组。

自定义分组的优点是灵活性高,可以根据实际情况进行调整,缺点是需要根据具体问题进行分组规则的确定。

4. 基于统计量的分组基于统计量的分组是根据变量的分布特点,将变量的取值按照一定的统计量进行划分。

这种分组方式适用于变量的分布不符合正态分布的情况。

例如,对于收入这个离散型变量,可以按照分位数进行分组,将数据分为高收入、中等收入和低收入三组。

基于统计量的分组的优点是能够充分利用数据的分布特点,缺点是需要对数据进行统计分析。

5. 基于业务需求的分组基于业务需求的分组是根据具体的业务背景和分析目的,将变量的取值按照业务需求进行划分。

这种分组方式适用于变量的取值与业务指标相关的情况。

6.几种离散型变量的分布及其应用

6.几种离散型变量的分布及其应用

P( x) C (1 )
x n x
n x
,( x 1, 2, 3......n)
n! C 式中: x !( n x )!
x n
称二项系数。
一、二项分布的适用条件和性质
(一)二项分布的适用条件:
即分别发生两种结果的概率之和恒等于1。
1. 各观察单位只能具有互相对立的一种结果,属于二项分类资料;
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
( a b) C a b C a b C a b C a b
n k 0 n 1 n 1 1 n k n k n 0
C a b
2 n
2 n 2
...
C ab
n k
Bernoulli试验 毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
例:对13名输卵管结扎的育龄妇女经壶腹部-壶腹 部吻合术后,观察其受孕情况,发现有7人受孕, 请估计该吻合术妇女受孕率的95%可信区间。
未孕率的95%CI:
注意:X>n/2时应以n-X查表 此例:n=13, n- x=6 查表得95%CI为:19%~75%。
25%~81%
(二)正态近似法:
应用条件:当n较大、 np及n(1−p)均≥5
抓中三个黑球的概率: P(3)=0.5×0.5×0.5=0.12 5
抓中两黑一白的概率: P(2)=3×0.125=0.375
定理:在几个互不相容的事件 中,任一事件发生的概率等于 这几个事件的概率之和。

第六章 几种离散型变量的分布

第六章  几种离散型变量的分布

累积概率函数:
P( X k )
k x n x
P( X
X 0 n x
k
k)
C (1 )
x 0
由上可知: n次Bernoulli试验中,事件A发生的次数K服从二项 分布。 n次Bernoulli试验有如下特点: A、各次试验结果相互独立; B、每次试验只有二种可能的结果; C、每次试验事件A发生的概率是固定的。
k n k
n k
0<π<1, K=0,1,2,……, n 则称随机变量X服从参数为n, π的二项分布, 记为X ~ B (n, π )或B(X; n, π )
例:临床用针灸治疗某型头痛,有效的概率 为60%,现以该法治疗3例,其中两例有效 的概率是多少?
例:据报道,有10%的人对某药有胃肠道反 应。为考察某厂的产品质量,现任选5人服 用此药。求:2个人有胃肠道反应的概率; 不多于2个人有胃肠道反应的概率。
假定符合一定条件的病人可视为相同的个体。若某药治愈概 率为60%,现用该药治疗10例病人,求治愈病人数的概率分布
X
Pi
样本率P=x/n
0
1
0.0001
0.0016
0.00%
10.00%
2
3 4 5 6 7 8 9 10
0.0106
0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060
>5 合计
12 96
12.5 100.0
96 ——
100.0 ——
对此资料我们可均数、标准差等数值特征指标来概括 资料的特点,均数、标准差可利用原始资料计算。
但更进一步的了解,需知道每一事件所对应的发生概率。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0 . 55
X
(1 0 . 55 )
10 X
X 9
= 0.023257

按=0.05水准,拒绝H0 ,接受H1 ,即认 为实施峡部-峡部吻合术妇女的受孕率要高 于壶腹部-壶腹部吻合术。
例 6-5 已知某种非传染性疾病采用甲药治疗的 有效率为 0.60。今改乙药治疗该疾病患者 10 人,发 现 9 人有效。问甲、乙两种药物的疗效是否不同? 显然,这是双侧检验的问题。记乙药治疗该疾病 的有效率为π,其假设检验为 H0:π=0.60 H1:π 0.60 =0.05 本例 n=10,按π=0.60,实际样本阳性数 X =9 出现 的概率由公式(6-1)有


(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
(1)出现“阳性”的次数至多为k次的概率为:


对这10名实施峡部-峡部吻合术的妇女,按 0.55的受孕率,若出现至少9人受孕的概率 大于0.05,则不拒绝H0 ;否则,拒绝H0 , 接受H1。 本例n=10,π=0.55,k=9。按公式(6-12) 有:
P (X 9)
P(X )
X 9
10
10
10 ! X ! (10 X )!
8 10 8
0.23347
一、二项分布的适用条件和性质



(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果 之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的 概率π固定不变; 3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出 现的概率。
P ( X 9) 10 ! 9! (10 9 )! 0 . 60 (1 0 . 60 )
9 10 9

0.040311
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P ( X i ) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
本例 n=100,p=55/100=0.55
S
p

p (1 p ) n
S
p
0 .5 5 (1 0 .5 5 ) 100
0 .0 4 9 7
0.55-1.96×0.0497=0.4526 0.55+1.96×0.0497=0.6474 即该药物治疗有效率的 95%可信区间为(45.26%, 64.74% ) 。
Sp
p (1 p ) / n

2.二项分布的图形 对于二项分布而言, 当π=0.5时,分布是对称的,见图6-1;
图 6-1.
=0.5 时 , 不 同 n 值 下 的偏态的,但随着n的增 大,分布趋于对称。当n 时,只要π不 太靠近0或1,二项分布则接近正态分布, 见图6-2。


2. 正态近似法 根据数理统计学的中心极限 定理可得,当n较大、π不接近0也不接近1 时,二项分布B(n,π)近似正态分布 N ( n , n (1 )) ,而相应的样本率p的分布也近 2 N ( , p ) 正态分布。为此,当n较大、 似 p和1-p均不太小,如np和n(1-p)均大于5时, 可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
P (6) 10 ! 6! (10 6 )! 0 . 70 (1 0 . 70 )
6 10 6
0.20012
10! 7 107 P(7) 0.70 (1 0.70) 0.26683 7! (10 7)!
P (8 ) 10 ! 8! (10 8 )! 0 . 70 (1 0 . 70 )
P P( X k )
P( X
i
i)
,其中 i 满足
P ( X i) P ( X k ) 。


例6-4 据报道,对输卵管结扎了的育龄妇女实施 壶腹部-壶腹部吻合术后,受孕率为0.55。今对10 名输卵管结扎了的育龄妇女实施峡部-峡部吻合术, 结果有9人受孕。问实施峡部-峡部吻合术妇女的 受孕率是否高于壶腹部-壶腹部吻合术? 显然,这是单侧检验的问题,其假设检验为 H0:π=0.55 H1:π>0.55 =0.05
本例n=13,X=6。查附表6,取0.05时,在n=13 (横行)与X=6(纵列)的交叉处数值为19~75, 即该吻合术妇女受孕率的95%可信区间为(19%, 75%)。 n n X 时,可先按 附表6只列出 X 2 的部分。当 2 1 “阴性”数n-X查得总体阴性率的 可信区间 1 QL~QU,再用下面的公式转换成所需的阳性率 的 可信区间。 PL=1-QU, PU=1-QL

n
2


n (1 )
n (1 )

总体标准差为

若以率表示,则样本率p的 总体均数为
p


总体方差为

2 p

(1 )
n

总体标准差为

p

(1 )
n


样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。 在一般情形下,总体率π往往并不知道。此 时若用样本资料计算样本率p=X/n作为π的 p 估计值,则 的估计为:
0.5 0.4
0.4 0.3
P(X)
P (X)
0.3 0.2 0.1 0 0 1 n= 2 2 3 阳性数X
0.2 0.1 0 0 1 2
n=5
3
4
阳性数X
5
0.3
0.3
0.2
P (X)
0.2
0.1
P(X)
0.1 0
0 1 2 3 4
n= 8
0
5
6
7
8
0
1
2
3
4
5
n=10
6
7
8
9 10
阳性数X
阳性数X

2.正态近似法 当n较大、p和1-p均不太小, 如np和n(1-p)均大于5时,利用样本率的分 布近似正态分布的原理,可作样本率p与已 知总体率π0的比较。检验统计量u值的计算 公式为:
u
p 0
0 (1 0 ) n

例6-6 对某疾病采用常规治疗,其治愈率 为45%。现改用新的治疗方法,并随机抽 取180名该疾病患者进行了新疗法的治疗, 治愈117人。问新治疗方法是否比常规疗 法的效果好? 本例是单侧检验,记新治疗方法的治愈率 为π,而π0=0.45。其假设检验为 H0:π=0.45 H1:π>0.45 =0.05
医学统计学
2012-9-29
第一节 二项分布

二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性” 之一的n次独立重复试验(常常称为n重 Bernoulli试验)中,当每次试验的“阳性” 概率保持不变时,出现“阳性”的次数X=0, 1,2,…,n的一种概率分布。
图 6-2.

=0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法


1. 查表法 对于n 50的小样本资料,直接 查附表6百分率的95%或99%可信区间表, 即可得到其总体率的可信区间。 例6-2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术妇 女受孕率的95%可信区间。
在上面的例6-1中,对这10名非传 染性疾病患者的治疗,可看作10次独 立的重复试验,其疗效分为有效与无 效,且每一名患者治疗有效的概率 (π=0.70)是恒定的。这样,10人中 发生有效的人数X~B(10,0.70)。


(二) 二项分布的性质
1. 二项分布的均数与标准差 在 n 次独立 重复试验中,出现“阳性”次数X的 总体均数为 总体方差为

(三)两样本率的比较
两样本率的比较,目的在于对相应的两总体率进 行统计推断。
x0 n
n! X ! ( n X )!
2012-9-29
医学统计学
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10 人,试分别计算这10人中有6人、7人、8人 有效的概率。 本 例 n=10 , π=0.70 , X=6 , 7 , 8 。 按 公 式 (6-1)计算相应的概率为



本例n=180,p=117/180=0.65
u

0 . 65 0 . 45 0 . 45 (1 0 . 45 ) 180
5 . 394
查u界值表(t界值表中 为 ∞的一行)得 单侧 P 0 . 0005 。按 а=0.05水准,拒绝H0, 接受H1 ,即新的治疗方法比常规疗法的效 果好。
2012-9-29
医学统计学


在医学中类似如这种n重Bernoulli试验的 情形较为常见。 如用某种药物治疗某种疾病,其疗效分 为有效或无效; 在动物的致死性试验中,动物的死亡或 生存; 接触某种病毒性疾病的传播媒介后,感 染或非感染等。
2012-9-29 医学统计学

若从阳性率(死亡率、感染率等) 为π的总体中随机抽取大小为n的样本, 则出现阳性数为X的概率分布即呈二项 分布,记为X~B(n,π).
相关文档
最新文档