第六章 几种离散型变量的分布及其应用(正式)
医学统计学课件:第六章 几种离散型变量的分布及其应用
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数
高考数学知识点精讲常见随机变量的分布类型
高考数学知识点精讲常见随机变量的分布类型高考数学知识点精讲:常见随机变量的分布类型在高考数学中,随机变量的分布类型是一个重要的知识点,理解和掌握这些分布类型对于解决概率相关的问题至关重要。
下面我们就来详细讲解一下常见的随机变量分布类型。
首先,我们来认识一下什么是随机变量。
简单来说,随机变量就是把随机试验的结果用数字表示出来。
比如说掷骰子,我们可以定义随机变量 X 为骰子掷出的点数,那么 X 可能取值 1、2、3、4、5、6。
常见的随机变量分布类型主要有以下几种:一、离散型随机变量的分布1、两点分布两点分布是最简单的一种离散型随机变量分布。
比如抛一枚硬币,正面朝上记为1,反面朝上记为0,那么这个随机变量就服从两点分布。
其概率分布为 P(X = 1) = p,P(X = 0) = 1 p ,其中 0 < p < 1 。
2、二项分布二项分布在实际生活中有很多应用。
比如进行n 次独立重复的试验,每次试验只有两种结果(成功或失败),成功的概率为 p ,失败的概率为 1 p 。
那么成功的次数 X 就服从二项分布,记为 X ~ B(n, p) 。
二项分布的概率公式为:P(X = k) = C(n, k) p^k (1 p)^(n k) ,其中 C(n, k) 表示从 n 个元素中选出 k 个元素的组合数。
举个例子,假设一批产品的次品率为 02,从这批产品中随机抽取10 个,那么抽到次品个数 X 就服从二项分布 B(10, 02) 。
3、超几何分布超几何分布与二项分布有点类似,但适用的场景略有不同。
超几何分布是从有限 N 个物件(其中包含 M 个指定种类的物件)中抽出 n 个物件,成功抽出指定种类物件的次数 X 就是超几何分布。
超几何分布的概率公式为:P(X = k) = C(M, k) C(N M, n k) /C(N, n) 。
比如说在一个有 50 个球,其中 20 个红球,30 个白球的盒子中,随机抽取 10 个球,红球的个数 X 就服从超几何分布。
第六章 几种离散型变量的分布及其应用(正式)
n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
第六章 几种离散型变量的分布
累积概率函数:
P( X k )
k x n x
P( X
X 0 n x
k
k)
C (1 )
x 0
由上可知: n次Bernoulli试验中,事件A发生的次数K服从二项 分布。 n次Bernoulli试验有如下特点: A、各次试验结果相互独立; B、每次试验只有二种可能的结果; C、每次试验事件A发生的概率是固定的。
k n k
n k
0<π<1, K=0,1,2,……, n 则称随机变量X服从参数为n, π的二项分布, 记为X ~ B (n, π )或B(X; n, π )
例:临床用针灸治疗某型头痛,有效的概率 为60%,现以该法治疗3例,其中两例有效 的概率是多少?
例:据报道,有10%的人对某药有胃肠道反 应。为考察某厂的产品质量,现任选5人服 用此药。求:2个人有胃肠道反应的概率; 不多于2个人有胃肠道反应的概率。
假定符合一定条件的病人可视为相同的个体。若某药治愈概 率为60%,现用该药治疗10例病人,求治愈病人数的概率分布
X
Pi
样本率P=x/n
0
1
0.0001
0.0016
0.00%
10.00%
2
3 4 5 6 7 8 9 10
0.0106
0.0425 0.1115 0.2007 0.2508 0.2150 0.1209 0.0403 0.0060
>5 合计
12 96
12.5 100.0
96 ——
100.0 ——
对此资料我们可均数、标准差等数值特征指标来概括 资料的特点,均数、标准差可利用原始资料计算。
但更进一步的了解,需知道每一事件所对应的发生概率。
6卡方检验2002
H0:1
,任两对比组的总体有效率相等
2
H1: 1
,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =
k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n
2 c
(a
b)(c
d )(a
2 c)(b
d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05
医学统计学课件:第六章 几种离散型变量的分布及其应用
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 二项分布的发生数X均数与标准差
17
在 n 次独立重复试验中,出现“阳性”次数 X 的总体均数为
=n
X 的总体方差为
2=n (1-)
X 的总体标准差为
n 1
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
X 3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt
0.20012
P(7)
7! 7!(10
0.707(1 7)!
0.7 0)1 0 7
0.26683
P(8)
8! 8!(10
0.708(1 8)!
0.70)1 0 8
0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!
几种离散型变量
u
p 0
0 (1 0 ) n
?
例 6-6
对某疾病采用常规治疗的治愈率为45%。
现随机抽取180名该疾病患者改用新的治疗方法 进行治疗,治愈117人。问新治疗方法是否比常 规疗法的效果好? 本例是单侧检验,记新治疗方法的治愈率为 π, 而π0=0.45。其假设检验为
H0:π=0.45
p
2
(1 )
n
(1 )
n
总体标准差为
p
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率 π 往往并不知道。 此时若用样本资料计算样本率 p=X/n作为π 的估计值,则 p 的=0.55
H1:π>0.55
ɑ =0.05
π=0.55
本例 n=10,π=0.55,k=9。按公式(6-12)有:
P(X 9) P ( X )
X 9 10 10 X 9
10! 0.55 X (1 0.55)10 X X !(10 X )!
=0.023257
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别差 异,今随机抽查了该职业人群男性 120 人和 女性 110 人,发现男性中有 36 人患有颈椎病, 女性中有22人患有颈椎病。试作统计推断。
二项函数 1 展开式的通项
n
n! P( X ) X (1 ) n X X 0,1, 2, , n X !( n X )!
《医学统计学》计算题答案
《医学统计学》最佳选择题和计算分析题答案教材:孙振球,徐勇勇主编. 医学统计学. 第4版. 北京:人民卫生出版社,2014最佳选择题答案第二章计量资料的统计描述(第20-21页)(1)D (2)C (3)D (4)D (5)C (6)E (7)E (8)D (9)E (10)B第三章总体均数的估计与假设检验(第43-44页)(1)E (2)C (3)E (4)E (5)B (6)E (7)D (8)E (9)D (10)C第四章多个样本均数比较的方差分析(第63-64页)(1)D (2)C (3)D (4)A (5)C (6)A (7)A第五章计数资料的统计描述(第20-21页)(1)B (2)D (3)A (4)A (5)E (6)D (7)C (8)E (9)B (10)D第六章几种离散型变量的分布及其应用(第94页)(1)A (2) 不要求(3) 不要求(4)E (5)不要求(6)不要求第七章c2检验(第112-113页)(1)D (2)C (3)C (4)A (5)不要求(6)A (7)不要求第八章秩转换的非参数检验(第128页)(1)E (2)D (3)D (4)D (5)A (6)C第九章双变量回归与相关(第151-152页)(1)B (2)E (3)C (4)C (5)不要求(6)D (7)B (8) 不要求第十章统计表与统计图(第163-164页)(1)B (2)D (3)B (4)E (5)选项有误 (6)D (7)E (8)D (9)C (10)C 注:第(5)题的选项是(箱式图),但5个选项中没有“箱式图”。
第十九章生存分析(第300页)(1)A (2) E (3)B (4)D (5)D第三十四章观察性研究设计(第544-545页)(1)C (2)C (3)C (4)C (5)D (6)C (7)A (8)D (9)D (10)A (11)E (12)E (13)B (14)A (15)B第三十六章试验研究设计(第582页)(1)D (2)D (3)D (4)E (5)A (6)D第三十七章临床试验研究设计(第603-604页)(1)C (2)C (3)C (4)D计算分析题参考答案第二章计量资料的统计描述计算分析题(P21)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
6.几种离散型变量的分布及其应用
P( x) C (1 )
x n x
n x
,( x 1, 2, 3......n)
n! C 式中: x !( n x )!
x n
称二项系数。
一、二项分布的适用条件和性质
(一)二项分布的适用条件:
即分别发生两种结果的概率之和恒等于1。
1. 各观察单位只能具有互相对立的一种结果,属于二项分类资料;
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
( a b) C a b C a b C a b C a b
n k 0 n 1 n 1 1 n k n k n 0
C a b
2 n
2 n 2
...
C ab
n k
Bernoulli试验 毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
例:对13名输卵管结扎的育龄妇女经壶腹部-壶腹 部吻合术后,观察其受孕情况,发现有7人受孕, 请估计该吻合术妇女受孕率的95%可信区间。
未孕率的95%CI:
注意:X>n/2时应以n-X查表 此例:n=13, n- x=6 查表得95%CI为:19%~75%。
25%~81%
(二)正态近似法:
应用条件:当n较大、 np及n(1−p)均≥5
抓中三个黑球的概率: P(3)=0.5×0.5×0.5=0.12 5
抓中两黑一白的概率: P(2)=3×0.125=0.375
定理:在几个互不相容的事件 中,任一事件发生的概率等于 这几个事件的概率之和。
医学统计学——变量的分类与统计资料的类型
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
同正常。 总体:1)某地所有的正常成年男子
2)某地所有的正常成年男子的 红细胞数
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的
• 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
• 2)无限总体(infinite population):研 究单位数是无限的
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
错单位等,亦称过失误差(gross error) • 这类误差应当通过认真检查核对予以清除,否
则将会影响研究结果的准确性。
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
为 什 么 要
学 医 学 统
计 统计知识 学 的运用 ?
概率论常见分布性质及应用
概率论常见分布性质及应用概率论是研究随机现象的规律性及概率性问题的数学分支。
常见的概率论分布有离散分布和连续分布两种。
下面将对常见的概率论分布性质及其应用进行详细阐述。
一、离散分布:1. 伯努利分布(Bernoulli Distribution):伯努利分布是最简单的离散分布,它只有两个取值0和1,其中0发生的概率为p,1发生的概率为q=1-p。
伯努利分布通常用来表示只有两个可能结果的试验,如掷硬币的结果。
应用:伯努利分布可以用于模拟二项分布的单次试验结果,也可以用于描述二分类问题的概率分布。
2. 二项分布(Binomial Distribution):二项分布描述了一系列独立重复的伯努利试验,在每次试验中,都有成功的概率p,失败的概率q=1-p。
将n次伯努利试验的成功次数定义为X,X的取值为0到n。
二项分布的概率质量函数可以表示为P(X=k) = C(n,k) * p^k * q^(n-k)。
应用:二项分布可以用于模拟多次试验的结果,如投掷硬币、扔骰子等。
在实际应用中,二项分布也可以用于描述二分类问题的概率分布,如判断客户是否购买某个产品。
3. 泊松分布(Poisson Distribution):泊松分布描述了在一个固定时间间隔内某个事件发生的次数的概率分布。
泊松分布的概率质量函数可以表示为P(X=k) = (lambda^k * e^(-lambda)) / k!,其中lambda为事件发生的平均次数。
应用:泊松分布广泛应用于描述实际生活中的随机事件,如交通事故发生的次数、电话呼叫的次数等。
此外,泊松分布还可以用于模拟排队论中的到达与服务过程。
二、连续分布:1. 均匀分布(Uniform Distribution):均匀分布是最简单的连续分布,它的概率密度函数在一个有限区间内是常数,而在区间外为零。
均匀分布的概率密度函数可以表示为f(x) = 1/(b-a),其中a和b为区间的起始和结束点。
第六章 几种常见离散型变量的分布及其应用(li)
=0.040311+0.000104858+0.001572864+0.010617 +0.006046618 =0.058652 0.05<P<0.10,按 =0.05 水准,不拒绝 H0,尚不 能认为甲、乙两种药物的疗效不同。
患者进行了新疗法的治疗,治愈117人。问新治
疗方法是否比常规疗法的效果好?
本例是单侧检验,记新治疗方法的治愈率为π,而 π0=0.45。其假设检验为 H0:π=0.45 H1:π>0.45
α =0.05
本例n=180,p=117/180=0.65
u
0.65 0.45 0.45(1 0.45) 180
检验统计量u的计算公式为:
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
10! P(X 9) 0.609 (1 0.60)109 0.040311 9!(10 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P( X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
P X C 1
X n X
n X
其中X=0,1,2…,n。 n,π 是二项分布的两个参数 。
对于任何二项分布,总有
二项式展开各项就是每种组合的概率
其一般表达式为:
由于各观察单位是独立的,则从该总体中随机抽取n例,
其中恰有x例是阳性的概率为二项式展开,
离散型变量的分布及其应用
【解】本例 n=13,X=6。查附表 6,取a=0.05 时,在
n=13(横行)与 X=6(纵列)的交叉处数值为 19–75,即该
吻合术妇女受孕率的 95%可信区间为(19%,75%)。
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.3 反查表求总体率的区间估计(P94)
23
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.4 正态近似法求总体率的区间估计(P94) 24
例 6-3 在观测一种药物对某种非传染性疾病的治疗效果 时,用该药治疗了此种非传染性疾病患者 100 人,发现 55 人有效,试据此估计该药物治疗有效率的 95%可信区间。 本例 n=100,X=55,经计算得 p=55/100=0.55,Sp=0.0497。
quant:发生数; n=实验次数; prob:发生率。
P(X=6)= PDF.BINOM(6, 10, 0.7).
When n is 1, this is the same as PDF.BERNOULLI.
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.55 例6-1 SPSS操作过程
n
且 P(X) 1。
X 0
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.4 二项系数的展开:杨辉三角
8
1
1次
11
2次
121
3次
1331
n 1, (1 )
X 1 X 0
4次 1 4 6 4 1 5次 1 5 10 10 5 1
n 2,( (1 ))2 2 2 (1 ) (1 )2
统计学知识点(完整)
基本统计方法第一章 概论1. 总体(Population):根据研究目的确定的同质对象的全体(集合);样本(Sample):从总体中随机抽取的部分具有代表性的研究对象。
2。
参数(Parameter):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。
3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。
第二章 计量资料统计描述1. 集中趋势:均数(算术、几何)、中位数、众数2。
离散趋势:极差、四分位间距(QR =P 75—P 25)、标准差(或方差)、变异系数(CV )3。
正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f (X )取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68。
27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
4。
医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法:P 2。
5-P 97.5.第三章 总体均数估计和假设检验1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。
抽样误差不可避免,产生的根本原因是生物个体的变异性.2. 均数的标准误(Standard error of Mean , SEM ):样本均数的标准差,计算公式:/X σσ=3。
降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。
4。
t 分布特征:①单峰分布,以0为中心,左右对称;②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
31
u
p 0 0 (1 0 ) / n 117 / 180 0.45 0.45 1 0.45) 180 ( / 5.394
u=5.394>u0.0005=3.2905 p<0.0005 结论:按=0.05水准,拒绝H0,接受H1, 认为新治疗方法比常规疗法效果好。
负二项分布
2
第一节 二 项 分 布
一、定义 二、适用条件
三、性质
四、二项分布的应用
3
第一节 二项分布
Binomial Distribution
4
Bernoulli试验
毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
特点:某结果发生(A)——结果不发生(非A) 这类只有两种互斥结果可能发生的单次随机 试验称为Bernoulli试验。
27
例5 已知某种非传染性疾病采用甲药治疗 的有效率为0.60。今改用乙药治疗该病患 者10人,发现9人有效。问甲乙两种药物 的疗效是否不同? H0: =0.60 H1: ≠0.60 =0.05
28
10! P( X 9 ) 0.609 (1 0.60)10 9 0.040311 9! (10 9)!
20
正态近似法
当n较大、p和1-p均不太小,如np和 n(1-p)均大于5时: (P - uα/2 Sp , P + uα/2 Sp )
21
例3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染 性疾病患者100人,发现55人有效,试据 此估计该药物治疗有效率的95%可信区间。 本例n=100,p=55/100=0.55
n=6,π=0.3的二项分布
0.3
0.2
p(X)
0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.3的二项分布
0.3
0.2
p(X)
0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13
n=20,π=0.3的二项分布
四、二项分布的应用
1. 总体率的区间估计 2. 样本率与总体率的比较 3. 两样本率的比较 4. 研究非遗传性疾病的家族集聚性
19
例2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术 妇女受孕率的95%可信区间。 本例n=13,X=6。查附表6,取0.05时, 在n=13(横行)与X=6(纵列)的交叉处 数值为19~75,即该吻合术妇女受孕率的 95%可信区间为(19%,75%)。
5
一、定义
二项分布(binomial distribution) 是指在 只会产生两种可能结果如“阳性”或“阴 性”之一的n次独立重复试验(常常称为n 重Bernoulli试验)中,当每次试验的“阳 性”概率保持不变时,出现“阳性”的次 数X=0,1,2, ,n的一种概率分布。 记为X~B (n, ), n为试验次数, 为 “阳性”概率。
33
例7 为研究某职业人群颈椎病发病的性别 差异,今随机抽查了该职业人群男性120 人和女性110人,发现男性中有36人患有 颈椎病,女性中有22人患有颈椎病。试作 统计推断。 记该职业人群颈椎病的患病率男性为π1, 女性为π2,其检验假设为 H0:π1=π2 H1:π1≠π2 34 =0.05
比实际样本更背离无效假设的样本,即满 足P(X=i)≤0.040311的 i (i≠k) 分别有:0、1、 2、10。 P=P(X=9)+P(X=0)+P(X=1)+P(X=2)+P(X=10) = 0.040311+0.000105+0.001573+0.010617 +0.006047=0.058653 结论:按=0.05水准,不拒绝H0,尚不能 认为甲乙两种药物的疗效不同。
x x0
n
11
三、性质
1.平均数 μ=nπ
μp=π(以率表示)
2.标准差
p n(1 ) (1 ) (以率表示) n
12
例1中出现“阳性”次数的均数与标准差
X x n 3 0 .8 2 . 4 X p 0 .8 S x n(1 ) 3 0.8(1 0.8) 0.6928 S p (1 ) / n 0.8 (1 0.8) / 3 0.2309
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布
0.5 0.4
p(X)
0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=3,π=0.3的二项分布
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
S p 0.55(1 0.55) / 100 0.0497
0.55±1.96×0.0497=0.4526,0.6474 即该药物治疗有效率的95%可信区间为 (45.26%,64.74% )。
22
2.样本率与总体率的比较 直接法(单侧检验) 若回答“差”或“低”的问题,需计算 出现“阳性”次数至多为K次的概率:
死 0.20.20.8=0.032
3 生 0.20.80.2=0.032 px 1 1 1 1 2 0.096
2
1
生 死 生
生 0.80.20.2=0.032 死 0.20.80.8=0.128 死 0.80.20.8=0.128 px 2 3 2 1 1 0.384 2 生 0.80.80.2=0.128 死 0.80.80.8=0.512 px 3 3 3 1 0 0.512 3
x 0,1,2, , n
C
x
n
也记作
n 学中二项式定理
n ( a b)
Cn a Cn a b Cn a
n
0
1
n 1
2
n 2
b Cn ab
2
n 1
n 1
Cn b n
n
Cn a n-xb x
25
10
10
结论: 按=0.05水准,拒绝H0,接受H1, 认为实施峡部-峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验)
回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 次 数为k次)出现的概率与更背离无效假设 的极端样本(“阳性”次数i≠k)出现的概 率之和。
n X n! X P( X k ) P( X ) (1 ) ! X 0 X 0 X! (n X) k k
若回答“优”或“高”的问题,需计算 出现“阳性”次数至少为K次的概率:
n X n! X P( X k ) P( X ) (1 ) ! Xk X k X! (n X ) 23 n n
例4 据报道,对输卵管结扎了的育龄妇女 实施壶腹部-壶腹部吻合术后,受孕率为 0.55。今对10名输卵管结扎了的育龄妇女 实施峡部-峡部吻合术,结果有9人受孕。 问实施峡部-峡部吻合术妇女的受孕率是否 高于壶腹部-壶腹部吻合术? H0: =0.55 H1: >0.55 =0.05
24
按0.55的受孕率,10名实施峡部-峡部吻合 术的妇女,出现至少9人受孕的概率:
5. 群检验
18
1.总体率的区间估计
查表法
对于n≤50小样本资料,直接查附表6“百分率 的可信区间”表。得总体率1-可信区间。
附表6中X最大为25,当X>n/2时,按“阴性” 数n-X查得总体阴性率的1-可信区间QL~ QU,再转换成阳性率的1-可信区间: PL=1-QU ,PU=1-QL。
32
3.两样本率的比较 当n1与n2均较大,p1、1-p1和p2、1-p2均不 太小,如n1 p1、 n1(1-p1)和n2 p2、 n2(1-p2) 均大于5时:
p1 p 2 u S p1 p 2
S p1 p 2 X1 X2 X1 X2 1 1 1 n1 n 2 n 1 n 2 n1 n 2
13
3.图形 =0.5时,二项分布对称。 ≠0.5时,二项分布偏态。 当n较大、p和1-p均不太小,如np和 n(1-p) 均大于5时,二项分布近似正态 分布。
14
0.4 0.3
p(X)
0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=3,π=0.5的二项分布
6
二、适用条件
1. 每次试验只会发生两种对立的结果之一, 两种互斥结果的概率之和恒等于1;
2. 每次试验产生某种结果(如“阳性”) 的概率π固定不变; 3. 各次试验是互相独立的,即任何一次试 验结果的出现不会影响其它试验结果出 现的概率。
7
例1
设小白鼠接受某种毒物一定剂量时,其死 亡率为80%, 对每只小白鼠来说,其死亡 概率为0.8,生存概率为0.2,若每组各用甲、 乙、丙三只小白鼠逐只做实验,观察每组 小白鼠的存亡情况,其可能发生的结果见 下表。
1
2
死 死
0