第六章 几种离散型变量的分布及其应

合集下载

医学统计学课件:第六章 几种离散型变量的分布及其应用

医学统计学课件:第六章  几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数

离散型随机变量及其分布函数_图文

离散型随机变量及其分布函数_图文

5.超几何分布
设X的分布律为
说明 超几何分布在关于废品率的计件检验中常用到.
三、内容小结
1.常见离散型随机变量的分布 两点分布 二项分布 泊松分布
几何分布 超几何分布
两点分布
二项分布
泊松分布
则 X 的取值范围为 (a, b) 内的任一值.
定义 说明
离散型随机变量的分布律也可表示为 或
例1 设一汽车在开往目的地的路上需经过四盏信号
灯.每盏灯以
的概率禁止汽车通过.以
表示汽车首次停下时已经过的信号灯盏数(信
号灯的工作是相互独立的),求 的分布律.
Байду номын сангаас
离散型随机变量的分布函数与其分布律之间的关系 :
也就是: 分布律
分布函数
二、常见离散型随机变量的概率分布
1.两点分布
设随机变量 X 只取0与1两个值 , 它的分布律为
则称 X 服从 (0-1) 分布或两点分布或伯努利分布.
说明
两点分布是最简单的一种分布,任何一个只有 两种可能结果的随机现象, 比如新生婴儿是男还是 女、明天是否下雨、种籽是否发芽等, 都属于两点 分布.
离散型随机变量及其分布函数_图文.ppt
一、离散型随机变量的分布函数
随机变量
离散型 非离散型
连续型 其它 (1)离散型 若随机变量所有可能的取值为有限个
或可列无穷个,则称其为离散型随机变量.
实例1 观察掷一个骰子出现的点数. 随机变量 X 的可能值是 : 1, 2, 3, 4, 5, 6.
实例2 若随机变量 X 记为 “连续射击, 直至命 中时的射击次数”, 则 X 的可能值是:
二十世纪初罗瑟福和盖克两位科学家在观察 与分析放射性物质放射出的 粒子个数的情况时, 他们做了2608 次观察(每次时间为7.5 秒),发现 放射性物质在规定的一段时间内, 其放射的粒子 数X 服从泊松分布.

离散型随机变量及其分布规律

离散型随机变量及其分布规律

解:
例5. 某射手连续向一目标射击,直到命中为止,
已知他每发命中的概率是p,求射击次数X 的分布列.
解: 显然,X 可能取的值是1,2,… , 为计算 P(X =k ), k = 1,2, …,
设 Ak = {第k 次命中},k =1, 2, …,
于是
P(X =1)=P(A1)=p,
P(X 2)P(A1A2 ) (1 p)p
P(X 3)P(A1A2 A3)(1 p)2p
可见 P(Xk)(1 p)k1p k1,2,
这就是所求射击次数 X 的分布列.
若随机变量X的分布律如上式, 则称X 服从
几何分布. 不难验证:
(1 p)k1p 1
k 1
几个重要的离散性随机变量模型
(0,1)分布 二项分布 波松分布
一、 (0-1)分布 (二点分布)
按Po
k
n=10 n=20 n=40 n=100 =np=1 p=0. p=0.05 p=0.02 p=0.01
0 10.349 0.3585 0.369 0.366
0
1 0.305 0.377 0.372 0.370
0
2 0.194 0.189 0.186 0.185
0
3 0.057 0.060 0.060 0.061
•• • • • • • 56 7 8 9 10








•20x
二项分布的图形特点:
X ~ Bn, p
对于固定n 及 P, 当k 增加时 , 概率P (X = k ) 先是随之增加
Pk
直至达到最大值, 随后单调减少.
当 n 1p 不为整数时, n 1p 二项概率 PX k

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

几种常见离散型变量的分布及其应用

几种常见离散型变量的分布及其应用
二项分布图形由参数n和π决定, 当π=0.5时,分布是对称的,见图6-1
图 6-1.
=0.5 时,不同 n 值下的二项分布
2、二项分布的图形特征
当π≠0.5时,分布是偏态的,但随着n的增大, 分布趋于对称。当n ~ ∞时,只要π不太靠近0 或1,二项分布则接近正态分布, 见图6-2。
图6-2
10! P(X 9) 0.609 (1 0.60)109 0.040311 9!(10 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P( X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为
X k X k
X !(n X )!
对于双侧检验而言,由于要回答的是 “有无差别” ,即备择假设 H1:π π0 是否 成立,因此,所要计算的双侧检验概率 P 值 应为实际样本(记“阳性”次数为 k 次)出 现的概率与更背离无效假设的事件(记“阳 性”次数为 i 次,i k)出现的概率之和, 即
5.394
查u界值表(t界值表中 v为 ∞的一行)得单 侧 P<0.005 。按 а=0.05水准,拒绝H0, 接受H1,即新的治疗方法比常规疗法的效 果好。
(三)两样本率的比较 两样本率的比较,目的在于对相应的两总体率 进行统计推断。 设两样本率分别为p1和p2,当n1与n2均较大, 且p1 、1-p1 及p2 、1-p2 均不太小,如n1p1 、 n1(1-p1)及n2p2 、n2(1-p2)均大于5时,可利 用样本率的分布近似正态分布,以及独立的 两个正态变量之差也服从正态分布的性质, 采用正态近似法对两总体率作统计推断。
验中,下面两种情形的概率计算是不可少的。

6 第6讲 离散型随机变量及其分布列

6 第6讲 离散型随机变量及其分布列

第6讲 离散型随机变量及其分布列1.随机变量的有关概念(1)随机变量:随着试验结果的变化而变化的变量,常用字母X ,Y ,ξ,η,…表示. (2)离散型随机变量:所有取值可以一一列出的随机变量. 2.离散型随机变量的分布列及其性质(1)概念:一般地,若离散型随机变量X 可能取的不同值为x 1,x 2,…,x i ,…,x n ,X 取每一个值x i (i =1,2,…,n )的概率P (X =x i )=p i ,则下表X x 1 x 2 … x i … x n Pp 1p 2…p i…p n的概率分布列,简称为的分布列,有时为了表达简单,也用等式P (X =x i )=p i ,i =1,2,…,n 表示X 的分布列.(2)离散型随机变量的分布列的性质 ①p i ≥0(i =1,2,…,n ); ②∑ni =1p i =1. 3.两点分布若随机变量X 服从两点分布,则其分布列为X 0 1 P1-pp=P (X =1)称为成功概率[疑误辨析]判断正误(正确的打“√”,错误的打“×”)(1)随机变量和函数都是一种映射,随机变量把随机试验的结果映射为实数.( ) (2)抛掷均匀硬币一次,出现正面的次数是随机变量.( ) (3)离散型随机变量的各个可能值表示的事件是彼此互斥的.( )(4)离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.( )(5)由下表给出的随机变量X 的分布列服从两点分布.( )X 2 5 P0.30.7[教材衍化]1.(选修2-3P77A 组T1改编)设随机变量X 的分布列如下:解析:由分布列的性质知,112+16+13+16+p =1, 所以p =1-34=14.答案:142.(选修2-3P49A 组T1改编)有一批产品共12件,其中次品3件,每次从中任取一件,在取到合格品之前取出的次品数X 的所有可能取值是________.解析:因为次品共有3件,所以在取到合格品之前取到次品数为0,1,2,3. 答案:0,1,2,33.(选修2-3P49A 组T5改编)设随机变量X 的分布列为解析:由13+m +14+16=1,解得m =14,P (|X -3|=1)=P (X =2)+P (X =4) =14+16=512. 答案:512[易错纠偏]随机变量的概念不清.袋中有3个白球、5个黑球,从中任取两个,可以作为随机变量的是( ) A .至少取到1个白球 B .至多取到1个白球 C .取到白球的个数D .取到的球的个数解析:选C.A ,B 两项表述的都是随机事件,D 项是确定的值2,并不随机;C 项是随机变量,可能取值为0,1,2.故选C.离散型随机变量的分布列的性质设离散型随机变量X的分布列为X 01234P 0.20.10.10.3m(2)|X-1|的分布列.【解】由分布列的性质知:0.2+0.1+0.1+0.3+m=1,解得m=0.3.(1)2X+1的分布列为2X+113579P 0.20.10.10.30.3(2)|X-1|的分布列为|X-1|012 3P 0.10.30.30.3(变问法)在本例条件下,求P(1<X≤4).解:由本例知,m=0.3,P(1<X≤4)=P(X=2)+(X=3)+P(X=4)=0.1+0.3+0.3=0.7.离散型随机变量分布列的性质的应用(1)利用分布列中各概率之和为1可求参数的值,此时要注意检验,以保证每个概率值均为非负值;(2)若X为随机变量,则2X+1仍然为随机变量,求其分布列时可先求出相应的随机变量的值,再根据对应的概率写出分布列.1.设随机变量X等可能地取1,2,3,…,n,若P(X<4)=0.3,则n的值为() A.3B.4C .10D .不确定解析:选C.“X <4”的含义为X =1,2,3,所以P (X <4)=3n =0.3,所以n =10.2.随机变量X 的分布列如下:X -1 0 1 Pabc解析:因为a ,b ,c 成等差数列,所以2b =a +c . 又a +b +c =1,所以b =13,所以P (|X |=1)=a +c =23.又a =13-d ,c =13+d ,根据分布列的性质,得0≤13-d ≤23,0≤13+d ≤23,所以-13≤d≤13. 答案:23 ⎣⎡⎦⎤-13,13离散型随机变量的分布列(高频考点)离散型随机变量的分布列是高考命题的热点,多以解答题的形式出现,试题难度不大,多为容易题或中档题.主要命题角度有:(1)用频率代替概率的离散型随机变量的分布列; (2)古典概型的离散型随机变量的分布列;(3)与独立事件(或独立重复试验)有关的分布列的求法.(下一讲内容) 角度一 用频率代替概率的离散型随机变量的分布列某商店试销某种商品20天,获得如下数据:日销售量(件)0 1 2 3 频数1595当天营业结束后检查存货,若发现存量少于2件,则当天进货补充至3件,否则不进货,将频率视为概率.(1)求当天商店不进货的概率;(2)记X 为第二天开始营业时该商品的件数,求X 的分布列. 【解】 (1)P (当天商店不进货)=P (当天商品销售量为0件)+P (当天商品销售量为1件)=120+520=310.(2)由题意知,X 的可能取值为2,3.P (X =2)=P (当天商品销售量为1件)=520=14;P (X =3)=P (当天商品销售量为0件)+P (当天商品销售量为2件)+P (当天商品销售量为3件)=120+920+520=34.所以X 的分布列为X 2 3 P1434角度二 古典概型的离散型随机变量的分布列(2020·浙江省名校协作体高三联考)一个盒子里装有大小均匀的6个小球,其中有红色球4个,编号分别为1,2,3,4;白色球2个,编号分别为4,5,从盒子中任取3个小球(假设取到任何一个小球的可能性相同).(1)求取出的3个小球中,含有编号为4的小球的概率;(2)在取出的3个小球中,小球编号的最大值设为X ,求随机变量X 的分布列. 【解】 (1)“设取出的3个小球中,含有编号为4的小球”为事件A ,P (A )=C 12C 24+C 22C 14C 36=45,所以取出的3个小球中,含有编号为4的小球的概率为45.(2)X 的可能取值为3,4,5.P (X =3)=1C 36=120;P (X =4)=C 12C 23+C 22C 13C 36=920;P (X =5)=C 25C 36=12,所以随机变量X 的分布列为X 3 4 5 P12092012离散型随机变量分布列的求解步骤(1)明取值:明确随机变量的可能取值有哪些,且每一个取值所表示的意义. (2)求概率:要弄清楚随机变量的概率类型,利用相关公式求出变量所对应的概率. (3)画表格:按规范要求形式写出分布列.(4)做检验:利用分布列的性质检验分布列是否正确.[提醒] 求随机变量某一范围内取值的概率,要注意它在这个范围内的概率等于这个范围内各概率值的和.某校校庆,各届校友纷至沓来,某班共来了n 位校友(n >8且n ∈N *),其中女校友6位,组委会对这n 位校友登记制作了一份校友名单,现随机从中选出2位校友代表,若选出的2位校友是一男一女,则称为“最佳组合”.(1)若随机选出的2位校友代表为“最佳组合”的概率不小于12,求n 的最大值;(2)当n =12时,设选出的2位校友代表中女校友人数为X ,求X 的分布列.解:(1)由题意可知,所选2人为“最佳组合”的概率为C 1n -6C 16C 2n =12(n -6)n (n -1),则12(n -6)n (n -1)≥12, 化简得n 2-25n +144≤0,解得9≤n ≤16, 故n 的最大值为16.(2)由题意得,X 的可能取值为0,1,2,则P (X =0)=C 26C 212=522,P (X =1)=C 16C 16C 212=611,P (X =2)=C 26C 212=522,X 的分布列为X 0 1 2 P522611522[基础题组练]1.设某项试验的成功率是失败率的2倍,用随机变量X 去描述1次试验的成功次数,则P (X =0)等于( )A .0 B.12 C.13D.23解析:选C.设X 的分布列为X1即“X =0”表示试验失败,“X =1”表示试验成功.由p +2p =1,得p =13,故应选C.2.设随机变量Y 的分布列为则“32≤Y ≤72”的概率为( )A.14B.12C.34D.23解析:选C.依题意知,14+m +14=1,则m =12.故P ⎝⎛⎭⎫32≤Y ≤72=P (Y =2)+P (Y =3)=12+14=34. 3.设随机变量X 的概率分布列如下表所示:若F (x )=P A.13 B.16 C.12D.56解析:选D.由分布列的性质,得a +13+16=1,所以a =12.而x ∈[1,2),所以F (x )=P (X ≤x )=12+13=56. 4.已知离散型随机变量X 的分布列为则P (X ∈Z )=( ) A .0.9 B .0.8 C .0.7D .0.6解析:选A.由分布列性质得0.5+1-2q +13q =1,解得q =0.3,所以P (X ∈Z )=P (X =0)+P (X =1)=0.5+1-2×0.3=0.9,故选A. 5.抛掷2颗骰子,所得点数之和X 是一个随机变量,则P (X ≤4)=________. 解析:抛掷2颗骰子有36个基本事件,其中X =2对应(1,1);X =3对应(1,2),(2,1);X =4对应(1,3),(2,2),(3,1).所以P (X ≤4)=P (X =2)+P (X =3)+P (X =4)=136+236+336=16.答案:166.已知随机变量ξ只能取三个值:x 1,x 2,x 3,其概率依次成等差数列,则公差d 的取值范围是________.解析:设ξ取x 1,x 2,x 3时的概率分别为a -d ,a ,a +d ,则(a -d )+a +(a +d )=1,所以a =13,由⎩⎨⎧13-d ≥0,13+d ≥0,得-13≤d ≤13.答案:⎣⎡⎦⎤-13,13 7.若离散型随机变量X 的分布列为则常数c =________,P (X 解析:由分布列的性质知,⎩⎪⎨⎪⎧9c 2-c ≥0,3-8c ≥0,9c 2-c +3-8c =1,解得c =13,故P (X =1)=3-8×13=13.答案:13 138.在一个口袋中装有黑、白两个球,从中随机取一球,记下它的颜色,然后放回,再取一球,又记下它的颜色,则这两次取出白球数X 的分布列为________.解析:X 的所有可能值为0,1,2.P (X =0)=C 11C 11C 12C 12=14,P (X =1)=C 11C 11×2C 12C 12=12,P (X =2)=C 11C 11C 12C 12=14.所以X 的分布列为答案:9.(1)写出正面向上次数X 的分布列; (2)求至少出现两次正面向上的概率. 解:(1)X 的可能取值为0,1,2,3. P (X =0)=C 0323=18;P (X =1)=C 1323=38;P (X =2)=C 2323=38;P (X =3)=C 3323=18.所以X 的分布列为(2)至少出现两次正面向上的概率为 P (X ≥2)=P (X =2)+P (X =3)=38+18=12.10.(2020·台州高三质检)在一次购物活动中,假设每10张券中有一等奖券1张,可获得价值50元的奖品;有二等奖券3张,每张可获得价值10元的奖品;其余6张没有奖.某顾客从这10张券中任取2张.(1)求该顾客中奖的概率;(2)求该顾客获得的奖品总价值X (元)的分布列.解:(1)该顾客中奖的概率P =1-C 04C 26C 210=1-1545=23.(2)X 的所有可能取值为0,10,20,50,60,且P (X =0)=C 04C 26C 210=13,P (X =10)=C 13C 16C 210=25,P (X =20)=C 23C 210=115,P (X =50)=C 11C 16C 210=215,P (X =60)=C 11C 13C 210=115.故X 的分布列为X 0 10 20 50 60 P1325115215 1151.(2020·浙江高中学科基础测试)一个袋子装有大小形状完全相同的9个球,其中5个红球编号分别为1,2,3,4,5;4个白球编号分别为1,2,3,4,从袋中任意取出3个球.(1)求取出的3个球编号都不相同的概率;(2)记X 为取出的3个球中编号的最小值,求X 的分布列.解:(1)设“取出的3个球编号都不相同”为事件A ,“取出的3个球中恰有两个球编号相同”为事件B ,则P (B )=C 14C 17C 39=2884=13,所以P (A )=1-P (B )=23.(2)X 的取值为1,2,3,4,P (X =1)=C 12C 27+C 22C 17C 39=4984,P (X =2)=C 12C 25+C 22C 15C 39=2584,P (X =3)=C 12C 23+C 22C 13C 39=984,P (X =4)=1C 39=184.所以X 的分布列为X 1 2 3 4 P71225843281842.O 为起点,再从A 1,A 2,A 3,A 4,A 5,A 6,A 7,A 8(如图),这8个点中任取两点分别为终点得到两个向量,记这两个向量的数量积为X .若X =0就参加学校合唱团,否则就参加学校排球队.(1)求小波参加学校合唱团的概率;(2)求X 的分布列.解:(1)从8个点中任取两点为向量终点的不同取法共有C 28=28(种),当X =0时,两向量夹角为直角,共有8种情形,所以小波参加学校合唱团的概率为P (X =0)=828=27. (2)两向量数量积X 的所有可能取值为-2,-1,0,1,X =-2时,有2种情形;X =1时,有8种情形;X =-1时,有10种情形.所以X 的分布列为3.袋中装有黑球和白球共7个,从中任取2个球都是白球的概率为17.现在甲、乙两人从袋中轮流摸取1球,甲先取,乙后取,然后甲再取……取后不放回,直到两人中有一人取到白球为止,每个球在每一次被取出的机会是相等的,用X 表示终止时所需要的取球次数.(1)求袋中原有白球的个数;(2)求随机变量X 的分布列;(3)求甲取到白球的概率.解:(1)设袋中原有n 个白球,由题意知17=C 2n C 27=n (n -1)27×62=n (n -1)7×6, 所以n (n -1)=6,解得n =3或n =-2(舍去).即袋中原有3个白球.(2)由题意知X 的可能取值为1,2,3,4,5.P (X =1)=37; P (X =2)=4×37×6=27; P (X =3)=4×3×37×6×5=635; P (X =4)=4×3×2×37×6×5×4=335;P (X =5)=4×3×2×1×37×6×5×4×3=135. 所以取球次数X 的分布列为(3)因为甲先取,所以甲只可能在第1次、第3次和第5次取球. 设“甲取到白球”的事件为A ,则P (A )=P (X =1或X =3或X =5).因为事件“X =1”“X =3”“X =5”两两互斥,所以P (A )=P (X =1)+P (X =3)+P (X =5)=37+635+135=2235.。

离散型随机变量及其分布

离散型随机变量及其分布
(0-1)分布的分布律用表格表示为:
X0 1
P 1-p p
0
易求得其分布函数为: F (x) 1 p
1
x0 0 x 1
x 1
2.二项分布(binomial distribution): 定义:若离散型随机变量X的分布律为
PX k Cnk pkqnk k 0,1,L , n
其中0<p<1,q=1-p,则称X服从参数为n,p的二项
下面我们看一个应用的例子.
例7 为保证设备正常工作,需要配备适量的 维修人员 . 设共有300台设备,每台独立工作, 且发生故障的概率都是0.01。若在通常的情况 下,一台设备的故障可由一人来处理 , 问至 少应配备多少维修人员,才能保证当设备发生 故障时不能及时维修的概率小于0.01?
我们先对题目进行分析:
§2.2 离散型随机变量及其分布
一、离散型随机变量及其分布律
1.离散型随机变量的定义 设X为一随机变量,如X的全部可能取到的值
是有限个或可列无限多个,则称随机变量X为离 散型随机变量(discrete random variable)。
设X是一个离散型随机变量,它可能取的值 是 x1, x2 , … .为了描述随机变量 X ,我们不仅 需要知道随机变量X的取值,而且还应知道X取 每个值的概率.
定义1 :设xk(k=1,2, …)是离散型随机变 量X所取的一切可能值,称等式
P(X xk) pk, k=1,2,… …
为离散型随机变量X的概率函数或分布律, 也称概率分布.
其中 pk (k=1,2, …) 满足:
(1) pk 0,
(2) pk1
k
k=1,2, …
用这两条性质判断 一个函数是否是

医学统计学PPT课件

医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100

N=5万 → X =118.6cm
• 特点:1)不可避免性

第六章 几种离散型变量的分布及其应用(正式)

第六章  几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X

离散型随机变量及其分布函数

离散型随机变量及其分布函数
第2.2节 离散型随机变量 及其分布函数
一、离散型随机变量的分布函数 二、几种常见的离散型随机变量 三、小结
一、离散型随机变量的分布函数
随机变量
离散型 非离散型
连续型 其它 (1)离散型 若随机变量所有可能的取值为有限个
或可列无穷个,则称其为离散型随机变量.
实例1 观察掷一个骰子出现的点数. 随机变量 X 的可能值是 : 1, 2, 3, 4, 5, 6.
因此 P{X 2} 1 P{X 0} P{X 1} 1 (0.98)400 400(0.02)(0.98)399 0.9972.
3. 泊松分布
设随机变量所有可能取的值为 0, 1, 2, ,而取各个 值的概率为
P{X k} ke , k 0,1, 2, ,
k!
其中 0是常数.则称 X 服从参数为的泊松分 布,记为 X ~ ().
P{X k} Cnk pnk (1 pn )nk 且满足
npn 0
则对任意非负整数k , 有
lim P{X k} k e
n
k!
证明

pn
,得
n
P{ X
k}
n! k!(n
( k)!
pn )k
(1
pn )nk
n(n 1) (n k 1() )(k 1 )nk
k!
n
n
k [1 (1 1 )(1 2) (1 k 1)](1 )n (1 )k
(k 1,2,)
说明 几何分布可作为描述某个试验 “首次成功” 的概率模型.
5.超几何分布
设X的分布律为
P{X
m}
CMm
C nm NM
(m 0,1,2,, min{M , n})

6卡方检验2002

6卡方检验2002

H0:1


,任两对比组的总体有效率相等
2
H1: 1


,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =

k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n

2 c

(a

b)(c

d )(a
2 c)(b

d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt


0.20012
P(7)
7! 7!(10
0.707(1 7)!

0.7 0)1 0 7

0.26683
P(8)
8! 8!(10
0.708(1 8)!

0.70)1 0 8

0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!

6第六章二项分布22

6第六章二项分布22

S p = p (1 p ) / n
率的标准误与样本率和样本大小的关系如何? 率的标准误与样本率和样本大小的关系如何? 率的标准误的用途: 率的标准误的用途: ①衡量率的抽样误差 ②衡量样本率的可靠性 ③估计数总体率的可信区间 率的假设检验. ④率的假设检验.
2.二项分布的图形 2.二项分布的图形 (1)π=0.5,对称分布; 0.5,对称分布;
一,二项分布的适用条件和性质 (一)二项分布的适用条件 1.两种结果相互对立; 1.两种结果相互对立 两种结果相互对立; 2.已知固定的π和 n; 2.已知固定的 已知固定的π 3.各次试验相互独立. 3.各次试验相互独立 各次试验相互独立.
(二)二项分布的性质 1.二项分布的均数和标准差 二项分布的均数和标准差 1.绝对数形式: 均数 绝对数形式: 绝对数形式
所有可能结果 生 生 生 生 生 死 生 死 生 死 生 生 生 死 死 死 生 死 死 死 生 死 死 死 合计 每组小白鼠的死亡和生存只数及其概率 每种结果的概率 死亡数 不同死亡数的概率 0.008 0 0.008 0.032 0.032 1 0.096 0.032 0.128 0.128 2 0.384 0.128 0.512 3 0.512 1.000 1.000 -
例6-1 某种药物治疗某种非传染性疾病的 有效率为0.70,无效率为 有效率为 ,无效率为0.30.今用该药治疗该疾 . 病患者10人 试分别计算这10人中有 人中有6人 病患者 人,试分别计算这 人中有 人,7人,8 人 人有效的概率. 人有效的概率.
10! 6 10 6 P (6) = 0.70 (1 0.70) = 0.20012 6!(10 6)! 10! 7 10 7 P (7) = 0.70 (1 0.70) = 0.26683 7!(10 7)! 10! 8 10 8 P (8) = 0.70 (1 0.70) = 0.23347 8!(10 8)!

统计学与研究方法试题答案

统计学与研究方法试题答案

统计学与研究方法试题答案第一章绪论1单选题1、总体是指()A.全部研究对象B.全部研究对象中抽取的一份C.全部样本D.全部研究指标E.全部同质研究对象的某个变量的值2、统计学中所说的样本是指()A.随意抽取的总体中任意部分B.有意识的选择总体中的典型部分C.依照研究者要求选取总体中有意义的一部分D.依照随机原则抽取总体中有代表性的一部分E.有目的的选择总体中的典型部分3、下列资料属等级资料的是()A.白细胞计数B.住院天数C.门急诊就诊人数D.病人的病情分类E.ABO血型分类4、为了估计某年华北地区家庭医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391元。

该研究中研究者感兴趣的总体是()A.华北地区1500户家庭B.华北地区的5个城市C.华北地区1500户家庭的年医疗费用D.华北地区所有家庭的年医疗费用E.全国所有家庭的年医疗费用5、欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度、高血压家族史、月人均收入、吸烟、饮酒、打鼾、脉压差、心率等指标信息。

则构成计数资料的指标有()A.文化程度、高血压家族史吸烟、饮酒、打鼾B.月人均收入、脉压差、心率C.文化程度、高血压家族史、、打鼾D.吸烟、饮酒E.高血压家族史、饮酒、打鼾第二章计量资料统计描述及计数资料统计描述1、描述一组偏态分布资料的变异度,以()指标较好。

A.全距B.标准差C.变异系数D.四分位数间距E.方差2、用均数和标准差可以全面描述()资料的特征。

A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。

A.均数不变B.几何均数不变C.中位数不变D.标准差不变E.变异系数不变4、比较某地1~2岁和5~5.5岁儿童身高的变异程度。

宜用()。

A.极差B.四分位数间距C.方差D.变异系数E.标准差5、偏态分布宜用()描述其分布的集中趋势。

离散型随机变量及其分布列

离散型随机变量及其分布列

离散型随机变量及其分布列离散型随机变量是概率论中的一种重要概念。

它是指取有限或无限个数值的随机变量,其可能取值的集合是离散的。

离散型随机变量可以用分布列来描述其取值和对应的概率。

离散型随机变量的分布列是一个表格,其中包含了随机变量的所有可能取值和对应的概率。

这个表格可以用来表示离散型随机变量的分布情况。

每个取值对应的概率是该取值发生的可能性大小。

为了更好地理解离散型随机变量及其分布列,我们可以通过一个简单的例子来说明。

假设有一个掷硬币的实验,正面朝上记为1,反面朝上记为0。

这个实验的随机变量X可以取到的值只能是0或1,因此X是一个离散型随机变量。

通过多次实验,我们记录下了X的取值和对应的频率,得到如下的分布列:| X | 0 | 1 || :--: | :-: | :-: || P(X) | 0.4 | 0.6 |在这个例子中,分布列告诉我们当硬币扔出来后,有40%的可能性出现反面朝上,有60%的可能性出现正面朝上。

离散型随机变量的分布列具有以下性质:1. 所有可能取值的概率大于等于0:对于所有可能取值xi,P(X=xi)大于等于0。

2. 所有可能取值的概率之和为1:所有的概率值P(X=xi)的和等于1,即ΣP(X=xi) = 1。

离散型随机变量的分布列可以通过实验或者推理来确定。

在实验中,可以通过重复进行一定次数的实验,记录下随机变量的取值和对应的频率,从而近似估计出分布列。

在推理中,可以根据问题的给定条件和假设,利用概率论的理论和方法来推导出分布列。

离散型随机变量的分布列对于概率计算和统计分析非常重要。

通过分布列,可以计算出随机变量的期望、方差和其他重要统计量。

同时,分布列也可以用来描述随机变量的概率分布,从而进一步研究随机现象的规律和性质。

常见的离散型随机变量及其分布列有很多,例如二项分布、泊松分布、几何分布等。

这些分布在概率论、统计学和应用领域中都有广泛的应用。

对于每种离散型随机变量,都有其特定的分布列形式和计算方法。

离散型变量的分布及其应用

离散型变量的分布及其应用

【解】本例 n=13,X=6。查附表 6,取a=0.05 时,在
n=13(横行)与 X=6(纵列)的交叉处数值为 19–75,即该
吻合术妇女受孕率的 95%可信区间为(19%,75%)。
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.3 反查表求总体率的区间估计(P94)
23
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.4 正态近似法求总体率的区间估计(P94) 24
例 6-3 在观测一种药物对某种非传染性疾病的治疗效果 时,用该药治疗了此种非传染性疾病患者 100 人,发现 55 人有效,试据此估计该药物治疗有效率的 95%可信区间。 本例 n=100,X=55,经计算得 p=55/100=0.55,Sp=0.0497。
quant:发生数; n=实验次数; prob:发生率。
P(X=6)= PDF.BINOM(6, 10, 0.7).
When n is 1, this is the same as PDF.BERNOULLI.
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.55 例6-1 SPSS操作过程
n
且 P(X) 1。
X 0
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.4 二项系数的展开:杨辉三角
8
1
1次
11
2次
121
3次
1331
n 1, (1 )
X 1 X 0
4次 1 4 6 4 1 5次 1 5 10 10 5 1
n 2,( (1 ))2 2 2 (1 ) (1 )2

2.2离散型随机变量及其分布律

2.2离散型随机变量及其分布律

2. 等可能分布
如果随机变量 X 的分布律为
X
pk
a1 1 n
a2 an 1 1 n n
其中 (ai a j ), ( i j ) , 则称 X 服从等可能分布.
例 抛掷骰子并记出现的点数为随机变量 X,
则有
X
pk
1 1 6
2 1 6
3 1 6
4 1 6
5 1 6
6 1 6
3. 贝努里(伯努利)试验和二项分布
C C P( X 2) 0.00618 C
1 2 95 5 3 100
例9 某类灯泡使用时数在1000小时以上 的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X为三个灯泡在使用1000小时已坏的灯泡数 . 把观察一个灯泡的使用 k 3k P( X k )C (0时数看作一次试验 .8) (0.2) , k , 0,1,2,3 “使用到1000小时已坏” P{X 1} =P{X=0}+ P{X=1} 视为事件 A .每次试验, 2 0.8 出现的概率为 =(0.2)3A +3(0.8)(0.2)
k e
,
k 0,1,2, ,
X ~ P( ).
泊松分布是常见的。 例如
地震 火山爆发 特大洪水
商场接待的顾客数 电话呼唤次数 交通事故次数
n k n k p ( 1 p ) 二项分布与泊松分布的关系 k 历史上,泊松分布是作为二项分布的近似,于 1837年由法国数学家泊松引入的 .
k 0,1,, n
称这样的分布为二项分布.记为 X ~ b( n, p).
二项分布
n1
两点分布
显然, 若X~B(n,p), 则 P{X=k} 表示在n次独立重复试验中A恰好发生k次的概率; P{X≤k} 表示A发生的次数不超过k次的概率;

离散型随机变量的分布列,期望与方差

离散型随机变量的分布列,期望与方差
一,离散型随机变量
1、随机变量:
如果随机试验的结果可以用一个变量来表示, 那么这样的变量叫做随机变量.随机变量常用 希腊字母 ξ、η 等表示.
随机变量将随机事件的结果数量化.
问题:某人射击一次,可能出现哪些结果?
若设射击命中的环数为ξ, 则ξ是一个随机变量. ξ可取0,1,2,…,10. ξ=0,表示命中0环;
(1). pi 0, i 1,2,3,
(2). p1 p2 p3 1
例1、某一射手射击所得环数的分布列如下:
ξ 4 5 6 7 8 9 10
p 0.02 0.04 0.06 0.09 0.28 0.29 0.22
求此射手“射击一次命中环数≥7”的概 率
一般地,离散型随机变量在某一范围内的概 率等于它取这个范围内各个值的概率之和。
例1.设p是 非 负 实 数, 随 机 变 量的 概 率 分 布为
0
1
2
P
1 p 2
p
1 2
则E的 最 大 值 为______,D的 最 大 值 为______
例2.A、B是 治 疗 同 一 种 疾 病 的 两种 药 , 用 若 干 实 验 组 进 行 对 比 实 验 。每 个 试 验 组 由4个 小 白 鼠 组 成 , 其 中2只 服 用A, 另2只 服 用B, 然 后 观 察 疗 效 。 若 在 一 个 试 验 组中 , 服 用A有 效 的 小 白 鼠 的 只 数 比 服 用B有 效 的 多 , 就 称 该 试 验组 为 甲 类
写出ξ的分布列. 解: 随机变量ξ的可取值为 1,2,3.
当ξ=1时,即取出的三只球中的最小号码为1,则其它
两只球只能在编号为2,3,4,5的四只球中任取两只,故
有P(ξ=1)=
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P P( X 9) P( X 0) P( X 1) P( X 2) P( X 10)
=0.040311+0.000104858+0.001572864+0.010617 +0.006046618 =0.058652 0.05<P<0.10,按 =0.05 水准,不拒绝 H0,尚不 能认为甲、乙两种药物的疗效不同。
第一节
二项分布
二项分布




一个袋子里有5个乒乓球,其中2个黄球,3个白球, 我们进行摸球游戏,每次摸1球,然后放回再摸。先 后摸5次,摸到黄球的可能是0次,可能是1次、2次 等,也可能每次都摸到黄球。 问摸到黄球次数为0的概率有多大?为1的概率?为2 的概率?5次均为黄球的概率? 每一次摸到黄球的概率是0.4,摸到白球的概率是0.6, 如果5次里前x次摸到的是黄球,以后5-x次摸到的是 白球,相应的概率是0.4x0.65-x
P(X 9) 10! 0.609 (1 0.60)109 0.040311 9!(10 9)!
比 实 际 样 本 更 背 离 无 效 假 设 的 事 件 , 即 满足 P( X i) 0.040311 的 i(i 9)分别有:0、1、2、10。 因此,所要计算的双侧检验概率 P 值为

在医学中类似如这种n重Bernoulli试验的情形 较为常见。
如用某种药物治疗某种疾病,其疗效分为有效 或无效; 在动物的致死性试验中,动物的死亡或生存;



接触某种病毒性疾病的传播媒介后,感染或非 感染等。

若从阳性率(死亡率、感染率等)为π的 总体中随机抽取大小为n的样本,则出现 阳性数为X的概率分布即呈二项分布,记 为X~B(n,π).

=0.05


对这 10名实施峡部 -峡部吻合术的妇女 , 按 0.55的受孕率,若出现至少9人受孕的概率大 于0.05,则不拒绝H0 ;否则,拒绝H0 ,接受 H 1。 本例n=10,π=0.55,k=9。按公式(6-12) 有:
P(X 9)
P( X )
X 9
10
10
X 9

本例 n=13,X=6。查附表 6, 取 0.05 时,在 n=13 (横行)与X=6(纵列)的交叉处数值为19~75, 即该吻合术妇女受孕率的95%可信区间为(19%, 75%)。 附表6只列出X
n n X 2 的部分。当 2
时,可先按“阴 性”数n-X查得总体阴性率的 可信区间QL~QU, 1 1 再用下面的公式转换成所需的阳性率的 可信区 间。 PL=1-QU, PU=1-QL
一、二项分布的适用条件和性质



(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果 之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”)的 概率π固定不变; 3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出 现的概率。
n n! 称为二项系数。总有: P ( X ) 1 。 X ! ( n X )! x0
例6-1 某种药物治疗某种非传染性疾病的有效率 为0.70。今用该药治疗该疾病患者10人,试分 别计算这10人中有6人、7人、8人有效的概率。
本例n=10,π=0.70,X=6,7,8。 按公式(6-1)计算相应的概率为
第六章
几种离散型变量的 分布及其应用
Distribution and Application of Discrete Data
Binomial
distribution Poissin distribution



随机变量有连续型和离散型之分,相应的 概率分布就可分为连续型分布和离散型分布。 有关连续型分布如正态分布、t分布和F分 布等在前面的章节中已作了介绍。 本章主要介绍在医学中较为常用的离散型 分布,即二项分布、Poisson分布。
P(X
k) P( X )
X 0
k
k
X 0
n! X (1 ) n X X !( n X )!
(2)出现“阳性”的次数至少为k次的概率为
P(X k) P( X )
X k
n
n
X k
n! X (1 ) n X X !(n X )!
0.38 0.37 0.36 0.35 0.34 0.33 0.32 0.31 0.30
P(X ) 1
P(X) 0.0000059 0.0001378 0.0014467 0.0090017 0.0367569 0.1029193 0.2001209 0.2668279 0.2334744 0.1210608 0.0282475

n
2

n (1 )
n (1 )


若以率表示,则样本率p的 总体均数为
p
p
2

总体方差为
总体标准差为
(1 )
n
(1 )
n

p


样本率的标准差也称为率的标准误,可用来描 述样本率的抽样误差,率的标准误越小,则率 的抽样误差就越小。 在一般情形下,总体率π往往并不知道。此时 若用样本资料计算样本率p=X/n作为π的估计 值,则 p 的估计为:
10! 6 106 P(6) 0.70 (1 0.70) 0.20012 6! (10 6)!
10! 7 107 P(7) 0.70 (1 0.70) 0.26683 7! (10 7)!
10! 8 108 P(8) 0.70 (1 0.70) 0.23347 8! (10 8)!
Sp
p(1 p) / n

2.二项分布的图形 对于二项分布而言,当 π=0.5时,分布是对称的,见图6-1;
图 6-1.
=0.5 时,不同 n 值下的二项分布

当 0.5时,分布是偏态的,但随着n的增大, 分布趋于对称。当n 时,只要π不太靠近0 或1,二项分布则接近正态分布,见图6-2。
0.5 0.4 0.3 0.2 0.1 0 0 1 n=2 2 3 阳性数X
0.4 0.3
P(X)
P(X)
0.2 0.1 0 0 1 2
n=5
3
4
阳性数X
5
0.3
0.3
0.2
P(X)
0.1
P(X)
0.2 0.1 0
0
0
1
2
3
4
n=8
5
6
7
8
0 1 2 3 4 5 6 7 8 9 10
n=10 阳性数X
二项分布
二项分布的概念与特征 这个实验有三个特点:

一是各次摸球是彼此独立的; 二是每次摸球只有二种可能的结果,或黄球或白球; 三是每次摸到黄球(或摸到白球)的概率是固定的。

具备这三点, n次中有X次摸到黄球(或白球) 的概率分布就是二项分布。

二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性”之 一的n次独立重复试验(常常称为n重 Bernoulli试验)中,当每次试验的“阳性” 概率保持不变时,出现“阳性”的次数X=0, 1,2,…,n的一种概率分布。

2. 正态近似法 根据数理统计学的中心极限定理可 得,当n较大、π不接近0也不接近1时,二项分布 B(n,π)近似正态分布 N (n , n (1 )) ,而相应的 N ( , p 2 ) 样本率p的分布也近似正态分布 。为此, 当n较大、p和1-p均不太小,如np和n(1-p)均大于 5时,可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
10! 0.55 X (1 0.55)10 X X !(10 X )!
=0.023257

按=0.05水准,拒绝H0,接受H1,即认为实施 峡部-峡部吻合术妇女的受孕率要高于壶腹部壶腹部吻合术。
例 6-5 已知某种非传染性疾病采用甲药治疗的 有效率为 0.60。今改乙药治疗该疾病患者 10 人,发 现 9 人有效。问甲、乙两种药物的疗效是否不同? 显然,这是双侧检验的问题。记乙药治疗该疾病 的有效率为π,其假设检验为 H0:π=0.60 H1:π 0.60 =0.05 本例 n=10,按π=0.60,实际样本阳性数 X =9 出现 的概率由公式(6-1)有
治疗10例可能的有效例数及其概率 X C10 有效人数x X (1 )n X
0 1 1 10 0.70 0.71 0.310 0.39
2 3 4 5 6 7 8 9 10
45 120 210 252 210 120 45 10 1
0.72 0.73 0.74 0.75 0.76 0.77 0.78 0.79 0.710
本例 n=100,p=55/100=0.55
Sp p(1 p) Sp n 0.55(1 0.55) 0.0497 100
0.55-1.96×0.0497=0.4526 0.55+1.96×0.0497=0.6474 即该药物治疗有效率的 95%可信区间为(45.26%, 64.74% ) 。
二项分布有两个参数:
总体率
样本含量

n
记作:X~B(n,π)
在n个独立的个体中出现X个阳性的概率可由下式求 出:
n! P( X ) X (1 )n X X !(n X )!
P( X )
X 0,1, 2, , n
实际 上就是二 项函数 (1 )n 展 开式中的 通项,式中 的
相关文档
最新文档