统计学Ch06 几种离散型变量的分布及其应用

合集下载

医学统计学课件:第六章 几种离散型变量的分布及其应用

医学统计学课件:第六章  几种离散型变量的分布及其应用

2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.52 SPSS: 常用PDF函数(23种)
11
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
从阳性率为 的总体中随机抽取大小为 n 的
样本,则出现阳性数为 X 的概率分布呈二项分布,
记为 X~B(n,)。
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.2 二项分布,binomial distribution
6
用某药治疗某种疾病,其疗效分为有效或无效, 每个病案的有效率相同; 在动物的致死性试验中,动物的死亡或生存; 接触某种病毒性疾病的传播媒介后,感染或非 感染等。
X 2 X 1 X 0
n 3,( (1 ))3 3 3 2(1 ) 3 (1 )2 (1 )3
2020/10/18
XБайду номын сангаас3
X 2 X 1
X 0
医学统计学 第六章 几种离散型变量的分布及其应用
1.5 例6-1 二项分布概率的计算
9
某种药物治疗某种非传染性疾病的有效率为 0.70。今用该药治疗该疾病患者10人。计算10 人中有6人、7人、8人有效概率。
P(8) 10! 0.708 (1 0.70)108 0.23347 8!(10 8)!
2020/10/18
医学统计学 第六章 几种离散型变量的分布及其应用
1.51 SPSS: PDF函数

06统计学第六章 几种离散型变量的分布及其应用

06统计学第六章  几种离散型变量的分布及其应用

(二)样本率与总体率的比较 1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
(1)出现“阳性”的次数至多为k次的概率为:
对于双侧检验而言, 对于双侧检验而言 , 由于要回答的是 有无差别” “有无差别 ” 即备择假设 H1:π ≠ π0 是否 , 成立,因此 ,所要计算的双侧检验概率 成立,因此,所要计算的双侧检验概率 P 值 应为实际样本( 阳性” 应为实际样本(记“阳性”次数为 k 次)出 现的概率与更背离无效假设的事件( 现的概率与更背离无效假设的事件(记“阳 出现的概率之和, 性”次数为 i 次,i ≠ k)出现的概率之和, 即
第一节 二项分布
二项分布(binomial distribution)是指在只 会产生两种可能结果如“阳性”或“阴性” 之一的n次独立 n 独立 独立重复试验(常常称为n重 n Bernoulli试验)中,当每次试验的“阳性” 概率保持不变时,出现“阳性”的次数X=0, 1,2,…,n的一种概率分布。
10! P ( X = 9) = 0.60 9 (1 − 0.60)10−9 = 0.040311 9!(10 − 9)!
比 实际样本更 背 离 无 效 假 设 的 事 件 , 即 满足 P ( X = i ) ≤ 0.040311 的 i(i ≠ 9)分别有:0、1、2、10。 分别有: 10。 因此, 因此 ,所要计算的双侧检验概率 P 值为
阳性数X
图 6-2.
π =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法

常见离散型随机变量的分布

常见离散型随机变量的分布

P(X
k)
C
k n
pk (1
p)nk
k 0,1, 2, ..., n
称X所服从的分布为二项分布. 记为 X~B(n,p)或X~b(n,p).
二项分布X的分布列表(q=1-p)
X0
1
k
n
P qn Cn1 pqn1
Cnk pk qnk
pn
说明:若X ~ B(n, p),则
二项分布 n 1 两点分布
28
EX E( X1 X 2 X n ) EX1 EX 2 EX n np DX D( X1 X 2 X n ) DX1 DX 2 DX n np(1 p) npq 注:利用方差和的性质时要注意相互独立的条件。
例2 设X表示 10次独立重复射击命中目标的次 数,每次射中目标的概率为0.4, 则X2的数学期 望E(X2)=( 18.4 )
k 0
k0 k !
e
k 1
k1 (k 1)!
ee
E(X )
D(X )
E( X 2 ) k 2P{X k} [k (k 1) k ] k e
k 0
k 0
k!
2e
k 2
E(X )
k2 (k 2)!
2ee 2
D( X ) E( X 2 ) [E( X )]2 2 2
P ( X 3 ) P ( A1 A2 A3 ) (1 p)2 p
所求射击次数X的概率分布为:
P ( X k ) (1 p )k1 p k 1, 2,
四、几何分布
在独立重复伯努利试验中,若成功率(事件A发 生的概率)为p,如果X为首次成功(事件A首次 发生)时的试验次数,X的分布列为
例4、设随机变量 X 服从参数为λ的泊松分布,且已知

常见的离散型随机变量的分布

常见的离散型随机变量的分布

30台设备发生故障不能及时维修为事件 Ai

P( Ai )
P(Y
2)
k 2
e0.3 0.3k k!
0.0369 i 1,2,3
三个人各独立负责30台设备发生故障不能及时
维修为事件 A1 A2 A3 3
PA1 A2 A3 1 P( Ai )
i1
1 (1 0.0369)3 0.1067 0.013459
例1 独立射击5000次,每次的命中率为0.001, 求 (1) 最可能命中次数及相应的概率;
(2) 命中次数不少于2 次的概率.
解 (1) k = [( n + 1)p ] = [( 5000+ 1)0.001] = 5
P5000(5) C55000(0.001)5 (0.999)4995 0.1756
0 1 2 34 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000
P 0.273•
由图表可见 , 当 k 2或3 时, 分布取得最大值
P8(2) P8(3) 0.273 此时的 k 称为最可能成功次数
•••••••••
012345678
(1) 问至少要配备多少维修工人,才能保证当设 备发生故障时不能及时维修的概率小于0.01?
(2) 问3个人共同负责90台还是3个人各自独立负 责30台设备发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人,设 X 为90 台
设备中发生故障的台数,则 X ~ B( 90, 0.01)
90
P( X N ) C9k0 (0.01)k (0.99)Nk
k N 1
令 90 0.01 0.9

第六章 几种离散型变量的分布及其应用(正式)

第六章  几种离散型变量的分布及其应用(正式)

n−x
× × 死 0.2×0.2×0.8=0.032
3 × × 生 0.2×0.8×0.2=0.032 p (x = 1 ) = (1 )π 1 (1 − π )2 = 0.096
2
1
生 死 生
× × 生 0.8×0.2×0.2=0.032 × × 死 0.2×0.8×0.8=0.128 × × 死 0.8×0.2×0.8=0.128 p (x = 2 ) = ( 3 )π 2 (1 − π )1 = 0 .384 2 × × 生 0.8×0.8×0.2=0.128 × × 死 0.8×0.8×0.8=0.512 p(x = 3) =
25
10
10
结论: 结论: 水准, 按α=0.05水准,拒绝 0,接受H1, 水准 拒绝H 接受 认为实施峡部-峡部吻合术妇女的受孕率 认为实施峡部 峡部吻合术妇女的受孕率 要高于壶腹部-壶腹部吻合术妇女的受孕 要高于壶腹部 壶腹部吻合术妇女的受孕 率。
26
直接法(双侧检验 直接法 双侧检验) 双侧检验 回答的是“有无差别” 回答的是“有无差别”,所要计算的双 侧 检验概率P值应为实际样本(记“阳性” 检验概率 值应为实际样本 记 阳性” 值应为实际样本 次 数为k次)出现的概率与更背离无效假设 数为 次 出现的概率与 出现的概率 的极端样本(“阳性 次数i≠k)出现的概 阳性” 的极端样本 阳性”次数 出现的概 率之和。 率之和。
n=3,π=0.5的二项分布 的二项分布
0.4 0.3 pX () 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X
n=10,π=0.5的二项分布 的二项分布
0.5 0.4 pX () 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 X

6卡方检验2002

6卡方检验2002

H0:1


,任两对比组的总体有效率相等
2
H1: 1


,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =

k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n

2 c

(a

b)(c

d )(a
2 c)(b

d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt

spss统计分析讲义 第六章 几种离散型变量的分布及其应用.ppt


0.20012
P(7)
7! 7!(10
0.707(1 7)!

0.7 0)1 0 7

0.26683
P(8)
8! 8!(10
0.708(1 8)!

0.70)1 0 8

0.23347
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.31 SPSS: PDF函数
2020/2/16
医学统计学 第六章 几种离散型变量的分布及其应用
1.32 SPSS: 常用PDF函数(23种)
7
BERNOULLI:贝努里。
BINOM:二项分布。
CHISQ:卡方分布。
第七章。
F:F分布,第四章。
NORMAL:正态分布。
POISSON:泊松分布。
下一节。
T:t分布。
UNIFORM:均匀分布。
X的总体标准差为
2020/2/16
np 1 p
医学统计学 第六章 几种离散型变量的分布及其应用
2.3 例 二项分布的均数与标准差计算 12
若某药治疗某病的有效率p =0.70,治疗该病 患者10人(n=10),
则10人 中 平 均 有 效 人 数X为
m np 10 0.7 7(人)
0.70。今用该药治疗该疾病患者10人。计算 10人中有6人、7人、8人有效概率。
n =10,p =0.70,X=6、7、8。
P( X )
n! X!(n
X )!p X(1 p )n X
X 0,1,2,...,n
P(6)
6! 6!(10
0.706(1 6)!

6第六章二项分布22

6第六章二项分布22

S p = p (1 p ) / n
率的标准误与样本率和样本大小的关系如何? 率的标准误与样本率和样本大小的关系如何? 率的标准误的用途: 率的标准误的用途: ①衡量率的抽样误差 ②衡量样本率的可靠性 ③估计数总体率的可信区间 率的假设检验. ④率的假设检验.
2.二项分布的图形 2.二项分布的图形 (1)π=0.5,对称分布; 0.5,对称分布;
一,二项分布的适用条件和性质 (一)二项分布的适用条件 1.两种结果相互对立; 1.两种结果相互对立 两种结果相互对立; 2.已知固定的π和 n; 2.已知固定的 已知固定的π 3.各次试验相互独立. 3.各次试验相互独立 各次试验相互独立.
(二)二项分布的性质 1.二项分布的均数和标准差 二项分布的均数和标准差 1.绝对数形式: 均数 绝对数形式: 绝对数形式
所有可能结果 生 生 生 生 生 死 生 死 生 死 生 生 生 死 死 死 生 死 死 死 生 死 死 死 合计 每组小白鼠的死亡和生存只数及其概率 每种结果的概率 死亡数 不同死亡数的概率 0.008 0 0.008 0.032 0.032 1 0.096 0.032 0.128 0.128 2 0.384 0.128 0.512 3 0.512 1.000 1.000 -
例6-1 某种药物治疗某种非传染性疾病的 有效率为0.70,无效率为 有效率为 ,无效率为0.30.今用该药治疗该疾 . 病患者10人 试分别计算这10人中有 人中有6人 病患者 人,试分别计算这 人中有 人,7人,8 人 人有效的概率. 人有效的概率.
10! 6 10 6 P (6) = 0.70 (1 0.70) = 0.20012 6!(10 6)! 10! 7 10 7 P (7) = 0.70 (1 0.70) = 0.26683 7!(10 7)! 10! 8 10 8 P (8) = 0.70 (1 0.70) = 0.23347 8!(10 8)!

几种离散型变量

几种离散型变量

u
p 0
0 (1 0 ) n


例 6-6
对某疾病采用常规治疗的治愈率为45%。
现随机抽取180名该疾病患者改用新的治疗方法 进行治疗,治愈117人。问新治疗方法是否比常 规疗法的效果好? 本例是单侧检验,记新治疗方法的治愈率为 π, 而π0=0.45。其假设检验为

H0:π=0.45
p
2

(1 )
n
(1 )
n

总体标准差为
p

样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率 π 往往并不知道。 此时若用样本资料计算样本率 p=X/n作为π 的估计值,则 p 的=0.55
H1:π>0.55
ɑ =0.05
π=0.55
本例 n=10,π=0.55,k=9。按公式(6-12)有:
P(X 9) P ( X )
X 9 10 10 X 9
10! 0.55 X (1 0.55)10 X X !(10 X )!
=0.023257
p1 p 2 u S p1 p2
S p1 p2 X1 X 2 X1 X 2 1 1 (1 )( ) n1 n2 n1 n2 n1 n2
例6-7 为研究某职业人群颈椎病发病的性别差 异,今随机抽查了该职业人群男性 120 人和 女性 110 人,发现男性中有 36 人患有颈椎病, 女性中有22人患有颈椎病。试作统计推断。
二项函数 1 展开式的通项
n
n! P( X ) X (1 ) n X X 0,1, 2, , n X !( n X )!

6.几种离散型变量的分布及其应用

6.几种离散型变量的分布及其应用

P( x) C (1 )
x n x
n x
,( x 1, 2, 3......n)
n! C 式中: x !( n x )!
x n
称二项系数。
一、二项分布的适用条件和性质
(一)二项分布的适用条件:
即分别发生两种结果的概率之和恒等于1。
1. 各观察单位只能具有互相对立的一种结果,属于二项分类资料;
0.000006 0.000138 0.001447 0.009002 0.036757 0.102919 0.200121 0.266828 0.233474 0.121061 0.028248
( a b) C a b C a b C a b C a b
n k 0 n 1 n 1 1 n k n k n 0
C a b
2 n
2 n 2
...
C ab
n k
Bernoulli试验 毒性试验:白鼠 临床试验:病人 临床化验:血清 死亡——生存 治愈——未愈 阳性——阴性
例:对13名输卵管结扎的育龄妇女经壶腹部-壶腹 部吻合术后,观察其受孕情况,发现有7人受孕, 请估计该吻合术妇女受孕率的95%可信区间。
未孕率的95%CI:
注意:X>n/2时应以n-X查表 此例:n=13, n- x=6 查表得95%CI为:19%~75%。
25%~81%
(二)正态近似法:
应用条件:当n较大、 np及n(1−p)均≥5
抓中三个黑球的概率: P(3)=0.5×0.5×0.5=0.12 5
抓中两黑一白的概率: P(2)=3×0.125=0.375
定理:在几个互不相容的事件 中,任一事件发生的概率等于 这几个事件的概率之和。

统计学与研究方法试题答案

统计学与研究方法试题答案

统计学与研究方法试题答案第一章绪论1单选题1、总体是指()A.全部研究对象B.全部研究对象中抽取的一份C.全部样本D.全部研究指标E.全部同质研究对象的某个变量的值2、统计学中所说的样本是指()A.随意抽取的总体中任意部分B.有意识的选择总体中的典型部分C.依照研究者要求选取总体中有意义的一部分D.依照随机原则抽取总体中有代表性的一部分E.有目的的选择总体中的典型部分3、下列资料属等级资料的是()A.白细胞计数B.住院天数C.门急诊就诊人数D.病人的病情分类E.ABO血型分类4、为了估计某年华北地区家庭医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391元。

该研究中研究者感兴趣的总体是()A.华北地区1500户家庭B.华北地区的5个城市C.华北地区1500户家庭的年医疗费用D.华北地区所有家庭的年医疗费用E.全国所有家庭的年医疗费用5、欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度、高血压家族史、月人均收入、吸烟、饮酒、打鼾、脉压差、心率等指标信息。

则构成计数资料的指标有()A.文化程度、高血压家族史吸烟、饮酒、打鼾B.月人均收入、脉压差、心率C.文化程度、高血压家族史、、打鼾D.吸烟、饮酒E.高血压家族史、饮酒、打鼾第二章计量资料统计描述及计数资料统计描述1、描述一组偏态分布资料的变异度,以()指标较好。

A.全距B.标准差C.变异系数D.四分位数间距E.方差2、用均数和标准差可以全面描述()资料的特征。

A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。

A.均数不变B.几何均数不变C.中位数不变D.标准差不变E.变异系数不变4、比较某地1~2岁和5~5.5岁儿童身高的变异程度。

宜用()。

A.极差B.四分位数间距C.方差D.变异系数E.标准差5、偏态分布宜用()描述其分布的集中趋势。

离散型随机变量及其函数的分布

离散型随机变量及其函数的分布
联合分布
对于两个离散型随机变量X和Y,它们的联合分布可以表示为P(X=x,Y=y),其中x和y是 所有可能取值的集合。联合分布可以用来计算两个随机变量的期望和方差。
04
离散型随机变量的函数
线性函数
线性函数
$Y = aX + b$,其中$a$和 $b$为常数。
分布性质
线性函数会改变随机变量的 均值和方差,但不会改变其 离散性。
离散型随机变量的分布函数
定义
离散型随机变量的分布函数是描述随机 变量取值概率的函数,通常用F(x)表示。
VS
性质
分布函数F(x)的值等于随机变量X小于等 于x的所有可能取值的概率之和。
离散型随机变量的概率分布
定义
离散型随机变量的概率分布是描述随机变量 取各个可能值的概率的函数,通常用P(X=x) 表示。
组合概率
如果事件A和B是独立的,那么P(A∪B)=P(A)+P(B)-P(A∩B)。
条件概率
如果事件A和B是独立的,那么P(B|A)=P(B)。
独立性与期望、方差的关系
期望
如果随机变量X和Y是独立的,那么E(XY)=E(X)E(Y)。
方差
如果随机变量X和Y是独立的,那么D(X+Y)=D(X)+D(Y) 。
性质
方差具有线性性质,即D(aX+b)=a^2D(X),其中a和b是常 数。
方差的期望
对于离散型随机变量X,有D(D(X))=D(X)。
离散型随机变量的期望与方差的计算
期望的计算
根据离散型随机变量的定义和概率分布,计算每个可能取值的概率加权和。
方差的计算
根据离散型随机变量的定义和概率分布,计算每个可能取值的概率加权平方与期望值的 差的平方。

离散型统计变量

离散型统计变量

练习 :某类灯泡使用2000小时以上视为正品。已知
有一大批这类的灯泡,次品率是0.2。随机抽出20只灯
泡做寿命试验,求这20只灯泡中恰有3只是次品的概
率。
解: 设X为20只灯泡中次品的个数,则 X ~ B (20, 0.2),
20 3
P( X k )
C (0.2) (0.8)
3 20 3
解:设月底存货为 a 件 则当 X a 时该商品就不会脱销 有
P{X a} 0.95
5k 5 P{ X a} P{ X k} e 0.95 k 0 k 0 k !
a a
5k 5 查附表 1 泊松分布表知 e 0.968 0.95 ,所以 a 最小应是 9. k 0 k !
解 设该商店每月销售该商品的件数为 X 依题意 X ~ P(5) ,且
5 5 P{ X k} e ,(k 0,1,2, ) k!
销售2件产品的概率为
k
52 5 P{ X 2} e 0.0842 2!
例6某商店根据过去的销售记录,总结出某种商品每月 的销售量可以用参数为 5 的泊松分布来描述,试求: (2)下个月该商店销售此种商品多于2件的概率是多少?
求:(1)X 的分布列;(2)编号大于1的概率.
解:事件“编号大于 1”可用随机变量 X 表示为 {X 1} ,有
1 P{ X 2} 2
1 P{ X 3} 6
P{X 1} P{ X 2} P{ X 3}
1 1 2 2 6 3
56页2题
一袋中有5个乒乓球,编号分别为1,2,3,4, 5,从中随机抽取3个,以X表示取出的3个球 中最大的号码,求X的分布列.

离散型变量的分布及其应用

离散型变量的分布及其应用

【解】本例 n=13,X=6。查附表 6,取a=0.05 时,在
n=13(横行)与 X=6(纵列)的交叉处数值为 19–75,即该
吻合术妇女受孕率的 95%可信区间为(19%,75%)。
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.3 反查表求总体率的区间估计(P94)
23
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
3.4 正态近似法求总体率的区间估计(P94) 24
例 6-3 在观测一种药物对某种非传染性疾病的治疗效果 时,用该药治疗了此种非传染性疾病患者 100 人,发现 55 人有效,试据此估计该药物治疗有效率的 95%可信区间。 本例 n=100,X=55,经计算得 p=55/100=0.55,Sp=0.0497。
quant:发生数; n=实验次数; prob:发生率。
P(X=6)= PDF.BINOM(6, 10, 0.7).
When n is 1, this is the same as PDF.BERNOULLI.
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.55 例6-1 SPSS操作过程
n
且 P(X) 1。
X 0
2020/10/23
医学统计学 第六章 几种离散型变量的分布及其应用
1.4 二项系数的展开:杨辉三角
8
1
1次
11
2次
121
3次
1331
n 1, (1 )
X 1 X 0
4次 1 4 6 4 1 5次 1 5 10 10 5 1
n 2,( (1 ))2 2 2 (1 ) (1 )2

离散型随机变量的分布列 课件

离散型随机变量的分布列     课件

[分析] 随机取出 3 个球的最大号码 X 的所有可能取值为 3、4、5、6.“X=3”对应事件“取出的 3 个球的编号为 1、2、 3”;“X=4”对应事件“取出的 3 个球中恰取到 4 号球和 1、 2、3 号球中的 2 个”;“X=5”对应事件“取出的 3 个球中恰 取到 5 号球和 1、2、3、4 号球中的 2 个”;“X=6”对应事 件“取出的 3 个球中恰取到 6 号球及 1、2、3、4、5 号球中的 2 个”,而要求其概率则要利用等可能事件的概率和排列组合 知识来求解,从而获得 X 的分布列.
∴X 的分布列是
X
0
1
P
3 11
8 11
[点评] 两点分布中只有两个对应的结果,因此在解答此 类问题时,应先分析变量是否满足两点分布的条件,然后借助 概率的知识,给予解决.
[解析] 随机变量 X 的可能取值为 3、4、5、6.从袋中随机 地取出 3 个球,包含的基本事件总数为 C36,事件“X=3”包含 的基本事件总数为 C33;事件“X=4”包含的基本事件总数为 C23;事件“X=5”包含的基本事件总数为 C24;事件“X=6” 包含的基本事件总数为 C25.从而有 P(X=3)=CC6333=210,P(X=4) =CC2336=230,P(X=5)=CC6432=130,P(X=6)=CC6532=12.
X x1 x2 … xi … xn P p1 p2 … pi … pn 那么上表称为离散型随机变量 X 的 概率分布列 ,简称 为 X 的分布列.
(2)表示:离散型随机变量可以用表格法 、解析法、图象法 表示.
(3)性质:离散型随机变量的分布列具有如下性质: ①pi ≥ 0,i=1,2,…,n;
n
(2)超几何分布列 一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其 中恰有 X 件次品,则事件{X=k}发生的概率为 P(X=k)=

离散型随机变量的分布列,期望与方差

离散型随机变量的分布列,期望与方差
一,离散型随机变量
1、随机变量:
如果随机试验的结果可以用一个变量来表示, 那么这样的变量叫做随机变量.随机变量常用 希腊字母 ξ、η 等表示.
随机变量将随机事件的结果数量化.
问题:某人射击一次,可能出现哪些结果?
若设射击命中的环数为ξ, 则ξ是一个随机变量. ξ可取0,1,2,…,10. ξ=0,表示命中0环;
(1). pi 0, i 1,2,3,
(2). p1 p2 p3 1
例1、某一射手射击所得环数的分布列如下:
ξ 4 5 6 7 8 9 10
p 0.02 0.04 0.06 0.09 0.28 0.29 0.22
求此射手“射击一次命中环数≥7”的概 率
一般地,离散型随机变量在某一范围内的概 率等于它取这个范围内各个值的概率之和。
例1.设p是 非 负 实 数, 随 机 变 量的 概 率 分 布为
0
1
2
P
1 p 2
p
1 2
则E的 最 大 值 为______,D的 最 大 值 为______
例2.A、B是 治 疗 同 一 种 疾 病 的 两种 药 , 用 若 干 实 验 组 进 行 对 比 实 验 。每 个 试 验 组 由4个 小 白 鼠 组 成 , 其 中2只 服 用A, 另2只 服 用B, 然 后 观 察 疗 效 。 若 在 一 个 试 验 组中 , 服 用A有 效 的 小 白 鼠 的 只 数 比 服 用B有 效 的 多 , 就 称 该 试 验组 为 甲 类
写出ξ的分布列. 解: 随机变量ξ的可取值为 1,2,3.
当ξ=1时,即取出的三只球中的最小号码为1,则其它
两只球只能在编号为2,3,4,5的四只球中任取两只,故
有P(ξ=1)=
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 二项分布
分类资料:分类个体数。最简单——分两类
总体:总个体数 N 某类个体数 M 非某类个体数 N M 总体率(构成比) M / N
统计推断:由样本信息推断
样本:含量:n
某类个体数 X 非某类个体数 n X
样本率(构成比) p X / n
X 0,1, 2,L , n
p 0 , 1 , 2 ,L , n nnn n
N(n,n (1 )) ,而相应的样本率p的分布也近 似 N( , p2) 正态分布。为此,当n较大、 p和1-p均不太小如np和n(1-p)均大于5时, 可利用样本率p的分布近似正态分布来估计 总体率的可信区间。
的1可信区间为:
( p u 2S p , p u 2S p )
如: 的95%可信区间为 ( p 1.96Sp, p 1.96Sp ) 的99%可信区间为 ( p 2.58Sp, p 2.58Sp )
第六章
几种离散型变量的 分布及其应用
讲授内容: 第一节 二项分布 第二节 Poisson分布 第三节 负二项分布(不讲)
随机变量有连续型和离散型之分, 相应的概率分布就可分为连续型分布和 离散型分布。有关连续型分布如 u 分布、
t 分布和 F 分布等在前面的章节中已作
了介绍。本章介绍在医学中常用的三种 离散型分布:二项分布、Poisson 分布和 负二项分布。
75%)。
附表6只列出
X
n2的部分。当X
n 2
时,可先按“阴
性”数n-X查得总体阴性率的1 可信区间QL~QU,
再用下面的公式转换成所需的阳性率的 1可信
区间。 PL=1-QU, PU=1-QL
2. 正态近似法 根据数理统计学的中心极限 定理可得,当n较大、π不接近0也不接近1 时,二项分布B(n,π)近似正态分布
0.55+1.96×0.0497=0.6474
即该药物治疗有效率的 95%可信区间为(45.26%,
64.74% )。
(二)样本率与总体率的比较
1.直接法 在诸如疗效评价中,利用二项分 布直接计算有关概率,对样本率与总体率 的差异进行有无统计学意义的比较。比较 时,经常遇到单侧检验,即“优”或“劣” 的问题。那么,在总体阳性率为π的n次独 立重复试验中,下面两种情形的概率计算 是不可少的。
例6-2 在对13名输卵管结扎的育龄妇女经壶 腹部-壶腹部吻合术后,观察其受孕情况, 发现有6人受孕,据此资料估计该吻合术妇 女受孕率的95%可信区间。
本例n=13,X=6。查附表6,取0.05时,在n=13
(横行)与X=6(纵列)的交叉处数值为19~75,
即该吻合术妇女受孕率的95%可信区间为(19%
8!(10 8)!
一、二项分布的适用条件和性质
(一) 二项分布的适用条件 1. 每次试验只会发生两种对立的可能结果
之一,即分别发生两种结果的概率之和 恒等于1; 2. 每次试验产生某种结果(如“阳性”) 的
概率π固定不变;
3. 重复试验是相互独立的,即任何一次试 验结果的出现不会影响其它试验结果出
规律:二项分布 二项式 1 n
展开的通项
P( X )
(
n X
)
X
(1
)nX
P( p)
式中
(
n X
)
n! X!(n
X
)!
且总有 P( X ) 1
二项分布有两个参数:
总体率
样本含量 n
记作:X~B(n,π)
例6-1 某种药物治疗某种非传染性疾病的有 效率为0.70。今用该药治疗该疾病患者10 人,试分别计算这10人中有6人、7人、8人 有效的概率。
n=8
阳性数X
0 0 1 2 3 4 5 6 7 8 9 10
n=10
阳性数X
图 6-2. =0.4 时,不同 n 值下的二项分布图
二、二项分布的应用 (一)总体率的区间估计 1. 查表法 2. 正态近似法
1. 查表法 对于n 50的小样本资料,直接
查附表6百分率的95%或99%可信区间表, 即可得到其总体率的可信区间。
总体均数为 n
总体方差为 2 n (1 )
总体标准差为 n (1 )
若以率表示,则样本率p的
总体均数为 p
总体方差为
2 p
(1 )
n
总体标准差为
p
(1 )
n
样本率的标准差也称为率的标准误,可用 来描述样本率的抽样误差,率的标准误越 小,则率的抽样误差就越小。
在一般情形下,总体率π往往并不知道。此 时若用样本资料计算样本率p=X/n作为π的 估计值,则 的p 估计为:
S p p(1 p) / n
2.二项分布的图形 对于二项分布而言,当 π=0.5时,分布是对称的,见图6-1;
图 6-1. =0.5 时,不同 n 值下的二项分布
当 0.5时,分布是偏态的,但随着n的增
大,分布趋于对称。当n 时,只要π不
太靠近0或1,二项分布则接近正态分布, 见图6-2。
P(X)
0.5 0.4 0.3 0.2 0.1
0
0
1
2
3
n=2
阳性数X
P(X)
0.4 0.3 0.2 0.1
0 0
12345
n=5
阳性数X
P(X)
0.3
0.3
0.2
0.2
P(X)
0.1
0.1
0
012345678
本 例 n=10 , π=0.70 , X=6 , 7 , 8 。 按 公 式 (6-1)计算相应的概率为
P(6) 10! 0.706 (1 0.70)106 0.20012 6!(11 0.70)107 0.26683
7!(10 7)!
P(8) 10! 0.708 (1 0.70)108 0.23347
例6-3 在观测一种药物对某种非传染性疾病 的治疗效果时,用该药治疗了此种非传染性 疾病患者100人,发现55人有效,试据此估 计该药物治疗有效率的95%可信区间。
本例 n=100,p=55/100=0.55
Sp
p(1 pS)p 0.55(1 0.55) 0.0497
n
100
0.55-1.96×0.0497=0.4526
在上面的例6-1中,对这10名非传染 性疾病患者的治疗,可看作10次独立 的重复试验,其疗效分为有效与无效, 且每一名患者治疗有效的概率
(π=0.70)是恒定的。这样,10人 中发生有效的人数X~B(10,0.70)。
(二) 二项分布的性质
1. 二项分布的均数与标准差 在n次独立重 复试验中,出现“阳性”次数X的
相关文档
最新文档