第四讲概率分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

16
第一节 正态分布
Z变换
Z
X

17
第一节 正态分布——标准正态分布
若X服从正态分布 N(μ ,σ 2),经此变换后, 则Z就服从均数为0,标准差为1的正态分布,这 种正态分布称为标准正态分布,用 N(0,1)表示,这种变换称为标准化变换, 又称Z变换。
18
0.4
0.35
0.3
4
第一节 正态分布
正态曲线是一条高峰位于中央,两侧逐渐下降 并完全对称,曲线两端永远不与横轴相交的钟 型曲线。
5
第一节 正态分布
正态分布曲线的密度函数
1 f (X ) e 2
( X ) 2 2 2
,
X
此函数式中有四个常数: 为圆周率 e 为自然对数的底,2.71828 与 是两个不确定的常数
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 90
100
不同, 相同
110
120
130
140
150
8
图 不同均数的正态分布
9
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 90
100
110
120
130
140
150
160
相同, 不同
10
图 不同标准差的正态分布
下限:X -1.96S =55.26-1.96×0.38=54.52 (1012 /L) 上限: X +1.96S =55.26+1.96×0.38=56.00( 1012 /L)
33
第一节 正态分布——制定医学参考值范围注意
95%医学参考值范围仅仅告诉我们95%某特定人 群的某项指标测定值在此范围内,并不能说明凡 在此范围内都正常;也不能说明凡不在此范围内 的都不正常。因此医学参考值范围在临床上只能 作为参考,不能作为诊断指标。
P X 4 P4 P5 1 P( X ) 0.5282
3 X 0
38
第二节 二项分布和泊松分布—二项分布
(二)二项分布的特征
二项分布的均数与标准差
n
总体标准差为:
n (1 )
二项分布的图形和正态近似
39
第二节 二项分布和泊松分布—二项分布
1 P( X k 1) 1 P( X )
X 0
37
k 1
若问至多4例有效的累积概率,记作 P X 4
P X 4 P0 P1 P2 P3 P4 1 P5 0.8319
若问至少4例有效的累积概率,记作 P X 4
29
第一节 正态分布——制定医学参考值范围
例如:某市欲制定学龄前儿童血铅的参考值范围
观察对象定为: ①年龄为3~6岁,在本市居住1年以上;
②无肝、肾等器质性病变;
③无铅接触史;
④无特殊的饮食习惯;
⑤测定前3天未进食含铅高的食物。
30
第一节 正态分布——制定医学参考值范围
21
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0 -4
-3
-2
-1
0
1
2
3
4
22
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0 -4
-3
-2
-1
0
1
2
3
4
23
第一节 正态分布——标准正态分布

标准正态分布曲线下 (-1.96, 1.96)区间面积占总面积(或总观察例数) 的95%。 (-2.58, 2.58)区间面积占总面积(或总观察例数) 的99%。
P( X k ) P0 P(1) P(2) P(k ) 次试验中至少发生阳性数为k的累积概率 P(x≥k)
P( X k ) Pk P(k 1) P(n)
X k
P( X )
n
1 ( P(0) P(1) P(k 1))
中医药统计学与软件应用
曹治清
成都中医药大学管理学院 数学与统计教研室 czq9771@163.com
第4讲 概率分布
正态分布
二项分布和泊松分布
三大分布
医学参考值范围的制定
2
25 20 15 10 5 0 109 113 117 121 125 129 133
10 8 6 4 2 0 105 109 113 117 121 125 129 133
13
第一节 正态分布
用μ 和 σ 两个参数就可以描述一个正态分布, 习惯上用N( μ , σ 2)表示均数为μ ,标准 差为σ 的正态分布。 例如,某年某市城区5岁女孩的身高X服从均数为 110.15cm,标准差为5.86cm的正态分布,可记为 X~N(110.15,5.862)。 正态分布在医学科研中应用很广,因为有很多医 学现象是服从正态分布或近似正态分布的。比如 同性别、同年龄儿童的身高,同性别健康成人的 红细胞数、血红蛋白含量、脉搏数等。
< X 1.64S <P95
31
例2.21
某地调查正常成年男子200人的红
细胞数得均数=55.26×1012/L,标准差
S=0.38×1012/L,试估计该地正常成年男子
红细胞数的95%参考值范围。
32
因红细胞数过多或过少均属异常,故取双侧。该地正常成年男子红细胞数 的95%参考值范围为
0 -4 -3 -2 -1 0 1 2 3 4
第一节 正态分布——标准正态分布
为了方便应用,统计学家按标准正态分布的累积 概率分布函数(z)编制了附表2,标准正态分布 曲线下的面积,由表可查出曲线下-∞到z 区间 的面积。 因为正态分布两边对称,所以只给出了Z取负值 的情况。 标准正态曲线下面积用Ф (z)表示。
二项分布的正态近似 由统计学中的中心极限 定理(大样本的统计量服从正态分布)
41
第二节 二项分布和泊松分布—二项分布
当 n 时,二项分布近似于正态分布,二项分 布 X ~ B(k , n, ) 的极限分布就是正态分布 X ~ N (n , n (1 )) 这样,对于二项分布概率的计算,当n较大时, 就可以用正态分布的计算来替代,使得计算更 简化。
14
第一节 正态分布
正态曲线下面积的分布规律
实际工作中经常要知道正态曲线下横轴上一定区 间的面积占总面积的百分数,用以估计某变量值 落在该区间的例数占总例数的百分数,或变量值 落在该区间的概率。 对应于不同的参数μ 和σ 会产生不同位置、不同 形状的正态分布,(X1,X2)范围内的面积也不同。 例如,当μ =0,σ =1时,在(-1.96,1.96)范围 内正态曲线下的面积为95%;而当μ =0,σ =1.96 时,在(-1.96,1.96)范围内正态曲线下的面积 就不是95%,而是68.26%。 15
0.25
0.2
0.15
0.1
0.05
0 -4
-3
-2
-1
0
1
2
3
4
标准正态分布N(0, 1)
19
0 .4
0 .3 5
0 .3
( z )
z
-
1 e 2
- z2 2
dz
0 .2 5
0 .2
0 .1 5
0 .1
0 .0 5
z 标准正态分布曲线下从-∝到z之间的面积( (z) ) 20 示意图
(三)二项分布的应用
二项分布是伯努利概率模型,必须满足其试验条 件:对立性、独立性、重复性
42
k (a)
k-0.5 k k+0.5
k-0.5
k k+0.5
(b)
(c)
二项分布连续性校正和正态近似示意图
43
第二节 二项分布和泊松分布—二项分布
【例5-3】 某地区流行某种传染病,人们受感染的概率 为20%,在该地区某单位共有30人,问:(1) 该单位被 传染人数的平均值、标准差;(2) 现对该单位每人注射 一种能预防该传染病的疫苗,注射后至多有1人被传染, 试推断该疫苗是否真的有效。 ① 平均数 6;标准差 2.19 ②假设该疫苗无效,人们受感染的概率为0.20,不被感 染的概率为0.80,30人中至多有1人被传染的概率也就 是至少29人不被感染的概率为:
1.500 1.672 z2 0.58 0.298
26
0 .4
0 .3 5
0 .3
0 .2 5
0 .2
0 .1 5
0 .1
0 .0 5
0 -4
(z2 ) ( z1 ) 0.2810 0.0571 0.2239
-3
-2
-1
0
1
2
3
4
27
第一节 正态分布——正态分布的应用
第一节 正态分布
①正态分布曲线下与横轴间的面积为1.
②区间(, )内的面积或概率为0.683,区间外为0.317,左 右两侧各为0.1585.
③区间(,)内的面积或概率为0.95,区间外为0.05,左右两 侧各为0.025 . ④区间在(,)内的面积或概率为0.99,此区间外为0.01,左 右两侧各为0.005 .
107 109 111 113 115 117 119 121 123 125 127 129 131 133
3
第一节 正态分布
(一)正态分布的概念
正态分布的图形也称正态曲线,是呈对称的钟形 曲线,它是一条两端低,中间高的有对称轴的曲线 ,最早由德国数学家 Gauss在描述误差分布时所发现 。如频数分布图5-1所示,当样本量不断增大时,分 组就会越来越多,组距就会越来越小,图中的直方 逐渐变窄,整个图形将逐渐形成一条高峰位于中央 ,两侧逐渐降低且左右对称接近光滑的曲线,近似 于数学上的正态分布曲线。可以想象,当样本量增 加至总体数量时,变量的频率分布曲线即为正态分 布曲线,变量的分布称为正态分布。正态分布也称 Gauss分布、“钟形”分布。
确定医学参考值范围 做质量控制图 许多统计方法的理论基础
28
第一节 正态分布——制定医学参考值范围
医学参考值范围是指特定的“正常”人群(排除 了对所研究指标有影响的疾病和有关因素的特定 人群)的解剖、生理、生化指标及组织代谢产物 含量等数据中大多数个体的取值所在的范围。 习惯上取该人群95%的个体某项医学指标的取值 范围为该指标的医学参考值范围。
ຫໍສະໝຸດ Baidu

24
例:已知120名9岁男孩肺活量均数标准差下:
X 1.672 L, S 0.298L
欲估计该市肺活量介于1.200~1.500 L范围
内的9岁男孩的比例 。
25
当分布不是标准正态分布,但已知,和
X 时,先按式
z
X
查表求得曲线下某区间的面积。

求得z值,再
1.200 1.672 z1 1.58 0.298
34
第二节 二项分布和泊松分布—二项分布
(一)二项分布的概念
【例5-2】 用某药治疗慢性支气管炎,若该药的 有效率为70%,用该药试治5例慢性支气管炎患者, 问4例有效的概率是多少? 特点:对立性、独立性、重复性 贝努力试验:在相同条件下进行大量重复、独立 的试验,其结果是相互对立的两个结果。 具备这三点,n次中有k次有效(或无效)的概率 分布就是二项分布 记为B(k,n,π)
11
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 70
80
90
100
110
120
130
140
150
160
、 变化
12
第一节 正态分布
(二)正态分布的特征
关于均数对称。 曲线在均数处最高,在μ ±σ 处有拐点,表现 为钟形曲线。 曲线下面积之和为1。 曲线有两个参数, μ 和σ 。 曲线下面积分布有一定规律。
二项分布的图形的形状与二个参数n和π有关, 当 0.5 时,图形对称;当 0.5时,图形呈偏态, 随着当样本量n的增大,图形逐渐趋于对称。

图5-5
π 为0.5,n为5、10、30时二项分布的概率分布图
40
第二节 二项分布和泊松分布—二项分布

图5-6
π =0.3,n为5、10、30时二项分布的概率分布图
正态分布法:正态分布资料 百分位数法:任何分布资料
异同点 相同点 区 别 点 分布类型 指标特征 正态分布法 1.同质人群 百分位数法
2.n≥100
正态分布
X 1.96S
任何分布
过高过低均异常(Hb)
(P2.5,P97.5)
过低异常(肺活量) > X 1.64S >P 5
过高异常(尿铅)
6
第一节 正态分布
μ 为总体均数,决定曲线在横轴上的位置,又 称位置参数, μ 增大,曲线沿横轴右移;反 之, μ 减小,曲线沿横轴左移。 σ 为总体标准差,决定曲线的形状,又称形 态参数,当μ 恒定时, σ 越大表示数据越分 散,则曲线越矮胖, σ 越小表示数据越集中, 则曲线越高瘦。
7
0.08
35
P( X k ) C (1 )
k n k
n k
n! C k!(n k )!
k n
P( X 4) C (0.7) (0.3)
4 5 4
1
36
第二节 二项分布和泊松分布—二项分布
n次试验中刚好发生阳性数为k的概率P(x=k) n次试验中至多发生阳性数为k的概率P (x≤k)
相关文档
最新文档