第二章 随机变量的概率分布与数字特征

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的取值范围及可能取哪些值,其次还要知道它取
这些值的概率,也就是要知道它取值的规律。随
机变量X的取值规律称为X的概率分布,简称分布。
定义2-3 设离散随机变量X的所有可能取值 为 ,X取各个值 相应概率

,则称
式(2-1)
为离散随机变量X的概率分布或分布律,也 称概率函数。
X的概率分布也常用表2-1的方式来表达。
累加起来,就能够求得分布函数,即
例2-7 已知到某药检所送检的10件药品中有2件失效, 若从送检的药品中先后抽检3件,试列出抽检出次品 数的分布函数。
(二)连续随机变量的分布函数 由分布函数的定义及连续随机变量的特点,连续随机 变量X的分布函数为
式(2-5) 其中 为X的密度函数。
从几何上看,
,即
值),记作
(二)、连续型随机变量的数学期望
定义2-11 设连续型随机变量X的密度函数为 称 均值),记作

的值为随机变量的X的数学期望(简称期望或
(三)、随机变量函数的数学期望 定义2-12 设X是一个随机变量,Y=g(X)也是随机变量,
且E(Y)存在,
(1)若X是离散随机变量,其概率分布为
定义2-8 若随机变量X的概率密度函数为
(公式2-6)
其中
态分布,记作
,均为常数,则称X服从参数为
的正
正态分布的分布函数为
(公式2-7)
二、正态分布的图形与性质
f ( x)
F ( x)
1 正态分布曲线是一条关于
1 2
对称的
钟形曲线。
0.5 特点是:两头低,中间高,左右对称。
O

x
Fra Baidu bibliotek
O

x
图2-7 正态分布的概率密度函数f(x)的图像
3.5-10
0.5-0.7
X10E9/L
10 血细胞比容(HCT)
11 平均红细胞体积(MCV) 12 平均血红蛋白含量(MCH)
0.296
86.3 32.4 375
0.35-0.55
78.8-100 27-32 300-600 fl pg g/L
0.2-0.45 2.0-4.0 X10E9/L X10E9/L 1.0-3.3 X10E9/L
1 白细胞计数(WBC)
2 中性粒细胞百分率(NEUT%) 3 中间细胞百分率(MXD%) 4 淋巴细胞百分率(LYMPH%) 5 中性粒细胞绝对值(NEUT#) 6 中间细胞绝对值 (MXD# ) 7 淋巴细胞绝对值(LYMPH#) 8 红细胞计数(RBC)
7.20
0.667 0.033 0.300 4.80 0.20 2.20 3.48
随机变量。
例2-3 观察下列试验的结果,判断是否为离散型随机
变量。
(1)50件产品中有8件次品,其余为正品,从中取出4
件进行检验,则取到的次品数。
(2)某实验一次观测数据为5个,其中异常值的个数。
(3)某交通道口中午1小时内汽车流量。
(二)离散随机变量的概率分布
对于一个随机变量进行研究,首先要判断它
(一)方差的定义 定义2-13 设X是一个随机变量,称 为X的方差,记作 ,即

为X的标准差,记作
(二)方差的性质 性质1 若C是常数,则
性质2 若C是常数,则 性质3 若X、Y相互独立,则
试求:
第二章 随机变量的概率分布 与数字特征
第二节
随机变量的分布函数
定义2-6 设X是一个随机变量,对任意实数x,称函数
式(2-3)
为随机变量X的分布函数。 说明:
对任意实数
,有
特别的:
(一)离散随机变量的分布函数
对于离散随机变量,由于分布函数的定义域为R,
所以任意的
相应概率值
,只要将小于等于x的一切取值 的
(3)一批灯泡的使用寿命。
这些都可以用连续型随机变量来表示。
二、连续型随机变量的概率分布 由于随机变量能够取某些区间中的所有值, 不能像离散型随机变量那样将其所有可能取值 与对应概率一一列出,因而不能用离散型随机
变量的概率函数来描述,于是我们引入概率密
度函数来描述连续随机变量的概率分布。
新生婴儿的体重X是一个随机变量,假如记录很多 个新生婴儿的体重,我们用频率直方图表示出来。x轴 表示体重(单位:500g),y轴表示(频率/组距)。
随机变量X表示“随机取出某药品的检验结果”,用
数值1,表示合格;用数值0,表示不合格,则X作为
样本空间Ω的实值函数定义为:
离散型随机变量 随机变量 非离散型 随机变量
其中最重要的一种
连续型随机变量
二、离散型随机变量
(一)离散型随机变量的定义
定义2-2 如果一个随机变量只能取有限个或
可列无限个值,那么称这个随机变量为离散型
值用小写字母x,y,z等表示。
假如一个随机变量仅取有限个或可列个值,则称其 为离散随机变量。假如一个随机变量的可能取值充满 数轴上的一个区间 (其中a可以是 ,则称其为连续随机变量。 ,b可以是 )
例2-2 某药检所对某种送检的药品进行检查,按合 格与不合格进行分类,使用随机变量表示检验结果。
解:该试验的样本空间为Ω={合格,不合格},若用
第二章 随机变量的概率分布 与数字特征
第二节
连续型随机变量及其概率分布
一、连续型随机变量的定义
定义2-4 如果一个随机变量可以取得某一区间内的
任何数值或在整个数轴上的取值,那么称这个随机变
量为连续型随机变量。
例如:
(1)某小学四年级某班50名女生的身高。
(2)100名健康成年男子血清总胆固醇的测定结果。
(3)采用某种新药对10名患者进行治疗,治愈的患 者人数。
(4)一个肝硬化病人的Hp感染情况,可能出现阳性 Hp(+),也可能出现阴性Hp(-)。
(5)对于某种新药疗效的试验结果,可能为“无
效”、“好转”、“显效”、“治愈”。
定义2-1 定义在样本空间Ω上的实值函数X=X(ω)称
为随机变量,常用字母X,Y,Z等表示随机变量,其取
对于正态分布
,参数
时 。
的正态分布称为标准正态分布,记作
其概率密度函数用
表示为
式(2-8)
图2-9 标准正态分布的密度函数图像
其概率分布函数用
表示为
式(2-9)
1 0.5
图2-10 标准正态分布的分布函数图像
常用公式:
案例2-11 设
,查表求:
四、正态分布的标准化 步骤:
1、找出
2、利用公式: 3、查表求值。
3、正态分布法
第二章 随机变量的概率分布 与数字特征
第四节
随机变量的数字特征
一、数学期望及其性质
问题:有甲、乙两个射手,他们的射击技术用下表表出:
试问:哪个射手技术较好?
(一)、离散型随机变量的数学期望 定义2-10 设离散型随机变量X的概率分布为

的值为随机变量X的数学期望(简称期望或均
的解剖、生理、生化、免疫等各种指标数据的波动
范围。
由于存在个体差异,生物医学数据并非常数而
是在一定范围内波动,故采用医学参考值范围作为
判定正常和异常的参考标准,但不是“金标准”。
2、单、双侧问题,常依据医学专业知识而定。
双侧 : 血清总胆固醇无论过低或过高均属异常 白细胞数无论过低或过高均属异常
异常 正常 异常 双侧上限
表2-1 X的概率分布
X P
概率分布的两个性质
1、非负性:
2、正则性:
表2-2 抛一枚硬币试验的概率分布
X P
0 1/2
1 1/2
表2-3 抛一枚骰子试验的概率分布
X P
0
1
2
3
4
5
6
1/6 1/6 1/6 1/6 1/6
1/6 1/6
例2-2
一位隐性遗传疾病的携带者有两个女儿,则每
个女儿都有1/2的可能性从母亲那里得到一个致病的X染 色体而成为携带者(假设父亲正常),用A、B分别表示 大女儿和小女儿是携带者,试求: (1)女儿中携带者人数X的概率分布; (2)至少有一个为携带者的概率。
第二章 随机变量的概率分布 与数字特征
第一节
离散型随机变量及其概率分布
一、随机变量
在第一章中,我们曾提及随机变量,
我们把“用来表示随机试验结果的变
量”称为随机变量。
例2-1 观察些列随机试验的结果与数值之间的关系

(1)掷一颗骰子出现的点数。
(2)一位隐性遗传疾病的携带者有三个女儿,则女
儿中为该疾病携带者的人数。
3、设X为连续随机变量,则对任意指定实数
,有
即连续随机变量在
处概率为零; ,则
4、设连续随机变量X,对任意
5、几何意义:随机变量X落在区间
由密度函数
内的概率等于
所围成的曲边梯形
的面积。
图2-1 随机变量X落在区间
内概率的几何意义
例2-5 已知随机变量X的概率密度为
例2-6 设随机变量X的概率密度为
积各占50%,越靠近
处曲线下面积越大,两边逐渐减
少。
正态分布的3 原则
图2-11 正态分布的3 原则示意图
六、正态分布的应用举例
1、制定医学参考值的范围 2、质量控制(自学) 3、可疑值取舍(自学)
西京医院检验报告单
姓 名:XXX 性 别:女 年 龄:30岁 No 项 目 病 员 号:91176092 科 别: 床 号: 结果 参考值 标本种类:全血 采样日期:2009-8-09 送检医生: 单位 No 项 目 样本编号:20090809G0050049 临床诊断: 备 注: 结果 参考值 单位
频率/组距
f(x)
X
定义2-5

对于随机变量X,如果存在一个非负可积函
,使对任意 ,都有
式(2-2) 则称 为连续型随机变量X的概率密度函数,简称
概率密度或密度函数。
概率密度函数的性质 1、非负性: 2、归一性: 这两个性质刻画了密度函数的特征,也就是说, 如果某个实值函数具有这两条性质,那么它必定是 某个连续随机变量的密度函数。
双侧下限
单侧上限 : 如:血清转氨酶、
正常 异常 单侧上限
体内有毒物质过高异常(越低越好,<P95)
单侧下限 : 如:肺活量过低异常(越高越好, >P5)
异常
正常
单侧下限
3、医学参考值范围有90%、95%、99% 等, 最常用的为95% 。
计算医学参考值范围的常用方法:
正态分布法
百分位数法
表示密度函数
与 轴在
和点
之间的图像面积。
图2-4 连续变量分布函数
几何意义
例2-8 设随机变量X的概率密度函数为 ,试求X的分布函数
例2-9 设随机变量X的分布函数
,试求:
(1)
(2)X的密度函数。
第二章 随机变量的概率分布 与数字特征
第三节
常用连续随机变量分布 ——正态分布
一、正态分布的定义
13 平均血红蛋白浓度(MCHC)
14 红细胞分布宽度CV(RDW%) 0.137 15 血小板计数(PLT) 16 血小板分布宽度(PDW) 17 平均血小板体积(MPV) 170 14.8 11.50 80-300 12-18 4.0-12.0 X10E9/L fl fl
3.45-6.50 X10E9/L
9 血红蛋白(HCG)
111
115-180
g/L
18 大血小板比率(P-LCR)
0.370
0.15-0.45
检验日期:20090809 注:此检验报告仅对本次标本负责.
报告日期:2009-08-09 09:46:48检验者:XXX
审核者:XXX
(一)制定医学参考值的范围
1、意义:医学参考值是指绝大多数正常人群
案例2-12 设
,查表求
案例2-13 对使用过甘草的许多中药处方进行分析,若 已知每次的甘草用量X~N(8,4),现任抽一张含甘草的 处方,求甘草的用量在5-10g范围内的概率。
五、正态曲线下面积分布规律
◆曲线下的面积即为概率,可通过公式求得。
(公式2-7)
◆曲线下的总面积为1或100%,以
为中心左右两侧面
—位置参数
描述:正态分布的平均水平
决定:正态曲线在X轴上的
位置 固定 ,改变 ,
曲线沿X轴水平移动,形状不变,只改变位置
—形状参数
描述:正态分布的变异程度
决定:正态曲线的分布形状
固定
,改变

越大,曲线越矮胖,表示数据越分散,变异度越大 越小,曲线越高瘦,表示数据越集中,变异度越小
三、标准正态分布
图2-8 正态分布的分布函数的图像
位置参数
固定, 改变
的值
沿X轴平行移动
图像越靠右
3
1
2
形状参数
固定, 改变
的值
越大,图像越平坦 越小,图像越陡峭
2 1
3
1、正态分布曲线是以 值 ;
为对称轴,当
时,取得最大
2、图像在处
有拐点,且以X轴为渐近线;
3、正态分布完全由两个参数

决定:
则随机变量函数g(X)的期望为
(2)设X是连续型随机变量,其密度函数为 随机变量函数 的期望为
,则
(四)、数学期望的性质
性质1 若C是常数,则 性质2 若C是常数,则 性质3 性质4 若X,Y相互独立,则
二、方差及其性质
问题:有丙、丁两个射手,他们的射击技术用下表表出:
试问:哪个射手技术较好?
相关文档
最新文档