随机变量概率和概率分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、概率分布(probability distribution)
概率分布:描述随机变量值xi及这些值对应概率 P(X=xi)的表格、公式或图形。
• 离散型随机变量概率分布 • 连续型随机变量概率分布
1. 离散型随机变量的概率分布
表 4.3 性别(X) 概率(P) 婴儿的性别情况表 1(女) 0.483 0(男 ) 0.517
第三节 常用的概率分布 离散型随机变量分布 一、二项分布 二、泊松分布 连续型随机变量分布 三、正态分布
一、二项分布
毒性试验:白鼠 临床试验:病人 临床化验:血清 事件 死亡——生存 治愈——未愈 阳性——阴性
成功(A)——失败(非A)
这类“成功─失败型”试验称为Bernoulli试 验。
Bernoulli试验序列
35 30 25
人数
20 15 10 5 0
7~
1~
5~
9~
3~
7~
1~
5~ 5. 5.
2.
3.
3.
3.
4.
4.
Байду номын сангаас
5.
血清总胆固醇(mmol/L)
图2 - 1
表2 - 4 数据的直方图
9~
6.
3
如果样本量很大,组段很多,矩形顶端组成 的阶梯型曲线可变成光滑的分布曲线。 大多数 情况下,可采用一个函数拟合这一光滑曲线。 这种函数称为概率密度函数(probability density function)
150 名成年男子血清胆固醇的频数与频率
划记 ( 2) 正正正 T 正正正正正 正正正正正 T 正正正正正正 正正正止 正正正 正上 正频数(f) ( 3) 6 12 25 28 31 19 15 8 6 频率(P)% ( 4) 4.00 8.00 16.67 18.67 20.67 12.67 10.00 5.33 4.00
频率与概率间的关系:
1. 样本频率总是围绕概率上下波动 2. 样本含量n越大,波动幅度越小,频 率越接近概率。
第二节 随机变量及其概率分布概述
一、随机变量
每次抛两个硬币,记录正、反面结果;结果可记 录为: 硬币1正面朝上,硬币2正面朝上; 2个正面 硬币1正面朝上,硬币2反面朝上; 1个正面 硬币1反面朝上,硬币2正面朝上; 1个正面 硬币1反面朝上,硬币2反面朝上 0个正面
如果连续型随机变量X的概率密度函数记为:
f ( x)
则在区间[x1,x2] 范围内的概率可由微积分函
数定义
F ( X ) P{x1 X x2} f ( x)dx
x1 x2
( x1, x2 ) (, )
F ( X ) P{ x } f ( x)dx 1
表 7-1 死 亡 数 存 活 数
3 只 白 鼠 各 种 试 验 结 果 及 其 发 生 概 率
试 验 结 果 甲 生 死 生 生 乙 生 生 死 生 死 生 死 死 丙 生 生 生 死 生 死 死 死 试 验 结 果 的 概 率
X取
值 概 率
X
0 1
3 X
3 2
k 3k P( X ) ( 3 k ) (1 ) 0 3 P( X 0) ( 3 0 ) (1 )
成功次数的概率分布─二项分布
• 例 设某毒理试验采用白鼠共3只,它们 有相同的死亡概率π,相应不死亡概率为 1-π 。记试验后白鼠死亡的例数为X, 分别求X=0、1、2和3的概率
k n k P( X k ) ( n ) (1 ) k k nk n 右侧(n ) (1 ) 为二项式 [ (1 )] 展开式的各项 k
第四章 随机变量、概率和概率分布
本章内容
第一节 概率的有关概念 第二节 随机变量及其概率分布概述 第三节 常用的概率分布 二项分布、泊松分布、正态分布 第四节 常用的抽样分布 卡方分布、t分布、F分布
第一节
概率的有关概念
一、频率与概率 frequency and probability
样本的实际发生率称为频率。设在相同 条件下,独立重复进行n次试验,事件A出现 f 次,则事件A出现的频率为f/n。 概率:随机事件发生的可能性大小,用 大写的P 表示;取值[0,1]。
变量的取值充满整个数值区间,无 法一一列出其每一个可能值。 一般将连续型随机变量整理成频数 表,对频数作直方图,直方图的每个 矩形顶端连接的阶梯形曲线来描述连 续型变量的频数分布。
表 2.4
组段 (1) 2.7~ 3.1~ 3.5~ 3.9~ 4.3~ 4.7~ 5.1~ 5.5~ 5.9~6.3
离散型随机变量概率分布的表格形式
X
x1
x2
„„ „„
xk p(xk)
„„
p(X=xi) p(x1) p(x2)
„„
离散型随机变量分布的特点:
(1) 0 p( xi ) 1(i 1, 2,...)
(2) p( xi ) 1
所有xi
(4.1)
离散型随机变量的概率分布举例
2. 连续型随机变量的概率分布
正面数就是一个随机变量,记为x,我们通常对x 的每个取值的概率感兴趣。
对于本例,x的取值为0、1、2。
二、离散型随机变量与连续型随机变量
离散型随机变量(discrete random variable): 数据间有缝隙,其取值可以列举。 例如抛硬币10次,正面的可能取值x为0、1、2、3、 4、5、6、7、8、9、10 连续型随机变量(continous random variable)数 据间无缝隙,其取值充满整个区间,无法一一列举每 一可能值 例如身高、体重、血清胆固醇含量
n次Bernoulli试验构成了Bernoulli试验序列。 其特点(如抛硬币)如下: (1)每次试验结果,只能是两个互斥的结果之 一(A或非A)。 (2)每次试验的条件不变。即每次试验中,结 果A发生的概率不变,均为 π 。 (3)各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
二、随机事件
Certain
1
Random events
必然事件 随机事件 不可能事件
P = 1
0 < P < 1
0.5
P = 0
Impossible
0
P ≤ 0.05(5%)或P ≤ 0.01(1%)称为
小概率事件(习惯),统计学上认为不大可能发生。
样本空间(sampling space):随机试 验的所有可能的结果称为样本空间。