第四章 基本概率理论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 蒙特卡罗模拟的基本思想
蒙特卡罗(Monte Carlo)模拟方法也称为计算机随机模拟方法,是 一种基于“随机数”的计算方法。 蒙特卡罗模拟实验是通过某种“实验”的方法,得出A事件出现 的频率,以此估计出A事件出现的概率方法。 蒙特卡罗模拟中非常关键的一个环节就是模拟抽样给定分布的随 机数。
(二)概率的定义和基本性质
1. 概率的定义
例1 每轮实验投掷一枚均匀硬币5000次,下图展示了两轮实验的结果。
①实验A正面的比例开始时低,而 实验B的比例高。 ②实验 A 、 B 正面的比例开始时差 异较大,当投掷次数增多,比例均 趋近于0.5并保持稳定。
重复两轮实验投掷硬币5000次结果出现正面的比例
(2)多个随机事件和的概率:如果有事件A,事件B和事件C及更多事
件 是 互 斥 的 , 那 么 有 其 之 和 的 概 率 Pr(A 或 B 或 C 或 …)= Pr(A)+Pr(B)+Pr(C)。
第一节 概率
(三)随机事件的概率运算
2. 条件概率
(1)独立事件 (independence event):事件A是否发生对事件 B发生
概率密度曲线与直方图关系的示意图
第二节 概率分布
(二)随机变量的均数和方差
1. 随机变量的均数
(1)定义:指随机变量所有可能值的平均,即把每个取值都按照它的概
率来加权之后的平均,每个可能取值的权重就是取这个值的概率。
①概率分布的均数描述的是长期大量重复实验后的平均值,常用符号是希 腊字母 ,也称为期望值。
3. 乘法法则
(1)两随机事件积的概率:事件A与事件B的积是指事件A、B同时发
生。假设Pr(B|A)是事件A发生时B发生的条件概率,那么事件A和事件
B的积的概率 Pr(A和B)=Pr(A)Pr(B|A)。 (2)多个随机事件积的概率:将乘法法则扩展到多个事件同时发生的
概率的计算,例如有事件 A ,事件 B ,事件 C 的积的概率为 Pr(A 、 B 和
第一节 概率
(三)随机事件的概率运算
1. 加法法则
(1)两随机事件和的概率:事件A与事件B的和是指事件A、B中任意
一个事件发生。用 Pr(A) 表示事件 A 的发生概率,用 Pr(B) 表示事件 B 的
发生概率,如果事件A和事件B是两个互斥事件,那么有两者之和的概 率Pr(A或B)= Pr(A)+ Pr(B)。
第三节 蒙特卡罗模拟
(二)常见分布的模拟抽样
1. 正态分布随机数的模拟抽样
第三节 蒙特卡罗模拟
(二)常见分布的模拟抽样
2. 二项分布随机数的模拟抽样
第三节 蒙特卡罗模拟
(三)蒙特卡罗模拟步骤
3. 蒙特卡罗模拟的主要步骤和应用
( 1 )整体规划 :根据需要制定解决问题的步骤,包括确定目标及将不具
A B C D E
概率
0.31 0.40
0.20
0.04
0.05
第二节 概率分布
(一)随机变量及其概率分布
3. 连续型随机变量
(1)定义:连续型随机变量X是取值范围充满某一数值 区间的变量,即连续型随机变量在忽略测量精度的条件 下可以取到该区间中的任意一个值。 (2)概率密度曲线(probability density curve):概率密度 曲线是位于横轴上方用于描述概率分布的曲线,该曲线 下面积为1,对应概率为1。某事件在概率密度曲线下对 应某一区间的面积即为该事件的概率。
(五)正态分布
第二节 概率分布
(五)正态分布
第二节 概率分布
(五)正态分布
例8 不同省份的考题难易程度不一,很难直接用分数高低来比 较不同学生的成绩优劣。某年高考中,甲省A考生考了580分, 乙省B考生考了525分。那么他们在各省的排名到底谁高谁低。 假定已知A省的分数大致服从均数为500,标准差为80的正态分 布,乙省的分数大致服从均数为450,标准差为50的正态分布。 那么谁考得比较好呢?
Y
第二节 概率分布
(二)随机变量的均数和方差
例6 投资方案选择 某投行现有甲乙两个备选项目投资,随机变量X表示 甲项目的盈利,随机变量Y表示乙项目的盈利,其具体分布如下表所示, 分别计算它们的均数和方差以及总的均数和方差,并以此提出两个项目 同时投资的建议。
甲项目
概率
0
乙项目
概率
300
第二节 概率分布
第一节 概率
(二)概率的定义和基本性质
1. 概率的定义
(1)随机现象(random phenomenon):指在个别实验中结果不能预
测但在大量重复实验后结果展现出一定规律的现象。
(2)随机事件(random event):是随机现象中所有可能结果的一个 子集,如投掷硬币实验中出现正面就是一个随机事件。
(二)随机变量的均数和方差
根据离散型随机变量的均数和方差计算公式,甲项目的均数和方差分别为:
乙项目的均数和方差分别为:
由于甲项目的赢利情况与乙项目的盈利情况没有任何关系,所以可看作满足相互独立 的条件,根据均数和方差的加法法则,甲项目和乙项目盈利之和的均数与方差分别为:
第二节 概率分布
(三)二项分布
第二节 概率分布
(三)二项分布
二项分布概率分布
第二节 概率分布
(三)二项分布
第二节 概率分布
(三)二项分布
B n,
第二节 概率分布
(三)二项分布
第二节 概率分布
(四) Poisson分布
第二节 概率分布
(四) Poisson分布
2. Poisson分布的概率分布
Poisson分布概率分布
卫生统计学
第四章 基本概率理论
李晓松
高 培
四川大学
北京大学
目录
01 02 03 4
第一节:概率
第二节:概率分布
第三节:蒙特卡罗模拟
重点难点
※ 概率的定义、基本性质和运算 ※ 随机变量均数、方差的含义及其计算方法 ※ 二项分布的性质、特征及其适用条件 ※ 正态分布的性质、特征及其应用
※ 蒙特卡罗模拟的思想及实现步骤
C)=Pr(A)Pr(B|A)Pr(C|A和B) 。
第一节 概率
(三)随机事件的概率运算
4. 条件概率与树状图
例2 微信聊天现已成为年轻人的主流聊天方式,调查显示在18岁以上
的成年手机用户中,18到29岁的手机用户中有47%进行微信聊天, 30
到 49岁的手机用户中有 21%进行微信聊天, 50岁及以上的手机用户中 有7%的人进行微信聊天。此外成年手机用户的年龄构成如下:29%的 手机用户在 18~29 年龄段, 47% 的手机用户在 30~49 年龄段,剩下 24% 的手机用户是50及以上年龄段的。那么对于随机选择的一个成年手机 用户,他使用微信聊天的概率是多少?
数字的时候,其均数正好落在对称中心。
但是我们不能直观地从图(B)中看出服从 本福特定律的右偏态分布的均数位置。
不同概率分布示意图中的均数位置
第二节 概率分布
(二)随机变量的均数和方差
X x 3 1 2 K 3 2 K
第二节 概率分布
(二)随机变量的均数和方差
概率
第二节 概率分布
(二)随机变量的均数和方差
第一节 概率
第一节 概率
(一)机会与不确定性
1. 机会 可被用于描述我们对不确定性事物的看法。 比如投掷一枚均匀对称的硬币,观察硬币出现正面的机会。 (1)投掷结果为正面的机会为1/2。
(2)投掷结果为正面的机会要么是1要么是0。
2. 随机性 机会常称为随机性,用于刻画事件的不确定性。
第一节 概率
的概率没有影响,这样的两个事件叫做相互独立事件。
( 2 )条件概率 (conditional probability) :符号 Pr(A|B) 表示条件概率, 它指在知道另一个事件 B 发生的情况下,某一事件 A 发生的概率,
符号“|”可理解为“考虑到”或“在什么条件下”。
第一节 概率
(三)随机事件的概率运算
不同年龄段手机用户微信聊天的条件概率与树状图
第二节 概率分布
X x 2 1 1 2
3 3 2 1 2 1
第二节 概率分布
(一)随机变量及其概率分布
概率
X
第二节 概率分布
(一)随机变量及其概率分布
例3 一所大学对英语课程的成绩分布进行研究。在最近一学期的英 语课程中,成绩分布如下:得A的占31%,B占40%,C占20%,D 占4%,E占5%。随机选择一名学生,所谓“随机选择”是指每个 学生都有相同的机会被选到。将选到的学生的成绩记为随机变量 , 那么随机变量X的概率分布是怎样的? 根据题意,随机变量X 的概率分布如下:
第一节 概率
(三)随机事件的概率运算
4. 条件概率与树状图
由图可知有三条路径可以到达事件C, 即通过加法法则可以计算事件C的概率 为三条路径代表的互斥事件之和:
Pr(C) Pr(C 和 A1)+Pr(C和A 2)+Pr(C和A3) Pr(A1)Pr(C | A1)+Pr(A 2)Pr(C | A 2)+Pr(A3)Pr(C | A 3) =0.1363 0.0987 0.0168 0.2518
第二节 概率分布
(五)正态分布
第二节 概率分布
(五)正态分布
(6)正态分布的重要性
①正态分布能够很好地描述一些实际数据的分布。 ②正态分布可以很好地近似许多随机事件的结果。 ③利用正态分布制定“医学参考值范围”。 ④根据68-95-99.7法则,可以制定相应的质量控制线和警戒线。 ⑤建立在正态分布基础上的很多统计推断过程也适用于其它近似对称分布。
1 概率 0.301
2 0.176
3 0.125
4 0.097
5 0.079
6 0.067
7 0.058
8 0.051
9 0.046
第二节 概率分布
(二)随机变量的均数和方差
1. 随机变量的均数
分别在两个概率密度分布图中展示了
变量X和V的均数。离散型均匀分布的图 (A)是对称的,即随机抽取的1到9之间的
②随机变量的均数是概率分布特征的一个参数,是一个客观存在的固定数
值,并不会随着抽样样本的不同而发生改变。
第二节 概率分布
(二)随机变量的均数和方差
概率
第二节 概率分布
(二)随机变量的均数和方差
1
2
3
4
5
6
7
8
9
概率
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
第二节 概率分布
(二)随机变量的均数和方差
(3)概率(probability):度量事件发生可能性大小的数量指标,
就叫做概率。随机现象中的概率可被定义为随机实验无限重复中某 随机事件所占的比例。
百度文库
第一节 概率
(二)概率的定义和基本性质
2. 概率的基本性质
(1)任何概率取值为0~1。
(2)所有可能的结局加起来的概率必须等于1。
(3)如两个事件互斥(没有共同可能的结局),两个事件至少一个发 生的概率就是两个事件单独发生的概率之和,即概率的加法原则。 (4)一个事件不会发生的概率等于1减去这个事件会发生的概率。
第二节 概率分布
(五)正态分布
第二节 概率分布
(五)正态分布
给定区间时标准正态分布的概率计算示意图
正态曲线下的面积对称规律
第二节 概率分布
(五)正态分布
正态分布的68-95-99.7法则
第二节 概率分布
(五)正态分布
第二节 概率分布
(五)正态分布
第二节 概率分布
(五)正态分布
第二节 概率分布
第三节 蒙特卡罗模拟
r 1 r 1
第三节 蒙特卡罗模拟
(一)蒙特卡罗模拟的基本思想
单位圆与单位正方形的关系: 一个边长为1的正方形恰好包住一个半径为 1 的1/4圆(阴影部分)。
投米粒实验圆周率π的模型
第三节 蒙特卡罗模拟
(一)蒙特卡罗模拟的基本思想
第三节 蒙特卡罗模拟
(一)蒙特卡罗模拟的基本思想
有随机性质的问题构造为具有随机性质的问题。
(2)描述概率过程:对具有随机性质或构造的具有随机性质的问题进行正
确描述其概率过程。
(3)实现从已知概率分布抽样:根据已构建的概率模型后产生已知概率分布
的随机变量。
(4)重复多次并综合结果估计:大量重复实验后,将其结果作为需要解决问
题的近似答案。
小结