5-Galton钉板实验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
和 binopdf(x,n,p)中是一样,运行该指令后,得到一个 s×
m 的矩阵。 执行命令 disttool,可以进入概率分布的 demo。 执行命令 randtool,可以进入随机数生成的 demo。
2、动画模拟 Galton 钉板试验 运行观察程序 Gaห้องสมุดไป่ตู้ton_1.m,屏幕将出现一个图形窗口,动画模拟扔球过程。
型。
例如,若学校的电话总机设有 99 个分机,已知每号分机平均每小时有 3 分
钟要使用外线,在考虑该总机应设置多少条外线合适的问题时,可归结为 n 重
Bernoulli 试验的问题。在任一时刻考察一部分机是否占用外线时,其可能结果只
有 两 个 :“ 占 用 ”( 发 生
A )、“ 不 占 用 ”( 发 生
有多种情况,但若只关心明天是否下雨,则观察明天的天气(作为一次试验),
其结果只有两个:“下雨”或“不下雨”,因而可被看作是个 Bernoulli 试验。
实际上常要考察独立重复进行一 Bernoulli 试验的序列,并将这一独立重复
试验序列作为单独一个复合试验来对待。这里,所谓独立重复进行一 Bernoulli
图 1-1 Galton 钉板模型(n=5)
1
问题:1、向 Galton 钉板扔进一个小球,它将落到哪一个格子中?事先能预 测吗?
2、如果不断地重复扔球过程,将会发现什么结果呢?落入各个格子中 的小球的堆积形状如何?反映了什么信息?
3、如果这是一个抽奖游戏,扔一次小球需要付出 1 元代价,同时在不 同的格子中设置了不同价值的奖品,如表 1-给出了一种奖品设置的 情况。抽奖者一般的希望是奖品回报大于所付出的代价,这一点能 够实现吗?
拷贝动画矩阵
Movie(mat,m)
播放动画矩阵 m 次
Binopdf(x,n,p)
概率密度函数。
计算二项分布列,参数 n 和 p 分别为试验次数和成功概率。
给定 x,就可以计算 x 处的概率。x 可以是向量或矩阵。
Binocdf(x,n,p)
累计概率密度函数。
binornd(n,p,s,m)
二项分布发生器,模拟二项分布的随机变量。参数 n 和 p
问题 2、小球自上方落下,经过 n 个钉子。每经过一个钉子时只有两种可能 结果:向右或向左。这是一个具有两个结果(成功和失败)的随机试验 E,将向
右视为成功,成功的概率为 p ,向左为失败,失败的概率为 q 1 p 。小球碰到
一个钉子下落一格,相当于进行了一次试验 E。小球自顶端落下,碰到 n 个钉子, 最终落在某个格子的过程,恰好相当于将试验 E 重复了 n 次,因此一次投球过 程就是一个 n 重贝努利试验(将仅有两个相互排斥结果的试验 E 独立重复 n 次,
构成了 n 重贝努利试验 E n )。
n 重贝努利试验的成功次数 X 正好是小球向右移动的次数,它是一个随机变
量。根据概率论的结果有 X ~ B(n, p) 。对于一个随机变量,我们首先要弄清楚
它的取值范围,X 的取值范围为 0,1, 2,, n ,这是什么意思呢?在 Galton 钉板模
型中 X =0 表示小球向右移动的次数,也就是小球一直向左移动,所以它恰好要 落在编号为 0 的格子里;同理 X =1 表示小球恰好要落在编号为 1 的格子里,依 次类推,这就是说, X 是小球最终落进的格子编号数,当然它也对应为小球向 右移动的次数。
如果将这样的抽检一件产品看作是进行一次试验,则试验的结果可以是发生 A
(这是件不合格产品)或
A
(A
不发生,即产品质量合格)。称这种只有两个可
能结果
A(称“成功”)或
A
(称“失败”)的试验为
Bernoulli
试验。
有很多试验,其可能的结果不止两个,但由于人们常只对试验是否发生某一
3
种特定结果感兴趣,因而可将之归结为 Bernoulli 试验、例如,明天的天气可以
实验五 Galton 钉板实验
一、实验目的与要求 1.复习概率论中随机变量、概率分布、二项分布、均值和分布函数等概念。 2.理解 Galton 钉板实验中小球落入格子所服从的规律。 3.了解 Matlab 软件中进行动画演示的命令。 4.了解 Matlab 软件中计算二项分布概率、产生二项分布随机数的命令,了 解计算离散型随机变量数学期望的方式。 5.了解 Matlab 软件中进行随机模拟的方法。
工的单位估计此种疾病的发病情况时,需用 p 0.001 的 n 重 Bernoulli 试验模型,
这里 n=5000。
3、二项分布
在“成功”概率是 p ,即 p P ( A) 的 n 重 Bernoulli 试验中,事件 A 出现的
次数 是二项分布随机变量,其可能的取值为:
0,1,……,n
有分布律
如 1-1 是模拟向一个 5 层 Galton 钉板扔 100 次小球的过程的最后的结果。在模拟 过程中我们看到,每一个小球落在哪一个格子是无法预测的,但小球逐渐堆积成 一种单峰的形状,落在中间格子的小球数较多,落在两端格子的小球数很少。你
可以增加投球次数,观察小球堆积的分布有无改变;你也可以改变概率 p ,观察
二、问题描述 所有现象的“因”和“果”,即“条件”和“结果”之间在客观上都存在着
一定的规律,这种规律通常可以分成两类:一是确定性的规律,另一类是非确定 性规律。对于确定性的系统,当已知条件是充分时,那么实验的结果也是确定的, 即在每一次试验进行以前,可以预见试验产生的结果。但若条件不充分时,就无 法预测试验的结果,这就产生了“因果律的缺失”的随机现象。随机现象在实践 中是大量遇到的,如掷骰子。虽然无法由“因”预测“果”,但是当进行大量重 复试验时,因果之间仍会呈现一种统计规律。概率方法建立在“重复试验”的基 础上,统计规律只有在大量重复后才会呈现出来,诸如随机变量。分布、均值、 方差等概念无一不体现了重复的思想。
数学期望可以理解为由于随机变量 X 以 pi 的概率取到值 i (即小球落入第 i
格的概率为 pi ),这意味着抽奖者以 pi 的概率获得价值 fi ,所以若以概率 pi 对函
数值 fi 做折扣:即计算折扣值 fi pi ,并把所有折扣值加总,就得到了理论均值
或数学期望 Ef ( X ) 。
根据上述公式可计算,抽一次奖所得回报的理论均值为
A
)。 而 且 据 已 知 数 据 有
p P ( A) 3 / 60 0.05 ,所以这是一个 p 0.05 的 Bernoulli 试验。由于各分机是
否在占用外线可合理地认为是相互独立的,因而这个问题可看成涉及了一个
p 0.05 的 99 重 Bernoulli 试验。
再比如,已知某疾病的发病率为 0.001,当卫生部门要对一个拥有 5000 名员
Ef ( X ) 5 C50 p0q5 2 C51 p1q4 0.2 C52 p2q3 0.2 C53 p3q2 2 C54 p4q1 5 C55 p5q0 0.75 <1
因此,抽奖者总体上是要亏的。
四、背景知识介绍
1、随机变量
随机变量是随机试验结果的函数,其特点是在试验前,并不能预知这个函数
将取何值,这要凭机会,就是“随机”的意思。一旦试验后,取值就确定了。例
如,你在 3 月 31 日买了一张奖券,到 6 月 30 日开奖。当你买这张奖券时,可以
对你说:“你中奖的金额 是个随机的变量,其值在 6 月 30 日'抽奖试验'做过之
后才能确定。”
明白了这一点就不难举出许多随机变量的例子。例如,某出租车公司的电话
试验的意思是,这个序列中的每一试验的结果都只能发生
A
或
A
,且发生
A
的
概率一样,是某个值
p
P(
A)
。当然,发生
A
的概率也就是一样地是
q
P(
A)
,
并且每一试验发生的结果不会影响其他试验出现的结果。
独立重复试验序列最重要的特性是序列由独立重复进行 n 次 Bernoulli 试验
组成,简称为 n 重 Bernoulli 试验。在很多问题中可以用上 n 重 Bernoulli 试验模
二项随机变量 X 的分布列为:
pi P( X i) Cni piqni , i 0,1,, n
问题 3、由(1)可知,扔一次小球无法预测它到底会落到 0,1,2,3,4, 5 中的哪一个格子,因此抽一次奖有可能获得 5 元收入,也可能只获得 0.2 元收 入,即结果是不确定的。如果继续抽奖 m 次,将每次获得的奖品价值相加并除
格子编号
表 1-1 奖品的设置
0
1
2
3
4
5
奖品的价值 fi(元) 5
1 0.2 0.2 1
5
三、问题分析 问题 1、当扔小球时,关心的是小球落入格子的编号数 X。在扔小球之前虽
然可以知道,小球必会落到编号为 0,1,2,3,4,5 的某一个格子中,但是我 们无法预测小球到底会落到哪一个格子中。因此小球落入格子的编号数 X 是一 个随机变量,它的取值为 0,1,2,3,4,5。
小球堆积情况的变化;当然,你也可以增加钉子的数目,看看小球堆积分布的变 化情况(只是这是计算时间花费较长,可以修改程序,取消动画,只显示最终的 结果)。
模拟 Galton 钉板试验的步骤如下: (1)确定钉子的位置:将钉子的横、纵坐标存储在两个矩阵 X 和 Y 之中。 (2)在 Galton 钉板试验中,小球每碰到钉子下落时都具有两种可能性。向
右的概率为 p ,向左的概率为 q 1 p ,这里 p 0.5 ,表示向右和向左的机会是
相同的。
将[0,1]区间分成两段,区间[0, q) 和[ p, q q]。如果随机数 u [0, p) ,让小
球向右落下;若 u [q, p q] ,让小球向左落下。将这一过程重复 n 次,并用直
线连接小球落下时所经过的点,这样就模拟了小球从顶端随机地落入某一个格子 的过程。
订车中心,一天内接到的订车电话的次数 ;某射手对一活动靶进行射击,到击
中目标为止,所进行的射击次数 ;从一批灯泡中,任取一只,测定这只灯泡的
寿命 ,等等,这些都是随机变量。
2、n 重 Bernoulli 试验
当依照一定的质量标准,从大批产品中抽出一件进行产品质量合格性检查
时,得出的结果可以是二者之一:“这是件不合格产品”或“这是件合格产品”。
k
k
E xk pk xk P ( xk )
数学期望表征的是随机变k量 取值的“k 平均值”。
4
五、实验过程 1、Matlab 命令简介
命令
功能
rand(m,n)
产生 m×n 个(0,1)区间中的随机数,并将这些随机数存于
一个 m×n 矩阵中。每次调用 rand(m,n)的结果都会不同。
Getframe
5
(3)模拟小球堆积的形状。输入仍球次数 m(例如 m=50、100、500 等), 计算落在第 i 格格子的小球数在总球数 m 中所占的比例,这样当模拟结束时,就
得到了频率
fi
mi m
,i
0,, n ,用频率反映小球的堆积形状。
程序 Galton_1.m: clear,clf,m=100;n=5;y0=2; ballnum=zeros(1,n+1);
以下围绕着 Galton 钉板模型来讨论。 Galton 钉板试验是由英国生物统计学家 Galton 设计的。在一板上有 n 排钉 子,图 1-1 所示的是 n=5 的情况。图中 15 个圆点表示 15 颗钉子,在钉子的下 方有 6 个格子,分别编号为 0,1,2,3,4,5。自 Galton 钉板的上方扔进一个 小球任其自由下落,在下落的过程中当小球碰到钉子时,从左边落下与从右边落 下的机会相等、碰到下一排钉子时又是如此。最后落入底板中的某一个格子。图 中用一条折线显示小球下落的一条轨迹。
2
以 m,就得到了每次抽奖的平均回报。这个平均回报也是在变化的,这个人抽奖 m 次的平均 回报可能是 0.7 元,另外一个人可能是 1.2 元。平均来说,一次抽奖 理论上的回报到底是多少呢?
我们可以计算一次抽奖所得回报的平均值(数学期望),即为:
n
Ef ( X ) fi pi i0
若此平均值大于 1,说明抽奖者总体上会赢的;若平均值小于 1,说明抽奖者总 体上要亏的。
P (
k)
C
k n
pkqnk ,
0
k
n
这个值也被记作 b(k ; n, p ) , 服从参数为 n ,p 的二项分布,也记作 ~ B (n, p ) 。 4、离散型随机变量的数学期望
设随机变量 具有概率分布列
x1 x2 xn
p1
p2 pn
则当 | xk | pk 时,称 xk pk 为随机变量 的数学期望或均值,记作