第六章概率论与数学建模

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章概率论与数学建模
一、随机事件及其概率
1.随机事件:可重复;可预测结果且结果明确;试验前出现那个结果
不能确定
例如:抛骰子一次,抛一枚硬币三次等。

2.事件的运算及其含义:
B
A⊂:A为B的子事件。

其含义是:A发生则B必发生
A=:事件A,B相等。

其含义是:A发生则B必发生,反之亦然B
⋂:事件A与B的交。

其含义是:C发生当且仅当A,B同时A=
C
B
发生
A=
⋃:事件A与B的并(和)。

其含义是:C发生当且仅当A,B
C
B中至少有一个发生。

-:事件A与B的差。

其含义是:C发生当且仅当A发生并A=
C
B
且B不发生。

φ
AB:事件A与B互不相容。

其含义是:A与B不可能同时发生。

=
A:事件A的对立事件。

3.概率:刻化某一事件在一次试验中发生的可能性大小的数量指标。

(当∞
n时,)

f P−→
A
−)
(
P
)
(A
4.古典概论:某个试验共有n个等可能的结果(样本点),事件A包
m就是事件A的概率。

这种基含其中m个结果(样本点),则认为
n
于等可能性确定概率的模型称为古典概率模型。

例6.1.1(Monte Hall Problem)20世纪60,70年代,美国“电视游
戏秀”曾经非常流行一个名叫“Let ’s Make a Deal ”的节目,由Monte Hall 主持。

游戏过程如下:有三扇关着的门,其中一扇门后面有奖品(一辆汽车),其余两扇门后面则没有奖品,若猜中了有奖品的门就能赢取这辆汽车。

你从中挑选一扇门,但暂不打开。

这时,主持人在另外两扇门中挑一个没有奖品的门打开,并展示给你和观众。

然后,主持人问你:是坚持原来的选择,还是换成最后那扇门?
解:从能不能得奖的角度看,这个游戏只有两个结果:不换门得奖(A )、换门能得奖(B )。

第一个门是你“三选一”随机(等可能地)挑选的,故P(A)=1/3,自然,另一个结果的概率就是P(B)=2/3。

因此,正确的决定是换成那扇门。

例6.1.2(抽签原理)袋中有2只红球8只黑球(除颜色外无法再分辨)。

10个人依次摸球,得红球者中奖。

求:k A ={第k 个摸球者中奖}
的概率,k=1,2,…,10
解法一:假定对解题者来说这些球可辨别。

样本点为一轮抽签结束后这10个球的排列,共有10!个等可能的样本点。

事件k A 所含样本点
的特征是:两个红球中任选一个排在第k 位(有12C 种可能),而其余
9个球在其余9个位置上可任意排列(有9!种可能)。

因此k A 包含了
9!1
2
C 个样本点,故51!10!9)(12==C A P K . 解法二:假定球不可辨,只需关注红球落入哪两个人之手,样本空间
共有45210=C 个等可能的样本点。

事件k A 发生意味着第k 个人得一红
球,另一红球落入其余9人中某一人之手,这有19C 种可能,所以
5
1459)(==K A P 。

例6.1.3(分球入盒模型)将2只球随机地放入3个可辨的盒子中。

求事件A={甲乙两个盒子中各有一只球}的概率。

模型一:假定球可辨,根据乘法原理,样本空间有23个等可能的样本点,而事件A 所含的样本点有222=P 个(两只球的排列),所以9
2)(=A P . 模型二:假定球不可辨,则样本空间共有624=C 个样本点(两块隔板就可以代表三个盒子,两只球以及两块隔板共4个位置,任选其中两个放置隔板):
⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯⨯,,,,, 而事件A 所含的样本点只有一个。

人的直觉经验一般应该是这样的:从物理学上说,球总是可辨的(难以想象这个球既是这个球又是那个球),所谓不可辨,也只是根据问题或研究的目的,不在乎它们之间的区别而已。

如果需要,后三种情形还是可以区别的。

因此,现在这6个样本点不是等可能的:前三个均为91,后三个均为92。

故答案应该还是92)(=A P 。

例6.1.4(浦丰投针问题)在平面上画一些间距为d 的平行线,向此平面投掷一根长为l 的(l<a )的针,试求A={此针能与某一直线相交}的概率。

略。

5.条件概率、乘法公式、独立性、全概率公式、贝叶斯公式
(1)条件概率:)/(B A P 表示事件B 发生的条件下事件A 发生的概率。

且 )()()/(B P AB P B A P =
(2) 乘法公式:若0)(>B P ,有)()/()(B P B A P AB P ⋅=.
(3)独立性:若0)(>B P ,0)(>B P 有)()()(B P A P AB P ⋅=或)()/(A P B A P =。

则称A 、B 相互独立。

(4)全概率公式:设n B B ,,1 是S 的一个分割,且0)(>j B P ,则对任一事件S A ⊂,有∑==N
J J J B A P B P A P 1)/()()(.
条件全概率公式:设n B B ,,1 是S 的一个分割,且0)(>j B P ,0)(>C P ,0)(>C B P j ,则
∑==n
j j j CB A P C B P C A P 1)/()/()/(
例6.1.5(Polya 模型)罐子里有r 只红球和b 只黑球,随机取出一球,放回后再加入同颜色的球c 只。

如此下去,求第n 次取出红球的概率。

解:设n R ={第n 次取出的是红球},n B ={第n 次取出的是黑球},
n=1,2,….根据全概率公式,有
b
r r c b r r b r b c b r c r b r r B R P B P R R P R P R P +=++⋅+++++⋅+=+=)
/()()/()()(1211212 依次递推,易知有b r r R P n +=
)(。

(5)贝叶斯公式:设n B B ,,1 是S 的一个分割,且0)(>j B P ,则对概率大于零的事件S A ⊂,有
∑==n j j j i i i B A P B
P B A P B P A B P 1)
/()()
/()()/( i=1,2,…,n 例6.1.6一个从不抽烟的60岁男性去医院看病,主诉有症状A={慢性咳嗽及非经常性憋气},医生安排他做肺部活组织检验,假定检验只
有三种可能的结果:1B ={正常(没有严重的肺病)},2B ={肺癌},3B ={结节病}。

假设医生根据临床经验,得知这三种病与该组症状之间的关联(条件概率)如下:
001.0)/(1=B A P ,9.0)/(2=B A P ,9.0)/(3=B A P
另外,从疾病资料库中“年龄-性别-抽烟”这个症状组合栏目可以找到,在60岁从不抽烟的男性群体中,患这三种病的先验概率(频率)为 99.0)(1=B P ,001.0)(2=B P ,009.0)(3=B P
问:肺部活组织检查前,医生对该名男子应该如何诊断? 解:用贝叶斯公式,已知症状组合A,三种疾病321,,B B B 的条件概率分
别为
0991.09.0009.09.0001.0001.099.0001.099.0)/(1≈⨯+⨯+⨯⨯=
A B P 0901.09
.0009.09.0001.0001.099.09.0001.0)/(2≈⨯+⨯+⨯⨯=A B P 8108.09
.0009.09.0001.0001.099.0001.0009.0)/(3≈⨯+⨯+⨯⨯=A B P 虽然结节病的先验概率0.009很小,但他患有结节病的后验概率却高达0.8108.也就是说,虽然这组症状与两种疾病(肺癌和结节病)都比较相符,但结合病人的年龄、性别和抽烟等情况综合考虑,应该诊断为结节病。

下面举一个综合运用加法公式、乘法公式、全概率公式、贝叶斯公式和独立性的例子。

例6.1.7一个罪犯单独作案,在现场留下了一些DNA 信息。

法医研究后发现能够辨别的只有5对,而且无罪的人也可能与此匹配,匹配的概率为510-。

检查官认为罪犯就是该城镇100万居民之一。

过去10
年,该城镇曾有包括琼斯在内的10000人蹲过监狱,他们的DNA 资料均记录在案。

在检查对比这些DNA 文档之前,检察官根据经验,认为有前科的人又犯罪的概率是没有前科的人犯罪概率的k 倍。

实际的DNA 对比结果是:琼斯是唯一匹配的人。

琼斯有罪的概率是多少? 解:设有前科者的犯罪概率为α,无前科者的犯罪概率为β,则βαk =。

由于是单独作案,某甲作案与某乙作案不相容,且必有一人作案,故 199000010000=+βα,因此
99000010000+=k k
α,990000100001
+=k β
记A={琼斯是作案者},B={琼斯是10000人中唯一与现场留下的DNA 信息匹配的人},则α=)(A P 。

我们要求的概率是)/(B A P ,由贝叶斯公式 )/()()/()()
/()()/(A B P A P A B P A P A B P A P B A P ⋅+⋅⋅=
在10000个有前科的DNA 对比试验中,每个人是否与现场DNA 信息匹配是相互独立的。

这里我们必须再补充一个假设:DNA 对比试验技术上完美无缺(即,事实上匹配的人,对比结果必然匹配,事实上不匹配的人,对比结果必然不匹配)。

因此,在琼斯是作案者(其他9999人都不是作案者)的前提下,琼斯匹配而其他9999人都不匹配的概率应该是
99995)101(1)/(--⋅=A B P 现来求)/(A B P .设C ={琼斯以外的9999个有前科者这次都没作案},根据条件全概率公式,有
)/()/()/()/()/(A C B P A C P A C B P A C P A B P +=
显然其中的
0)/(=A C B P ,999955)101(10)/(---=A C B P 注意到,事件A C 意为“该案是990000个没有前科者之一所为”,故 β990000)(=A C P ,即α100001-。

于是
αα--==
1100001)()()/(A P A C P A C P 最终,我们得到
k
B A P 9.911
)100001(101100001)101(10)1()101()101()/(5999955999959999
5+=-+=--⋅-⋅⋅-+--=-----ααα
αα
ααα 例如,若10=k 则新的DNA 证据表明琼斯作案的概率为5025.099
.11)/(≈=B A P ,若100=k 则琼斯作案的概率为
9099.0099.11)/(≈=B A P 。

二、随机变量
1.随机变量的概念:
2.常见的随机变量:
(1)泊松分布:k e P X k k k λ
λ-(=)=,=0、1、2、、、!
实际应用:一本书中一页中的印刷错误数。

(小概率事件)某地区在一天内邮件遗失的信件数。

某一天内医院的急症病人数。

某一地区一个时间间隔内发生交通事故的次数 一个时间间隔内某种放射性物质发出的经过计数器的α粒子数等等……
(2)指数分布:⎩⎨⎧≤>=-0
,00,)(x x e x f x λλ 其中>0λ为常数 ,记为 )(~λExp X
特点:无记忆性
P(/)()X s t X s P X t >+>=>
一个元件已经使用了s 小时,在此情形下,它总共能使用至少s+t 小时的概率,与开始使用时算起它至少能使用t 小时的概率相等,即元件对已使用过s 小时无记忆。

实际应用:可靠性理论、排队论,许多“等待时间”服从指数分布,一些没有明显“衰老”迹象的机械元器件(如半导体元件)的寿命也可也用指数分布来描述……
(3)正态分布:2
2
2)(21)(σμπσ--=x e x f ,∞<<∞-x
记为),(~2σμN X
图6.1
若1,02==σμ,则此分布为标准正态分布,记为X~N(0,1)。

对于一般的正态分布,通常可以转化为标准正态分布,这样就可以直接查标准正态分布表。

定理:设),(~2σμN X ,则)1,0(~*N X X σμ-=
,并且
)()(
)(σμσμ-Φ--Φ=≤≤a b b X a P
证明:对任意的)(,d c d c ≤,有
)(2121)
()*(22)(222σ
μππσσμσμσμσμσμ-===+≤≤+=≤≤⎰⎰-++--t s ds e dt e d X c P d X c P d c s d c t 这说明)1,0(~*N X X σμ-=。

于是,又有
)()()()(σμ
σμ
σμ
σμ-Φ--Φ=-≤≤-=≤≤a b b X a P b X a P
图6.2
图6.3
“3σ”原则:
3σ原则被实际工作者发现,工业生产上用的控制图和一些产品质量指数都是根据3σ原则制定。

学生的考分一般服从正态分布,为了避免因微小随机差异而误评学生的表现,很多国家将分数(百分制)超过σμ+的评为A 级,再以一个σ为单位,依次往下评定为B 级、
C

6σ4σ(1)
(2)(3)
μ
级和D 级,分数低于σμ2-的评为E 级。

例6.2.1设从甲地到乙地有两条路可供选择。

第一条路较短但交通比较拥堵,所需要的时间(分钟)服从正态分布)100,50(N ,第二条路较长但意外阻塞可能性较小,所需要的时间服从正态分布)16,60(N 。

(1)如果有70分钟可用,宜选哪条路?
(2)如果只有60分钟可用,宜选哪条路?
解:(1)走第一条路所需设为X ,)100,50(~N X ,则70分钟内可以到达的概率为9772.0)105070(
)70(≈-Φ=≤X P 。

走第二条路所需时间为Y ,)16,60(~N Y ,则70分钟内可以到达的概率为
9938.0)10
6070()70(≈-Φ=≤X P (2)假设同(1),则60分钟内可以到达的概率分别为
8413.0)105060(
)60(≈-Φ=≤X P
5.0)10
6060()60(=-Φ=≤X P 3.随机变量的特征数(数字特征):
均值(期望):k k k x p E X xf x dx ∞
∞∞
⎧⎪⎪⎨⎪⎪⎩∑⎰=1+-,(离散型)()=(),(连续型) 方差:222))(()())(()(X E X E X E X E X D -=-=
例6.2.2(分赌本问题)1654年,职业赌徒de Mere 爵士(可能是历史上最敬业的赌徒)向法国数学家Pascal 提出一个困惑他已久的问题:甲乙二人赌技相同,各出赌资50法郎,假定无平局,事前约定:
谁先胜三局则拿走全部赌资100法郎。

当甲赢了二局、乙赢了一局时,因故要中止赌博。

问:这100法郎要如何分才算公平?
解:以下有两种分法
(1)甲得100法郎中的2/3,乙得100法郎中的1/3.这是基于已赌局数:甲赢了二局、乙赢了一局。

(2)帕斯卡提出如下的分法:设想再赌下去,则甲最终所得X为一个随机变量,其可能取值为0或100.再赌二局必可结束,其结果不外乎以下四种情况之一:
甲甲,甲乙,乙甲,乙乙
其中“甲乙”表示第一局甲胜第二局乙胜。

因为赌技相同,所以在这四种情况中有三种可使甲获100法郎,只有一种情况(乙乙)下甲获0法郎。

所以甲获得100法郎的可能性为3/4,获得0法郎的可能性为1/4,即X的分别列为
经上述分析,帕斯卡认为,甲的“期望”所得应为:
75

+

.0
0=
25
.0
75
100
即甲得75法郎,乙得25法郎。

这种分法不仅考虑了已赌局数,而且还包含了对再赌下去的一种“期望”,它比(1)的分法更为合理。

例6.2.3在一个人数很多的团体中普查某种疾病,为此要抽验N个人的血,可以用两种方法进行。

(1)将每个人的血分别去验,这就需验
N 次。

(2)按K 个人一组进行分组,把从K 个人抽来的血混合在一起进行检验,如果这混合血液呈阴性反应,就生命K 个人的血都呈阴性反应,这样,这K 个人的血就只需验一次,若呈阳性,则再对这K 个人的血液分别进行化验,这样,这K 个人的血总共要化验K+1次。

假设每个人化验呈阳性的概率为p ,且这些人的试验反应是相互独立的,试说明当p 较小的时,选取适当的K ,按第二种方法可以减少化验的次数,并说明K 取什么值时最适宜。

解 各人的血呈阴性反应的概率为p q -=1.因而K 个人的混合血呈阴性反应的概率为k q ,K 个人的混合血呈阳性反应的概率为k q -1。

设以K 个人为一组时,组内每人化验的次数为X ,则X 是一个随机变量,其分布率为
X
的数学期望为
k
q q k
q k
X E k k k 11)1)(11(1)(+-=-++= N 个人平均需化验的次数为
)1
1(k
q N k +-
由此可知,只要选择K 使 111<+-k
q k
则N 个人平均需化验的次数<N ,当p 固定时,我们选取K 使得 k
q L k 11+-=
小于1且渠道最小值,这时就能得到最好的分组方法。

例如,p =0.1,则q =0.9,当K=4时,L 取到最小值。

此时得到最好的分组方法,若N=1000,此时以K=4分组,则按第二种方法平均只需化验
594)4
1
9.01(10004=+-(次) 这样平均来说,可以减少40%的工作量。

三.概率模型: (一)报童的诀窍模型
问题:报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。

设报纸每份的购进价为b,零售价为a,退回价为c(a>b>c)。

这就是说,报童售出一份报纸赚a-b ,退回一份赔b-c 。

报童每天如果购进的报纸太少,不够卖的,会少赚钱;如果购进太多,卖不完,将要赔钱。

请你为报童筹划一下,他应如何确定每天购进报纸的数量,以获得最大的收入。

分析:需求量是随机的,假定报童已经掌握了需求量的随机规律,即在他的销售范围内每天报纸的需求量为r 份的概率是),2,1,0)(( =r r f 。

有了)(r f 和a,b,c ,就可以建立关于购进量的优化模型了。

因为需求量r 是随机的,致使报童每天的收入也是随机的,所以作为优化模型的目标函数,应该是他长期卖报的日平均收入,即每天收入的期望值。

模型建立与求解:假设每天购进量为n 份,则每天的收入为

⎨⎧>-≤----=n r n b a n r r n c b r b a g ,)(),)(()(
于是每天购进n 份报纸时的平均收入为
∑∑∞
+-=-+
----=1
)()()()])(()[()(n r n
r r nf b a r f r n c b r b a g E (6.2.1)
问题归结为:在)(r f 和a,b,c 已知时,求n 使)(g E 最大。

通常需求量r 的取值和购进量n 都相当大,将r 近似地看成连续变量更便于分析和计算,这时概率)(r f 转化为概率密度)(r p ,式(6.2.1) 变成
dr r np b a dr r p r n c b r b a g E n
n
⎰⎰∞
-+----=)()()()])(()[()(0
(6.2.2)
计算
⎰⎰⎰⎰∞
∞-+--=-+-----=n
n n
n dr
r p b a dr r p c b r p b a n np b a dr r p c b n np b a dn g dE )()()()()
()()()()()()()()
(0

0)
(=dn
g dE ,得到
c
b b
a dr
r p dr r p n
n
--=

⎰∞
)()(0 (6.2.3) 使报童日平均收入达到最大的购进量n 应满足(6.2.3)。

因为
1)(=⎰

n
dr r p ,所以式(6.2.3)又可表为
c
b b
a dr r p n
--=

)( (6.2.4) 根据需求量的概率密度)(r p 的图形很容易从式(6.2.3)或(6.2.4)确定购进量n 。

图6.4
在上图中用1P 和2P 分别表示曲线)(r p 下的两块面积,则式(6.2.3)可记作
c
b b
a P P --=
21 因为当购进n 份报纸时,⎰=n
r p P 01)(是需求量r 不超过n 时的概率,即卖不完的概率,⎰∞
=n r p P )(2是需求量r 超过n 的概率,即卖完的概率,所以式(6.2.3)表明,购进的份数n 应该使卖不完与卖完的概率之比,恰好等于卖出一份赚的钱a-b 与退回一份赔的钱b-c 之比。

显然,当报童与报社签订的合同使报童每份赚钱与赔钱之比越大时,报童购进的份数就应该越多。

(二)蔬菜销售的最优订购量问题
问题:某超市蔬菜部在一时期内每天订购几种蔬菜销售,现考虑其中一种蔬菜的销售利润问题。

设这种蔬菜每千克批进价为1c 元,零售价为2c ;若卖不完就在当天以每千克3c 元处理掉。

这里,21c c <;对这种蔬菜每天需支付运费和行政费0c 元。

试制订一个使得销售该种蔬菜平均每天利润达到最大的最优方案,进而求出这个最大平均利润。

问题分析:运用数学建模方法解决这一问题时,要抓住以下三个要点:一是超市蔬菜部每天销售这种蔬菜的数量是一个随机变量,因此每天销售这种蔬菜的利润也是一个随机变量,显然后者是前者的函数,必须根据问题所提供的信息将这一关系式列举出来;二是每天的订购量必须适当,既不能太少,否则供不应求,并将会减少收益,也不能太多,否则当天因卖不完以较低的价格处理掉将会影响收益。

既然每天
销售这种蔬菜的利润是一个随机变量,所以作为优化模型的目标函数,不能是每天的利润,而应考虑每天利润的统计平均值,即数学期望;三是所要求的制订使得销售该种蔬菜平均每天利润达到最大的最优订购方案是数学上的最值问题。

模型假设:为便于在数学上建模处理,需作如下假设:
(1)蔬菜批发市场每天有足够的这种蔬菜可供超市蔬菜部批进; (2)蔬菜部除了支付批进这种蔬菜所需的成本费用外,其他有关费用已考虑在零售价之中,不另计算;
(3)记ξ(单位:千克)为在一段时期内,市场上每天对该超市销售这种蔬菜的需求量,η(单位:元)为蔬菜部每天销售这种蔬菜的利润,为研究作为ξ的函数η的统计特性,必须知道ξ的统计规律性。

假设蔬菜部已通过长期的销售经验或其他渠道掌握了市场在这段时期内其ξ的概率分布可以近似地用概率密度函数

⎨⎧≤>=0,00),()(x x x f x p ξ
刻画。

模型建立:设在一段时期内,超市蔬菜部每天对这种蔬菜的订购量为u (单位:千克)
,则由于销售利润等于销售收入减去销售成本,于是η作为ξ的函数g 。

其表达式为 ⎩⎨
⎧>+-≤+--+==u u c c u c u
u c c u c c g ξξξξξη),
(),()()(1021032
此问题的目标函数为每天销售这种蔬菜的平均利润,即η的数学期望
)(ηE 是u 的函数,记为)(u J 。

利用连续型随机变量函数的数学期望求
法,有
⎰⎰⎰⎰∞
++∞

-+∞
+-++--+=====u
u dx
x f u c c u c dx x f u c c x u c x c dx
x f x g dx x p x g g E E u J )()]([)()]()([)()()()()]([)()(1020
10320
ξξη
化简,得
01200
2332)()()()()()(c u c c dx x f u c c dx x xf c c u J u
u
--+-+-=⎰

问题归结为求使得)(u J 达最大的u 值。

模型求解 为求得上式的最大值,将上式对u 求导,得
)
()()()
(])()()[()()()(120
321202332c c dx x f c c c c u uf dx x f c c u uf c c u J u
u
-+--=-++-+-='⎰⎰
令0)(='u J ,解得唯一稳定点*u 满足
3212*
)(c c c c dx x f u --=

即3
212*)(c c c
c u F --=ξ 注意到ξ的分布函数⎰∞-=x
dx x p x F )()(ξξ单调递增,于是得 )(
*3
21
21c c c c F u --=-ξ 由于 0*)()()(32*<--=''=u f c c u J u u 故使得平均利润达最大值的最优订购量由)(*3
21
21c c c c F u --=-ξ给出。

进而,最大平均利润为
*
320
12*
3
21
223320
12*
*
2332)()(*)(*
)()()(*)()(*)()()(*)
()(max c dx x xf c c c u c c c c c c u c c dx x xf c c c u c c dx x f u c c dx x xf c c u J u J u u u u --=--+---+-=--+-+-==⎰⎰⎰⎰
(三)轧钢中的浪费模型:
问题:将粗大的钢坯制成合格的钢材需要两道工序:粗轧(热轧),形成刚才的雏形;精轧(冷轧),得到规定长度的成品材料。

由于受到环境、技术等因素的影响,得到钢材的长度是随机的,大体上呈正态分布,其均值可以通过调整轧机设定,而均方差是由设备的精度决定,不能随意改变。

如果粗轧后的钢材长度大于规定长度,精轧时要把多余的部分切除,造成浪费;而如果粗轧后的钢材长度小于规定长度,则造成整根钢材浪费。

如何调整轧机使得最终的浪费最小。

(1) 问题概述:成品材料的规定长度已知为l ,粗轧后的钢材长度的
标准差为σ,粗轧后的钢材长度的均值m ,使得当轧钢机调整到m 进行粗轧,然后通过精轧以得到成品材时总的浪费最少。

(2) 问题分析:精轧后的钢材长度记为X ,X 的均值记为m ,X 的
方差为σ,按照题意,),(~2σm N X 。

概率密度函数记为f (x ),
当成品钢材的规定长度l 给定后,记x ≥
ι的概率为p ', p '=p (x ≥ι)。

在轧钢过程中产生的浪费由两种情况构成:若l X >,则浪费量为l X -;若l X <,则浪费量为X 。

注意到当
m 很大时,l X >的可能性增加,浪费量同时增加;而当m 很小
时,l X <的可能性增加,浪费量也增加,因此需要确定一个合
适的m 使得总的浪费量最小。

(3) 模型建立与求解:
这是一个优化模型,建模的关键是选择合适的目标函数,并用
l ,σ,m 把目标函数表示出来。

根据前面的分析,粗轧一根钢
材平均浪费长度为:
W (x -)f (x )d x +
x f (x )d (
ι
ι
ι∞
-∞
=
⎰⎰ 利用
f(x)dx 1+∞
-∞
=⎰,
xf(x)d(x)m +∞
-∞
=⎰,和f(x)dx p ι
+∞
'=⎰
由(1)得:W=m-l
p '

W 为目标函数是否合适?
由于轧钢的最终产品是成品材,浪费的多少不应以每粗轧一根钢材的平均浪费量为标准,而应该用每得到一根成品材浪费的平均长度来衡量。

因此目标函数为:
W m
J P P
ι==-''
因为ι
是已知的常数,所以目标函数可以等价的取为:
m J (m ),(2)
P (m )
=' 其中P (m)=p(x)dx ι

'⎰
,22
(x-m)-2P(X)=
σ
易见J(m)平均每得到一根成品钢材所需要的刚才长度,问题就转化为求m 使J(m)达到最小。

令x m
m
y ,,,ι
μλσ
σσ
-=
==则(2)式可表为:
(-Z)J()J(Z),(Z=-)(-)(Z)
σμσλμλμφλμφ-
===
其中:2y -2
z
(Z)=(y)dy,(y)=
φφ∞
ψ⎰
可用微分法解J (Z)-
的极值问题。

注意到)()(Z Z -Φ=Φ',不难推出最优值Z 应满足方程:
Z Z Z -=Φλφ)
()
( (*)
记)()
()(Z Z Z F Φ=
φ,
)(Z F 可根据标准正态分布的函数值φ和Φ制成表格
式给出图形。

由上表可得方程(*)的根Z*
注:当给定λ>)0(F =1.253时,方程(*)不止一个根,但是可以证得,只有唯一负根Z*<0,才使J (Z)-
取得极小值。

(四)火灾报警问题
(美国)一个地区911应急服务中心在过去的一年内平均每月要收到171个房屋火灾电话,基于这个资料的,火灾率被估计为每月
171次,下个月收到火灾报警电话只有153个,这表明房屋火灾率实际上实际上是减少了,或是或是它只是一个随机波动?
分析:n X ——第n-1次和第n 次火灾之间的时间(月),X1…,Xn ,…是独立的且每一个Xn 服从参数为λ的指数分布,λ为报告的
房屋火灾率(月),即是:i x i f(X )=e λ-λ,(Xi>0)
目标:给定λ=171,确定每月收到153次这样的少的电话报警的概率有多大?或者说每月收到153是否属于正常范围内? 建模:i
x i e x f λλ-=)(,λ
μ1
)(=
=n X E ,2
2
1
σ
λ=
将1
1
μσλ
λ
=
=
,代入得:
(利用3σ原理):
若要有95%
的把握,则:...22X X X n μ
+++--≤≤ 若要有98%
的把握,则:33-≤≤
选择95%的把握得到:
12...n n
n
X X X λ
λ
λ
λ
-
≤+++≤
+
将λ=171,n=153代入(1),有:
12153153153 (171171171171)
X X X -≤+++≤+ 即:121530.75... 1.04X X X ≤+++≤ 因此我们的观察值12153...1X X X +++≈ 是在正常的变化范围之内
结论:断言火灾报警率降低的证据不充分,它可能是正太随机变量的正常结果。

当然,若每月都连续这样低,则需重新评估。

灵敏度分析:当λ=171代入(1)得:
12 (171171171171)
n n n X X X -≤+++≤+
因为对任何的[]n 147199∈,,区间
171171
n ±总会包含1,即在[]147199,之间都属于正常范围。

对于“每月171次”的假设的敏感性分析。

去掉特殊性,假设每月的均值是λ,我们有一个月的报警电话次数的观测值n=153,代入(1),有:
12153153153...X X X λλλλ
-≤+++≤+
因为对于任何的[]128
1178λ∈,之间153
λ
λ
±
总会包含
1,所以λ=153属于正常的变化范围。

(续)随机过程部分
一、随机过程:
热噪声电压:电子元件或器件由于内部微观粒子的随机热骚动所引起的端电压称为热噪声电压。

它在任一时刻t 的值是一随机变量,记为V(t),不同时刻对应不同的随机变量,当时间在某区间,譬如在[]∞0,+
上推移时,热噪声电压表现为一族随机变量,记为:{V(t),t>=0}。

由于热骚动的随机性,在相同条件下每次测量都将产生不同的电压——时间函数。

这样,不断的独立的测量就可以得到一族不同的电压——时间函数。

设T 是一无限实数集,我们把依赖于参数t T ∈的一族(无限多个)随机变量称为随机过程。

记为{X(t), t T ∈}。

这时每一个t T ∈,X(t)是一随机变量,T 叫做参数集。

把t 看作为时间,称X(t)为时刻t 时过程的状态,而X(t)=x 或是t=t1时过程处于状态x 。

对于一切的t T ∈,X(t)的所有可能的一切值的全体称为随机过程的状态空间。

二、马尔可夫链及其基本方程:
将时间离散化为n=0,1,2,…对每个n ,系统的状态用随机变量Xn 表示,设Xn 可以取k 个离散的值Xn=1,2,…k ,且记
i n a n P X i ()=(=)
即状态概率从Xn=i~Xn+1=j 的概率记为 ij n n P P X j X i =+1(=|=),即转移概率。

如果Xn+1的取值只取决
于Xn 的取值及转移概率,而与X1,X2,…,Xn-1的取值无关,则称这种离散状态按照离散的时间的随机转移过程叫做马尔可夫过程。

或者说此过程具有马尔可性或无后效性。

注:还可以这样表示
{}{}n n 12n-1n n n n n n P X x X x X x X x P X x X x x R
≤=≤∈12-1-1-1|=,=,...,=|=,
由状态转移的无后效性和全概率公式可以写出马尔可夫链的基本方程为
k
i j
ij
j a
n a n P i 123k =∑=1
(+1)=(),,
,,..., (1) 并且i a n ()
和ij P 应满足: i
1
a
n ,0,1,2,...0,1
,,1,2,...,k
ij ij j n P P i j k ==≥==∑∑k
i=1
()=1 (2)
引入状态概率向量和转移概率矩阵
12k a n a n a n a n P
⨯ij k k ()=((),(),...,()),{P } 则(1)式可表为:a n+1()=a(n)p (3)
由此可得 :
a n n
()=a(0)p (4) (2)式表明转移矩阵P 是非负矩阵,且P 的行和为1,称为随机矩阵。

说明:对于马尔可夫链模型最基本的问题是构造状态Xn 及写出转移矩阵P ,一旦有了P ,那么给定初始状态概率a (0)就可以用(3)和(4)或计算任意时段n 的状态概率a (n ) 例题:
(1)健康与疾病:
n 1
X n 0122⎧==⎨⎩,健康 ,,,,...,疾病
i n ij n+1n a n P X i P P X j X i =()=(=)---状态概率
(=|=)----状态转移概率
其中(i ,j=1,2)
a n a n-1P a n P a n a n-1P a n P a a +⎧⎨+⎩1111221211222212()=()()()=()()(0)=1,(0)=0
若开始处于疾病状态,即a a 12(0)=0,(0)=1

更一般的12(0)0.25λ=(0)=0.75,a ,当n →∞时,a n a n 12(),()
的趋向与上面两表相同。

结论:当n →∞时,a n a n 12(),()
趋向于稳定值,与初始状态无关。

(2)健康、疾病、死亡
1,2n 3⎧⎪
=⎨⎪⎩
n 健康
X ,疾病 ,=0,1,2,...
,死亡
3
a n a n-1P a n-1P a n-1P a n a n-1P a n-1P a n-1P a (n)a n-1P a n-1P a n-1P a 0a 0a 0++⎧⎪
++⎨⎪=++⎩11112213312112222332
113223333123()=()()()()=()()()()()()给定初始状态:()=1,()=0,()=0
对于例题中的(1)小问,看出从任意状态出发经过有限次的转移都能达到另外的任意状态,而(2)小问中则不能。

正则链定义:一个有k 可状态的马尔可夫链,如果存在正整数N ,使从任意的状态i 经N 次转移都以大于0的概率到达状态j (i ,j=1,2,3,…,k )则称为正则链。

Th1.若马尔可夫链的转移矩阵为P ,则它是正则链的充要条件是存在正整数N ,使N
P >0(指N
P 的每一元素大于零)。

Th2.正则链存在唯一的极限状态概率π=(π1,π2,…,πk ),使
得当n →∞时,a n →()
π,π与初始状态概率a(0)无关(π称为稳定概率或稳定状态分布),满足π=πk
i
i 1=∑=1
π
例如:
⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦
1231230.8 0.18 0.02(π,π,π)=(π,π,π)0.65 0.25 0.10 0 1
3
i
i 1=∑=1
π
由上面方程组可求得,123π=(π,π,π)=(0,0,1) 注:这能够满足我们这样的一种想法:由于随机波动,我们不能期望当系统稳定时状态变量将停留在一个数值上。

我们能达到的最好的希望是状态变量的概率分布将趋于一个极限分布。

吸收链:马尔可夫链存在一种状态,系统一旦进入该状态不再会转移到其他状态,并且系统从其他任何状态出发最终都会转移到该状态。

吸收链的定义:转移概率Pij=1的状态i 称为吸收状态,如果马尔可夫链至少含一个状态,并且从每一个非吸收状态出发,能以正的概率经过有限次转移到达某个吸收状态,则称这个马尔可夫链为吸收链。

三、模型:
一个宠物商店出售容量为15L 的水族箱,每个周末商店老板要盘点存货,开出订单。

商店的订货策略是如果存货为0,就在这个周末进3个新的15L 水族箱。

如果,只要商店还保存一个存货,就不在进新的。

这个策略是基于商店平均每周销售一个水族箱的事实提出的。

这个策略是不是能够保证防止商店缺货时顾客需要水族箱而无货销售的损失?。

相关文档
最新文档