工程数学第四章 概率统计模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.2 机票超售(overbook )策略
2013-10-21 《北京晚报》:三天前,徐先生网上 为朋友订购了大新华航空公司于昨天下午3点55 分从北京飞往哈尔滨的机票。昨天下午,朋友两 点多就来到了机场,却在换登机牌时被工作人员 告知,登机牌已经换完,飞机上“满座”,已无 空位置。“为什么我买了票却不让我上去?”由 于着急赶时间,徐先生的朋友急切地与工作人员 交涉,结果被告知,“很多航班都会这样售票, 防止有人买票后临时有事退票或改签,导致飞机 坐不满人,浪费资源。”
第四章
概率统计模型
4.1 报童的诀窍(随机分布)
4.2 机票超售策略(随机模拟)
4.3 牙膏的销售量(多元线性回归)
4.4 教学评估(逐步回归)
4.5 Logistic回归
4.6 判别与聚类
确定性因素和随机性因素
确定性是理想化的,随机性是现实中必然存在的 1. 随机因素可以忽略 2. 随机因素影响可以简单 地以平均值的作用出现 3. 随机因素影响必须考虑 确定性模型
n r 0 r n 1
G(n) E (S (n)) [(a b)r (b c)(n r )] f (r )
(a b)nf (r )

求 n 使 G(n) 最大
n=E(R) ???
变限积分求导公式
F ( y)
b( y ) a( y)
f ( x, y )dx
mnx ( x mp ) 2 exp( )dx 2mpq 2 mpq mq n t mpq 2 t2 exp( )dt 2
mq n mpq
模型求解
令dE(S)/dm=0得
1 pq z qg ( g b)q (t )dt ( g b) t (t )dt 0 2 m
习题1
国际市场上每年对某种商品的需求量为一个随机 变量(单位:千吨),根据预测,它服从[2,4] 上的均匀分布,并已知每售出1千吨此种商品, 可以挣得外汇3千万美元,但若售不出去,而屯 售于仓库,每年需花费保养费每千吨为1千万美 元,问应组织多少货源可使平均收益达到最大?
天猫补救“超卖”
2014年11月11日,阿里双十一全 天交易额571亿元。9小时超过美 国“网络星期一”全天 ! 天猫方面承认“双11”当天因流量巨大,导致其系统商 品库存数据与商家的前后台数据对接不准,确有少 部分订单出现“超卖”。为此,天猫在致歉的同时 给出3条补救意见―― ■商家根据自己的实际情况对消费者进行额外补 偿,如店铺优惠券、现有商品5折销售等; ■对于未发货的“超卖”订单,支持进行全额退 款; ■对于所有“超卖”订单,买家都可获得商品价 格30%、最多500元的天猫积分。其中,最后一条是 天猫首次就“超卖”明确表示赔付。
5 R 500 x 500 5 P P ( R x ) = P ( ) , 1 8 50 50 8 查标准正态分布表: 1 e 2 x 500 0.32 50 516份
0.32 t2 2
5 x 500 dt , 0.32 8 50
dG ? (a b)np(n) n (b c) p(r )dr 0 dn (a b)np(n) (a b) p(r )dr
n
n
(b c) p(r )dr (a b) p(r )dr
0

dG 0 dn
p ( r ) dr a b p ( r ) dr b c
k 0
qmg r ( g b)
(m n k ) p
k
(q=1-p).
求m使E(S(m))最大
模型求解
方法一:数值模拟(实际计算适用)
对m=n, n+1, n+2, …., 计算E(S(m)), 求得最优m 注意到最优解与r无关 Matlab程序
n=300;p=0.05;q=1-p;g=1000;b=200; m=n+1; for k=0:(m-n-1) P(k+1)=nchoosek(m,k)*p^k*q^(m-k); end ES=q*m*g-(g+b)*(m-n-(0:(m-n-1)))*P'
来源变量也可以考虑多个,但是如果他们不独 立,是很难处理的。
算例
若每份报纸的购进价为0.75元,售出价为 1元,退回 价为0.6元,需求量服从均值500份,均方差50份的 正 态分布,报童每天应购进多少份报纸才能使平均收入 最高?
P1 a b 1 0.75 5 5 3 P2 b c 0.75 0.6 3 P1 ,P 2 8 8 P1 P2 1
a-b ~售出一份赚的钱
b-c ~退回一份赔的钱
p
P1 0
P2 n r
通常,a-b>b-c, R接近正态分布,n>E(R)
为什么用随机分布模型?
需求R是随机的 由于收入是需求的非线性函数,日平均收入 ES(n)不是简单地由日平均需求E(R)决定
G(n) E (S (n)) [(a b)r (b c)(n r )] f (r )
z
z
0 t (t )dt t (t )dt 0.4
1 pq z t (t )dt 0 第 3项 2 m g ( z ) g b n=300, p=0.05, b/g=0.2, 计算得 m=319
思考:还可以 对第3项做更精 细的估计,从 而得到更高精 度结果。
m n 1 k 0 m n 1 k 0
(ng r (m n k )b) p
m n 1 k 0

k 0
k

k
k 0 m
k

k mn

k
((m k ) g r ) pk
m k
(ng r (m n k )b (m k ) g r ) p ((m k ) g r ) p
4.2 机票超售(overbook )策略
问题分析:
订票的乘客可能不来登机(no-show); 只按容量订票可能会出现很多空位从而损失利润; 超额订票可能导致乘客不能登机(deny-boarding, DB )而赔偿; 找一个最佳订票数量
模型假设
飞机容量n, 机票价格g, 固定飞行成本r; 订票限额m>=n, 乘客是否到来随机独立,每个 乘客no-show的概率p; no-show数K~B(m,p) 每位DB无须付机票费,且赔偿b.
模型求解
ES0=ES-1; while ES>ES0 m=m+1;ES0=ES; for k=0:(m-n-1) P(k+1)=nchoosek(m,k)*p^k*q^(m-k); end ES=q*m*g-(g+b)*(m-n-(0:(m-n-1)))*P'; end m,ES0 %计算结果m=321(但计算有溢出警告)
应根据需求确定购进量 每天需求量是随机的
存在一个合 适的购进量
每天收入是随机的
优化问题的目标函数应是长期的日平均收入 等于每天收入的数学期望
准 备 建 模
随机因素的主要来源——每天需求量 为 R ,概率 P(R=r)=f(r), r=0,1,2… • 设每天购进 n 份(不随机),日平均收入为 G(n) • 已知售出一份赚 a-b;退回一份赔 b-c, 日收入为 (a b) R (b c)(n R), R n S (n) (a b)n Rn
问题的推广
现实情况:每天的需求并不完全是随机的,如 周末或重大事件期间销量会上升,天气不好时 销量会下降。 解决途径一:利用历史数据; 解决途径二:利用时间序列分析方法; 解决途径三:利用Monte Carlo数值模拟。
Monte Carlo模拟
若明天需求量依赖于气温T, R=500+-|T-20|, N(0,50^2), U(5,15), 与独立 Matlab程序(明天T=5)求得n0=371(近似). a=1;b=0.75;c=0.6; T=5; N=1000; e=normrnd(0,50,1,N); d=unifrnd(5,15,1,N); R=500+e-d*abs(T-20); S0=0;for n=100:800, S=mean(((a-b)*R-(b-c)*(n-R)).*(R<=n)+(a-b)*n*(R>n)); if S>S0, S0=S;n0=n;end; end;n0,S0
模型求解
方法二:模型近似化简(理论上比较漂亮)
当m很大, K~B(m,p)近似N(mp, mpq) q=1-p.
E ( S (m)) qmg r ( g b) qmg r ( g b) qmg r ( g b)
mn mn
(m n x ) p ( x )dx
基本模型
利润
订票数m, 容量n, no-show人数 K~B(m,p)
到来(on-show)人数m-K
(m K ) g r mK n S K n)b m K n ng r (m m m 期望利润 p 1, kp mp
E ( S (m))
模型求解
方法三:Monte Carlo模拟(不求数学期望,从最原始 的随机数开始模拟,忽略r)
clear;n=300;p=0.05;g=1000;b=200; for i=0:50; m=n+i; K=binornd(m,p,1,10000); ES(i+1)=mean(g*(m-K).*(m-K<=n)+(n*g-b*(m-K-n)).*(mK>n)); end [maxES,id]=max(ES) m=n+id %计算结果m=321
r 0 n r n 1
(a b)nf (r )

R的随机分布对最优决策有影响 若收入是需求的线性函数,日平均收入可用日 平均需求来表示,就不必用随机模型。
怎样运用随机分布模型?
关键:搞清楚随机性的主要来源是什么? 这个主要来源设为一个随机变量(如报童模型中 每天的需求量R)
这个随机变量的分布是容易得到的; 其他随机变量(如收入)可以写成它的函数。
F '( y ) f (b( y ), y )b( y ) f (a ( y ), y )a( y )
b( y ) a( y)
f y ( x, y )dx
为简化计算
求解
n
将r视为连续变量
f (r ) p(r ) (概率密度)

G(n) 0 [( a b)r (b c)( n r )] p(r )dr n (a b)np(r )dr
z
qg 1 pq z q ( z ) t (t )dt 0 g b 2 m mq n 这里z , ( z )和 (t )为N (0,1)分布和密度 mpq
模型求解
由于(-t)= (t) ,所以 可以证明zR
z 0
z 0时, t (t )dt 0
随机性模型
4.1
报童的诀窍
百度文库
假设《新民晚报》 平均每天零售 500份,报亭每 天应该预定多 少份?
4.1 报童的诀窍
报童售报: a (零售价) > b(购进价) > c(退回价)
问 售出一份赚 a-b;退回一份赔 b-c 题
购进太多卖不完退回赔钱
每天购进多少份可使收入最大?
分 购进太少不够销售赚钱少 析
0 n
n
n
d 2G 又 (c a) p(n) 0,所以确实为极大值点。 2 dn
结果解释
n
p ( r ) dr a b p ( r ) dr b c
0 n
n
p(r )dr P , p(r )dr P
0 1 n

2
P a b 1 取 n使 P2 bc
考虑不同客源的模型
第一类顾客(no show概率大):后付费,高票价。 第二类顾客:先付费,低票价。设打折,打折 票t张,第二类顾客no show概率=0. no show K~B(m-t, p)
相关文档
最新文档