报童问题的最优竞争比策略及其风险补偿模型_张桂清
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
决策者对离线对手发出的不确定输入序列 往往
有自己的预测, 令 F A I 为 预期输 入序 列, 若 在 线决策者能 够成功 地预 期未 来的输 入序 列, 则
可得到预期输 入 下策 略 A 的 约束 竞 争比KA =
sup{ Pr of ( opt R) / Pr of A ( R) } , 该 预期下 的最优 约ຫໍສະໝຸດ 期, 预期成功后的收益最大值。
报童问题的最优竞争比策略及其风险补偿模型 ) )) 张桂清 徐寅峰
令{ 3F i , P i4| i = 1, 2, ,, m} 是 一个 概率 预 期, 对任意一个 F i 作进一步划分, 使 F i = Fi, 1 G Fi,2 且 F i, 1 H F i, 2 = <; 对于 F i, 1 和 F i, 2 , 若 在线 决 策者预 计 其 出现 的 概率 分 别 为 P i,1 和 P i,2 , 则 P i, 1 + P i, 2 = P i 。记 { 3F 1 , P 14, ,, 3Fi- 1 , P i- 1 4,
和式( 2) 分别表示对于成本最小化和利润最大化
的在线决策问题所定义的竞争比, 本文分析的在
线报童模型是利润最大化的在线决策问题。
竞争比分析是在线问题最基本也是最 重要
的研究方法, 但是这种方法不太灵 活, 特别 是在
经济管理问 题中, 许多 投资 者希望 自己 能够 管
# 98 #
管理学报第 8 卷第 1 期 2011 年 1 月
他优化方法 的区别 在于: 它 在变化 因素 的每 一 个特例中都能给出一个 方案, 使得 这一方案 所 得到的解离最优方案给出的解总在一定的 比例
之内, 从而使在线 问题 的解 始终保 持在 一个 较
优的状态, 即对在线策 略 A 以及任何 有限的 输
入序列 R, 若存在一个常数满足
Co s tA ( R) [ KCos topt ( R) + C,
第 8 卷第 1 期 2011 年 1 月
管理学报 Chinese Journal o f M anagement
Vo l. 8 N o. 1 Jan. 2011
报童问题的最优竞争比策略及其风险补偿模型
张桂清1 徐寅峰1, 2
( 1. 西安交通大学管理学院; 2. 西安交通大学机械制造系统工程国家重点实验室)
收稿日期: 2009- 03- 10 基金项目: 国家自然科学基金资助项目( 71071123) ; 国家自然科学基金重点资助项目( 60736027)
# 97 #
析。M A 等[ 12] 从 竞争 比分 析的 角度, 研 究了 一 类部分信息下的报童问题( 快餐数问题) 。
然而, 已有的 部分信 息下的 报童 模型只 适 合风险中性的决策者。需求范围是刻画部 分信 息的一种常见表达形式。本文使用竞争比 分析 的方法来研究部分信息下的报童模型。主 要目 的是发展一个管理部分信息下的报童问题 的回 报和风险的框架。本文首先在在线竞争比 分析 框架下, 提出了最优竞争比策略; 然后建立 了概 率预期下在线报童问题的风险 补偿模型。分别 在确定性预期、基本概率预期下, 为具有风险偏 好的报童设计了最优订购策略, 使报童可以根据 自己不同的风险容忍度 和未来预期选 择最优的 订购策略。
经 典报童 问题 即单 周期 库存 问题 ( sing le per iod pro blem , 简 称 SPP) , 是供 应 链管 理 中 重要的模 型之 一, 1955 年, WH IT IN 首 次建 立 了受价格影 响的 报 童问 题模 型[1] 。其 后, 很 多 学者扩展了 传统的 报童 模型, 进行 了大 量的 研 究[ 2, 3] 。报童模 型及 其各 种 扩展 模型 大都 建 立 在风险中性 假设基 础之 上, 即最优 订购 量为 期 望利润最大化点或者期望成本最小化 点, 然而, 有实验表明: 实际 订购 量与 根据报 童模 型得 到 的最优量之 间存 在 偏差[ 4] 。 根据 这种 观 点, 很 多学者研究了基于风险分析的报童模型[ 5~ 7] 。
RI Fi
约束竞争比, R A, i = K* / KA , i 为 预 期 F i 成功 后 的
m
E 收益。在此基 础上, 定 义 ~K=
P K i A , i 为概 率
i= 1
预期{ 3F i , P i4| i= 1, 2, ,, m } 下 的约束竞争比,
定义
~
R
A
=
K* / ~KA 为在概率预期下的收益。
1 竞争比分析与风险补偿模型扩展
1. 1 竞争比分析与风险补偿模型[ 13~ 16] SL EAT OR 等[ 13] 以 计 算 机 页 面 置 换 为 应
用背景, 正式提出在线算法, 给出了研究在 线问 题的竞争比分析方法。在在线算法竞争比 分析
中, 存在着一个供决 策者 选择的 策略集 S 和 一 个离线对手 发出 的不确 定的 序列 集 I 。在线 决 策者的目的就是设计一个好的策略 A I S 以应 对离线对手 不确 定的 输入序 列 R I I 。也就 是 说, 在线决策者相 对离 线博 弈对手 而言 是一 个 局内人, 而离线对 手相 对在 线决策 者而 言是 无 所不知的局 外人, 二者 进行 的是一 场动 态的 零 和博弈。竞争比分析方法与解决此类问题 的其
( Xi. an Jiaot ong Universit y, Xi. an, China) Abstract: New sboy problem has alway s been an impo rt ant issue in invent ory management. A number of met ho ds have been pro posed t o solve such problems based on dif ferent object ives or considerat ions. T radit ional new sbo y models assume full know ledge of t he demand pro babilit y dist ribut ion; ho w ever, in realit y, it is of ten diff icult to com plet ely charact erize t he demand. T herefo re, many researchers f ocused on t he new sboy problem w it h part ial ( or limit ed) inf orm ation. T his paper const ruct s an online risk- rew ard m odel f or t he newsboy problem w ith rang inf orm ation under pro babilist ic fo recast s. U sing t he abo ve met hod, t his paper desig ns t he risk t olerance st rat egy and pro ves it s competit ive rat io to help t he new sboy choosing t he opt imal st rat egy acco rding t o his ow n risk t olerance and probabilist ic fo recast . Key words: new sbo y problem; online alg orit hm ; r isk- rew ard; pr obabilist ic for ecast
摘要: 报童问题是库存管理中一个重要的模型。对报童问题在不同的目标函数和约束条 件下的扩展模型已有了大量的研究。已有研究假设产品的需求分布已知, 然而, 在实际中完全 刻画需求分布信息常常是很困难的, 因此, 部分信息下的报童模型研究近年越来越受到重视。 在竞争比分析方法下, 对报童问题进行了讨论, 建立概率预期下风险补偿模型用于解决部分信 息的报童问题。在确定性预期和基本概率预期下, 分别为具有风险偏好的报童设计了最优订 购策略, 使报童可以根据自己不同的风险容忍度和未来预期选择订购策略。
NA LI [ 16] 于 1999 年正 式提出 了在 线风 险回 报 的思想。
根据在线风险 回报思 想, 对于 任意 A I S,
采用策略 A 的 竞争 比与 传统 最 优竞 争比 的 比 值来量化策略 A 的 风险, 即 t A = KA / K* , tA 的 值 越大, 选择策略 A 的风险 也越大。考 虑到在 线
理风险, 有时为了更大的收益, 他们愿意担 负一 定的风险。M A CCRIM M ON 等[14] 给出 了研 究
风险的一些基础 模型。BO RODIN 等[ 15] 在使 用
在线算法研 究换页 问题 时, 提出的 邻接 图方 法 就蕴涵 了在 线 风 险 回 报思 想 的 雏 形。A L-BI-
上述概 率 预 期下 收 益 定 义 有如 下 良 好 性
质, 证明见文献[ 17] 。
性质 1
min{ R A ,i }
[
~
RA
[
m ax{ RA, j } 。
i
i
性质 1 显示概率 预期下的 收益大于 从 F1 ,
F2 , ,, Fm 中选取确定 性预期, 预期成功 后的收
益最小值; 小于 F 1 , F2 , ,, Fm 从中选 取确定 预
发生会带来收益, 预 期失 败会 带来 风险。文 献 [ 17] 将其扩展 为概 率预 期, 概率预 期不 对预 期 简单地作是 和否的 判断, 而 是估计 预期 出现 的
概率。首先给出概率预期下约束竞争比和 收益
的定义。令 F1 , F2 , ,, Fm A I 是决策 者对离 线
m
对手发出系列 集的 一个 划 分, 即 G Fi = I , Fi H i= 1
关键词: 报童问题; 在线算法; 风险回报; 概率预期 中图分类号: C93; F22410 文献标识码: A 文章编号: 1672- 884X( 2011) 01- 0097- 06
The Optimal Competitive Strategy and Risk-Reward Model of the Online Newsboy Problem ZH A N G G uiqing1 X U Y inf eng1, 2
( 1)
或
P rof opt ( R) [ KPr of A ( R) + C,
( 2)
则称在线策略 A 为 K竞争策略, 或者称 A 具有
竞争比 K, K是与离线对手发出 序列无关的常 数
项。若某在线策略的竞争比 满足 K* = inf ( KA ) , AIS
则 K* 为该在线问题的 最优竞 争比。这里式 ( 1)
Fj = <。对于 Fi , 决策 者预 计出现 的概 率为 P ,
m
E P i = 1。称 二元 组集 {3Fi , P i4| i = 1, 2, ,,
i= 1
m} 为一个概率预期。对于策 略 A I S , 令 KA , i =
sup{ Pr of ( opt R) / Pr of A ( R) } 为预 期 Fi 成 功后 的
传统的报童模型还假设产品的需求分 布已
知。然而, 在实际 中完 全刻 画需求 常常 是很 困 难的, 因此, 一些学者开始关注部分信息下 的报 童问题, 并有 一些研 究成 果。这些 研究 使用 的 方法是 SA VAGE[ 8] 提出的最 小最大后 悔准则。 这种方法的目的是最小化没有做出最优决 策的 机会成 本。YU E 等[ 9] , P ERAKIS 等[ 10] 使 用 最 小最大完全后悔准则研究了部分信息下的 报童 模型。ZH U 等[ 11] 使用 最小 最大相 对后 悔准 则 研究了同一 个问 题。在 大多数 情况 下, 这 2 种 基于最小最大后悔准则的模型可得到类似 的结 果。同时, PERA KIS 等[ 10] 也 认 为 最小 最 大 后 悔准则类似 于 计 算机 科 学 中使 用 的 竞争 比 分
RI F
束竞争比为 K* = inf( KA ) 。采用预期正确下约束 AIS
竞争比性能的提高来衡量策略容忍风险后 所获
得的回报收益, 策略 A 的回报收益定义为 R A = K* / KA 。 1. 2 风险补偿模型扩展
上述风险、收 益考虑 的都 是一种 确定性 预
期, 它对预期是否发生仅作是和否的判断, 预期