报童问题的最优竞争比策略及其风险补偿模型_张桂清
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经 典报童 问题 即单 周期 库存 问题 ( sing le per iod pro blem , 简 称 SPP) , 是供 应 链管 理 中 重要的模 型之 一, 1955 年, WH IT IN 首 次建 立 了受价格影 响的 报 童问 题模 型[1] 。其 后, 很 多 学者扩展了 传统的 报童 模型, 进行 了大 量的 研 究[ 2, 3] 。报童模 型及 其各 种 扩展 模型 大都 建 立 在风险中性 假设基 础之 上, 即最优 订购 量为 期 望利润最大化点或者期望成本最小化 点, 然而, 有实验表明: 实际 订购 量与 根据报 童模 型得 到 的最优量之 间存 在 偏差[ 4] 。 根据 这种 观 点, 很 多学者研究了基于风险分析的报童模型[ 5~ 7] 。
Fj = <。对于 Fi , 决策 者预 计出现 的概 率为 P ,
m
E P i = 1。称 二元 组集 {3Fi , P i4| i = 1, 2, ,,
i= 1
m} 为一个概率预期。对于策 略 A I S , 令 KA , i =
sup{ Pr of ( opt R) / Pr of A ( R) } 为预 期 Fi 成 功后 的
RI Fi
约束竞争比, R A, i = K* / KA , i 为 预 期 F i 成功 后 的
m
E 收益。在此基 础上, 定 义 ~K=
P K i A , i 为概 率
i= 1
预期{ 3F i , P i4| i= 1, 2, ,, m } 下 的约束竞争比,
定义
~
R
A
=
K* / ~KA 为在概率预期下的收益。
传统的报童模型还假设产品的需求分 布已
知。然而, 在实际 中完 全刻 画需求 常常 是很 困 难的, 因此, 一些学者开始关注部分信息下 的报 童问题, 并有 一些研 究成 果。这些 研究 使用 的 方法是 SA VAGE[ 8] 提出的最 小最大后 悔准则。 这种方法的目的是最小化没有做出最优决 策的 机会成 本。YU E 等[ 9] , P ERAKIS 等[ 10] 使 用 最 小最大完全后悔准则研究了部分信息下的 报童 模型。ZH U 等[ 11] 使用 最小 最大相 对后 悔准 则 研究了同一 个问 题。在 大多数 情况 下, 这 2 种 基于最小最大后悔准则的模型可得到类似 的结 果。同时, PERA KIS 等[ 10] 也 认 为 最小 最 大 后 悔准则类似 于 计 算机 科 学 中使 用 的 竞争 比 分
1 竞争比分析与风险补偿模型扩展
1. 1 竞争比分析与风险补偿模型[ 13~ 16] SL EAT OR 等[ 13] 以 计 算 机 页 面 置 换 为 应
用背景, 正式提出在线算法, 给出了研究在 线问 题的竞争比分析方法。在在线算法竞争比 分析
中, 存在着一个供决 策者 选择的 策略集 S 和 一 个离线对手 发出 的不确 定的 序列 集 I 。在线 决 策者的目的就是设计一个好的策略 A I S 以应 对离线对手 不确 定的 输入序 列 R I I 。也就 是 说, 在线决策者相 对离 线博 弈对手 而言 是一 个 局内人, 而离线对 手相 对在 线决策 者而 言是 无 所不知的局 外人, 二者 进行 的是一 场动 态的 零 和博弈。竞争比分析方法与解决此类问题 的其
( Xi. an Jiaot ong Universit y, Xi. an, China) Abstract: New sboy problem has alway s been an impo rt ant issue in invent ory management. A number of met ho ds have been pro posed t o solve such problems based on dif ferent object ives or considerat ions. T radit ional new sbo y models assume full know ledge of t he demand pro babilit y dist ribut ion; ho w ever, in realit y, it is of ten diff icult to com plet ely charact erize t he demand. T herefo re, many researchers f ocused on t he new sboy problem w it h part ial ( or limit ed) inf orm ation. T his paper const ruct s an online risk- rew ard m odel f or t he newsboy problem w ith rang inf orm ation under pro babilist ic fo recast s. U sing t he abo ve met hod, t his paper desig ns t he risk t olerance st rat egy and pro ves it s competit ive rat io to help t he new sboy choosing t he opt imal st rat egy acco rding t o his ow n risk t olerance and probabilist ic fo recast . Key words: new sbo y problem; online alg orit hm ; r isk- rew ard; pr obabilist ic for ecast
发生会带来收益, 预 期失 败会 带来 风险。文 献 [ 17] 将其扩展 为概 率预 期, 概率预 期不 对预 期 简单地作是 和否的 判断, 而 是估计 预期 出现 的
概率。首先给出概率预期下约束竞争比和 收益
的定义。令 F1 , F2 , ,, Fm A I 是决策 者对离 线
m
对手发出系列 集的 一个 划 分, 即 G Fi = I , Fi H i= 1
和式( 2) 分别表示对于成本最小化和利润最大化
的在线决策问题所定义的竞争比, 本文分析的在
线报童模型是利润最大化的在线决策问题。
竞争比分析是在线问题最基本也是最 重要
的研究方法, 但是这种方法不太灵 活, 特别 是在
经济管理问 题中, 许多 投资 者希望 自己 能够 管
# 98 #
管理学报第 8 卷第 1 期 2011 年 1 月
关键词: 报童问题; 在线算法; 风险回报; 概率预期 中图分类号: C93; F22410 文献标识码: A 文章编号: 1672- 884X( 2011) 01- 0097- 06
The Optimal Competitive Strategy and Risk-Reward Model of the Online Newsboy Problem ZH A N G G uiqing1 X U Y inf eng1, 2
期, 预期成功后的收益最大值。
报童问题的最优竞争比策略及其风险补偿模型 ) )) 张桂清 徐寅峰
令{ 3F i , P i4| i = 1, 2, ,, m} 是 一个 概率 预 期, 对任意一个 F i 作进一步划分, 使 F i = Fi, 1 G Fi,2 且 F i, 1 H F i, 2 = <; 对于 F i, 1 和 F i, 2 , 若 在线 决 策者预 计 其 出现 的 概率 分 别 为 P i,1 和 P i,2 , 则 P i, 1 + P i, 2 = P i 。记 { 3F 1 , P 14, ,, 3Fi- 1 , P i- 1 4,
上述概 率 预 期下 收 益 定 义 有如 下 良 好 性
质, 证明见文献[ 17] 。
性质 1
min{ R A ,i }
[
~
RA
[
m ax{ RA, j } 。
i
i
性质 1 显示概率 预期下的 收益大于 从 F1 ,
F2 , ,, Fm 中选取确定 性预期, 预期成功 后的收
益最小值; 小于 F 1 , F2 , ,, Fm 从中选 取确定 预
决策者对离线对手发出的不确定输入序列 往往
有自己的预测, 令 F A I 为 预期输 入序 列, 若 在 线决策者能 够成功 地预 期未 来的输 入序 列, 则
可得到预期输 入 下策 略 A 的 约束 竞 争比KA =
sup{ Pr of ( opt R) / Pr of A ( R) } , 该 预期下 的最优 约
理风险, 有时为了更大的收益, 他们愿意担 负一 定的风险。M A CCRIM M ON 等[14] 给出 了研 究
风险的一些基础 模型。BO RODIN 等[ 15] 在使 用
在线算法研 究换页 问题 时, 提出的 邻接 图方 法 就蕴涵 了在 线 风 险 回 报思 想 的 雏 形。A 99 年正 式提出 了在 线风 险回 报 的思想。
根据在线风险 回报思 想, 对于 任意 A I S,
采用策略 A 的 竞争 比与 传统 最 优竞 争比 的 比 值来量化策略 A 的 风险, 即 t A = KA / K* , tA 的 值 越大, 选择策略 A 的风险 也越大。考 虑到在 线
( 1)
或
P rof opt ( R) [ KPr of A ( R) + C,
( 2)
则称在线策略 A 为 K竞争策略, 或者称 A 具有
竞争比 K, K是与离线对手发出 序列无关的常 数
项。若某在线策略的竞争比 满足 K* = inf ( KA ) , AIS
则 K* 为该在线问题的 最优竞 争比。这里式 ( 1)
管理学报 Chinese Journal o f M anagement
Vo l. 8 N o. 1 Jan. 2011
报童问题的最优竞争比策略及其风险补偿模型
张桂清1 徐寅峰1, 2
( 1. 西安交通大学管理学院; 2. 西安交通大学机械制造系统工程国家重点实验室)
摘要: 报童问题是库存管理中一个重要的模型。对报童问题在不同的目标函数和约束条 件下的扩展模型已有了大量的研究。已有研究假设产品的需求分布已知, 然而, 在实际中完全 刻画需求分布信息常常是很困难的, 因此, 部分信息下的报童模型研究近年越来越受到重视。 在竞争比分析方法下, 对报童问题进行了讨论, 建立概率预期下风险补偿模型用于解决部分信 息的报童问题。在确定性预期和基本概率预期下, 分别为具有风险偏好的报童设计了最优订 购策略, 使报童可以根据自己不同的风险容忍度和未来预期选择订购策略。
它在变化因素的每一个特例中都能给出一个方案使得这一方案所得到的解离最优方案给出的解总在一定的比例之内从而使在线问题的解始终保持在一个较优的状态即对在线策略以及任何有限的输入序列若存在一个常数满足costacostopt为竞争策略或者称a具有竞争比是与离线对手发出序列无关的常数项
第 8 卷第 1 期 2011 年 1 月
收稿日期: 2009- 03- 10 基金项目: 国家自然科学基金资助项目( 71071123) ; 国家自然科学基金重点资助项目( 60736027)
# 97 #
析。M A 等[ 12] 从 竞争 比分 析的 角度, 研 究了 一 类部分信息下的报童问题( 快餐数问题) 。
然而, 已有的 部分信 息下的 报童 模型只 适 合风险中性的决策者。需求范围是刻画部 分信 息的一种常见表达形式。本文使用竞争比 分析 的方法来研究部分信息下的报童模型。主 要目 的是发展一个管理部分信息下的报童问题 的回 报和风险的框架。本文首先在在线竞争比 分析 框架下, 提出了最优竞争比策略; 然后建立 了概 率预期下在线报童问题的风险 补偿模型。分别 在确定性预期、基本概率预期下, 为具有风险偏 好的报童设计了最优订购策略, 使报童可以根据 自己不同的风险容忍度 和未来预期选 择最优的 订购策略。
他优化方法 的区别 在于: 它 在变化 因素 的每 一 个特例中都能给出一个 方案, 使得 这一方案 所 得到的解离最优方案给出的解总在一定的 比例
之内, 从而使在线 问题 的解 始终保 持在 一个 较
优的状态, 即对在线策 略 A 以及任何 有限的 输
入序列 R, 若存在一个常数满足
Co s tA ( R) [ KCos topt ( R) + C,
RI F
束竞争比为 K* = inf( KA ) 。采用预期正确下约束 AIS
竞争比性能的提高来衡量策略容忍风险后 所获
得的回报收益, 策略 A 的回报收益定义为 R A = K* / KA 。 1. 2 风险补偿模型扩展
上述风险、收 益考虑 的都 是一种 确定性 预
期, 它对预期是否发生仅作是和否的判断, 预期