第十六章随机决策分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十六章随机决策分析方法
人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判定和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个差不多特点:后果的不确定性和后果的效用. 所谓后果的不确定性,要紧是由于问题的随机性,使得问会显现什么状态是不确定的,因此计策人做出的某种决策以后会显现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,不管决策人采纳什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情形下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有如此,人们才能比较各种策略的优劣,依照自己的喜好来选择最佳的决策方案. 在决策分析中,后果的不确定性和关于后果给予的效用是两个关键性的问题.为此,关于状态的不确定性要紧用主观概率来表示,而后果的效用则用效用理论来研究.
16.1 随机性决策问题的差不多概念
16.1.1 主观概率 随机性决策问题的后果的不确定性,要紧是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的. 主观概率是决策人进行决策分析的依据,尽管他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.那个地点仅给出主观概率所服从的差不多假设(或称公理系统):
(1)设Ω为一非空集合,其元素能够是某种试验或观看的结果,也能够是自然的状态.将这些元素记作抽象的点ω,因而有{}.ωΩ= (2)设F 是Ω中的一些子集A 所构成的集合,F 满足下列条件: 1)F Ω∈
2)假如A F ∈,则\A A F =Ω∈;
3)假如可列多个n A F ∈,1,2,
,n =则它们的并集
1
n n A F ∞
=∈.
(3)设()()P A A F ∈是定义在F 上的实值集函数,假如它满足下列条件,就称为F 上的
(主观或客观)概率测度,或简称概率,这些条件是
1)关于每个A F ∈,有0()1;P A ≤≤
2)()1;P Ω=
3)假如可列多个n A F ∈(1,2,
)n =,i j A A ⋂=∅()i j ≠,则
1
1
(
)().n n n n P A P A ∞
∞
===∑
那个地点称点ω为差不多事件, F 中的集A 称为事件, F 是全体事件的集合, ()P A 称为事件A 的(主观或客观)概率,三元总体(,,)F P Ω称为(主观或客观)概率空间.
设定主观概率的方法要紧有:主观先验分布法、无信息先验分布法、极大熵(极大平均信
息量)先验分布法和利用过去数据设定先验分布法等[3.4]
.
16.1.2 效用函数
在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.因此,在研究后果的效用时要充分考虑后果的不确定性.
设决策人在选择某一行动时,决策问题可能的n 个后果为12,,
,;n C C C 后果i C 可能发
生的概率分别是(1,2,
,),i p i n =且1
1.n
i i p ==∑用P 表示所有后果的概率分布,并记
1122(,;,;;,)n n P p C p C p C =则称P 为展望.所有展望构成的集合记为P ,能够验证P 关
于凸线性组合是封闭的,即假如12,,P P P ∈而且01,λ≤≤则有
12(1)P P P λλ+-∈.
关于任意两个展望12,P P P ∈,都存在一定的优先关系,即关于决策人能够认为1P 优于2P ,
或1P 与2P 无差异,或1P 不优于2P 三种情形,将这三种关系分别记为1
21
2,P P P P 和
21.P P .这种优先关系反映了决策人对各种后果的偏好程度.
定义16.1 设()u P 是定义在展望P 上的实值函数,且满足 (1)它和在P 上的优先关系
一致,即假如关于所有
12,P P P ∈,有1
2,P P 当且仅当12()()u P u P ≥;
(2)它在P 上是线性的,即假如12,P P P ∈,而且01,λ≤≤则
1212((1))()(1)(),u P P u P u P λλλλ+-=+-
那么称()u P 是定义在展望P 上的效用函数.
假如1122(,;,;
;,)n n P p C p C p C P =∈,则()u P 确实是表示以概率i p 选择
(1,2,
,)i C i n =的期望效用.效用是决策人在有风险的情形下对后果的偏好的量化,因此,其
中包含有决策人关于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.假如所研
究的事件是确定的事件,并不受自然状态的阻碍,类似地能够定义一个效用来表示决策人对确定事件的各种后果的偏好程度.关于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.
定义16.2 设X 为所有确定事件的后果x 的集合, ()u x 是定义在X 上的实值函数,假
如关于任意的12,x x X ∈有12()()u x u x ≥,当且仅当12.x x ,则称()u x 是定义在X 上的序数效用函数. 基数效用和序数效用的要紧区别是:基数效用在正线性变换下是唯独的,而序数效用在保序变换下是唯独的. 正线性变换: ()()(0)u P u P αβα=+>.
保序变换:()(())u x f u x =,对任意,x X f ∈为严格的单调增加函数.
16.2 效用函数理论
16.2.1 效用与风险的关系
实际中专门多的决策问题都涉及经济效益,关于这类问题,在后果不确定的情形下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一样是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型.
假设决策人面对一种风险的情形有1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.假如决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.假如决策人认为这和不冒任何风险的另一行为盈利a 元等价,则对待风险的态度是中立型的.这三种不同的态度能够反映在效用函数上确实是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.
图16-1 三种不同的效用函数曲线
由图16-1(a
)是风险厌恶型的效用函数,即有
[]123
121
()()()()
22x x u x u x u
x u +
=
+<;
由图16-1(b )是风险中立型的效用函数,即有
[
]12
3121
()(
)
()()22x x u x u x u x u +=
+=;
由图16-1(c )是风险喜好型的效用函数,即有
[]123121
()()()()22x x u x u x u x u +=
+>;
实际中,专门多的情形效用函数的曲线呈S 型,即在后果的范畴内,决策人对待风险的
态度往往会从厌恶风险改变为喜好风险.如图16-2.
图16-2(a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b )反映了决策人的财产随着从缺失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.
16.2.2 缺失函数与风险函数
有的时候不要效用函数,而是用缺失函数来做决策分析.记缺失函数为(,)l x a ,它表时示一个决策问题当状态为x ,决策人的行动为a 时所产生的后果使决策人所受的缺失.缺失函数能够为正,也能够为负,它反映决策人获得的利益,后果效用越大,则缺失越小.由此能够用效用函数来定义缺失函数,即令
(,)(,)l x a u x a =-
实际中,在有些问题上为了使缺失函数总是为非负的,也能够定义缺失函数为
(,)supsup (,)(,).x X a A
l x a u x a u x a ∈∈=-
在效用理论中,我们说明了期望效用能够合理的表示在风险情形下决策人的偏好,因此,期望缺失也必定是决策人在风险情形下遭受缺失的一个正确测度.
16.2.3 随机函数与效用函数
随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情形下制定决策的方法,称为随机优势法.
假设问题的效用函数为()u x ,其自变量x 表示财宝(为一随机变量)。
实际中的问题总是有[],x a b ∈,且()u x 在[],a b 上有界,关于这种效用函数能够分为以下几类:
1. 递增效用函数
实际中,一样要求财宝的效用函数()u x 是[],x a b ∈的非递减函数,即意味着当财宝增 加时,它的效用总可不能减少.通常是随着x 的增加()u x 是严格递增的,而且是有界的.为此,我们假设:
(1) 关于任意[]12,,x x a b ∈,当12x x <时有12()()u x u x <; (2) ()u x 在[],a b 上连续,且有界,即存在0M >使()u x M ≤; (3) ()u x 在[],a b 上一次可微,且在(,)a b 内有'
0()u x M <≤.
记此类效用函数为1U ,即
{}
1''0U u u u u =>和在[a,b]上连续有界,且在(a,b)内
这中类型的效用函数仅能反映出财宝与风险的关系,但不能反映出决策人对待风险的态度.因此1U 中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还能够进一步分类.
2. 递增的凹效用函数
这种效用函数是递增的,故设1()u x U ∈,而且是严格凹的,即()u x 在[],a b 上具有二 阶连续有界的导数.记为
[]{
}''''21|,,,0.U u u U u C a b u =∈∈<且在(a,b)内
实际中常用的2U 类函数有
幂函数:[](),,(0,0);c
u x x x a b c a -=-∈>>
对数函数:[]()ln ,,(0,);u x x x a b =∈⊂+∞ 指数函数:(),[,)(0).cx
u x e
x a c -=-∈+∞>
依照风险和效用函数的关系,当',''u u 存在,且'
0u ≠时,定义对待风险态度的局部测度为
'''()
(),()
u x r x u x =-
即()r x 是效用函数()u x 的曲率测度,能够证明:假如()0r x >,则决策人的财产为x 时,他是厌恶风险的.假如()0r x =,则决策人的财产x 时,他是风险中立的.假如()0r x <,则
决策人财产为x 时,他是追求风险的,而且()r x 愈大,他愈厌恶(或追求)风险.
3. 递增的厌恶风险的效用函数
实际中,多数决策人对小额盈亏的态度是随着财宝的积存而变化的,他们的财宝积存 愈多,对小额盈亏所冒风险的厌恶程度愈小.因此,我们假设()r x 是x 的非递增的函数,则能够得到一类效用函数,记为
[]{}'32|,(),,()0,
U u u U r x a b x =∈≤在上连续可微有界,且r
即3U 是2U 的一个子类.
由于当'
()0r x ≤时,()r x 是非递增的。
要使'
()0r x ≤,即
2
''''''
'
2'
()()0,()u u u x r x u x ⎡⎤-⎣⎦=-≤⎡⎤⎣⎦
则'''
'
''2
()0,u u u -≥故'''''
'()
()0.u u x u
-≥因此,3U 类函数存在的必要条件是
'''0,(,),u x a b >∈但不是充分条件.
上面给出了适应于不同情形的效用函数的差不多形式,实际中需要依据具体问题的性质,来选用合适的效用函数,对问题进行研究.
16.3 DVD 在线租赁问题数学模型
16.3.1 问题提出
随着信息时代的到来,电子商务已成为一个重要的商业途径.在线DVD 租赁确实是其中一种典型的经营方式,但在实际的经营过程中依旧存在专门多问题.下面我们从复杂的现实情形中考虑一个典型的情形.
鉴于业务量的考虑,网站有必要采纳会员制度,顾客需缴纳一定数量的月费成为会员. 会员对哪些DVD 有爱好,只要在线提交订单,网站就能赶忙了解他们的需求,并通过快递的方式尽可能满足要求.会员提交的订单内容包括他对哪几张DVD 感爱好,对不同的DVD 的偏爱度,用数字表示.这些DVD 是基于其偏爱程度排序的.网站会依照手头现有的DVD 数量和会员的订单进行分发.
每个会员每个月租赁次数不得超过2次,每次获得3张DVD.会员看完3张DVD 之后,只需要将DVD 放进网站提供的信封里寄回(邮费由网站承担),就能够连续下次租赁.
1、由于DVD 的更新速度专门快,网站必须经常更新现有产品,因此在现有会员中随机抽取1000个会员进行调查,以得知情愿观看不同DVD 的人数(表1.1给出了其中5种DVD 的数据).尽管网站规定每位会员每月只能借两次DVD ,但从历史数据显示,60%的会员每月租赁DVD 两次,而另外的40%只租一次.现在我们假设网站现有10万个会员,并差不多明白会员对DVD 的需求,以及会员每月订DVD 的规律.问题是应该至少预备多少张,
才能保证期望看到该DVD的会员中至少50%在一个月内能够看到?假如要求保证在三个月内至少95%的会员能够看到呢?
表1.1 对1000个会员调查的部分结果
2、尽可能多的满足会员是经营中的一大目标,但每个会员对不同DVD的偏爱度是大相径庭的,尽管他们都对该DVD下了订单,但最后得到该张DVD收到的成效差别专门大,因此还要考虑会员中意度的问题.表1.2列出了网站中20种DVD的现有张数和当前需要处理的100位会员的在线订单.如何对手中已有的DVD进行分配,以使所有会员的中意度和达到最大?
表1.2 现有DVD张数和当前需要处理的会员的在线订单(表格格式示例)
D001-D020表示20种DVD, C0001-C0100表示100个会员,会员的在线订单用数字1,2,…表示,数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的在线订单中.
3、在实际的经营过程中,不可能像刚才讨论的两个问题这么简单,我们不可能将顾客的中意率与他们的中意度割裂开来分开研究,能够说这是两个问题是相互牵制的关系.假设表1.2中DVD现有数量全部为0.作为网站经营治理人员,如何决定每种DVD的购买量,以及如何对这些DVD进行分配,才能使一个月内95%的会员得到他想看的DVD,同时中意度最大呢?只有弄清晰那个问题,我们才能初步的对DVD在线租赁问题有个认识.
16.3.2 问题分析
问题一类似于“物资储备问题(Inventory problem)”,差不多思路是跟踪DVD在一个月(三个月)内的流淌情形,目标是运算出DVD的流转次数,然后再结合中意率要求得出所需预备的DVD数量.
问题二类似于“分配问题”或“指派问题(Assignment problem)”,我们能够对偏爱度进行适当的处理以满足我们的要求.0-1规划是处理该问题的最佳方法,因此如何使用这一方法将是研究问题二的关键.
问题三看似是问题一与问题二的结合(存贮+分配),但实际要复杂得多.它综合考虑一个月内DVD的购买、分配方案,是一个多目标线性规划.从经济效益看,在保证95%以上会员一个月内看到想看的DVD的情形下,期望购买尽量少的DVD,从社会效应看,则要尽可能多地考虑让总的中意度最大.
这时,能够将多目标规划变为单目标规划,以求得一个经济与社会效益的综合最优.由
于问题三牵涉到两次分配,而对会员中意率的明白得又有多种说明,因此目标及约束函数会和问题一、问题二有专门大差别.而问题三的模型又可从当前中意度最大和一段时刻内中意度最大两个角度来考虑.
16.3.3 假设条件
1.对1000名会员的调查足以反映10万名会员关于各种DVD 的需求及喜好;
2.所有会员提交订单的时刻是随机的;
3.一个月的天数为30天;
4.会员中有60%的会员每月租赁DVD 两次,40%的会员每月租赁DVD 一次;
5.会员只有在需要再次租赁DVD 时,才会将上次租赁的DVD 归还;
6.会员临近两次借的DVD 种类可不能重复;
7.每位会员每月至少租赁1次;
8.会员本次提交后没得到该DVD ,则他下次仍要看该DVD ,且偏爱度不变;
9.每类租赁出的DVD 有60%在每月租赁2次的会员中,40%在每月租赁1次的会员中; 10.公司收到订单时不明白此会员在一个月内会借一次或两次. 在实际建模中还会遇到其他问题,比如问题一中能够淡化会员每次借三张的条件,即会员每次借的DVD 数量不固定;问题二中不考虑多次分配的问题;问题三中对顾客中意率的不同明白得.因此,我们将在以下讨论具体问题时再给出.
16.3.4 模型建立与数值求解
参数与变量说明
j
i X :第i 时刻节点上第j 种DVD 的可分配量;
j P :所有会员中情愿观看第j 种DVD 的人的概率; c P :所有会员中每月借2次的人的概率; s P :需要满足的会员比例;
M :会员总数;
n :所考虑的时刻跨度,即月份数; ij b :第i 个会员对第j 种DVD 的偏爱程度; ij a :第i 个会员对第j 种DVD 的中意度;
ij x :分配变量,1ij x 表示第i 个会员得到第j 种DVD ,否则为0; j w :网站第j 种DVD 的现有数量.
其余专门的变量将在后面的讨论中具体说明. 问题一:悲观情形估量 — 一个月
假设DVD1其购买量为1x ,从表1能够认为想看DVD1的有2万人,而会员一个月借
1次或借2次是随机的,这就可能显现极端的情形,即第一次分配时正好所有1类会员都分配到了DVD1,我们把这种情形称为悲观情形.则1x 的一部分第一被会员总数40%的1类会员借走了,而且在该月可不能归还.那么,为了保证至少有50%的会员在一个月内能看到该DVD ,则DVD1总的购买量应满足:
()140%20000x - 40%20000250%20000θ⨯+⨯⨯≥⨯
19000
x ≥
同理,设j p 为情愿看第j 种DVD 的人的概率,j p 可从表1中将情愿看该DVD 的人数除以总人数可获,则5种DVD 的购买量为:
()()
j 40%100000 x - 40%1000002 50%1000001,2,3,4,5j j j
p p p j ⨯+⨯⨯≥⨯=
问题一:悲观情形估量-三个月
从“一月情形”,我们能够推广到“三月情形”.假如140%20000x <⨯,则每次分配都将只能由每月借一次的会员的到DVD ,如此三个月中DVD1的流淌量就仅为13x ,为了保证至少有50%的会员在一个月内能看到该DVD ,那么现在DVD1总的购买量应该满足
11395%20000
6334
x x ≥⨯≥
同理,关于其余4种DVD 的购买量有,
395%1000002,3,4,5
j j
x p j ≥⨯=
为保证三个月内至少95%的会员看到他想看的DVD ,每种DVD 的购买量为:
问题一:均值情形估量
现实中,每天都会有订单提交,也有DVD 归还,而且差不多上服从参数为λ的普哇松分布.考虑平均情形,认为:60%的会员15天归还DVD ,40%的会员一个月归还,即关于每张DVD 有60%的可能15天流通一次,40%的可能30天流淌一次.假设所有会员在每个月的某天(不妨为1号)提交订单,那些2类会员也集中在15号归还并提交下一份订单,则能够发觉上述的简化是普哇松分布的平均情形.因此,在处理时能够不考虑每个会员的具体租赁、归还的时刻,而只考虑每个月两次的分配方案,即1号和15号的分配方案.
同时,在DVD 租赁出去后,关于某种DVD ,是平均的分布在1类会员和2
类会员中,
即在15号,该DVD 将有60%归还.
我们用下图表示租赁情形,每块代表长度为15天的时段,上方的箭头表示该时刻借出的数量,下方表示归还的数量.则初始时刻DVDj 有1j
x 张可用于分配
关于“一月情形”,仅观看上图中的前两段.在分配时,每张DVD 都有60%的可能被分配给一月个借2次的会员,40%的可能分配给每月借1次的.在初始时刻会将所有DVD 借出,因此,即表示网站对DVDj 的购买量,而问题目标则是要求出1j
x 的最小值,以达到效益的最优.
由假设可知,第1个月月中有160%j
x ⨯的DVDj 归还,另外40%仍在会员中,这时网站可将160%j
x ⨯的DVDj 借出.则1j
x 与2j x 有如下关系:
210.6j j x x =⨯
如此就能够运算DVDj 在一个月中的流通量1211.6j j j
x x x +=即一个月内DVD 的流通
量为月初购买量的1.6倍,称那个“1.6”为“一月流通系数”.那么DVD 一个月最小购买量可通过以下公式来运算:
()
11
11min .. 1.650%1000001,2,3,4,5S
j
j j j
j S x s t x p x S Z j ==≥⨯⨯∈=∑,,
由表1得到1000人中情愿观看每种DVD 的概率分别为:
()()12345,,,,0.2,0.1,0.05,0.025,0.01p p p p p =
由于这1000人为10万人的子样本, ()12345,,,,p p p p p 也可表示10万人中情愿观看每种DVD 的概率.则100000j p 表示10万人中情愿观看第j 种DVD 的人.经运算,各种DVD 的最少月初购买量为:
DVDj
j
x
总的最少购买量S=12033
问题一:均值情形估量-三月
该情形需要考虑6个时段,而且各个时段节点互相阻碍.在“一月情形”中差不多明白1
j
x 与 2j
x 之间的关系:
在第3个时刻点,会有3j x 张DVD 归还.观看3j
x 张DVD 的组成,第1个时刻点有40%的DVD 分配给了1类会员,则在第3个时刻点归还,数量为10.4j
x .而关于第2个时刻点中收回的部分DVD 同样有60%的可能分配给2类会员,40%的可能分配给1类会员,因此在第3个时刻点,会有60%的人归还,数量为20.6j
x .则第3个时刻点收回的3j
x 来源于两个部分,分别为第1时刻点借给“一类会员” 的DVD 以及第2个时刻点借给“二类会员”的DVD.
因此有3120.40.6j j j
x x x =+.三个月内6 DVD 租出数如下: 第一次:1j
x 第二次:210.6j j x x = 第三次:3120.40.6j j j x x x =+ 第四次:4230.40.6j j j
x x x =+
第五次:5340.40.6j j j x x x =+ 第六次:()6450.40.61,2,3,4,5j j j
x x x j =+=
由此,能够得出一个通用的递推公式:
()
211
2
0.60.60.43,4,5,6j j j
j j i i i x x x x
x
i --==+=
通过上面的递推公式就能够建立与“一月情形”相似的模型:
()
()
2112
61
0.60.60.43,4,5,695%1000001,2,3,4,5j j
j j j i i i j i j
i j i x x x x x i x p x Z
j --===+=≥⨯⨯∈=∑
经运算,各种DVD 的最少月初购买量为
总的最少购买量S=8147.
由上面的递推公式可得“三月情形”中DVD 的流通量:
()
12345611111110.60.760.6960.72160.711364.491,2,3,4,5j j j j j j
j j j j j j j
x x x x x x x x x x x x x j +++++=+++++≈= 式中“4.49” 为“三月流通系数”.
问题一:理论证明
事实上,不必认为所有人都在1号来借DVD.以DVD1为例,设某种DVD 一个月内被看到1次的概率为0.4,被看到2次的概率为0.6,则其服从分布:
12~0.40.6i ξ⎛⎫
⎪
⎝⎭
为使想看该DVD 的会员中至少50%在一个月内能够看到,即要
1
50%20000n
i
i ξ
=≥⨯∑
成立的概率尽可能大,不妨取:150%2000095%n i i P ξ=⎛⎫
≥⨯≥ ⎪⎝⎭
∑
由因此i ξ独立同分布的,且n 的数量专门大,有中心极限定理知,1
n
i
i ξ
=∑近似服从正态
分布.将其化为标准正态分布即为:
( 1.6)0.95n
i
P ξ⎛⎫
- ⎪≥
≥⎝⎭
∑
查表并求解得:(
2
0.256250n ≥+≈
同理也可推出其他解,由此证明了均值情形下的估量是完全可行的.
问题一:一样情形推广
在上面的基础中,我们把模型推广到范畴更广的现实经济生活中.假设通过问卷调查分析推算出任意客户群体的借阅分布情形,设c p 为2类会员的概率,s p 为需要满足的会员比例,n 为所考虑的时刻跨度,即月份数,M 为会员总数,则可得到下面更一样的带约束的线性规划模型(那个地点人设DVD 种类为5种):
()()()
5
1
2112
21
min ..13,4,,21,2,3,4,5,,,j
i j j j
c j j j i c i c i n
j
i
s c
i j i S x s t
x p x x p x p x i n x
M p p j x S M n Z
=--===⨯=⨯+-⨯=≥⨯⨯=∈∑∑
16.3.5 问题二的模型与求解
问题二是在现有一定数量DVD 的前提下,如何分配以使会员总的中意度最大.这与“分配问题”或“指派问题(Assignment problem )”有专门多相同点.我们能够通过一些变化来使求解“分配问题”的模型能运用于该问题.
我们把问题二中“100个会员对DVD 的需求” 明白得为“需要完成的100项任务”,“20种DVD 数量”明白得为“有m 个人能够承担这些任务”,“会员关于不同DVD 的偏爱度”明白得为“不同人去完成不同工作的效率”,通过类比就能把分配问题的模型运用到问题二中了. 分配问题最常用的方法是0-1型整数规划.在具体使用前,还需要将每个会员对不同DVD 的偏爱度转化为中意度.因为我们的目标是总体中意度最大.
从表1.2中能够看到:会员的在线订单用数字1,2,
表示,数字越小表示会员的偏爱程
度越高,数字0表示对应的DVD 当前不在会员的在线订单中.通过观看我们用一个大于9的固定数值来减偏爱数,把那个差值作为中意度.
问题二:参数定义
1、设矩阵B 为偏爱度矩阵,矩阵中的元素ij b 为表1.2中的偏爱数,表示第i 个会员对
DVDj 的偏爱数.ij b 越小表示会员的中意程度越高,ij b 为1时最高,为0时表示客户没有下
订单.因此就得到了偏爱度矩阵()()100201,2,3,
,100;1,2,3,
,20ij
B b i j ⨯===.
2、设矩阵A 为中意度矩阵,矩阵中的元素ij a 为中意度,表示第i 个会员对第DVDj 的中意度. ij a 可通过如下算法获得:
()1001,2,3,
,100;1,2,3,
,200
ij ij ij ij ij a b b i j a b =-≠⎧==⎨
==⎩
通过矩阵()()100201,2,3,
,100;1,2,3,
,20ij
A a i j ⨯===就能应用0-1规划进行
求解.
3、令ij x 为分配变量,1ij x =表示第i 个会员得到DVDj ;0ij x =表示DVDj 未分配给第i 个会员.由此得到我们要求的分配矩阵为:
()
()100201,2,3,
,100;1,2,3,
20ij X x i j ⨯===
4、令j w 表示DVDj 的现有数量,则有数量矩阵()8,1,22,10,,38W =.
5、令
10020
11
ij
ij i j a
x ==⨯∑∑表示所有会员中意度的总和,我们的目标确实是求出其最大值.
问题二:模型建立
1.因为表1.2中的数字0意义专门,不直截了当与中意度产生关系.0代表该DVD 没有
显现在订单中,即会员不需要看该DVD.从分配费用考虑,幸免把该DVD 分配给会员.依照
ij x 的定义,不妨认为:ij ij x b ≤,则0ij b =时,ij x 也等于0,即幸免了上述情形的发生.
2.由于一次最多只能借3张,那么就有:
()20
1
3
1,2,3,
,100ij
j x
i =≤=∑ ,又DVDj
分配给各会员的数量确信不超过现有数量j w ,因此:
100
1
ij
j i x
w =≤∑.
由以上分析可得问题二的模型:
()()
10020
11
100
120
1
max ..3
1,2,3,,1000;1
1,2,3,
,100;1,2,3,
,20ij ij
i j ij ij
ij
j i ij
j ij Z a x s t
x b x
w x
i x i j =====≤≤≤====∑∑∑∑
用LINGO 数学软件实现对此题0-1规划模型的求解.
问题二:模型改进-约束条件改进
依照上述模型的求解,我们发觉有些会员没有分配到3张DVD ,即他们的需要没能被满足.从网站的社会效益考虑,如此的情形会导致网站客户的流失.因此期望在满足所有会员都能借到3张DVD 的前提下,再通过会员总中意度最大来决定分配方案.这就需要对上面的模型做一些改进.
我们能够将 ()20
1
3
1,2,3,,100ij
j x
i =≤=∑改为
()20
1
3
1,2,3,,100ij
j x
i ===∑,则
得到模型
()()
10020
11
100
120
1
max ..3
1,2,3,,1000;1
1,2,3,
,100;1,2,3,
,20ij ij
i j ij ij
ij
j i ij
j ij Z a x s t
x b x
w x
i x i j =====≤≤=====∑∑∑∑
问题二:模型改进-约束条件改进
以上修改,约束条件加强了,可能导致模型无可行解.事实上通过LINGO 程序也发觉该模型无解.因为约束条件中规定了不能分配给会员不要的DVD ,而会员每次都被分到3张,则网站至少有300张DVD ,而现仅有303张,只比最低限度多3张,则当某DVD 需求较。