第十六章 随机决策分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十六章 随机性决策分析方法
人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用. 所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案. 在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题.为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.
16.1 随机性决策问题的基本概念
16.1.1 主观概率
随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的. 主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.这里仅给出主观概率所服从的基本假设(或称公理系统):
(1)设Ω为一非空集合,其元素可以是某种试验或观察的结果,也可以是自然的状态.将这些元素记作抽象的点ω,因而有{}.ωΩ=
(2)设F 是Ω中的一些子集A 所构成的集合,F 满足下列条件: 1)F Ω∈
2)如果A F ∈,则\A A F =Ω∈;
3)如果可列多个n A F ∈,1,2,
,n =则它们的并集
1
n n A F ∞
=∈.
(3)设()()P A A F ∈是定义在F 上的实值集函数,如果它满足下列条件,就称为F 上的
(主观或客观)概率测度,或简称概率,这些条件是 1)对于每个A F ∈,有0()1;P A ≤≤
2)()1;P Ω=
3)如果可列多个n A F ∈(1,2,
)n =,i j A A ⋂=∅()i j ≠,则
1
1
(
)().n n n n P A P A ∞
∞
===∑
这里称点ω为基本事件,F 中的集A 称为事件,F 是全体事件的集合,()P A 称为事件A 的(主观或客观)概率,三元总体(,,)F P Ω称为(主观或客观)概率空间.
设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4]
.
16.1.2 效用函数
在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.
设决策人在选择某一行动时,决策问题可能的n 个后果为12,,
,;n C C C 后果i C 可能发
生的概率分别是(1,2,
,),i p i n =且1
1.n
i i p ==∑用P 表示所有后果的概率分布,并记
1122(,;,;;,)n n P p C p C p C =则称P 为展望.所有展望构成的集合记为P ,可以验证P 关
于凸线性组合是封闭的,即如果12,,P P P ∈而且01,λ≤≤则有
12(1)P P P λλ+-∈.
对于任意两个展望12,P P P ∈,都存在一定的优先关系,即对于决策人可以认为1P 优于2P ,
或1P 与2P 无差异,或1P 不优于2P 三种情况,将这三种关系分别记为1
21
2,P P P P 和
21.P P .这种优先关系反映了决策人对各种后果的偏好程度.
定义16.1 设()u P 是定义在展望P 上的实值函数,且满足 (1)它和在P 上的优先关系
一致,即如果对于所有
12,P P P ∈,有1
2,P P 当且仅当12()()u P u P ≥;
(2)它在P 上是线性的,即如果12,P P P ∈,而且01,λ≤≤则
1212((1))()(1)(),u P P u P u P λλλλ+-=+-
那么称()u P 是定义在展望P 上的效用函数.
如果1122(,;,;
;,)n n P p C p C p C P =∈,则()u P 就是表示以概率i p 选择
(1,2,
,)i C i n =的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其
中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.
定义16.2 设X 为所有确定事件的后果x 的集合,()u x 是定义在X 上的实值函数,如果对于任意的12,x x X ∈有12()()u x u x ≥,当且仅当12.x x ,则称()u x 是定义在X 上的序数效用函数. 基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的. 正线性变换:()()(0)u P u P αβα=+>.
保序变换:()(())u x f u x =,对任意,x X f ∈为严格的单调增加函数.
16.2 效用函数理论
16.2.1 效用与风险的关系
实际中很多的决策问题都涉及经济效益,对于这类问题,在后果不确定的情况下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型.
假设决策人面对一种风险的情况有1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.如果决策人认为这和不冒任何风险的另一行为盈利a 元等价,则对待风险的态度是中立型的.这三种不同的态度可以反映在效用函数上就是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.
图16-1 三种不同的效用函数曲线
由图16-1(a
)是风险厌恶型的效用函数,即有
[]12
3121
()()(
)()22x x u x u x
u x u +=
+<;
由图16-1(
b )是风险中立型的效用函数,即有
[]123121
()()()()2
2x x u
x u x
u x
u +
=
+=;
由图16-1(c )是风险喜好型的效用函数,即有
[]123121
()()()()22x x u x u x u x u +=
+>;
实际中,很多的情况效用函数的曲线呈S 型,即在后果的X 围内,决策人对待风险的
态度往往会从厌恶风险改变为喜好风险.如图16-2.
图16-2(a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b )反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.
16.2.2 损失函数与风险函数
有的时候不要效用函数,而是用损失函数来做决策分析.记损失函数为(,)l x a ,它表时示一个决策问题当状态为x ,决策人的行动为a 时所产生的后果使决策人所受的损失.损失函数可以为正,也可以为负,它反映决策人获得的利益,后果效用越大,则损失越小.由此可以用效用函数来定义损失函数,即令
(,)(,)l x a u x a =-
实际中,在有些问题上为了使损失函数总是为非负的,也可以定义损失函数为
(,)supsup (,)(,).x X a A
l x a u x a u x a ∈∈=-
在效用理论中,我们说明了期望效用能够合理的表示在风险情况下决策人的偏好,因此,期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.
16.2.3 随机函数与效用函数
随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情况下制定决策的方法,称为随机优势法.
假设问题的效用函数为()u x ,其自变量x 表示财富(为一随机变量)。
实际中的问题总是有[],x a b ∈,且()u x 在[],a b 上有界,对于这种效用函数可以分为以下几类:
1. 递增效用函数
实际中,一般要求财富的效用函数()u x 是[],x a b ∈的非递减函数,即意味着当财富增 加时,它的效用总不会减少.通常是随着x 的增加()u x 是严格递增的,而且是有界的.为此,我们假设:
(1) 对于任意[]12,,x x a b ∈,当12x x <时有12()()u x u x <; (2) ()u x 在[],a b 上连续,且有界,即存在0M >使()u x M ≤; (3) ()u x 在[],a b 上一次可微,且在(,)a b 内有'
0()u x M <≤.
记此类效用函数为1U ,即
{}1''0U u u u u =>和在[a,b]上连续有界,且在(a,b)内
这中类型的效用函数仅能反映出财富与风险的关系,但不能反映出决策人对待风险的态度.因此1U 中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还可以进一步分类.
2. 递增的凹效用函数
这种效用函数是递增的,故设1()u x U ∈,而且是严格凹的,即()u x 在[],a b 上具有二 阶连续有界的导数.记为
[]{}''''21|,,,0.U u u U u C a b u =∈∈<且在(a,b)内
实际中常用的2U 类函数有
幂函数:[](),,(0,0);c
u x x x a b c a -=-∈>>
对数函数:[]()ln ,,(0,);u x x x a b =∈⊂+∞ 指数函数:(),[,)(0).cx
u x e
x a c -=-∈+∞>
根据风险和效用函数的关系,当',''u u 存在,且'
0u ≠时,定义对待风险态度的局部测度为
'''()
(),()
u x r x u x =-
即()r x 是效用函数()u x 的曲率测度,可以证明:如果()0r x >,则决策人的财产为x 时,他是厌恶风险的.如果()0r x =,则决策人的财产x 时,他是风险中立的.如果()0r x <,则
决策人财产为x 时,他是追求风险的,而且()r x 愈大,他愈厌恶(或追求)风险.
3. 递增的厌恶风险的效用函数
实际中,多数决策人对小额盈亏的态度是随着财富的积累而变化的,他们的财富积累 愈多,对小额盈亏所冒风险的厌恶程度愈小.因此,我们假设()r x 是x 的非递增的函数,则可以得到一类效用函数,记为
[]{}'32|,(),,()0,
U u u U r x a b x =∈≤在上连续可微有界,且r
即3U 是2U 的一个子类.
由于当'
()0r x ≤时,()r x 是非递增的。
要使'
()0r x ≤,即
2
''''''
'
2'
()()0,()u u u x r x u x ⎡⎤-⎣⎦=-≤⎡⎤⎣⎦
则'''
'
''2
()0,u u u -≥故'''''
'()
()0.u u x u
-≥因此,3U 类函数存在的必要条件是
'''0,(,),u x a b >∈但不是充分条件.
上面给出了适应于不同情况的效用函数的基本形式,实际中需要依据具体问题的性质,来选用合适的效用函数,对问题进行研究.
16.3 DVD 在线租赁问题数学模型
16.3.1 问题提出
随着信息时代的到来,电子商务已成为一个重要的商业途径.在线DVD 租赁就是其中一种典型的经营方式,但在实际的经营过程中还是存在很多问题.下面我们从复杂的现实情况中考虑一个典型的情景.
鉴于业务量的考虑,有必要采用会员制度,顾客需缴纳一定数量的月费成为会员.
会员对哪些DVD 有兴趣,只要在线提交订单,就能立即了解他们的需求,并通过快递的方式尽可能满足要求.会员提交的订单内容包括他对哪几XDVD 感兴趣,对不同的DVD 的偏爱度,用数字表示.这些DVD 是基于其偏爱程度排序的.会根据手头现有的DVD 数量和会员的订单进行分发.
每个会员每个月租赁次数不得超过2次,每次获得3XDVD.会员看完3XDVD 之后,只需要将DVD 放进提供的信封里寄回(邮费由承担),就可以继续下次租赁.
1、由于DVD 的更新速度很快,必须时常更新现有产品,因此在现有会员中随机抽取1000个会员进行调查,以得知愿意观看不同DVD 的人数(表1.1给出了其中5种DVD 的数据).虽然规定每位会员每月只能借两次DVD ,但从历史数据显示,60%的会员每月租赁DVD 两次,而另外的40%只租一次.现在我们假设现有10万个会员,并已经知道会员对DVD 的需求,以及会员每月订DVD 的规律.问题是应该至少准备多少X ,才能保证希望看到该
DVD的会员中至少50%在一个月内能够看到?如果要求保证在三个月内至少95%的会员能够看到呢?
表1.1 对1000个会员调查的部分结果
2、尽可能多的满足会员是经营中的一大目标,但每个会员对不同DVD的偏爱度是大相径庭的,虽然他们都对该DVD下了订单,但最后得到该XDVD收到的效果差别很大,所以还要考虑会员满意度的问题.表1.2列出了中20种DVD的现有X数和当前需要处理的100位会员的在线订单.如何对手中已有的DVD进行分配,以使所有会员的满意度和达到最大?
表1.2 现有DVDX数和当前需要处理的会员的在线订单(表格格式示例)
D001-D020表示20种DVD, C0001-C0100表示100个会员,会员的在线订单用数字1,2,…表示,数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的在线订单中.
3、在实际的经营过程中,不可能像刚才讨论的两个问题这么简单,我们不可能将顾客的满意率与他们的满意度割裂开来分开研究,可以说这是两个问题是相互牵制的关系.假设表1.2中DVD现有数量全部为0.作为经营管理人员,如何决定每种DVD的购买量,以及如何对这些DVD进行分配,才能使一个月内95%的会员得到他想看的DVD,并且满意度最大呢?只有弄清楚这个问题,我们才能初步的对DVD在线租赁问题有个认识.
16.3.2 问题分析
问题一类似于“货物存储问题(Inventory problem)”,基本思路是跟踪DVD在一个月(三个月)内的流动情况,目标是计算出DVD的流转次数,然后再结合满意率要求得出所需准备的DVD数量.
问题二类似于“分配问题”或“指派问题(Assignment problem)”,我们可以对偏爱度进行适当的处理以满足我们的要求.0-1规划是处理该问题的最佳方法,因此如何使用这一方法将是研究问题二的关键.
问题三看似是问题一与问题二的结合(存贮+分配),但实际要复杂得多.它综合考虑一个月内DVD的购买、分配方案,是一个多目标线性规划.从经济效益看,在保证95%以上会员一个月内看到想看的DVD的情况下,希望购买尽量少的DVD,从社会效应看,则要尽可能多地考虑让总的满意度最大.
这时,可以将多目标规划变为单目标规划,以求得一个经济与社会效益的综合最优.由
于问题三牵涉到两次分配,而对会员满意率的理解又有多种解释,因此目标及约束函数会和问题一、问题二有很大差别.而问题三的模型又可从当前满意度最大和一段时间内满意度最大两个角度来考虑.
16.3.3假设条件
1.对1000名会员的调查足以反映10万名会员对于各种DVD 的需求及喜好;
2.所有会员提交订单的时间是随机的;
3.一个月的天数为30天;
4.会员中有60%的会员每月租赁DVD 两次,40%的会员每月租赁DVD 一次;
5.会员只有在需要再次租赁DVD 时,才会将上次租赁的DVD 归还;
6.会员临近两次借的DVD 种类不会重复;
7.每位会员每月至少租赁1次;
8.会员本次提交后没得到该DVD ,则他下次仍要看该DVD ,且偏爱度不变;
9.每类租赁出的DVD 有60%在每月租赁2次的会员中,40%在每月租赁1次的会员中; 10.公司收到订单时不知道此会员在一个月内会借一次或两次.
在实际建模中还会遇到其他问题,比如问题一中可以淡化会员每次借三X 的条件,即会员每次借的DVD 数量不固定;问题二中不考虑多次分配的问题;问题三中对顾客满意率的不同理解.因此,我们将在以下讨论具体问题时再给出.
16.3.4 模型建立与数值求解
参数与变量说明
j i X :第i 时间节点上第j 种DVD 的可分配量;
j P :所有会员中愿意观看第j 种DVD 的人的概率;
c P :所有会员中每月借2次的人的概率; s P :需要满足的会员比例;
M :会员总数;
n :所考虑的时间跨度,即月份数;
ij b :第i 个会员对第j 种DVD 的偏爱程度; ij a :第i 个会员对第j 种DVD 的满意度;
ij x :分配变量,1ij x 表示第i 个会员得到第j 种DVD ,否则为0; j w :第j 种DVD 的现有数量.
其余特殊的变量将在后面的讨论中具体说明. 问题一:悲观情况估计 —一个月
假设DVD1其购买量为1x ,从表1可以认为想看DVD1的有2万人,而会员一个月借
1次或借2次是随机的,这就可能出现极端的情况,即第一次分配时正好所有1类会员都分配到了DVD1,我们把这种情况称为悲观情况.则1x 的一部分首先被会员总数40%的1类会员借走了,而且在该月不会归还.那么,为了保证至少有50%的会员在一个月内能看到该DVD ,则DVD1总的购买量应满足:
()140%20000x - 40%20000250%20000θ⨯+⨯⨯≥⨯
19000
x ≥
同理,设j p 为愿意看第j 种DVD 的人的概率,j p 可从表1中将愿意看该DVD 的人数除以总人数可获,则5种DVD 的购买量为:
()()
j 40%100000 x - 40%1000002 50%1000001,2,3,4,5j j j
p p p j ⨯+⨯⨯≥⨯=
问题一:悲观情况估计-三个月
从“一月情况”,我们可以推广到“三月情况”.如果140%20000x <⨯,则每次分配都将只能由每月借一次的会员的到DVD ,这样三个月中DVD1的流动量就仅为13x ,为了保证至少有50%的会员在一个月内能看到该DVD ,那么此时DVD1总的购买量应该满足
11395%200006334
x x ≥⨯≥
同理,对于其余4种DVD 的购买量有,
395%1000002,3,4,5
j j
x p j ≥⨯=
为保证三个月内至少95%的会员看到他想看的DVD ,每种DVD 的购买量为:
问题一:均值情况估计
现实中,每天都会有订单提交,也有DVD 归还,而且都是服从参数为λ的普哇松分布.考虑平均情况,认为:60%的会员15天归还DVD ,40%的会员一个月归还,即对于每XDVD 有60%的可能15天流通一次,40%的可能30天流动一次.假设所有会员在每个月的某天(不妨为1号)提交订单,那些2类会员也集中在15号归还并提交下一份订单,则可以发现上述的简化是普哇松分布的平均情况.因此,在处理时可以不考虑每个会员的具体租赁、归还的时间,而只考虑每个月两次的分配方案,即1号和15号的分配方案.
同时,在DVD 租赁出去后,对于某种DVD ,是均匀的分布在1类会员和2类会员中,
即在15号,该DVD 将有60%归还.
我们用下图表示租赁情况,每块代表长度为15天的时段,上方的箭头表示该时刻借出的数量,下方表示归还的数量.则初始时刻DVDj 有1j
x X 可用于分配
对于“一月情况”,仅观察上图中的前两段.在分配时,每XDVD 都有60%的可能被分配给一月个借2次的会员,40%的可能分配给每月借1次的.在初始时刻会将所有DVD 借出,因此,即表示对DVDj 的购买量,而问题目标则是要求出1j
x 的最小值,以达到效益的最优. 由假设可知,第1个月月中有160%j
x ⨯的DVDj 归还,另外40%仍在会员中,这时可将160%j
x ⨯的DVDj 借出.则1j
x 与2j
x 有如下关系:
210.6j j x x =⨯
这样就可以计算DVDj 在一个月中的流通量1211.6j j j
x x x +=即一个月内DVD 的流通
量为月初购买量的1.6倍,称这个“1.6”为“一月流通系数”.那么DVD 一个月最小购买量可通过以下公式来计算:
()
11
11min .. 1.650%1000001,2,3,4,5S
j
j j j
j S x s t x p x S Z j ==≥⨯⨯∈=∑,,
由表1得到1000人中愿意观看每种DVD 的概率分别为:
()()12345,,,,0.2,0.1,0.05,0.025,0.01p p p p p =
由于这1000人为10万人的子样本,()12345,,,,p p p p p 也可表示10万人中愿意观看每种DVD 的概率.则100000j p 表示10万人中愿意观看第j 种DVD 的人.经计算,各种DVD
DVDj
j
x
总的最少购买量S=12033
问题一:均值情况估计-三月
该情况需要考虑6个时段,而且各个时段节点互相影响.在“一月情况”中已经知道1j
x 与
2j x 之间的关系:
在第3个时间点,会有3j x XDVD 归还.观察3j
x XDVD 的组成,第1个时间点有40%的DVD 分配给了1类会员,则在第3个时间点归还,数量为10.4j
x .而对于第2个时间点中收回的部分DVD 同样有60%的可能分配给2类会员,40%的可能分配给1类会员,因此在第3个时间点,会有60%的人归还,数量为20.6j x .则第3个时间点收回的3j
x 来源于两个部分,分别为第1时间点借给“一类会员” 的DVD 以及第2个时间点借给“二类会员”的DVD.所以
有3120.40.6j j j
x x x =+.三个月内6 DVD 租出数如下: 第一次:1j x 第二次:210.6j j
x x =
第三次:3120.40.6j j j x x x =+ 第四次:4230.40.6j j j
x x x =+
第五次:5340.40.6j j j x x x =+ 第六次:()6450.40.61,2,3,4,5j j j
x x x j =+=
由此,可以得出一个通用的递推公式:
()
211
2
0.60.60.43,4,5,6j j j
j j i i i x x x x
x
i --==+=
通过上面的递推公式就可以建立与“一月情况”相似的模型:
()
()
2112
6
1
0.60.60.43,4,5,695%1000001,2,3,4,5j j
j j j i i i j
i
j
i j i x x x x x i x
p x Z
j --===+=≥⨯⨯∈=∑
经计算,各种DVD 的最少月初购买量为
由上面的递推公式可得“三月情况”中DVD 的流通量:
()
12345611111110.60.760.6960.72160.711364.491,2,3,4,5j j j j j j
j j j j j j j
x x x x x x x x x x x x x j +++++=+++++≈=
式中“4.49” 为“三月流通系数”.
问题一:理论证明
事实上,不必认为所有人都在1号来借DVD.以DVD1为例,设某种DVD 一个月内被看到1次的概率为0.4,被看到2次的概率为0.6,则其服从分布:
12~0.40.6i ξ⎛⎫
⎪
⎝⎭
为使想看该DVD 的会员中至少50%在一个月内能够看到,即要
1
50%20000n
i
i ξ
=≥⨯∑
成立的概率尽可能大,不妨取:150%2000095%n i i P ξ=⎛⎫
≥⨯≥ ⎪⎝⎭
∑
由于i ξ是独立同分布的,且n 的数量很大,有中心极限定理知,1
n
i
i ξ
=∑近似服从正态分
布.将其化为标准正态分布即为:
( 1.6)0.95n
i
P ξ⎛⎫
- ⎪≥
≥⎝⎭
∑
查表并求解得:(
2
0.256250n ≥+≈
同理也可推出其他解,由此证明了均值情况下的估计是完全可行的. 问题一:一般情况推广
在上面的基础中,我们把模型推广到X 围更广的现实经济生活中.假设通过问卷调查分析推算出任意客户群体的借阅分布情况,设c p 为2类会员的概率,s p 为需要满足的会员比例,n 为所考虑的时间跨度,即月份数,M 为会员总数,则可得到下面更一般的带约束的线性规划模型(这里人设DVD 种类为5种):
()()()
5
1
2112
21
min ..13,4,,21,2,3,4,5,,,j
i j j j
c j j j i c i c i n
j
i
s c
i j i S x s t
x p x x p x p x i n x
M p p j x S M n Z
=--===⨯=⨯+-⨯=≥⨯⨯=∈∑∑
16.3.5
问题二的模型与求解
问题二是在现有一定数量DVD 的前提下,如何分配以使会员总的满意度最大.这与“分配
问题”或“指派问题(Assignment problem )”有很多相同点.我们可以通过一些变化来使求解“分配问题”的模型能运用于该问题.
我们把问题二中“100个会员对DVD 的需求” 理解为“需要完成的100项任务”,“20种DVD 数量”理解为“有m 个人可以承担这些任务”,“会员对于不同DVD 的偏爱度”理解为“不同人去完成不同工作的效率”,通过类比就能把分配问题的模型运用到问题二中了.
分配问题最常用的方法是0-1型整数规划.在具体使用前,还需要将每个会员对不同DVD 的偏爱度转化为满意度.因为我们的目标是总体满意度最大.
从表1.2中可以看到:会员的在线订单用数字1,2,
表示,数字越小表示会员的偏爱程
度越高,数字0表示对应的DVD 当前不在会员的在线订单中.通过观察我们用一个大于9的固定数值来减偏爱数,把这个差值作为满意度.
问题二:参数定义
1、设矩阵B 为偏爱度矩阵,矩阵中的元素ij b 为表1.2中的偏爱数,表示第i 个会员对
DVDj 的偏爱数.ij b 越小表示会员的满意程度越高,ij b 为1时最高,为0时表示客户没有下
订单.于是就得到了偏爱度矩阵()()100201,2,3,
,100;1,2,3,
,20ij
B b i j ⨯===.
2、设矩阵A 为满意度矩阵,矩阵中的元素ij a 为满意度,表示第i 个会员对第DVDj 的满意度.ij a 可通过如下算法获得:
()1001,2,3,
,100;1,2,3,
,200
ij ij ij ij ij a b b i j a b =-≠⎧==⎨
==⎩
通过矩阵()()100201,2,3,
,100;1,2,3,
,20ij
A a i j ⨯===就能应用0-1规划进行
求解.
3、令ij x 为分配变量,1ij x =表示第i 个会员得到DVDj ;0ij x =表示DVDj 未分配给第i 个会员.由此得到我们要求的分配矩阵为:
()
()100201,2,3,
,100;1,2,3,
20ij X x i j ⨯===
4、令j w 表示DVDj 的现有数量,则有数量矩阵()8,1,22,10,,38W =.
5、令
10020
11
ij
ij i j a
x ==⨯∑∑表示所有会员满意度的总和,我们的目标就是求出其最大值.
问题二:模型建立
1.因为表1.2中的数字0意义特殊,不直接与满意度产生关系.0代表该DVD 没有出现在订单中,即会员不需要看该DVD.从分配费用考虑,避免把该DVD 分配给会员.根据 ij x 的定义,不妨认为:ij ij x b ≤,则0ij b =时,ij x 也等于0,即避免了上述情况的发生.
2.由于一次最多只能借3X ,那么就有:
()20
1
3
1,2,3,
,100ij
j x
i =≤=∑ ,又DVDj 分
配给各会员的数量肯定不超过现有数量j w ,所以:
100
1
ij
j i x
w =≤∑.
由以上分析可得问题二的模型:
()()
10020
11
100
120
1
max ..3
1,2,3,,1000;1
1,2,3,
,100;1,2,3,
,20ij ij
i j ij ij
ij
j i ij
j ij Z a x s t
x b x
w x
i x i j =====≤≤≤====∑∑∑∑
用LINGO 数学软件实现对此题0-1规划模型的求解.
问题二:模型改进-约束条件改进
根据上述模型的求解,我们发现有些会员没有分配到3XDVD ,即他们的需要没能被满足.从的社会效益考虑,这样的情况会导致客户的流失.所以希望在满足所有会员都能借到3XDVD 的前提下,再通过会员总满意度最大来决定分配方案.这就需要对上面的模型做一些改进.
我们可以将 ()20
1
3
1,2,3,
,100ij
j x
i =≤=∑改为()20
1
3
1,2,3,,100ij j x i ===∑,则得
到模型
()()
10020
11
100
120
1
max ..3
1,2,3,,1000;1
1,2,3,
,100;1,2,3,
,20ij ij
i j ij ij
ij
j i ij
j ij Z a x s t
x b x
w x
i x i j =====≤≤=====∑∑∑∑
问题二:模型改进-约束条件改进
以上修改,约束条件加强了,可能导致模型无可行解.事实上通过LINGO 程序也发现该模型无解.因为约束条件中规定了不能分配给会员不要的DVD ,而会员每次都被分到3X ,则至少有300XDVD ,而现仅有303X ,只比最低限度多3X ,则当某DVD 需求较大时就会供不应求.所以要放宽条件1,才能找到最优解.。