第十六章随机决策分析方法
十六章决策分析
23
三、决策树法 前面的决策问题大多是用决策表来表示和分析问
题的,它的优点是简单易行。但是,对于一些较为复 杂的决策问题,如多级决策问题,只用表格是难以表 达和分析的。
决策树法是另一种表示和分析决策问题的方法, 它具有直观形象、思路清晰的优点,但其原理同样是 使用期望值准则进行决策。
自然状态 行动方案
S1 (大批量生产) S2 (中批量生产) S3 (小批量生产)
自然状态最大值
N1
(需求量大) 30
20
10
30
N2
(需求量小) -6
-2
5
5
17
用aij’ 表示后悔值,构造后悔值矩阵:
自然状态
行动方案
N1
N2
(需求量大) (需求量小)
max
1j2
aij'
S1(大批量生产) 0 S2(中批量生产) 10 S3(小批量生产) 20
自然状态
N1
N2
行动方案
(需求量大) (需求量小)
S1(大批量生产)
30
-6
S2(中批量生产)
20
-2
S3(小批量生产)
10
5
8
一、最大最小准则(悲观准则, Wald, 1951)
决策者从最不利的角度去考虑问题,先选出每个方 案在不同自然状态下的最小收益值(最保险),然后从这 些最小收益值中取最大的,从而确定行动方案。
第十六章 决策分析
§1. 不确定情况下的决策 §2. 风险型情况下的决策 §3. 效用理论在决策中的应用 §4. 层次分析法
1
“决策” 一词来源于英语 Decision making,直译为“做出决 定”。所谓决策,就是为了实现预定 的目标在若干可供选择的方案中,选 出一个最佳行动方案的过程,它是一 门帮助人们科学地决策的理论。
决策专题一 随机决策方法
管理预测与决策
28
(2)多阶段决策
很多实际决策问题,需要决策者进行多次决策, 这些决策按先后次序分为几个阶段,后阶段的决 策内容依赖于前阶段的决策结果及前一阶段决策 后所出现的状态。 在做前一次决策时,也必须考虑到后一阶段的决 策情况,这类问题称之为多阶段决策问题。
管理预测与决策
29
某一化工原料厂,由于某项工艺不甚好,产品成本高。在价 格中等水平时无利可图,在价格低落时要亏本,只有在价格 高时才赢利,且赢利也不多。 现企业考虑进行技术革新,取得新工艺的途径有两种,一是 自行研究,成功的可能是0.6,二是购买专利,估计购买谈 判成功的可能性是0.8。 不论是研究成功还是谈判成功,生产规模有两种考虑方案, 一是产量不变,二是产量增加。若研究失败或者谈判失败, 则仍然采用原工艺进行生产,生产保持不变。 根据市场预测,今后五年内这两种产品跌价的可能性是0.1, 保持中等水平的可能性是0.5,涨价的可能性是0.4。现在企 业需要考虑:是否购买专利,是否自行研究。
管理预测与决策
26
好0.5
方案A1 -2000
Ⅰ
5000 2500 1500 8000 0 -2500
1
一般0.3 差0.2 好0.5
方案A2 -1500
2
一般0.3 差0.2
风险投资问题的决策树
管理预测与决策
27
计算各状态点的收益值。 状态点1:5000×0.5+2500×0.3+1500×0.2=3550(万元) 状态点2:8000×0.5+0×0.3+(-2500)×0.2=3500(万元) 计算各方案的收益期望值。 方案A1:3550-2000=1550(万元) 方案A2:3500-1500=2000(万元) 依据最大收益期望值准则,方案A2收益期望值较大,为最 优方案,也就是扶持小企业为最优决策方案。
决策分析方法
A2 250 20 190 300 300
A3 450 170
0
0 450
15
等可能性准则
决策者不能肯定那种状态会出现,采取一视同仁 的态度,认为出现的可能性相等,有n个状态, 其出现的概率均为1/n,计算各方案的期望最大 收益值,从中选取最大的。
例如:
S1
S2
S3
S4
ER
A1 200 125 45 -25 86.25
38
为此,建议增加一道“提纯”工序,通过提纯,能使全部原料处于S1状 态,从而降低了次品率。但每批原料的提纯费用为3400元,经估算,不 同纯度状态下的益损值如下表所示。如在生产前,先将化工原料检验一 下,通过检验可以掌握每批原料的纯度状态,这样可以对不同纯度的原 料采用不同策略,即提纯或不提纯,从而使益损期望值最大。
评定不确定因素:估计未来环境中各种状态出现 的概率
评价方案:按估计的后果和概率计算备选方案的 效益(效用)指标,按照效益(效用)最大者为 最优方案
6
决策分析的框架
灵敏度分析:由于后果值和概率的主观性和不确 定性,确定决策模型中参数的变化范围
收集信息:对灵敏度高的参数需收集更多信息进 行研究,但考虑信息价值问题
28
益损值表
状态
价跌
概率
0.1
按原工艺生产的益损值 -100
引进A1 产量不变 -250 (成功0.8) 产量增加 -400
自行设计A2 产量不变 -250 (成功0.6) 产量增加 -350
价平 价涨 0.5 0.4 0 125 80 200 100 300 0 250 -250 650
29
(1)绘制决策树。
例如:
第十六章不确定型决策方法16不确定型决策方法-
回总目录 回本章目录
不确定型决策的方法一般有:
• “好中求好”的决策方法; • “坏中求好”的决策方法;
• 系数决策方法;
• “最小的最大后悔值”决策方法; • 等概率决策方法。
回总目录 回本章目录
f(d 2 ) m a x ( 1 5 0 ,2 0 ) 1 5 0 f(d 3 ) m a x ( 1 0 0 ,6 0 ) 1 0 0 在各最大收益中再选取最大,最大值为200,对 应的为第一方案,因此“好中求好”决策方法结果 是第一方案为最优方案。
回总目录 回本章目录
(2)按“坏中求好”决策方法决策。 首先求每一方案在各自然状态下的最小收益值:
f ( d * ) m a x [ f ( d 1 ) , f ( d 2 ) ,, f ( d m ) ]
的方案 d * 就是“坏中求好”决策的最优方案。
回总目录 回本章目录
若决策矩阵为损失矩阵,则应采取最大最
小的方法,这时 f 大损失值,即
( d i )表示取行动方案
d
i
时的最
f ( d i ) m a x { L i 1 , L i 2 ,, L i n } ( i 1 , 2 ,, m ) 则满足
f( d 1 ) m in ( 2 0 0 , 2 0 ) 2 0
f(d 2 ) m in ( 1 5 0 ,2 0 ) 2 0 f(d 3 ) m in ( 1 0 0 ,6 0 ) 6 0 在各最小收益中选取最大,最大值为60,对应的 为第三方案,因此“坏中求好”决策方法结果是第 三方案为最优方案。
随机决策方法及其应用
、
其中:B 。 为行动 a的益损期望值 , () 自然状态 () 尼为
是 k的概率 。 可 以看 出 ,采用 期望 值最 大原 则进 行 决策并 不是 百分 之百 正确 的 ,若先 验信 息判 断错误 ,可能 会丧 失获得 最 大利润 的机 会甚 至亏 本 ,因此又 被称 为风 险决策 方法 。 显 然用 期望 值最 大原 则进 行决 策 的准确 度 主要取 决于 先验 信息 的准 确度 ,但是 ,在 决策 前 给定 准确 的先验 分 布是一 件很 困难 的事 ,因此 ,决 策人 员都 愿意 花 费一定 的时 间和 资金 获得 有关 自然状 态 的新 的信息 ,以便改 进对 状态 概率 分布 的估 计 , 提高分 析精 度 ,减少 决策 的风 险 。但此 时需 要考 虑 的问题 是 : 这 中行 为是 否值得 。也就 是说 通过试 验取 得新 信 息后 决策 可能 增 加 的效 益能 否抵 消试验 所需 成本 , 就有 必要 事先进 行分 析 , 这 我 们把 它称为 后验 预分析 。 当研 究对 象不 是一 个单 一体 ,而 是 南多个 个体 组成 的总 体
- 一 型 专 研 _ 5啊 业 穷
随机决策 方法及其 应用
孔翠 平 杨 洁 孟 君 1徐 州空军学院 2 工程兵指挥 学院 /. .
[ 要 ]本文介绍 了随机 性决策 的定义和进行随机决策的方法 ,并利用期望值最大原则画 出一个 序贯决策实际问题 的决策树 ,最 摘
终由决策树技术给 出最优决策。 [关键词 ]科学决策 决策树 序 贯决策
解:①假设a为买该箱元件;口 为不买; l . 码 詹 0 2 3
表示优质品率分别为 O1 .,0 .,0 5 . 9的兰种 自然状态 ;S. 表示
16_随机型决策分析方法
在对实际问题进行决策时,可以采用各种不同方法分 别进行计算、比较,然后通过综合分析,选择最佳的决策 方案,这样,往往能够减少决策的风险性。
一、最大可能法
• 最大可能法: 在解决风险型决策问题时,选择一个概率最大的自然状态,
E
(
B2
)
E
(
B3
)
E(B4 )
AP
10
25
12
11.8
12.6 21 17 13
18 17 23 17
20 12 17 19
22
8
0.2 0.4
11 21
0.2 0.1
16.92
16.7
18.3
16.48
由于E(B3)=max{E(Bi)}=183(千元/hm2),所 以该农场应该选择种植大豆为最佳决策方案。
• 随机型决策问题——指决策者所面临的各种自然状态将是 随机出现的。
• 随机型决策问题,必须具备以下几个条件: ① 存在着决策者希望达到的明确目标; ② 存在着不依决策者的主观意志为转移的两个以上的自 然状态; ③ 存在着两个以上的可供选择的行动方案; ④ 不同行动方案在不同自然状态下的益损值可以计算出 来。
旱年 0.2 12.6 21 17 13
平年 0.4 18 17 23 17
湿润年 0.2 20 12 17 19
极湿年 0.1 22 8 11 21
解:由表可知,"极旱年"、"旱年"、"平年"、"湿润年"、"极湿 年"5种自然状态发生的概率分别为0.1、0.2、0.4、0.2、0.1, 显然,"平年"状态的概率最大。按照最大可能法,可以将"平 年"状态的发生看成是必然事件。而在"平年"状态下,各行动 方案的收益分别是:水稻为18千元/hm2,小麦为17千元/hm2, 大豆为23千元/hm2,燕麦为17千元/hm2,显然,大豆的收益 最大。所以,该农场应该选择种植大豆为最佳决策方案。
决策分析方法
决策分析方法在现代社会中,决策是每个个体或组织必不可少的活动。
然而,随着信息的快速增长和复杂性的不断提高,做出正确的决策变得越来越困难。
因此,决策分析方法成为解决问题和制定决策的重要工具。
本文将介绍几种常用的决策分析方法。
一、期望效用理论期望效用理论是以价值理论为基础的一种决策分析方法。
其基本思想是在所面临的各种不确定性情况下,通过评估各种可能结果的价值和概率,计算期望效用值来进行决策。
这种方法可以帮助决策者在风险和收益之间做出权衡,选择最具效用的决策。
二、成本效益分析成本效益分析是一种将决策问题从经济角度进行评估的方法。
它通过比较不同决策方案的成本与效益,来评估方案的优劣。
在进行成本效益分析时,首先需要确定不同决策方案的成本和效益,并进行定量化和货币化的测算,最后通过计算成本效益比或成本效益比率来选择最优方案。
三、灰色关联度分析灰色关联度分析是一种通过模拟预测和观测数据之间的关联度来进行决策的方法。
它适用于数据不完整、信息不确定或存在相关性的问题。
灰色关联度分析通过建立关联度序列来评估各因素对目标的影响程度,从而帮助决策者确定最佳方案。
四、层次分析法层次分析法是一种将问题分解成多个层次并进行多因素分析的方法。
它通过构建层次结构模型,将问题分解为几个层次的准则和子准则,并进行定量化的比较和判断。
通过对各层次准则的重要性进行权重分配,最终得出最佳决策。
五、决策树分析决策树分析是一种以树状结构来表示决策问题的方法。
它通过将问题分解为一系列的决策和事件节点,根据各节点的概率和效用值来进行分析和决策。
决策树分析可以帮助决策者清晰地了解决策过程和结果,从而做出最优决策。
六、蒙特卡洛模拟法蒙特卡洛模拟法是一种基于随机数和概率统计的方法。
它通过模拟多次随机试验,计算各种可能结果的概率和效益,从而进行决策分析。
蒙特卡洛模拟法可以帮助决策者了解决策风险和不确定性,从而制定最佳决策方案。
综上所述,决策分析方法在解决问题和制定决策过程中具有重要的作用。
随机型决策分析方法
供应链管理
供应商选择
通过随机型决策分析方法,评估和选择合适的供应商, 确保供应链的稳定性和可靠性。
库存管理
通过随机型决策分析方法,确定合理的库存水平和库 存控制策略,避免缺货或积压现象。
物流优化
通过随机型决策分析方法,优化物流网络和运输方式, 降低物流成本和提高物流效率。
04
随机型决策分析方法的 优势与局限性
案例二
总结词
投资决策涉及到未来的不确定性和风险,随机型决策分析方法能够为投资者提供更加可靠的投资方案和风险管理 策略。
详细描述
在投资决策中,随机型决策分析方法通过对投资项目的不确定性因素进行分析,预测未来可能出现的风险和收益。 这种方法能够帮助投资者制定更加科学和可行的投资计划,提高投资的成功率和回报率。
决策树的分析
通过对决策树的分析,可以评估不同决策方案的 风险和收益,以及确定最优的决策方案。
03
随机型决策分析方法的 应用场景
风险评估
风险识别
01
通过随机型决策分析方法,识别出可能对项目或企业造成影响
的潜在风险因素。
风险量化
02
对识别出的风险因素进行量化和评估,确定其发生的概率和可
能造成的损失。
随机型决策分析方法
contents
目录
• 随机型决策分析方法概述 • 随机型决策分析方法的核心概念 • 随机型决策分析方法的应用场景 • 随机型决策分析方法的优势与局限性 • 随机型决策分析方法的案例研究
01
随机型决策分析方法概 述
定义与特点
定义
随机型决策分析方法是一种基于概率论和统计学的决策分 析方法,它通过考虑各种可能发生的情况和相应的概率, 为决策者提供最优的决策方案。
决策分析方法
决策分析方法决策分析是一种重要的管理技术,它能够帮助决策者更好地做出最佳决策。
本文将重点介绍决策分析的定义以及它的运用,并介绍决策分析方法的几种具体步骤,以及如何有效地使用它。
一、决策分析的定义决策分析是一种技术,用于帮助决策者根据有限信息计算出最佳决策,以获得最大的利益。
它是一种过程,包括获取、整合、分解和实施决策所需要的数据,以及使用有效的工具来建立、分析和评估其中的可能性。
决策分析通过发现与决策有关的各种变量,以及每一种可能结果的可能性,来帮助改善决策的风险管理。
二、决策分析的运用决策分析可以应用于不同领域,主要是在市场决策分析,经济学和财务、运营管理和政策制定等方面。
可以从不同的角度来使用决策分析,比如以经济学的视角来分析如何提高企业的效率,也可以从市场营销的角度来研究如何获得竞争优势。
三、决策分析方法的几种具体步骤1.析问题:首先,建立决策需求,并分析其背景。
这就是所谓的决策分析方法的“前期准备”。
2.定目标:确定决策的目标,做出有效的决策应该达到的结果。
3.集数据:收集相关的数据和信息,以提供决策分析所需的根据。
4.选决策:根据收集的数据,分析出几种决策选择,并对每一种选择进行评估。
5.析可能性:对所有决策选择进行分析,以找出每种决策选择的可能性和潜在风险。
6.定方案:为决策挑选一个最佳选择,并制定相应的具体方案。
7.行方案:实施决策方案,并确保其正确有效地执行。
8.估结果:重新评估决策的效果,以确定是否达到期望的目标。
四、如何有效地使用决策分析在使用决策分析时,应该注意以下几点:1.查细节:应深入了解决策情景,并收集尽可能多的信息,以确保决策的正确性。
2.意分析工具:应根据实际情况,选择合适的分析工具,这些工具可以帮助更好地进行决策分析。
3.立指标:应建立可靠的指标来衡量决策的效果,以便及时发现和调整问题。
4.意风险管理:要积极地管理和控制可能导致决策失败的各种风险,以保持决策的正确性和有效性。
第十六章 随机决策分析方法
第十六章 随机性决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用. 所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案. 在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题.为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.16.1 随机性决策问题的基本概念16.1.1 主观概率随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的. 主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.这里仅给出主观概率所服从的基本假设(或称公理系统):(1)设Ω为一非空集合,其元素可以是某种试验或观察的结果,也可以是自然的状态.将这些元素记作抽象的点ω,因而有{}.ωΩ=(2)设F 是Ω中的一些子集A 所构成的集合,F 满足下列条件: 1)F Ω∈2)如果A F ∈,则\A A F =Ω∈;3)如果可列多个n A F ∈,1,2,,n =则它们的并集1n n A F ∞=∈.(3)设()()P A A F ∈是定义在F 上的实值集函数,如果它满足下列条件,就称为F 上的(主观或客观)概率测度,或简称概率,这些条件是 1)对于每个A F ∈,有0()1;P A ≤≤2)()1;P Ω=3)如果可列多个n A F ∈(1,2,)n =,i j A A ⋂=∅()i j ≠,则11()().n n n n P A P A ∞∞===∑这里称点ω为基本事件,F 中的集A 称为事件,F 是全体事件的集合,()P A 称为事件A 的(主观或客观)概率,三元总体(,,)F P Ω称为(主观或客观)概率空间.设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4].16.1.2 效用函数在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的n 个后果为12,,,;n C C C 后果i C 可能发生的概率分别是(1,2,,),i p i n =且11.ni i p ==∑用P 表示所有后果的概率分布,并记1122(,;,;;,)n n P p C p C p C =则称P 为展望.所有展望构成的集合记为P ,可以验证P 关于凸线性组合是封闭的,即如果12,,P P P ∈而且01,λ≤≤则有12(1)P P P λλ+-∈.对于任意两个展望12,P P P ∈,都存在一定的优先关系,即对于决策人可以认为1P 优于2P ,或1P 与2P 无差异,或1P 不优于2P 三种情况,将这三种关系分别记为1212,P P P P 和21.P P .这种优先关系反映了决策人对各种后果的偏好程度.定义16.1 设()u P 是定义在展望P 上的实值函数,且满足 (1)它和在P 上的优先关系一致,即如果对于所有12,P P P ∈,有12,P P 当且仅当12()()u P u P ≥;(2)它在P 上是线性的,即如果12,P P P ∈,而且01,λ≤≤则1212((1))()(1)(),u P P u P u P λλλλ+-=+-那么称()u P 是定义在展望P 上的效用函数.如果1122(,;,;;,)n n P p C p C p C P =∈,则()u P 就是表示以概率i p 选择(1,2,,)i C i n =的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2 设X 为所有确定事件的后果x 的集合,()u x 是定义在X 上的实值函数,如果对于任意的12,x x X ∈有12()()u x u x ≥,当且仅当12.x x ,则称()u x 是定义在X 上的序数效用函数. 基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的. 正线性变换:()()(0)u P u P αβα=+>.保序变换:()(())u x f u x =,对任意,x X f ∈为严格的单调增加函数.16.2 效用函数理论16.2.1 效用与风险的关系实际中很多的决策问题都涉及经济效益,对于这类问题,在后果不确定的情况下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型.假设决策人面对一种风险的情况有1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.如果决策人认为这和不冒任何风险的另一行为盈利a 元等价,则对待风险的态度是中立型的.这三种不同的态度可以反映在效用函数上就是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.图16-1 三种不同的效用函数曲线由图16-1(a)是风险厌恶型的效用函数,即有[]123121()()()()22x x u x u xu x u +=+<;由图16-1(b )是风险中立型的效用函数,即有[]123121()()()()22x x ux u xu xu +=+=;由图16-1(c )是风险喜好型的效用函数,即有[]123121()()()()22x x u x u x u x u +=+>;实际中,很多的情况效用函数的曲线呈S 型,即在后果的X 围内,决策人对待风险的态度往往会从厌恶风险改变为喜好风险.如图16-2.图16-2(a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b )反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.16.2.2 损失函数与风险函数有的时候不要效用函数,而是用损失函数来做决策分析.记损失函数为(,)l x a ,它表时示一个决策问题当状态为x ,决策人的行动为a 时所产生的后果使决策人所受的损失.损失函数可以为正,也可以为负,它反映决策人获得的利益,后果效用越大,则损失越小.由此可以用效用函数来定义损失函数,即令(,)(,)l x a u x a =-实际中,在有些问题上为了使损失函数总是为非负的,也可以定义损失函数为(,)supsup (,)(,).x X a Al x a u x a u x a ∈∈=-在效用理论中,我们说明了期望效用能够合理的表示在风险情况下决策人的偏好,因此,期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.16.2.3 随机函数与效用函数随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情况下制定决策的方法,称为随机优势法.假设问题的效用函数为()u x ,其自变量x 表示财富(为一随机变量)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十六章随机性决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题. 这类问题称为随机性决策问题. 任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用.所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的. 而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同. 因而,同样的后果对不同的策略人产生的效用也会不同. 即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用. 只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案.在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题. 为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.16.1 随机性决策问题的基本概念16.1.1 主观概率随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的. 状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的.主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率. 这里仅给出主观概率所服从的基本假设(或称公理系统):(1)设为一非空集合,其元素可以是某种试验或观察的结果, 也可以是自然的状态.(2)设F是中的一些子集A所构成的集合,F满足下列条件:1) F2) 如果A F,则A A F ;3) 如果可列多个A n F,n 1,2,L ,则它们的并集U A n F -n 1(3)设P(A)(A F)是定义在F上的实值集函数,如果它满足下列条件,就称为F上的(主观或客观)概率测度,或简称概率,这些条件是1) 对于每个A F ,有0 P(A) 1;2) P( ) 1;3) 如果可列多个A F (n 1,2,L ), A A j (i j),贝U这里称点为基本事件,F中的集A称为事件,F是全体事件的集合,P(A)称为事件A的(主观或客观)概率,三元总体(,F,P)称为(主观或客观)概率空间.设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等[3.4].16.1.2效用函数在随机性决策冋题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的n个后果为C1,C2,L ,C n;后果G可能发生的n概率分别是p i(i 1,2丄,n),且口 1.用P表示所有后果的概率分布,并记i 1P (P1,G; P2,C2;L ; P n,C n)则称P为展望.所有展望构成的集合记为P,可以验证P关于凸线性组合是封闭的,即如果P1,P, P,而且0 1,则有P (1 )P2 P.对于任意两个展望R,B P,都存在一定的优先关系,即对于决策人可以认为P优于P2,或R与F2无差异,或R不优于P2三种情况,将这三种关系分别记为Rf P2,R: P2和P2fP1..这种优先关系反映了决策人对各种后果的偏好程度.定义16.1 设u(P)是定义在展望P上的实值函数,且满足(1 )它和在P上的优先关系f 一致,即如果对于所有P,P2P,有PfP2,当且仅当U(P l) U(P2);(2)它在P上是线性的,即如果PR P,而且0 1,则那么称u(P)是定义在展望P上的效用函数.如果P (P1,G;P2,C2;L ;P n,C n) P,则U(P)就是表示以概率口选择Q (i 1,2,L小)的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2 设X为所有确定事件的后果X的集合,u(x)是定义在X上的实值函数,如果对于任意的X1,X2 X有u(X1) u(X2),当且仅当xfx2.,则称u(x)是定义在X上的序数效用函数.基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的.正线性变换:$(P) u(P) ( 0).保序变换:$(x) f(u(x)),对任意X X, f为严格的单调增加函数.16.2 效用函数理论16.2.1 效用与风险的关系实际中很多的决策冋题都涉及经济效益,对于这类冋题,在后果不确定的情况下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通常可分为三种态度,即厌恶型、中立型和喜好型假设决策人面对一种风险的情况有 1/2的机会得不到任何盈利,也有1/2的机会盈利2a 元,即他的期望盈利为a 元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风 险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的•如果决策人认 为这和不冒任何风险的另一行为盈利a 元等价,则对待风险的态度是 中立型的•这三种不同的态度可以反映在效用函数上就是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.1X ! _.2u(X 1) u(X 2) u( ) 22;实际中,很多的情况效用函数的曲线呈 S 型,即在后果的范围内,决策人对待风险的态度往往会从厌恶风险改变为喜好风险•如图16-2.图16-2( a )反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变 .图16-2(b )反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶 的变化•这是最常用的效用函数•16.2.2损失函数与风险函数由图16-1(- £ uU2'_a )是风险厌恶型的效用函数[即有/ 立型的效用函数,,即有一ili3 i2 1X ! u(x 1) u(X 2)u(2(c)X 2 (b)由图16-1 (c )是风险喜好型的效用函数,即有u(X 3):U (X 3)种不同的效用函数2? > 一Q J xli2 X图 16-1u(i311 : x ,/2出吐凹__u HAU(X有的时候不要效用函数,而是用损失函数来做决策分析•记损失函数为l(x,a),它表时示一个决策问题当状态为x ,决策人的行动为 a 时所产生的后果使决策人所受的损失. 损失函数可以为正,也可以为负,它反映决策人获得的利益,后果效用越大,则损失越小. 由此可以用效用函数来定义损失函数,即令实际中,在有些问题上为了使损失函数总是为非负的,也可以定义损失函数为在效用理论中,我们说明了期望效用能够合理的表示在风险情况下决策人的偏好,因此,期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.16.2.3 随机函数与效用函数随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情况下制定决策的方法,称为随机优势法.假设问题的效用函数为u(x),其自变量x表示财富(为一随机变量)。
实际中的问题总是有x a,b,且u(x)在a,b上有界,对于这种效用函数可以分为以下几类:1.递增效用函数实际中,一般要求财富的效用函数u(x)是x a,b的非递减函数,即意味着当财富增加时,它的效用总不会减少.通常是随着x的增加u(x)是严格递增的,而且是有界的.为此,我们假设:(1)对于任意x j, x2a,b,当x_j x2时有u(xj u(x2);(2)u(x)在a,b上连续,且有界,即存在M 0使u(x) M ;(3)u(x)在a,b上一次可微,且在(a,b)内有0 u'(x) M .记此类效用函数为U,,即这中类型的效用函数仅能反映出财富与风险的关系,但不能反映出决策人对待风险的态度.因此U j中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还可以进一步分类2. 递增的凹效用函数这种效用函数是递增的,故设u(x) U i,而且是严格凹的,即u(x)在a,b上具有二阶连续有界的导数•记为实际中常用的U2类函数有幂函数:u(x)x c,x a,b (c0,a 0);对数函数:u(x)In x, x a,b(0,);指数函数: u(x)cxe ,x [a,)(c 0).根据风险和效用函数的关系,当u',u"存在,且u 0时,定义对待风险态度的局部测度为即r(x)是效用函数u(x)的曲率测度,可以证明:如果r(x) 0 ,则决策人的财产为x时,他是厌恶风险的•如果r(x) 0,则决策人的财产x时,他是风险中立的.如果r(x) 0,则决策人财产为x时,他是追求风险的,而且r(x)愈大,他愈厌恶(或追求)风险•3. 递增的厌恶风险的效用函数实际中,多数决策人对小额盈亏的态度是随着财富的积累而变化的,他们的财富积累愈多,对小额盈亏所冒风险的厌恶程度愈小•因此,我们假设r(x)是x的非递增的函数,则可以得到一类效用函数,记为即U3是U2的一个子类•由于当r'(x) 0时,r(x)是非递增的。
要使r'(x) 0,即卩II则u'u' (u")2 0,故u"'(x) 0.因此,U3类函数存在的必要条件是u" 0,x (a,b),但不是u充分条件•上面给出了适应于不同情况的效用函数的基本形式,实际中需要依据具体问题的性质,来选用合适的效用函数,对问题进行研究•16.3 DVD在线租赁问题数学模型16.3.1 问题提出随着信息时代的到来,电子商务已成为一个重要的商业途径•在线DVD租赁就是其中一种典型的经营方式,但在实际的经营过程中还是存在很多问题.下面我们从复杂的现实情况中考虑一个典型的情景•鉴于业务量的考虑,网站有必要采用会员制度,顾客需缴纳一定数量的月费成为会员•会员对哪些DVD有兴趣,只要在线提交订单,网站就能立即了解他们的需求,并通过快递的方式尽可能满足要求•会员提交的订单内容包括他对哪几张DVD感兴趣,对不同的DVD的偏爱度,用数字表示.这些DVD是基于其偏爱程度排序的•网站会根据手头现有的DVD 数量和会员的订单进行分发.每个会员每个月租赁次数不得超过2次,每次获得3张DVD会员看完3张DVD之后,只需要将DVD放进网站提供的信封里寄回(邮费由网站承担),就可以继续下次租赁.1、由于DVD的更新速度很快,网站必须时常更新现有产品,因此在现有会员中随机抽取1000个会员进行调查,以得知愿意观看不同DVD的人数(表1.1给出了其中5种DVD的数据).虽然网站规定每位会员每月只能借两次DVD但从历史数据显示,60%勺会员每月租赁DVD两次,而另外的40%只租一次.现在我们假设网站现有10万个会员,并已经知道会员对DVD的需求,以及会员每月订DVD的规律.问题是应该至少准备多少张,才能保证希望看到该DVD勺会员中至少50%在一个月内能够看到?如果要求保证在三个月内至少95%的会员能够看到呢?表1.1对2 、尽可能多的满足会员是经营中的一大目标,但每个会员对不同DVD的偏爱度是大相径庭的,虽然他们都对该DVD下了订单,但最后得到该张DVD收到的效果差别很大,所以还要考虑会员满意度的问题•表1.2列出了网站中20种DVD的现有张数和当前需要处理的100位会员的在线订单•如何对手中已有的DVD进行分配,以使所有会员的满意度和达到最大?表1.2 现有DVDD001—D020表示20种DVD,C0001 —C0100表示100个会员,会员的在线订单用数字1,2,…表示,数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的在线订单中•3 、在实际的经营过程中,不可能像刚才讨论的两个问题这么简单,我们不可能将顾客的满意率与他们的满意度割裂幵来分幵研究,可以说这是两个问题是相互牵制的关系•假设表1.2中DVD现有数量全部为0.作为网站经营管理人员,如何决定每种DVD的购买量,以及如何对这些DVD进行分配,才能使一个月内95%勺会员得到他想看的DVD并且满意度最大呢?只有弄清楚这个问题,我们才能初步的对DVD在线租赁问题有个认识.16.3.2 问题分析问题一类似于“货物存储问题(Inventory problem )”,基本思路是跟踪DVD在一个月(三个月)内的流动情况,目标是计算出DVD的流转次数,然后再结合满意率要求得出所需准备的DVD数量.问题二类似于“分配问题”或“指派问题( Assignment problem )”,我们可以对偏爱度进行适当的处理以满足我们的要求.0-1 规划是处理该问题的最佳方法,因此如何使用这一方法将是研究问题二的关键.问题三看似是问题一与问题二的结合 (存贮+分配),但实际要复杂得多.它综合考虑一个月内DVD的购买、分配方案,是一个多目标线性规划.从经济效益看,在保证95%以上会员一个月内看到想看的DVD的情况下,希望购买尽量少的DVD从社会效应看,则要尽可能多地考虑让总的满意度最大.这时,可以将多目标规划变为单目标规划,以求得一个经济与社会效益的综合最优.由于问题三牵涉到两次分配,而对会员满意率的理解又有多种解释,因此目标及约束函数会和问题一、问题二有很大差别. 而问题三的模型又可从当前满意度最大和一段时间内满意度最大两个角度来考虑.16.3.3 假设条件1.对1000名会员的调查足以反映10万名会员对于各种DVD的需求及喜好;2. 所有会员提交订单的时间是随机的;3. 一个月的天数为30 天;4. 会员中有60%勺会员每月租赁DVD两次,40%勺会员每月租赁DVD一次;5. 会员只有在需要再次租赁DVD时,才会将上次租赁的DVD归还;6. 会员临近两次借的DVD种类不会重复;7. 每位会员每月至少租赁1次;8. 会员本次提交后没得到该DVD则他下次仍要看该DVD且偏爱度不变;9. 每类租赁出的DVD有60%在每月租赁2次的会员中,40%在每月租赁1次的会员中;10. 公司收到订单时不知道此会员在一个月内会借一次或两次.在实际建模中还会遇到其他问题,比如问题一中可以淡化会员每次借三张的条件,即会员每次借的DVD数量不固定;问题二中不考虑多次分配的问题;问题三中对顾客满意率的不同理解. 因此,我们将在以下讨论具体问题时再给出.16.3.4 模型建立与数值求解参数与变量说明X i j:第i时间节点上第j种DVD的可分配量;P j :所有会员中愿意观看第j种DVD的人的概率;P c :所有会员中每月借2次的人的概率;P s :需要满足的会员比例;M :会员总数;n:所考虑的时间跨度,即月份数;b j :第i个会员对第j种DVD的偏爱程度;a j :第i个会员对第j种DVD的满意度;X j :分配变量,X j 1表示第i个会员得到第j种DVD否则为0;W j :网站第j种DVD的现有数量.其余特殊的变量将在后面的讨论中具体说明.问题一:悲观情况估计—一个月假设DVD1其购买量为X1,从表1可以认为想看DVD1的有2万人,而会员一个月借1次或借 2 次是随机的,这就可能出现极端的情况,即第一次分配时正好所有 1 类会员都分配到了DVD1我们把这种情况称为悲观情况.则X1的一部分首先被会员总数40%勺1类会员借走了,而且在该月不会归还•那么,为了保证至少有 50%勺会员在一个月内能看到该 DVD 则DVD1总的购买量应满足:同理,设P j 为愿意看第j 种DVD 的人的概率,P j 可从表1中将愿意看该DVD 的人数除 以总人数可获,则5种DVD 的购买量为问题一:悲观情况估计-三个月同理,对于其余4种DVD 的购买量有,为保证三个月内至少 95%勺会员看到他想看的 DVD 每种DVD 的购买量为:的普哇松分布.考虑平均情况,认为:60%勺会员15天归还DVD 40%勺会员一个月归还, 即对于每张DVD 有60%勺可能15天流通一次,40%勺可能30天流动一次•假设所有会员在每 个月的某天(不妨为1号)提交订单,那些2类会员也集中在15号归还并提交下一份订单, 则可以发现上述的简化是普哇松分布的平均情况.因此,在处理时可以不考虑每个会员的具体租赁、归还的时间,而只考虑每个月两次的分配方案,即1号和15号的分配方案.同时,在DVD 租赁出去后,对于某种 DVD 是均匀的分布在1类会员和2类会员中,即 在15问题一:均值 现实中,每天 也有DVD 归还,而情况估计都会有订单提交, 且都是服从参数为从“一月情况”,我们可以推广到“三月情况” .如果x 1 40% 20000,则每次分配都将只能由每月借一次的会员的到DVD 这样三个月中 DVD1的流动量就仅为3x i ,为了保证至少有50%勺会员在一个月内能看到该 DVD 那么此时DVD1总的购买量应该满足号,该DVD将有60%3还.我们用下图表示租赁情况,每块代表长度为15天的时段,上方的箭头表示该时刻借出的数量,下方表示归还的数量.则初始时刻DVDj有x1j张可用于分配优.由假设可知,第1个月月中有60% x i 的DVDj 归还,另外40%仍在会员中,这时网站 可将60%X ;的DVDj 借出.则x 1与x 2有如下关系:这样就可以计算DVDj 在一个月中的流通量x i x 2 1.6x 1即一个月内DVD 勺流通量为月 初购买量的1.6倍,称这个“1.6 ”为“一月流通系数”.那么DVD 一个月最小购买量可通 过以下公式来计算:由表1得到1000人中愿意观看每种 DVD 的概率分别为:由于这1000人为10万人的子样本,p 1, p 2, p 3, p 4, p 5也可表示10万人中愿意观看每种 DVD 的概率.则100000p j 表示10万人中愿意观看第j 种DVD 的人.经计算,各种 DVD 的最少 月初购买量为:DVD名 称 DVD1 DVD2 DVD3 DVD4 DVD5购买量6250 3125 1563 782 313总的最少购买量 S=12033问题一:均值情况估计一三月该情况需要考虑6个时段,而且各个时段节点互相影响.在“一月情况”中已经知道 X 1j 与 x 2之间的关系:在第3个时间点,会有x 3张DVD 归还.观察x 3张DVD 的组成,第1个时间点有40%勺DVD 分配给了 1类会员,贝V 在第3个时间点归还,数量为0.4x 1.而对于第2个时间点中收回的部亍jX i对于“一月情况”,仅观察上图中的前两段第三次 第四次 第五次x ; x 5j X6第一次租赁配给一月个 第五次 X6 「在分配时,每张DVD 都有60%勺可能被分、局\第四次0%勺可能分配给每月借亠次勺勺.在初始时刻会将所有DVD 昔出,第六次 第二次2次勺会员,因此,即表示网站对D V DJ ;的购买量,而问题目标则是要求出X 」的最小值,以达到效益的最X 2分DVD同样有60%勺可能分配给2类会员,40%勺可能分配给1类会员,因此在第3个时间点,会有60%勺人归还,数量为0.6x2.则第3个时间点收回的x3来源于两个部分,分别为第1时间点借给“一类会员” 的DVD以及第2个时间点借给“二类会员”的DVD所以有x3 0.4x1 0.6x2.三个月内6 DVD租出数如下:第二次:x2j0.6 x.第一次:j X1第三次:x3 0.4x10.6x2第四次:x40.4x20.6x3第五次:X第六次:x6j0.4x40.6x5 j 1,2,3,4,5? 0.4x30.6x4由此,可以得出一个通用的递推公式:通过上面的递推公式就可以建立与“一月情况”相似的模型:经计算,各种DVD的最少月初购买量为总的最少购买量S=8147.由上面的递推公式可得“三月情况”中DVD的流通量:式中“ 4.49 ”为“三月流通系数”.问题一:理论证明事实上,不必认为所有人都在1号来借DVD以DVD1为例,设某种DVD一个月内被看到1次的概率为0.4,被看到2次的概率为0.6,则其服从分布:n为使想看该DVD的会员中至少50%在一个月内能够看到,即要i 50% 20000i 1n成立的概率尽可能大,不妨取: 50% 20000 95%n由于i是独立同分布的,且n的数量很大,有中心极限定理知,i近似服从正态分布•i 1将其化为标准正态分布即为:_________________ 2查表并求解得:n 0.25 .0.2526250 6250同理也可推出其他解,由此证明了均值情况下的估计是完全可行的问题一:一般情况推广在上面的基础中,我们把模型推广到范围更广的现实经济生活中.假设通过问卷调查分析推算出任意客户群体的借阅分布情况,设P c为2类会员的概率,P s为需要满足的会员比例,n为所考虑的时间跨度,即月份数,M为会员总数,则可得到下面更一般的带约束的线性规划模型(这里人设DVD种类为5种):16.3.5问题二的模型与求解问题二是在现有一定数量DVD的前提下,如何分配以使会员总的满意度最大.这与“分配问题”或“指派问题(Assignment problem )”有很多相同点.我们可以通过一些变化来使求解“分配问题”的模型能运用于该问题.我们把问题二中“ 100个会员对DVD勺需求” 理解为“需要完成的100项任务”,“20 种DVD数量”理解为“有m个人可以承担这些任务”,“会员对于不同DVD的偏爱度”理解为“不同人去完成不同工作的效率”,通过类比就能把分配问题的模型运用到问题二中了.分配问题最常用的方法是0-1型整数规划.在具体使用前,还需要将每个会员对不同DVD的偏爱度转化为满意度.因为我们的目标是总体满意度最大.从表1.2中可以看到:会员的在线订单用数字1,2丄表示,数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的在线订单中.通过观察我们用一个大于9的固定数值来减偏爱数,把这个差值作为满意度.问题二:参数定义1、设矩阵B为偏爱度矩阵,矩阵中的元素b j为表1.2中的偏爱数,表示第i个会员对DVDj 的偏爱数. b ij 越小表示会员的满意程度越高,b ij 为1 时最高,为0 时表示客户没有下订单. 于是就得到了偏爱度矩阵B100 20 b ij i 1,2,3,L ,100; j 1,2,3,L ,20 .2、设矩阵A为满意度矩阵,矩阵中的元素a j为满意度,表示第i个会员对第DVDj的满意度. a ij 可通过如下算法获得:通过矩阵A100 20 a ij i 1,2,3,L ,100; j 1,2,3,L ,20 就能应用0-1 规划进行求解.3、令x ij 为分配变量,x ij 1表示第i 个会员得到DVDj ;x ij 0 表示DVDj 未分配给第i 个会员. 由此得到我们要求的分配矩阵为:4、令w j 表示DVDj 的现有数量,则有数量矩阵W 8,1,22,10,L ,38 .100 205、令a ij x ij 表示所有会员满意度的总和,我们的目标就是求出其最大值.i 1 j 1问题二: 模型建立1. 因为表1.2中的数字0意义特殊,不直接与满意度产生关系.0代表该DVD没有出现在订单中,即会员不需要看该DVD从分配费用考虑,避免把该DVD分配给会员.根据X j的定义,不妨认为:x ij b ij ,则b ij0时,x ij 也等于0,即避免了上述情况的发生.2. 由于一次最多只能借3 张,20那么就有:x ij 3 i 1,2,3,L ,100 ,又DVDj 分配给j1各会员的数量肯定不超过现有数量100w j ,所以:x ij w j .由以上分析可得问题二的模型:用LINGO 数学软件实现对此题0-1 规划模型的求解问题二: 模型改进- 约束条件改进根据上述模型的求解,我们发现有些会员没有分配到3张DVD即他们的需要没能被满足. 从网站的社会效益考虑,这样的情况会导致网站客户的流失. 所以希望在满足所有会员都能借到3张DVD的前提下,再通过会员总满意度最大来决定分配方案.这就需要对上面的模型做一些改进.20 20我们可以将x ij 3 i 1,2,3,L ,100 改为x ij 3 i 1,2,3,L ,100 ,则得到模型j 1 j1问题二: 模型改进- 约束条件改进以上修改,约束条件加强了,可能导致模型无可行解. 事实上通过LINGO 程序也发现该模型无解•因为约束条件中规定了不能分配给会员不要的DVD而会员每次都被分到3张,则网站至少有300张DVD而现仅有303张,只比最低限度多3张,贝V当某DVD需求较大时就会供不应求. 所以要放宽条件1,才能找到最优解.最优值在第165 次迭代后得到Z=2024 . 以上两个模型的结果是相同的,由于约束条件的放宽,后一个模型的迭代次数较少,则在说明每个会员一次能借到3张DVD不会影响会员整体满意度,而且从模拟结果看,改进后的对原有分配策略影响不大.问题二: 模型改进- 满意度定义改进以上的讨论都是基于用一个固定数去减会员偏爱数作为满意度来分析的. 但存在一定的不合理性.比如,当看到了最想看的DVD时,心理上满足是非常大的,但若仅仅得到了第二想看的DVD那样满足感会大打折扣,而如果仅得到了第三想看得DVD满足感会更低,但与仅获得第二想看的DVD相比,也许失落感并不会如没有获得第一想看的DVD那么大.所以,如果只是简单得把会员订单中的DVD进行了相同差别的处理,无法表示出会员的真实满意度差别•所以我们想到了用偏爱数的倒数来表示会员的满意度,对满意度矩阵A的元素a ij2 重新定义:把新定义的满意度代入上述模型中,并由LINGO 程序计算,最优值在第54 次迭代后得到Z=153.9984. 我们对分配策略的分析发现,该结果与上一个模型相比并没有太大的变动,这是因为两种满意度的定义其实质是一样的.16.3.6 问题三的模型与求解在现实的网站经营中需要综合考虑问题一、二,这就需要我们进一步讨论问题三的模DVD 型,它需要考虑两次分配方案,但我们可以简化为仅考虑当前时间点下如何用最小的购买来满足95%的会员并找出最佳分配方案使会员总满意度最大.那么如何将这两个目标同时放入一个目标函数呢,最简单的方法就是相加•。