第一章 决策论基础知识(博弈论-河海大学,王慧敏)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.4
期望效用最大化定理
这就是我们所说的期望效用最大化定理
1.5
贝叶斯条件概率系
我们定义有限集 上的一个贝叶斯条件概率系( Bayesian conditional-probability system)[或简称为条 件概率系(conditional-probability system)]为 上满足 贝叶斯公式的任何一个条件概率函数p。也就是说,如果p 是 上的一个贝叶斯条件概率系,则对 的每一个非空子 集S, p( S ) 都是 上的一个概率分布,使得 p(S S ) 1 , 且
对结果或彩金偏好的定量刻划的效用函数(utility function ),和一个能刻划其对所有相关位臵因素的主观概率分布( subjective probability distribution)来描述。
1.2
决策理论的基本概念
不确定性下的决策通常是用下述两个模型之一来描 述: ※ 概率模型(probability model)和状态变量模型( state-variable model) ※在每一模型中,我们所说的决策者都是在彩票( lotteries)中进行选择的人。 ※两者的区别在于其对彩票的定义不同:在概率模型 中,彩票是彩金的概率分布;而在状态变量模型中 ,彩票是从可能状态集到彩金集的函数。
1.7
占优
有时决策者发现主观概率难以确定,无论决策者的 信念是什么,某些决策选择对他来说都不可能是最优 的。在由决策理论转向博弈论之前,我们在这里介绍 一些能说明何时这种与概率无关的论断会成立的基本 结论。 凸性是许多数理经济学中出现的集合的一个重要特 征。一个向量集是凸的(convex),其充要条件: 对于任意两个向量p和q以及0与1之间的任一数字 , 若p和q都在这个向量集中,则向量 p (1 )q 也一 定在这个集合中。从几何意义上说,凸性意味着连接 集合内任意两点的整个线段也都一定包含于此集之中 。
( Z )表
这里给出一些基本的符号:对于一个有限集Z,用
示集上的概率分布集,即
( Z ) q : Z R q ( y ) 1 yZ
且q( z ) 0,z Z
(按照常规的集合记号,上述大括号中的“Ⅰ”表示“使得 ”)
令X表示决策者最终可能获得的彩金(prizes)所组成的
主讲人: 王慧敏 河海大学商学院
第一章 决策论基础知识
1.1 1.2 1.3 1.4 1.5 博弈论、理性和智能性 决策理论的基本概念 公理系 期望效用最大化定理 贝叶斯条件概率系
1.6
1.7
贝叶斯模型的局限性
占优
河海大学商学院
授课教师:王慧敏
1.1
博弈论、理性和智能性
博弈论(Game theory)可以被定义为是对智能的理性
1.2
决策理论的基本概念
我们所说的彩金(prize)可以是任何的商品组合或资源
配臵。我们假定,定义X中的彩金时已经使得这些彩金是互 不相同的,且穷尽了决策者各种决策的可能。
决策者关于世界真实状态可能拥有的信息可以用一个事
S S 且 S
件(event)来描述,每个事件都是 的一个非空子集。我 们用 表示所有事件组成的集,则
1.1
博弈论、理性和智能性
对于仅假设理性而不假设智能性的理论,可以考虑 经济学中的价格理论这一例。在价格理论的一般均衡 模型中,假定每个个体都是追求效用最大化的理性决 策者,但并不假定他们像价格理论家那样对经济模型 的全波结构有所了解。在价格理论模型(pricetheoretic models)中,个体只观察某些中间价格 信号并且对此做出反映,并且假定每个个体都相信, 他可以在这些价格上交易任意数量而不管这个经济系 统中是否有人实际上愿意与其做交易。
1.7
占优
凸性是许多数理经济学中出现的集合的一个重要特征。一个
向量集是凸的(convex),其充要条件: 对于任意两个向量p和q以及0与1之间的任一数字 ,若p和q都 在这个向量集中,则向量 p (1 )q 也一定在这个集合中。 从几何意义上说,凸性意味着连接集合内任意两点的整个线段 也都一定包含于此集之中。
决策者之间冲突与合作的数学模型的研究。 博弈论为分析那些涉及两个或更多个参与者且其决策会影 响相互间的福利的局势提供了一般的数学方法。
近代博弈论始于策墨洛(Zermelo,1913)、波雷尔(
Borel,1921)、冯.诺依曼(Von Neumann,1928)与摩根 斯特恩(Morgenstern,1944)合著的伟大的奠基性著作。 博弈论方面的许多早期著作都是在第二次世界大战期间在普 林斯顿完成的。
1.6
贝叶斯模型的局限性
期望效用最大化的解释力可以通过凸动扰动( salient perturbations)分析而扩展到许多貌似矛盾 的情形分析。某给定决策问题的一个扰动就是任何另 一个(在某种意义上)与之非常相似的决策问题。对 任何一个给定的决策问题,如果实际面临这个决策问 题的人很可能会采取其在某个扰动决策问题中一样的 行动,我们就说这个扰动是凸出的。当然们发现决策 问题难以理解而且扰动情形又与他们通常体验的情形 很相像时,这个决策问题的特定扰动可能也是凸出的 。如果我们能对个人决策问题的凸出扰动进行预测, 那么在这个凸出扰动中最大化他期望效用的决策可能 会时对其行为的一个准确预测。
xX
f ( x t ) 1 。令L表示所有这
样的彩票所组成的集合,就是 L f : ( X ) 对 中的任一状态 t 和L中的任一彩票 f ,f ( t ) 表示在状态
f ( t ) ( f ( x t ))xX ( X ) t 下由 f 确定的X上的概率分布,即:
1.2
决策理论的基本概念
贝叶斯理论概述:
贝叶斯理论的主要观点时将参数u看作随机变量,并具有 反映实验前关于u所有信息的先验分布,而在得到样本 X ( x1 , x2 , , xn ) 后,由X与先验分布得到u的后验分布,对 u所作的任何统计推断必须依据u的后验分布,因为后验分 布包含了参数u的所有信息。 h(u x) p(u) L(u x) 贝叶斯理论可以简单的表示为: L(u x ) p( u)为先验密度函数; 其中: h(u x ) 为后验密度函数; 为样本密度函数,称之为似然函数。
1.2
决策理论的基本概念
概率模型适用于描述彩金依赖于具有明显客观规律的事
件这一赌博,我们称这样的事件为客观未知。 Eg:安斯库姆 和奥曼(1963)的“轮盘彩票”(roulette lotteries)、奈 特(knight,1921)的“风险(risks)”
另外,很多事件不具有明显的概率;一个未来运动赛事
定理1.5
若给定 u : X R 和X中的y,则 () 中使得y为 最优的所有p所组成的集合是个凸集。
1.7
占优
一般地,一个随机策略(randomized
1.3
公理系
1.3
公理系
1.3
Leabharlann Baidu
公理系
1.4
期望效用最大化定理
上的一个条件概率函数(conditional-probability
function)时任何一个这样的函数 p : () ,它能对 中的每个状态t和事件S都具体指定非负的条件概率 p(t S ) 且使得
1.2
决策理论的基本概念
对于L中的任意两个彩票 f 和 g ,以及 中的任一事件S
,当且仅当,如果决策者知道了世界真实状态在 S中,则对 他来说, f 至少是和 g 一样的理想选择的时候,我们才写作 这就是说,当且仅当决策者在只知道事件S已经发 生而又必须在 f 和 g 之间择一时,选择了彩票 f ,才有 给定这个关系 ,我们可以定义关系( s )和 为
1.1
博弈论、理性和智能性
当我们像博弈论专家或社会科学家那样分析一个 博弈时,如果局中人知道我们对此博弈所知道的一 起,并能做出我们对此局势所能做出的一切推断, 我们就说此博弈的局中人时智能的(Intelligent)。 博弈论一般都假设局中人在上述意义上是智能的, 因此如果我们研究出一个能描述某个博弈中智能局 中人行为的理论,并且我们相信这一理论是正确的 ,那么我们也必须假设该博弈的每个局中人都了解 这一理论及其预测。
p(R T ) p(R S ) p(S T ),
R S, T S
1.6
贝叶斯模型的局限性
对于从公理系推倒出来的效用最大化定理, 一个理性偏好的人从直觉上来看似乎是合情合 理的。但决策方面的实验研究已经揭示了一些 系统背离期望效用最大化的行为,例如:
▶效用函数函数不适合:M.阿拉依斯提出的著名悖论 ▶主观概率不适用:参看卡尼曼和特弗斯基(1979) ▶任何经济模型都不适用:参看卡尼曼.斯洛维克和特 弗斯基(1982)
1.1
博弈论、理性和智能性
在博弈论的语言中,一个博弈(Game)指的是设计到
两个或更多个参与人的某个社会局势。 博弈所涉及的参与人被称为局中人(Players)。正如前面 博弈论的定义所述,博弈理论家一般要对局中人做两个基 本假设:他们都是理性的和智能的
如果一个决策者在追逐其目标时能前后一致的做决策,
我们就称他是理性的(rational) ※在基于决策理论的基本结论而建立起来的博弈论中,我 们假设每个局中人的目标是最求其个人期望支付值的最 大化,支付则是用某个效用(utility)尺度来衡量的。
1.1
博弈论、理性和智能性
※借助于理性决策者应该如何行动方面所做的一些非常弱 的假设,冯.诺依曼和摩根斯特恩(1947)证明了,对任 一理性决策者,一定存在某种方式对他所关心的各种可 能结果赋予效用数值,使其总是选择最大化自己的期望 效用。我们成这一结论为期望效用最大化定理( Expected-utility maximization theorem)。 ※在证明效用最大化定理成立的过程中,关键的假设是肯 定性(sure-thing)或替代性(substitution)公理:如 果偏好选项1胜于选项2,那么就有,他在知道事件A无 论发生还是不发生之前都应该偏好选项1胜于选项2。
p(t S ) 0
若
t S,
且
p( r S ) 1
rS
给定任一这样的条件概率函数,我们可以写
p( R S ) p(r S ),
rR
R S ,
S
1.4
期望效用最大化定理
一个效用函数(utility function)可以是从 X 到 实数集R的任一函数。对于效用函数u : X R ,当且仅当 它实际上不依赖于状态,于是就存在某个函数 U : X R 使 得对所有的x和t都有 u( x t ) U ( x) 时,u才被称为是状态 独立的。
的结果或者股票市场未来的行情都是很好的例子,我们称这 类事件为主观未知(subjective unknowns)事件。安斯库 姆和奥曼(1963)的“轮盘彩票”(roulette lotteries)或 奈特(knight,1921)的“不确定性”都相当于是依赖主观 未知事件的赌博。
1.2
决策理论的基本概念
1.2
决策理论的基本概念
博弈论的逻辑根源在于贝叶斯理论(Bayesian decision
thero)。事实上,博弈论可以看作是决策理论(对两个或 两个以上决策者情形)的一种推广,或者作为决策理论在 本质上的逻辑完备。因此,要理解博弈论的根本思想,就 应该从研究决策理论开始。
任何一个理性决策者的行为应该都可以用一个能给出其
集;令 表示可能的状态(states)所组成的集,其中之一 将是世界真实状态(true state of the world)。为了简化 数学,我们假定 X 和 两者都是有限集。
1.2
决策理论的基本概念
我们将彩票定义为某个函数 f
,对 X 中的每个彩金 x 和 中的每个状态 t , f 都给出一个非负实数 f ( x t ) ,使得对 中的每个 t 都有