【物流战略管理】战略博弈分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如,当两只豺狗同时遇到一块食物时,他们必须决定 是争斗还是共享食物。争斗是鹰派的策略:一方将获 胜,另一方将败落。共享食物是鸽派的策略:在对方 也是鸽派时,这个策略将发挥很好的功效;但当对方 是鹰派时,共享食物的提议则会遭到拒绝,并且,鸽 派参与人将一无所获。 参与人 • 其收益矩阵为: 鹰派 鸽派 鹰派 -2,-2 4,0 参与人 鸽派 0,4 2,2
囚徒困境
• 1950年,由就职于兰德公司的梅里尔· 弗勒德和梅尔文· 德 雷希尔拟定出相关困境的理论,后来由顾问艾伯特· 塔克以 囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境 如下: • 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二 人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并 向双方提供以下相同的选择: • 若一人认罪并作证检控对方(相关术语称“背叛”对 方),而对方保持沉默,此人将即时获释,沉默者将判监 10年。 • 若二人都保持沉默(相关术语称互相“合作”),则 二人同样判监1年。 • 若二人都互相检举(相关术语称互相“背叛”),则 二人同样判监8年。
鹰-鸽博弈的纳什均衡
• 假定鹰派的比例是p。同时,一个鹰派遇见另一个鹰 派的比例是p,而遇见一个鸽派的概率为1-p。因此, 鹰派的期望收益为:H=-2p+4(1-p)。鸽派的期望收 益为:D=2(1-p)。 • 假定具有较高收益的类型的繁殖速度更快一些,并 且他们会将其采取策略的倾向遗传给后一代。那么, 我们可以预期,如果H>D,种群中鹰派的比例将会 上升;如果H<D,鸽派的数量将会上升。
战略博弈理论简介
博弈定义: 博弈(game),又译对策、游戏或竞赛,最早由德国数 学家、哲学家莱布尼兹于1710年提出,它是对若干个人在 “策略相互依存”情形下相互作用状态的抽象表述。
博弈论的基本概念
• • • • •
博弈核心特征: 有一些规则,我们叫做博弈规则 有一个结果 策略 策略有相互依赖性
种群进化
• 鹰派和鸽派1:1的比例是个稳定均衡。因为如果鹰派 占的比例p>1/2,鹰派的收益将小于鸽派的收益,鸽 派的繁殖将加快,得p下降。类似地,如果P<1/2, 鹰派的收益将大于鸽派的收益,鹰派的繁殖速度加 快,P将上升,重新回到均衡。 • 因此,P=1/2不仅是一个均衡,而且是一个在进化动 力下稳定的均衡。这种策略被称为进化稳定策略
年轻人B 转向 不转向 年轻人A
转向 不转向
0,0 1,1
-1,1 -2,-2
情侣博弈
女
足球 1 音乐 0 0 0 0 1 2
头蛇) 商战 沉默 进入 900,1100 -2000,600 进入者(强龙) 不进入 0,3000 0,3000
鹰-鸽博弈与种群进化
斗鸡博弈
• 即电影中的汽车博弈:两个年轻人分别从一条街的两 头,驾车笔直地是向对方。第一个转向的人会颜面尽 失,但如果没有人转向,将会撞在一起。其收益矩阵 如下图: • 存在两个纳什均衡:(不转向,转向)和(转向,不 转向)。A偏好第一个,B偏好第二个。但这两个都比 撞车好。它和保证博弈有所区别,双方做不相同的事 情比做相同的事情好。
• 4、信息指的是参与人在博弈中所知道的关于自 己以及其他参与人的行动、策略及其得益函数等 知识; • 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; • 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 •
•
• 2、从参与人对其他参与人的各种特征信息的获 得差异来分,博弈可分为完全信息博弈和不完全 信息博弈。 • 完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 • 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
嫌疑人 2 坦 白 嫌 坦 白 疑 人 1 不坦白 嫌疑人1:坦白 嫌疑人2:坦白 -8, -8 -10, 0 不坦白 0, -10 -1, -1
两个罪犯的得益矩阵
智猪博弈
• 假设猪圈里有一头大猪、一头小猪。猪圈的 一头有猪食槽,另一头安装着控制猪食供应 的按钮,按一下按钮会有10个单位的猪食进 槽,但是谁按按钮就会首先付出2个单位的 成本,若大猪先到槽边,大小猪吃到食物的 收益比是9∶1;同时到槽边,收益比是7∶3; 小猪先到槽边,收益比是6∶4。那么,在两 头猪都有智慧的前提下,最终结果是小猪选 择等待,大猪去按钮
universitychina年轻人a年轻人b转向不转向转向不转向00111122universitychina情侣博弈足球音乐足球china强龙与地头蛇博弈市场原经营者地头蛇商战沉默进入90011002000600进入者强龙不进入0300003000universitychina鹰鸽博弈与种群进化例如当两只豺狗同时遇到一块食物时他们必须决定是争斗还是共享食物
博弈的分类和均衡 行动次序 信息 静态 纳什均衡 纳什 动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均 衡 泽尔腾等
完全信息
不完全信息
贝叶斯均衡 海萨尼
博弈研究的四类问题 1. 1.合作问题 2. 2.竞争问题 3. 3.共存问题 4.承诺问题
博弈研究的典型问题
1. 1.囚徒困境
2. 2.智猪博弈 3. 3.斗鸡博弈 4.情侣博弈 5.强龙与地头蛇博弈 6. 鹰-鸽博弈与种群进化
课后作业
• 1.列举生活中不同种类博弈的5个例子 • 2.谈谈你的领悟及体会 • 3.课外阅读:《博弈论的诡计》(选做) • 4.研究课题:博弈论视角下的社会问题研究(选做)
博弈的分类
• 根据参与人的多少,可将博弈分为两人博弈或多 人博弈; • 根据参与人是否合作,可将博弈分为合作博弈或 非合作博弈; • 根据博弈结果的不同,又可分为零和博弈、常和 博弈与变和博弈。
1、从行动的先后次序来分,博弈可以分为静态博 弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或 虽非同时但后行动者并不知道前行动者采取了什 么具体行动; 动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
博弈的要素
① ② ③ ④ ⑤ ⑥ 局中人(players) 策略(strategies) 信息(information) 得益(payoff) 均衡(equilibrium) 行动(actions or moves)
⑦ 结果(outcome)
博弈的组成要素
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体); • 2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策; • • 3、策略是指参与人选择行动的规则,即在博弈进 程中,什么情况下选择什么行动的预先安排;
囚徒困境
• 1950年,由就职于兰德公司的梅里尔· 弗勒德和梅尔文· 德 雷希尔拟定出相关困境的理论,后来由顾问艾伯特· 塔克以 囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境 如下: • 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二 人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并 向双方提供以下相同的选择: • 若一人认罪并作证检控对方(相关术语称“背叛”对 方),而对方保持沉默,此人将即时获释,沉默者将判监 10年。 • 若二人都保持沉默(相关术语称互相“合作”),则 二人同样判监1年。 • 若二人都互相检举(相关术语称互相“背叛”),则 二人同样判监8年。
鹰-鸽博弈的纳什均衡
• 假定鹰派的比例是p。同时,一个鹰派遇见另一个鹰 派的比例是p,而遇见一个鸽派的概率为1-p。因此, 鹰派的期望收益为:H=-2p+4(1-p)。鸽派的期望收 益为:D=2(1-p)。 • 假定具有较高收益的类型的繁殖速度更快一些,并 且他们会将其采取策略的倾向遗传给后一代。那么, 我们可以预期,如果H>D,种群中鹰派的比例将会 上升;如果H<D,鸽派的数量将会上升。
战略博弈理论简介
博弈定义: 博弈(game),又译对策、游戏或竞赛,最早由德国数 学家、哲学家莱布尼兹于1710年提出,它是对若干个人在 “策略相互依存”情形下相互作用状态的抽象表述。
博弈论的基本概念
• • • • •
博弈核心特征: 有一些规则,我们叫做博弈规则 有一个结果 策略 策略有相互依赖性
种群进化
• 鹰派和鸽派1:1的比例是个稳定均衡。因为如果鹰派 占的比例p>1/2,鹰派的收益将小于鸽派的收益,鸽 派的繁殖将加快,得p下降。类似地,如果P<1/2, 鹰派的收益将大于鸽派的收益,鹰派的繁殖速度加 快,P将上升,重新回到均衡。 • 因此,P=1/2不仅是一个均衡,而且是一个在进化动 力下稳定的均衡。这种策略被称为进化稳定策略
年轻人B 转向 不转向 年轻人A
转向 不转向
0,0 1,1
-1,1 -2,-2
情侣博弈
女
足球 1 音乐 0 0 0 0 1 2
头蛇) 商战 沉默 进入 900,1100 -2000,600 进入者(强龙) 不进入 0,3000 0,3000
鹰-鸽博弈与种群进化
斗鸡博弈
• 即电影中的汽车博弈:两个年轻人分别从一条街的两 头,驾车笔直地是向对方。第一个转向的人会颜面尽 失,但如果没有人转向,将会撞在一起。其收益矩阵 如下图: • 存在两个纳什均衡:(不转向,转向)和(转向,不 转向)。A偏好第一个,B偏好第二个。但这两个都比 撞车好。它和保证博弈有所区别,双方做不相同的事 情比做相同的事情好。
• 4、信息指的是参与人在博弈中所知道的关于自 己以及其他参与人的行动、策略及其得益函数等 知识; • 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; • 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 •
•
• 2、从参与人对其他参与人的各种特征信息的获 得差异来分,博弈可分为完全信息博弈和不完全 信息博弈。 • 完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 • 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
嫌疑人 2 坦 白 嫌 坦 白 疑 人 1 不坦白 嫌疑人1:坦白 嫌疑人2:坦白 -8, -8 -10, 0 不坦白 0, -10 -1, -1
两个罪犯的得益矩阵
智猪博弈
• 假设猪圈里有一头大猪、一头小猪。猪圈的 一头有猪食槽,另一头安装着控制猪食供应 的按钮,按一下按钮会有10个单位的猪食进 槽,但是谁按按钮就会首先付出2个单位的 成本,若大猪先到槽边,大小猪吃到食物的 收益比是9∶1;同时到槽边,收益比是7∶3; 小猪先到槽边,收益比是6∶4。那么,在两 头猪都有智慧的前提下,最终结果是小猪选 择等待,大猪去按钮
universitychina年轻人a年轻人b转向不转向转向不转向00111122universitychina情侣博弈足球音乐足球china强龙与地头蛇博弈市场原经营者地头蛇商战沉默进入90011002000600进入者强龙不进入0300003000universitychina鹰鸽博弈与种群进化例如当两只豺狗同时遇到一块食物时他们必须决定是争斗还是共享食物
博弈的分类和均衡 行动次序 信息 静态 纳什均衡 纳什 动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均 衡 泽尔腾等
完全信息
不完全信息
贝叶斯均衡 海萨尼
博弈研究的四类问题 1. 1.合作问题 2. 2.竞争问题 3. 3.共存问题 4.承诺问题
博弈研究的典型问题
1. 1.囚徒困境
2. 2.智猪博弈 3. 3.斗鸡博弈 4.情侣博弈 5.强龙与地头蛇博弈 6. 鹰-鸽博弈与种群进化
课后作业
• 1.列举生活中不同种类博弈的5个例子 • 2.谈谈你的领悟及体会 • 3.课外阅读:《博弈论的诡计》(选做) • 4.研究课题:博弈论视角下的社会问题研究(选做)
博弈的分类
• 根据参与人的多少,可将博弈分为两人博弈或多 人博弈; • 根据参与人是否合作,可将博弈分为合作博弈或 非合作博弈; • 根据博弈结果的不同,又可分为零和博弈、常和 博弈与变和博弈。
1、从行动的先后次序来分,博弈可以分为静态博 弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或 虽非同时但后行动者并不知道前行动者采取了什 么具体行动; 动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
博弈的要素
① ② ③ ④ ⑤ ⑥ 局中人(players) 策略(strategies) 信息(information) 得益(payoff) 均衡(equilibrium) 行动(actions or moves)
⑦ 结果(outcome)
博弈的组成要素
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体); • 2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策; • • 3、策略是指参与人选择行动的规则,即在博弈进 程中,什么情况下选择什么行动的预先安排;