博弈游戏简介.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 如果两人都招供,则两人都会因罪名各判10年。
根本问题:个体对自身利益的追求会损害整体的利益。
8
囚犯的推理:
甲 乙
招认
不招
招认 不招
10年 150年
150年 11年
9
1-正品 2-假冒产品
游戏
理想净收入:$1.08 理想净收入:$1.58
规则:根据选1的人数,将收入平分给在座所有人。
•现实例证 –政治
17
总结
• 决策形成的五个步骤:
1. 列出所有可以采取的行动; 2. 尽可能列出每个行动的可见后果; 3. 尽量评估每种结果可能发生的机会; 4. 试着表达你对每种结果的渴望或恐惧程度; 5. 把列出来的所有因素全部放在一起考量,
做出合理的决策。
18
• 肯尼迪的边缘策略-古巴导弹 • 毫无用处的核武器? • 约会—理想恋人的概率 • 赌博—必输游戏,何时应“孤注一掷” • 股市—巴菲特为什么能赚钱? • 强盗分脏—游戏 • 民主—既不一定正确也不一定公平
• 可能的结果及奖金:
1)合作,合作
2) 背叛,背叛
3
3
1
1
3)合作,背叛
0
5
12
参赛者提出了各种程序,大致可分为:
• 善良的-以合作为主,不首先背叛的规则 的规则
• 邪恶的-以占便宜为主的规则 • 随意的
竞赛结果:“以合作为主” 的善良策略大获全胜。而 善良的规则中“一报还一报”取得了最终的且惊人的胜 利!
– 善良的:首先合作,放弃占他人便宜的可能性。 – 清晰的:易于被理解,从而引出长期合作。 – 及时回报
• 报 复:对背叛的回报,使对方试着背叛一次后就不敢再背叛。 • 宽容的:对合作的回报,有助于重新恢复合作。
15
总是背叛 背叛 5 背叛 1 …
一报还一报 合作 0 背叛 1 …
遇到报复撤回背叛 背叛 5 背叛 1 合作 0 合作 3 …
预算问题
预算问题 30%*23/5=128%
艾滋新药 3700%%
艾滋新药
7300%%
7700%%**23//55==2482%%
7
三、策略困境-囚徒困境
• 如果两人都不坦白,警察会以非法携带枪支罪 而将二人各判1年;
• 如果其中一人招供而另一人不招,坦白者作为 证人将不会被起诉,另一人将会被重判15年;
主体的行为在发生直接的相互作用时,人们如 何进行决策以及这种决策如何达到均衡的问题。
2
受影响的决策
…
客户
父母
竞争 对手
决策
伴侣
同事
孩子
…
3
二、博弈策略
• 相继行动的博弈策略-向前展望,倒后推理
优势策略 • 同时行动的
博弈策略 劣势策略
策略组合
4
新闻大战与博弈策略
《时代》、《新闻周刊》
优势策略-封面问题:艾滋病特效新药、预算问题
13
一报还一报的伟大胜利
• “一报还一报”在整个生态模拟过程中一直保持领先,
到了第1000代,它是最成功的规则,并且比其他任何 规则都增长得快。
• “一报还一报”的稳定成功的原因是它综合了善良性、 报复性、宽容性和清晰性。
14
“一报还一报”成功分析
• 着眼于未来-赢得竞赛不是靠打击对方,而是靠引导对 方合作。
博弈游戏
--白波
博弈论 博弈策略
策略困境 走出困境
1
一、博弈论
• 1944年冯.诺依曼和奥地利经济学家奥.摩根 斯坦合作《博弈论与经济行为》(Theory of games and economic behavior),该书的出 版,标志着博弈论的创立。
• 博弈-可以分出胜负的游戏。 • 博弈论(Game Theory,又称对策论)研究决策
我们认为他们认 为我们认为…会
选…
5
艾滋病特效新药 预算问题 若相同
70% 30% 各50%
《新》 《时》 预算问题
艾滋新药
预算问题 151%5% 7300%%
艾滋新药 3700%% 35%
6
若两杂志采用同一个封面故事 《时代》3/5、《新闻周刊》2/5
艾滋病特效新药 70%
预算问题
30%
《新》 《时》
–教育
10
四、走出困境 -促进合作与生态模拟竞赛的启示
–双方主动合作。
–分解,增大未来的影响; –改变收益值
• 管理的目的不是让每个人做到最好, 而是避免内耗过多;
11
生态模拟竞赛
• 为了验证面对“囚徒困境”时人们可选择的策略以及 这些策略的有效程度,美国的学者组织了一次以此为 主题的计算机竞赛。竞赛的游戏方法是:游戏双方都 在不知对方将如何选择的情况下,选择合作或背叛。
一报还一报 合作 0 背叛 1 背叛 5 合作 3
…
伺机占便宜
一报还一报
合作 3
合作 3
…
…
背叛 5
合作 0
…
…
源自文库16
• 你不必每次都赢
–在一个有合作可能的博弈中,你没有必要非得比对 方做得更好。“一报还一报”从来没有一次在游戏 中比对方得更多的分!
• 未来影响现在
–走出囚徒困境取决于双方的策略为发展合作留出多 大的余地。从消极层面看,我们互不侵犯,是为了 避免没完没了、两败俱伤的循环报应。
19
20
根本问题:个体对自身利益的追求会损害整体的利益。
8
囚犯的推理:
甲 乙
招认
不招
招认 不招
10年 150年
150年 11年
9
1-正品 2-假冒产品
游戏
理想净收入:$1.08 理想净收入:$1.58
规则:根据选1的人数,将收入平分给在座所有人。
•现实例证 –政治
17
总结
• 决策形成的五个步骤:
1. 列出所有可以采取的行动; 2. 尽可能列出每个行动的可见后果; 3. 尽量评估每种结果可能发生的机会; 4. 试着表达你对每种结果的渴望或恐惧程度; 5. 把列出来的所有因素全部放在一起考量,
做出合理的决策。
18
• 肯尼迪的边缘策略-古巴导弹 • 毫无用处的核武器? • 约会—理想恋人的概率 • 赌博—必输游戏,何时应“孤注一掷” • 股市—巴菲特为什么能赚钱? • 强盗分脏—游戏 • 民主—既不一定正确也不一定公平
• 可能的结果及奖金:
1)合作,合作
2) 背叛,背叛
3
3
1
1
3)合作,背叛
0
5
12
参赛者提出了各种程序,大致可分为:
• 善良的-以合作为主,不首先背叛的规则 的规则
• 邪恶的-以占便宜为主的规则 • 随意的
竞赛结果:“以合作为主” 的善良策略大获全胜。而 善良的规则中“一报还一报”取得了最终的且惊人的胜 利!
– 善良的:首先合作,放弃占他人便宜的可能性。 – 清晰的:易于被理解,从而引出长期合作。 – 及时回报
• 报 复:对背叛的回报,使对方试着背叛一次后就不敢再背叛。 • 宽容的:对合作的回报,有助于重新恢复合作。
15
总是背叛 背叛 5 背叛 1 …
一报还一报 合作 0 背叛 1 …
遇到报复撤回背叛 背叛 5 背叛 1 合作 0 合作 3 …
预算问题
预算问题 30%*23/5=128%
艾滋新药 3700%%
艾滋新药
7300%%
7700%%**23//55==2482%%
7
三、策略困境-囚徒困境
• 如果两人都不坦白,警察会以非法携带枪支罪 而将二人各判1年;
• 如果其中一人招供而另一人不招,坦白者作为 证人将不会被起诉,另一人将会被重判15年;
主体的行为在发生直接的相互作用时,人们如 何进行决策以及这种决策如何达到均衡的问题。
2
受影响的决策
…
客户
父母
竞争 对手
决策
伴侣
同事
孩子
…
3
二、博弈策略
• 相继行动的博弈策略-向前展望,倒后推理
优势策略 • 同时行动的
博弈策略 劣势策略
策略组合
4
新闻大战与博弈策略
《时代》、《新闻周刊》
优势策略-封面问题:艾滋病特效新药、预算问题
13
一报还一报的伟大胜利
• “一报还一报”在整个生态模拟过程中一直保持领先,
到了第1000代,它是最成功的规则,并且比其他任何 规则都增长得快。
• “一报还一报”的稳定成功的原因是它综合了善良性、 报复性、宽容性和清晰性。
14
“一报还一报”成功分析
• 着眼于未来-赢得竞赛不是靠打击对方,而是靠引导对 方合作。
博弈游戏
--白波
博弈论 博弈策略
策略困境 走出困境
1
一、博弈论
• 1944年冯.诺依曼和奥地利经济学家奥.摩根 斯坦合作《博弈论与经济行为》(Theory of games and economic behavior),该书的出 版,标志着博弈论的创立。
• 博弈-可以分出胜负的游戏。 • 博弈论(Game Theory,又称对策论)研究决策
我们认为他们认 为我们认为…会
选…
5
艾滋病特效新药 预算问题 若相同
70% 30% 各50%
《新》 《时》 预算问题
艾滋新药
预算问题 151%5% 7300%%
艾滋新药 3700%% 35%
6
若两杂志采用同一个封面故事 《时代》3/5、《新闻周刊》2/5
艾滋病特效新药 70%
预算问题
30%
《新》 《时》
–教育
10
四、走出困境 -促进合作与生态模拟竞赛的启示
–双方主动合作。
–分解,增大未来的影响; –改变收益值
• 管理的目的不是让每个人做到最好, 而是避免内耗过多;
11
生态模拟竞赛
• 为了验证面对“囚徒困境”时人们可选择的策略以及 这些策略的有效程度,美国的学者组织了一次以此为 主题的计算机竞赛。竞赛的游戏方法是:游戏双方都 在不知对方将如何选择的情况下,选择合作或背叛。
一报还一报 合作 0 背叛 1 背叛 5 合作 3
…
伺机占便宜
一报还一报
合作 3
合作 3
…
…
背叛 5
合作 0
…
…
源自文库16
• 你不必每次都赢
–在一个有合作可能的博弈中,你没有必要非得比对 方做得更好。“一报还一报”从来没有一次在游戏 中比对方得更多的分!
• 未来影响现在
–走出囚徒困境取决于双方的策略为发展合作留出多 大的余地。从消极层面看,我们互不侵犯,是为了 避免没完没了、两败俱伤的循环报应。
19
20