微分博弈理论 ppt课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
恒成立。则称(x*,y*)为函数z=f(x,y)的鞍点。 ● 鞍点具有这样的特征:当x=x*为常数,y变化时,函
数f(x,y)在(x*,y*)取极小值:当y=y*为常数,x变 化时,函数f(x,y)在(x*,y *)取极大值。
鞍点规划(Saddle Point Programming)
• 鞍点具有特殊的性质, 无论是理论上还是实践 上,有许多问题与鞍点 有关。于是一种与鞍点 对应的数学规划就产生 并发展起来,称为鞍点 规划。
经典案例:囚徒困境
• 两人同时陷入招供还 是不招供的两难处境。 但两人无法沟通,于 是从各自的利益角度 出发,都依据各自的 理性而选择了招供, 这种情况就称为纳氏 均衡点。
• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
工程应用实例:防侧翻控制器设计
• 它给出了一种基于微分 博弈理论和进化遗传算 法的防侧翻控制器设计 方法。
• 将防侧翻问题描述为一 个非合作,零和,二人 微分博弈模型。
• 分别把驾驶员转向角输 入和主动防侧倾杆视为 扰动方和控制方。
汽车前视图
微分博弈模型
• 方程(1)和(2)分别为汽车系统的状态方程和博弈的目 标函数。上述方程中U(控制方)试图使L最小,而W (扰动方)试图使L最大。
是研究有利害冲突的双方在竞争性活动中如何制胜对方的最优策略的数学理论和方博弈论的发展史战国策孙子兵法博弈论和经济行为博弈动态规划和计算机微分对策理论古代产生了朴素的博弈论的思想1944年美国曼和o摩根司坦发表了巨著美国的数学家贝尔曼于1951年又发表了名著1965年埃萨克提出了在追踪问题中双方都能自由决策行动的微分对策理论构博弈论由三个基本要素成
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
博弈论的发展史
微分对策理论
《博弈·动态规划和计算机》
《博弈论和经济行为》
《战国策》 《孙子兵法》
古代产生了 朴素的博弈 论的思想
1944年美国 的J·冯诺意 曼和O·摩根 司坦发表了 巨著
美国的数学 家贝尔曼于 1951年又发 表了名著
发
1965年埃萨 克提出了在
展 中
追踪问题中
双方都能自
由决策行动
的微分对策
理论
博弈论的基本要素
• 构博弈论由三个基本 要素成: 局中人(如竞争的 双方); 策略(每个局中人 可供选择的行动方案; 一局对策的得失。
博弈论的基本模型
• 博弈论最基本的模型是两 人、零和对策。
• 每一个局中人,不管他选 择什么方案,另一局中人 总希望使对方损失最大化, 也就是每个局中人将选择 使另一局中人把对方损失 最大化的企图最小化的策 略,这就是博弈论的最佳 策略准则。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 在物理上要广泛一些,指 在一个方向是极大值,另 一个方向是极小值的点。
鞍点问题
• 在证券市场上,股民们总想 “在最小风险下获得最大收 益”。生产着总想“在最小 投入下获得最大产出”,都 是这一辨证思想的体现。将 这一思想用数学模型表述, 己不再是单纯的极大或极小 问题,而是“极大中的极小” 或“极小中的极大”。
纳什均衡点
• 纳什平衡,又称为非 合作赛局平衡,是博 弈论的一个重要概念, 以约翰·纳什命名。如 果某情况下无一参与 者可以独自行动而增 加收益,则此策略组 合被称为纳什均衡点。
经典案例:囚徒困境
• 一个案子的两个嫌疑 犯被分开审讯,警官 分别告诉两个囚犯, 如果你招供,而对方 不招供,则你将被立 即释放,而对方将被 判刑十年;如果两人 均招供• 所谓鞍点规划就是以寻 求目标函数的鞍点为目 的的一种数学规划,用 以解决“极大值的极小 化”或“极小值的极大 化”问题。
Z
鞍点
Y X
马鞍面z=x2/4-y2/6
鞍点规划的数学模型
• 鞍点规划的数学模型:
• 上述鞍点规划模型中,决策变量x,y没有加任何限制。实 际上,x,y经常受到一定的约束,于是有以下约束鞍点规 划问题:
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于“马 鞍中央的点”,从纵向看取极 小值,从横向看取极大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
博弈论
什么是博弈论
• 博弈论亦称对策论, 运筹学的一个分支。 是研究有利害冲突的 双方在竞争性活动中, 如何制胜对方的最优 策略的数学理论和方 法。
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
恒成立。则称(x*,y*)为函数z=f(x,y)的鞍点。 ● 鞍点具有这样的特征:当x=x*为常数,y变化时,函
数f(x,y)在(x*,y*)取极小值:当y=y*为常数,x变 化时,函数f(x,y)在(x*,y *)取极大值。
鞍点规划(Saddle Point Programming)
• 鞍点具有特殊的性质, 无论是理论上还是实践 上,有许多问题与鞍点 有关。于是一种与鞍点 对应的数学规划就产生 并发展起来,称为鞍点 规划。
经典案例:囚徒困境
• 两人同时陷入招供还 是不招供的两难处境。 但两人无法沟通,于 是从各自的利益角度 出发,都依据各自的 理性而选择了招供, 这种情况就称为纳氏 均衡点。
• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
工程应用实例:防侧翻控制器设计
• 它给出了一种基于微分 博弈理论和进化遗传算 法的防侧翻控制器设计 方法。
• 将防侧翻问题描述为一 个非合作,零和,二人 微分博弈模型。
• 分别把驾驶员转向角输 入和主动防侧倾杆视为 扰动方和控制方。
汽车前视图
微分博弈模型
• 方程(1)和(2)分别为汽车系统的状态方程和博弈的目 标函数。上述方程中U(控制方)试图使L最小,而W (扰动方)试图使L最大。
是研究有利害冲突的双方在竞争性活动中如何制胜对方的最优策略的数学理论和方博弈论的发展史战国策孙子兵法博弈论和经济行为博弈动态规划和计算机微分对策理论古代产生了朴素的博弈论的思想1944年美国曼和o摩根司坦发表了巨著美国的数学家贝尔曼于1951年又发表了名著1965年埃萨克提出了在追踪问题中双方都能自由决策行动的微分对策理论构博弈论由三个基本要素成
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
博弈论的发展史
微分对策理论
《博弈·动态规划和计算机》
《博弈论和经济行为》
《战国策》 《孙子兵法》
古代产生了 朴素的博弈 论的思想
1944年美国 的J·冯诺意 曼和O·摩根 司坦发表了 巨著
美国的数学 家贝尔曼于 1951年又发 表了名著
发
1965年埃萨 克提出了在
展 中
追踪问题中
双方都能自
由决策行动
的微分对策
理论
博弈论的基本要素
• 构博弈论由三个基本 要素成: 局中人(如竞争的 双方); 策略(每个局中人 可供选择的行动方案; 一局对策的得失。
博弈论的基本模型
• 博弈论最基本的模型是两 人、零和对策。
• 每一个局中人,不管他选 择什么方案,另一局中人 总希望使对方损失最大化, 也就是每个局中人将选择 使另一局中人把对方损失 最大化的企图最小化的策 略,这就是博弈论的最佳 策略准则。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 在物理上要广泛一些,指 在一个方向是极大值,另 一个方向是极小值的点。
鞍点问题
• 在证券市场上,股民们总想 “在最小风险下获得最大收 益”。生产着总想“在最小 投入下获得最大产出”,都 是这一辨证思想的体现。将 这一思想用数学模型表述, 己不再是单纯的极大或极小 问题,而是“极大中的极小” 或“极小中的极大”。
纳什均衡点
• 纳什平衡,又称为非 合作赛局平衡,是博 弈论的一个重要概念, 以约翰·纳什命名。如 果某情况下无一参与 者可以独自行动而增 加收益,则此策略组 合被称为纳什均衡点。
经典案例:囚徒困境
• 一个案子的两个嫌疑 犯被分开审讯,警官 分别告诉两个囚犯, 如果你招供,而对方 不招供,则你将被立 即释放,而对方将被 判刑十年;如果两人 均招供• 所谓鞍点规划就是以寻 求目标函数的鞍点为目 的的一种数学规划,用 以解决“极大值的极小 化”或“极小值的极大 化”问题。
Z
鞍点
Y X
马鞍面z=x2/4-y2/6
鞍点规划的数学模型
• 鞍点规划的数学模型:
• 上述鞍点规划模型中,决策变量x,y没有加任何限制。实 际上,x,y经常受到一定的约束,于是有以下约束鞍点规 划问题:
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于“马 鞍中央的点”,从纵向看取极 小值,从横向看取极大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
博弈论
什么是博弈论
• 博弈论亦称对策论, 运筹学的一个分支。 是研究有利害冲突的 双方在竞争性活动中, 如何制胜对方的最优 策略的数学理论和方 法。
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我