lecture_足球射门2015
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i =1
2
2
} }
a*=(a1*, a2*)
* * * u 2 ( a1 , a2 ) ≥ u 2 (a1 , a2 ), ∀a2 ∈ {L, R}.
| 0 ≤ qi ≤ 1, ∑ qi = 1
i =1
2 2 2 i =1 j =1
不存在(纯)NE 如果(完全虚拟的Payoff矩阵) 0.58 0.65 (纯)NE: a =(a , a M ' = {m } = 0.93 0.70
p∈S1
*
1
*
* 2 )
=(R, R)
min pMq
q∈S 2
T
完全信息 静态博弈 有限博弈 矩阵博弈 (2人) 零和博弈 常数和博弈
模型求解
max pMq T min pMqT
p∈S1
q∈S 2
0.58 0.95 y pMqT = ( x,1 − x) p1=x, q1=y 0.93 0.70 1 − y = 0.58 xy + 0.95 x(1 − y ) + 0.93(1 − x ) y + 0.70(1 − x)(1 − y )
点球大战( 点球大战(Penalty kicks in soccer)
•
•
统计(基于重大比 向左 向右 赛中的459次实际 罚球队员 40% 60% 罚球的数据): 守门员 42% 58% 为什么不是50%? 进球概率是完全对称的吗? 进球概率是完全对称的吗? 有无关系? 有无关系? 需要收集实际数据( 需要收集实际数据(可能因人而异) 可能因人而异) 守门员 扑向 扑向 统计(基于重大比 左侧 右侧 赛中的约1400次实 罚球队员 罚球队员 际罚球的数据) 踢向左侧 0.58 0.95 踢向右侧 0.93 0.70
max pMq T min pMqT
p∈S1
q∈S 2
模型求解
T
1
2
T
2
2015/11/26
模型求解
•
max pMq T min pMqT
p∈S1
q∈S 2
罚方
另一种解法
z
max U1(p) = min pM = ( x,1 − x) 0.93
max z z ≤ 0.58 x + 0.93(1 − x) z ≤ 0.95 x + 0.70(1 − x)
1 * 1 * 2 1 1 * 2 1
混合战略/策略: 策略:Mixed Strategy)
罚球队员的混合战略 罚球队员的混合战略集 混合战略集 守门员的混合战略 守门员的混合战略集 混合战略集 期望收益 罚方 •守方
• S2={ q=(q1, q2)
2
S1={p=(p1, p2) |
0 ≤ pi ≤ 1, ∑ pi = 1
模型假设
ቤተ መጻሕፍቲ ባይዱ
博弈参与者集合N={1,2}(1为罚球队员, 为罚球队员,2为守门员) ∈ • 罚球队员行动a A ={L,R}={1,2}; (1==L; 2==R) 守门员行动a ∈A ={1,2}。 (行动: 行动:即纯战略/策略) • 用u (a ,a )表示对罚球队员产生的结果, 表示对罚球队员产生的结果,即进球概 率,称为罚球队员的效用函数 称为罚球队员的效用函数( 效用函数(相当于目标函数) 相当于目标函数). 0.58 0.95 支付矩阵 M = {m } = (Payoff Matrix) 0 . 93 0 . 70 u (a ,a )对应 -M 完全信息、 完全信息、静态博弈: 零和博弈 (常数和博弈的特例)
M = {mij }2×2 0.58 0.95 = 0.93 0.70
ij 2×2
U1 ( p, q ) = ∑∑ mij ( pi q j ) = ∑∑ pi mij q j = pMqT
i =1 j =1
U 2 ( p, q) = −U1 ( p, q)
max pMqT
0.58 0.95 0.70
= (0.58 x + 0.93(1 − x ),0.95 x + 0.70(1 − x ))
守方 min U (q) = max 类似 线性规划求解 p =.383, p =.617 q =.417, q =.583 (p , q ): 混合(策略)纳什均衡(Mixed NE) 最优值为.796
考虑“ 考虑“点球大战” 点球大战”情形
•
考虑哪些影响进球因素? 考虑哪些影响进球因素? • 关键决策 – 罚球方: 罚球方:哪个方向踢? 哪个方向踢? – 防守方: 防守方:选哪个位置? 选哪个位置? • 方向、 方向、位置 – 三维? 三维? – 二维? – 一维? 一维? – 离散(有限个)?
模型检验
*
*
模型推广( 模型推广(略)
• • • ……
小结: 小结:博弈模型的基本要素
• • •
考虑左、 考虑左、中、右 考虑连续位置 参考文献:
• Chiappori, P., Levitt, S., & Groseclose, T. (2002). Testing mixed-strategy equilibria when players are heterogeneous: The case of penalty kicks in soccer. American Economic Review, 92, 1138-1151.
进攻队员: 队员:选择射门方向( 选择射门方向(远角?近角?) 守 门 员:如何选择防守位置(远门柱,近门柱)?
序贯决策
3
2015/11/26
Assumptions: Shot Accuracy
• (4) The outcome of the shot is stochastic. Specifically, we assume that a shot aimed at the near post follows its intended trajectory with probability n ∈ ( 0,1) , whereas a shot aimed at the far post reaches its intended target with probability f ∈ ( 0,1) • n & f : The accuracy of a shot, along the intended trajectory, obviously depends on the skills of the striker. It also depends on the field position from which it is taken (angle of the striker’s position relative to the goal, as well as distance from the goal).
问题: 问题:只考虑一维、 只考虑一维、离散情形( 离散情形(左右) 左右) • 罚球队员应该完全随机地把球踢向左侧或右侧? 罚球队员应该完全随机地把球踢向左侧或右侧? • 守门员也应该完全随机地向左或向右扑球? 守门员也应该完全随机地向左或向右扑球? • 若不是, 不是,最佳的射门方向和扑球方向应该 最佳的射门方向和扑球方向应该如何 应该如何? 如何? 向左右射门、 向左右射门、扑救的习惯( 扑救的习惯(概率)? 概率)? 需要收集实际数据( 需要收集实际数据(可能因人而异) 可能因人而异)
2015/11/26
数学模型引论
足球射门的数学模型
Tel: 010-62787812 Email: jxie@ /~jxie
谢金星 清华大学数学科学系
•
目标: 目标:进球( 进球(概率) 概率) – 防守方: 防守方:最小化 – 罚球方: 罚球方:最大化
点球大战( 点球大战(Penalty kicks in soccer)
假设1: (连续决策空间的离散化、 连续决策空间的离散化、二值化) 二值化) 仅考虑每一方都有“ 仅考虑每一方都有“左”、“右”两种选择 (不考虑连续位置 不考虑连续位置, 连续位置,且不考虑罚球 且不考虑罚球队员把球踢向中 罚球队员把球踢向中 路而守门员停留在球门中间位置不动 路而守门员停留在球门中间位置不动) • 假设2: (同时决策和行动) 同时决策和行动) 罚球队员、 罚球队员、守门员同时决策 守门员同时决策( 同时决策(没有时间在对方行动 后再反应) 后再反应)
•
模型假设
1
2015/11/26
∈
•
•
假设3: (进球概率----经验概率) 经验概率) 实证数据( 实证数据(实战中大约1400次罚球的统计分析) 次罚球的统计分析) 守门员 扑向左侧 扑向右侧 罚球队员 罚球队员 0.58 0.95 踢向左侧 0.93 0.70 踢向右侧 (如果左右无差异, 如果左右无差异,无理由不完全随机决策) 无理由不完全随机决策) 假设4:双方完全理性、 双方完全理性、拥有相同信息(共同知识)
0.58 0.95 M = 0.93 0.70
可分别令导数为0(或线性函数性质) 或线性函数性质)求解 •罚方 0.58 y + 0.95(1 − y ) = 0.93 y + 0.70(1 − y ) •守方 0.58 x + 0.93(1 − x) = 0.95 x + 0.70(1 − x) q =.417, q =.583 p =.383, p =.617 即 最优值均为.796 (p , q ): 混合(策略)纳什均衡(Mixed NE)
•
关键决策
– –
非点球情形: 非点球情形:Live play in soccer
Basic Assumptions
• (1) When the opportunity arises for a player (the striker) to take a shot at the opponent’s goal from an off-center position, he has two actions available: he can choose to shoot to the near post (N) or to shoot to the far post (F). • (2) The goalkeeper chooses a position p ∈ [ 0,1] where p measures the distance from the far post. • (3) The game is best viewed as sequential. The goalkeeper selects his position p prior to the shot, and the striker chooses the direction of the shot (either N or F) having observed p. ( )
•
1 1 2 2 1 1 2
ij 2× 2
博弈模型
2
1
2
博弈的解的概念 博弈的解的概念: 的概念:纳什均衡 (NE: Nash Equilibrium) Nash: 1994年获诺贝尔经济学奖 NE: 单向改变战略不能提高自己效用, 单向改变战略不能提高自己效用,即每一方的战略 对于他方的战略而言都是最优的(称为最优反应 称为最优反应). u (a , a ) ≥ u ( a , a ), ∀a ∈ {L, R}, (纯战略)纳什均衡
1 * 2 * 1 * * 2 * *
y=.417 x=.383
另一种解法 理性推理: 理性推理:(二人零和博弈, 二人零和博弈,完全竞争) 完全竞争)不管自己 怎么做, 怎么做,另一方总是希望尽量使自己得分尽量低. 从一个给定的战略中期望得到的赢得, 从一个给定的战略中期望得到的赢得,总是 采用该策略时他们可能得到的最坏的赢得! 采用该策略时他们可能得到的最坏的赢得! 罚方可以用min pM来衡量策略p的好坏 守方可以用max Mq 来衡量策略q的好坏 •罚方 max U (p) = min pM 可用线性规划求解 •守方 min U (q) = max Mq
•
2
0 ≤ x ≤1
0
1
x
MqT
1
*
* 2
* 1
2
*
• 按照纳什均衡解的要求, 纳什均衡解的要求,罚球队员应该以38.3%的概率 向左侧踢球, ,61.7%的概率向右侧踢球, 向左侧踢球 的概率向右侧踢球,而守门员以 41.7%的概率向左侧扑球, 的概率向左侧扑球,58.3%的概率向右侧扑球 • 有人收集了459次实际罚球的数据, 次实际罚球的数据,统计分析发现罚 球队员大约以40%的概率向左侧踢球, 的概率向左侧踢球,60%的概率向 右侧踢球, 右侧踢球,而守门员以42%的概率向左侧扑球, 的概率向左侧扑球,58% 的概率向右侧扑球 • 博弈论模型的结果是实际罚球的一个很接近的近似
参与人 行动空间( 行动空间(战略/策略空间) 策略空间) 效用函数 理性假设 参与者完全理性(最大化效用) 纳什均衡 单向改变战略不能提高自己效用 其他因素 • 多人(或非常数和)博弈问题, 博弈问题,一般不能用上面的线 性规划方法求解, 求解,而通过纳什均衡的定义求解 • 信息结构(完全/不完全); 行动顺序(静态/动态): 需要相应地修改均衡的定义
2
2
} }
a*=(a1*, a2*)
* * * u 2 ( a1 , a2 ) ≥ u 2 (a1 , a2 ), ∀a2 ∈ {L, R}.
| 0 ≤ qi ≤ 1, ∑ qi = 1
i =1
2 2 2 i =1 j =1
不存在(纯)NE 如果(完全虚拟的Payoff矩阵) 0.58 0.65 (纯)NE: a =(a , a M ' = {m } = 0.93 0.70
p∈S1
*
1
*
* 2 )
=(R, R)
min pMq
q∈S 2
T
完全信息 静态博弈 有限博弈 矩阵博弈 (2人) 零和博弈 常数和博弈
模型求解
max pMq T min pMqT
p∈S1
q∈S 2
0.58 0.95 y pMqT = ( x,1 − x) p1=x, q1=y 0.93 0.70 1 − y = 0.58 xy + 0.95 x(1 − y ) + 0.93(1 − x ) y + 0.70(1 − x)(1 − y )
点球大战( 点球大战(Penalty kicks in soccer)
•
•
统计(基于重大比 向左 向右 赛中的459次实际 罚球队员 40% 60% 罚球的数据): 守门员 42% 58% 为什么不是50%? 进球概率是完全对称的吗? 进球概率是完全对称的吗? 有无关系? 有无关系? 需要收集实际数据( 需要收集实际数据(可能因人而异) 可能因人而异) 守门员 扑向 扑向 统计(基于重大比 左侧 右侧 赛中的约1400次实 罚球队员 罚球队员 际罚球的数据) 踢向左侧 0.58 0.95 踢向右侧 0.93 0.70
max pMq T min pMqT
p∈S1
q∈S 2
模型求解
T
1
2
T
2
2015/11/26
模型求解
•
max pMq T min pMqT
p∈S1
q∈S 2
罚方
另一种解法
z
max U1(p) = min pM = ( x,1 − x) 0.93
max z z ≤ 0.58 x + 0.93(1 − x) z ≤ 0.95 x + 0.70(1 − x)
1 * 1 * 2 1 1 * 2 1
混合战略/策略: 策略:Mixed Strategy)
罚球队员的混合战略 罚球队员的混合战略集 混合战略集 守门员的混合战略 守门员的混合战略集 混合战略集 期望收益 罚方 •守方
• S2={ q=(q1, q2)
2
S1={p=(p1, p2) |
0 ≤ pi ≤ 1, ∑ pi = 1
模型假设
ቤተ መጻሕፍቲ ባይዱ
博弈参与者集合N={1,2}(1为罚球队员, 为罚球队员,2为守门员) ∈ • 罚球队员行动a A ={L,R}={1,2}; (1==L; 2==R) 守门员行动a ∈A ={1,2}。 (行动: 行动:即纯战略/策略) • 用u (a ,a )表示对罚球队员产生的结果, 表示对罚球队员产生的结果,即进球概 率,称为罚球队员的效用函数 称为罚球队员的效用函数( 效用函数(相当于目标函数) 相当于目标函数). 0.58 0.95 支付矩阵 M = {m } = (Payoff Matrix) 0 . 93 0 . 70 u (a ,a )对应 -M 完全信息、 完全信息、静态博弈: 零和博弈 (常数和博弈的特例)
M = {mij }2×2 0.58 0.95 = 0.93 0.70
ij 2×2
U1 ( p, q ) = ∑∑ mij ( pi q j ) = ∑∑ pi mij q j = pMqT
i =1 j =1
U 2 ( p, q) = −U1 ( p, q)
max pMqT
0.58 0.95 0.70
= (0.58 x + 0.93(1 − x ),0.95 x + 0.70(1 − x ))
守方 min U (q) = max 类似 线性规划求解 p =.383, p =.617 q =.417, q =.583 (p , q ): 混合(策略)纳什均衡(Mixed NE) 最优值为.796
考虑“ 考虑“点球大战” 点球大战”情形
•
考虑哪些影响进球因素? 考虑哪些影响进球因素? • 关键决策 – 罚球方: 罚球方:哪个方向踢? 哪个方向踢? – 防守方: 防守方:选哪个位置? 选哪个位置? • 方向、 方向、位置 – 三维? 三维? – 二维? – 一维? 一维? – 离散(有限个)?
模型检验
*
*
模型推广( 模型推广(略)
• • • ……
小结: 小结:博弈模型的基本要素
• • •
考虑左、 考虑左、中、右 考虑连续位置 参考文献:
• Chiappori, P., Levitt, S., & Groseclose, T. (2002). Testing mixed-strategy equilibria when players are heterogeneous: The case of penalty kicks in soccer. American Economic Review, 92, 1138-1151.
进攻队员: 队员:选择射门方向( 选择射门方向(远角?近角?) 守 门 员:如何选择防守位置(远门柱,近门柱)?
序贯决策
3
2015/11/26
Assumptions: Shot Accuracy
• (4) The outcome of the shot is stochastic. Specifically, we assume that a shot aimed at the near post follows its intended trajectory with probability n ∈ ( 0,1) , whereas a shot aimed at the far post reaches its intended target with probability f ∈ ( 0,1) • n & f : The accuracy of a shot, along the intended trajectory, obviously depends on the skills of the striker. It also depends on the field position from which it is taken (angle of the striker’s position relative to the goal, as well as distance from the goal).
问题: 问题:只考虑一维、 只考虑一维、离散情形( 离散情形(左右) 左右) • 罚球队员应该完全随机地把球踢向左侧或右侧? 罚球队员应该完全随机地把球踢向左侧或右侧? • 守门员也应该完全随机地向左或向右扑球? 守门员也应该完全随机地向左或向右扑球? • 若不是, 不是,最佳的射门方向和扑球方向应该 最佳的射门方向和扑球方向应该如何 应该如何? 如何? 向左右射门、 向左右射门、扑救的习惯( 扑救的习惯(概率)? 概率)? 需要收集实际数据( 需要收集实际数据(可能因人而异) 可能因人而异)
2015/11/26
数学模型引论
足球射门的数学模型
Tel: 010-62787812 Email: jxie@ /~jxie
谢金星 清华大学数学科学系
•
目标: 目标:进球( 进球(概率) 概率) – 防守方: 防守方:最小化 – 罚球方: 罚球方:最大化
点球大战( 点球大战(Penalty kicks in soccer)
假设1: (连续决策空间的离散化、 连续决策空间的离散化、二值化) 二值化) 仅考虑每一方都有“ 仅考虑每一方都有“左”、“右”两种选择 (不考虑连续位置 不考虑连续位置, 连续位置,且不考虑罚球 且不考虑罚球队员把球踢向中 罚球队员把球踢向中 路而守门员停留在球门中间位置不动 路而守门员停留在球门中间位置不动) • 假设2: (同时决策和行动) 同时决策和行动) 罚球队员、 罚球队员、守门员同时决策 守门员同时决策( 同时决策(没有时间在对方行动 后再反应) 后再反应)
•
模型假设
1
2015/11/26
∈
•
•
假设3: (进球概率----经验概率) 经验概率) 实证数据( 实证数据(实战中大约1400次罚球的统计分析) 次罚球的统计分析) 守门员 扑向左侧 扑向右侧 罚球队员 罚球队员 0.58 0.95 踢向左侧 0.93 0.70 踢向右侧 (如果左右无差异, 如果左右无差异,无理由不完全随机决策) 无理由不完全随机决策) 假设4:双方完全理性、 双方完全理性、拥有相同信息(共同知识)
0.58 0.95 M = 0.93 0.70
可分别令导数为0(或线性函数性质) 或线性函数性质)求解 •罚方 0.58 y + 0.95(1 − y ) = 0.93 y + 0.70(1 − y ) •守方 0.58 x + 0.93(1 − x) = 0.95 x + 0.70(1 − x) q =.417, q =.583 p =.383, p =.617 即 最优值均为.796 (p , q ): 混合(策略)纳什均衡(Mixed NE)
•
关键决策
– –
非点球情形: 非点球情形:Live play in soccer
Basic Assumptions
• (1) When the opportunity arises for a player (the striker) to take a shot at the opponent’s goal from an off-center position, he has two actions available: he can choose to shoot to the near post (N) or to shoot to the far post (F). • (2) The goalkeeper chooses a position p ∈ [ 0,1] where p measures the distance from the far post. • (3) The game is best viewed as sequential. The goalkeeper selects his position p prior to the shot, and the striker chooses the direction of the shot (either N or F) having observed p. ( )
•
1 1 2 2 1 1 2
ij 2× 2
博弈模型
2
1
2
博弈的解的概念 博弈的解的概念: 的概念:纳什均衡 (NE: Nash Equilibrium) Nash: 1994年获诺贝尔经济学奖 NE: 单向改变战略不能提高自己效用, 单向改变战略不能提高自己效用,即每一方的战略 对于他方的战略而言都是最优的(称为最优反应 称为最优反应). u (a , a ) ≥ u ( a , a ), ∀a ∈ {L, R}, (纯战略)纳什均衡
1 * 2 * 1 * * 2 * *
y=.417 x=.383
另一种解法 理性推理: 理性推理:(二人零和博弈, 二人零和博弈,完全竞争) 完全竞争)不管自己 怎么做, 怎么做,另一方总是希望尽量使自己得分尽量低. 从一个给定的战略中期望得到的赢得, 从一个给定的战略中期望得到的赢得,总是 采用该策略时他们可能得到的最坏的赢得! 采用该策略时他们可能得到的最坏的赢得! 罚方可以用min pM来衡量策略p的好坏 守方可以用max Mq 来衡量策略q的好坏 •罚方 max U (p) = min pM 可用线性规划求解 •守方 min U (q) = max Mq
•
2
0 ≤ x ≤1
0
1
x
MqT
1
*
* 2
* 1
2
*
• 按照纳什均衡解的要求, 纳什均衡解的要求,罚球队员应该以38.3%的概率 向左侧踢球, ,61.7%的概率向右侧踢球, 向左侧踢球 的概率向右侧踢球,而守门员以 41.7%的概率向左侧扑球, 的概率向左侧扑球,58.3%的概率向右侧扑球 • 有人收集了459次实际罚球的数据, 次实际罚球的数据,统计分析发现罚 球队员大约以40%的概率向左侧踢球, 的概率向左侧踢球,60%的概率向 右侧踢球, 右侧踢球,而守门员以42%的概率向左侧扑球, 的概率向左侧扑球,58% 的概率向右侧扑球 • 博弈论模型的结果是实际罚球的一个很接近的近似
参与人 行动空间( 行动空间(战略/策略空间) 策略空间) 效用函数 理性假设 参与者完全理性(最大化效用) 纳什均衡 单向改变战略不能提高自己效用 其他因素 • 多人(或非常数和)博弈问题, 博弈问题,一般不能用上面的线 性规划方法求解, 求解,而通过纳什均衡的定义求解 • 信息结构(完全/不完全); 行动顺序(静态/动态): 需要相应地修改均衡的定义