松弛算法——精选推荐

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


学校代码: 10128 学 号:
本科毕业论文 题 目: 学生姓名: 所在学院: 学科专业: 指导教师: 二零一四年四月
用不精确线搜索求解广义Nash均衡问题的
松弛算法
摘要:
广义Nash均衡问题(GNEP)是标准Nash游戏的一个推广,在这个游戏当中,每一个参与者的效用功能和策略空间的选择都依赖于其余参与者所选择的策略。

广义Nash均衡问题解决起来是比较困难的,并且如今能解决该问题的方法仅有数的见的几个。

其中一个比较普及的方法是--松弛算法。

该法在一系列的假定条件下被认为是全局收敛的。

在本论文中将给出一种改进的松弛算法来解决某种确定类型的广义Nash均衡问题(GNEP)。

该改进的松弛算法的收敛性分析有着完全不同的观点并且也避免了一些原松弛算法的技术条件。

此外,大量的实验也表明了该改进了的松弛算法很好的与给出的实际例字相吻合。

关键词:广义Nash均衡问题、正则化Nash均衡、松弛算法、
正则化Nikaido-Isoda function、全局收敛
第1节
广义Nash均衡问题(GNEP)近来引起了人们很多的关注,它不同于Nash 均衡问题。

在广义Nash均衡问题中,每个参与者的策略空间已不单纯是一个与其他参与者的策略选择无关的集合,而是与其他参与者的策略选择有关。

在不同的事件中,一些种类的Nash问题一下子出现的非常频繁。

例如,某一地区的河流污染或空气污染依赖于该地区内几家公司的产量并且不被允许超过某一特定的限制量;还有,当几家公司不得不共用同一批电线或者世界上的公司不得不公用自然资源时,他们的能力就固定了;感兴趣的读者可以在文献[9]中找到相关的调查实验,也可找到关于解决GNEP的某些方法的存在性综述和一些理论的结果。

前面已经提到解决GNEP 的一个最普及的方法是--松弛算法,该法在文献[26]中可以找到,也可以在[19]中找到该算法的一个改进版本。

遗憾的是,没有一个Nash 问题的解决者已经广泛的试验了许多不同种类的问题。

松弛算法似乎是唯一的一个已经被在几个问题中运用,具体的内容可以在[1,2,5,6,14,18,19]中找到。

此外,关于松弛算法的保证收敛的条件有着严格的限制在[26,19]中。

然而,在文献[26]中给出的不精确步长规则对本文的松弛算法有着或多或少的启发和效果,但在[19]中给出的精确步长规则并没有起到效果,下面就给出更为详细的叙述。

本文的目的是要给出关于松弛算法的一个新的收敛理论,该理论在不精确步长情况下,考虑弱一点的假定条件,使用一个清晰的规则来证明出该理论可以提供出更好的结果。

具体的说,接下来将给出Nash 均衡和广义Nash 均衡问题的定义:这俩个问题中有N 个参与者,每个参与者},...,1{N v ∈都控制着一个变量v n v R x ∈.
令T N x x x ),...,(1=为N 个参与者决策变量组成的向量,其中N n n n ++=...:1. 为了强调第v 个参与者所控制的变量在矢量x 中,我们有时候记为T v v x x x ),(-=. 其中v x -表示包括除第v 个参与者之外所有其余参与者所控制的变量。

此外,对于Nash 问题和广义Nash 均衡问题,我们令R R n v →:θ来表示第v 个参与者的效用函数,有时也被称为赔偿函数或损失函数。

对于一个标准的Nash 问题,对于每一个参与者v 都有一个策略集合v n v R X ⊆然后我们就说n T N R x x x ∈=),...,(*,1*,*是一个Nash 问题或者说是Nash 问题的一个解,如果对于每一个v x *,是下述最优化问题的一个解。

v x
min ),(*,v v v x x -θ s.t. V v X x ∈ 则,*x 就是一个Nash 均衡点,在该点下没有任何一个人参与者能改进他的境况了。

另外的,在一个广义Nash 均衡问题中,对于所有的参与者也存在一个普遍的
策略空间n R X ⊆,并且矢量T N x x x ),...,(*,1*,*=被叫做是一个广义Nash 均衡或者是一个广义Nash 均衡问题的解,如果对于每一个v x *,是下述最优化问题的一个解。

v x
min ),(*,v v v x x -θ s.t. X x x v v ∈-),(*, 因此,如果X 是笛卡尔乘积N X X ⨯⨯...1,那么,GNEP 就可以归纳为一个NEP 标准,可是事实上,对于参与者v 所能选择的策略依赖于所有其余参与者的策略选择,从而使得该问题更复杂了。

我们也知道目前存在着更多的GNEP 的定义,同上面叙述的一样,每一个参与者所能选择的策略都依赖于所有其余参与者的策略选择,但是对于每个参与者的策略是不同的,这可以在文献[8,9]中看到更多关于该方面的信息。

在本篇论文中,我们主要使用的是先前叙述的关于GNEP 的定义。

纵观全篇论文,我们给出了以下的假设:
假设1.1
)(a 集合n R X ⊆是非空闭凸集。

)(b 效用函数v θ是连续,具有凸性的,且仅为v x 的函数。

这两个假设均是本文中GNEP 问题的标准前提。

然而,我们想要强调与其他相关论文中关于X 的限定条件相比条件a 是非常弱的,此外,还被假定为是紧密集。

特别地,该集合的紧密性假设也被应用在文献[26,19]中来论述解决松弛算法。

对于解决NEP 和GNEP 问题,一个重要的工具就是Nikaido-Isoda 函数,也被叫做Ky Fan-function ,即为),(y x ψ:∑=---=N v v v v v v v x y x x 1)],(),([θθ。

为了克服该函数的一些不足,我们使用了一个规范化的函数版本,该版本作为求解NEP 的工具第一次被在文献[13]中所涉及,后来也出现在文献[14,15]中用于进一步的研究GNEP 问题。

也可在文献[20]中看到一个相似的映射是关于均衡项目之类的问题的研究。

在这里,我们给定一个参数0>α,那么,规范化的Nikaido-Isoda 函数为 ),(y x αψ:2
12)],(),([y x y y x x N v v v v v v v --
-=∑=--αθθ (1)
根据这个规范化后的函数,我们很容易的可以看出,将假设1.1中的条件)(b 考虑进去,则映射,.)(x αψ是严格的凸集对于任意的x 和y ,(y 是x 的函数)。

因此,最大化问题
y
max ),(y x αψ..t s X y ∈)2( 有一个对于每一个x 都有对应的唯一的解)(x y ∂(注意:该结论对于规范化的Nikaido-Isoda 函数是不成立的),也就是:
),(max arg )(y x x y X
y ααψ∈=)3( 然后,与之相对应的函数值就被定义为:
)(x V α :))(,(x y x ααψ=)4(
一个矢量X x ∈*,若0)(*=x V α,则该矢量*x 就被称为一个正则化Nash 均衡解,也被叫做社会平衡或者变量均衡。

需要指出的是,我们的定义与先前所给出的文献[24]中的不同,但是与在文献[14]当中所给出的的关于正则化Nash 均衡解是等价的。

不难看出,每一个正则化Nash 均衡解都是GNEP 的一个解,反之则不然。

事实上,可以容易找到许多广义Nash 均衡问题的例子且这些GNEP 的解都只有一个正则化Nash 均衡解。

在文献[26,19]中所出现的松弛算法同本文中所提到的一样也找到了一个正则化Nash 均衡解和一个GNEP 的一个具体解。

该松弛算法本身使用了迭代式 k k k k d t x x +=+:1 ,k k k x x y d -=)(:α,,...2,1,0=k )5(
特别地,当参数0=α,则步长]1,0(∈k t 满足:0↓k t 且∞=∑∞
=0k k t 。

这些结论表明,对某一个实数0>γ,则k t k γ=。

然而事实上,该种方法的收敛速度是很慢的,所以为了提高松弛算法的收敛速度,也出现一些不同的启发性思想,如文献
[19,14].在文献[19]中,松弛算法的步长k t 的计算是由一个映射)(:)(k k k td x V t +=αϕ在区间[0,1]的精确最小值来决定的。

该方法显示了与前述松弛算法一样也具有全局收敛性在文献[26]所提到的同样的集合的前提假设条件下。

由于αV 是一个典型的非线性函数,所以由最小值k ϕ而得到k t 的计算就不是很容易了。

此外,它的计算也是费时的,因为要计算k ϕ就必须先对映射αV 在迭代点k k td x +进行估计。

当0=α时,迭代式)5(就是标准的松弛算法,在本文中我们也会讨论0>α的
情况。

在文献[26,19]中关于收敛性的结论对与上述两种求步长的方法也是成立的在所拟定的假设前提下。

在这里,我们将给出一个完全不同的收敛性分析,它是由最优化问题的标准下降法而推到出来的,该最优化问题是使用了一个不精确线搜索方法来计算需要满足相关条件的k t 。

我们如下安排本文结构:
在第2节中,我们首先回顾一些正则化Nikaido-Isoda 函数的一些性质并给出它的一些新性质。

在第3节中给出了本文将用到的主要假设条件以及一些能使这些假设成立的充分条件。

在第4节中给出了严格的松弛算法的描述,并且证
明了该算法是定义好的并且根据第2节所给的假设条件下该算法全局收敛于正则化Nash 均衡解。

关于该算法的收敛性分析是基于映射函数的连续可微性,然而该算法本身在理论上是不需要求导的。

因此,在第5节中我们给出了该算法的另一个收敛性分析,在分析中未用到光滑性和可微性的假定,但是,该算法仅是基于是凸性的假定,该假定比第四节中所用的条件强的多。

最后,在第6节中, 将所得松弛算法要应用到各种各样不同的例子中来验证。

本文中的所用到符号大都是标准的,所以在这里陈述很少的几个:方阵A 是正定的如果对于所有的0≠x 满足0>Ax x T 。

需要注意的是这里我们不要求A 是对称的。

此外,)(x f ∂是函数f 在给定点x 的次微分,对于它的定义和一些性质可在文献中[16,23]中看到。

第2节 正则化的Nikaido-Isoda 函数的性质
αααφV y ,,如上面)4(),3(),1(式所示,这些映射有着许多重要的性质,现总结如下(性质的证明过程可以参考文献[14]).
命题2.1 下列陈述所满足的条件:
)(a 0)(≥x V α对于任意地X x ∈.
)(b 若X x ∈*满足0)(*=x V α*x ⇔是一个正则化广义Nash 均衡点.
)(c *x 是映射)(x y x α 中的一个固定的点⇔*x 是一个正则化广义Nash 均衡 点.
)(d 映射)(x y x α 是连续的.
)(e 若所有的v θ函数连续可导,则函数αV 连续可导,它的梯度为)(|),()(x y y x y x x V αααφ=∇=∇.
注意:对于连续可导的效用函数v θ,命题)(e 也陈述了映射))(,()(x y x x V αααφ=是连续可导的.然而,这并不是说任何关于αy 的梯度都存在,事实上,也可能是不可导的.
命题2.1表明*x 是一个正则Nash 均衡点当且仅当它是一个全局最小量,它所满足的最小化约束问题是
min )(x V αt s .X x ∈)6(
且优化函数的值0)(*=x V α.我们改进后的松弛算法的基本思想就是解决这个最小化问题通过一个合适的可行下降法.
参考文献:
[1] E. ADIDA AND G . PERAKIS: Dynamic pricing and inventory control: Uncertaintyand competition. Part A: Existence of Nash equilibrium. Operations Research, submitted.
[2] E. ADIDA and G . PERAKIS: Dynamic pricing and inventory control: Uncertaintyand competition. Part B: An algorithm for the normalized Nash equilibrium. Operations Research, submitted.
[3] J.-P. AUBIN Optima and Equilibria. An Introduction to Nonlinear Analysis. Springer, Berlin, second edition 1998.
[4] T. Bas¸ar and G .J. OLSDER: Dynamic Noncooperative Game Theory . AcademicPress, New Y ork, second edition 1995 (reprinted by SIAM, Philadelphia,
1999).
[5] S. BERRIDGE and J.B. KRAWCZYK: Relaxation algorithms infinding Nash equilibria. Economic working papers archives, 1997,
/eprints/comp/papers/9707/9707002.abs
[6] J. Contreras, M. KLUSCH, and J.B. KRAWCZYK: Numerical solutions to NashCournot Equilibria in coupled constraint electricity markets. IEEE Transactions on
Power Systems 19, 2004, pp. 195–206.
[7] E. van Damme: Stability and Perfection of Nash Equilibria. Springer, Berlin, Germany, second edition 1996.
[8] F. FACCHINEI A. Fischer, and V. PICCIALLI: Generalized Nash equilibrium problems and Newton methods. Mathematical Programming, to appear.
[9] F. FACCHINEI and C. KANZOW: Generalized Nash equilibrium problems. 4OR – AQuarterly Journal of Operations Research 5, 2007, pp. 173–210.
[10] S.D. Fl ˚ am and A. R USZCZY´NSKI: Noncooperative convex games: Computing equilibria by partial regularization. IIASA Working Paper 94-42, Laxenburg, Austria, May1994.
[11] F.FORG´O,J.SZ´EP,andF.SZIDAROVSZKY: Introduction to the Theory of Games.Concepts, Methods, Applications. KLUWER Academic Publishers, Dordrecht, Netherlands, 1999.
[12] D.FUDENBERG and J.TIROLE: Game Theory. MIT Press, Cambridge, MA, 1991.
[13] G. G¨ URKAN and J.-S. Pang: Approximations of Nash equilibria. Mathematical Programming, to appear.
[14] A. von HEUSINGER andC.KANZOW:Optimization reformulations of the generalizedNashequilibrium problem using Nikaido-Isoda-type functions. ComputationalOptimization and Applications, to appear.
[15] A. von HEUSINGER and C. KANZOW: SC1optimization reformulations of the generalized Nash equilibrium problem. Technical Report,Universityof W¨URZBURG,W¨URZBURG, Germany, May 2007 (revised January 2008).
[16] J.-B. HIRIART-URRUTY andC.LEMAR´ECHAL:ConvexAnalysisand
MinimizationAlgorithms I. Springer, Berlin, Germany, 1993.
[17] A.KESSELMAN,S.LEONARDI,andV.BONOFACI: Game-theoretic analysis of internet switching with selfish users. Lecture Notes in Computer Science 3828, 2005, pp.236–245.
[18] J.B.KRAWCZYK:Coupledconstraint Nash equilibria in environmental games. Resource and Energy Economics 27, 2005, pp. 157–181.
[19] J.B.KRAWCZYK andS.URYASEW:Relaxationalgorithms to find Nash equilibriawith economic applications. Environmental Modeling and Assessment 5, 2000, pp.63–73.
[20] G. MASTROENI:Gap functions for equilibriumproblems.Journal of Global Optimization 27, 2003, pp. 411–426.
[21] R.B.MYERSON:Game Theory. Analysis of Conflict. Harvard University Press, Cambridge, MA, 1991.
[22] J.OUTRA TA,M.KOCV ARA and J.ZOWE NONSMOOTH Approach to Optimization Problems with Equilibrium Constraints.K LUWER Academic Publishers, Dordrecht,Netherlands, 1998.
[23] R.T.R0CKAFELLAR:Convex Analysis. Princeton University Press, Princeton, NJ,1970.
[24] J.B.ROSEN:Existence and uniqueness of equilibrium points for concave N -persongames. Econometrica 33, 1965, pp. 520–534.
[25] K.TAJI,M.FUKUSHIMA,andT.IBARAKI:Aglobally convergent Newton methodfor solvingstrongly monotone variational inequalities. Mathematical Programming 58,1993, pp. 369–383.
[26] S. UIY ASEV and R.Y. Rubinstein: On relaxation algorithms in computation ofnoncooperative equilibria. IEEE Transactions on Automatic Control 39, 1994, pp.1263–1267.。

相关文档
最新文档