博弈论在公安领域的应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论在公安研究领域的应用
博弈论（Game Theory）是一种游戏的理论，又叫对策论，是以数学为基础，研究决策主体行为发生相互作用时的决策以及这种决策的均衡问题的一门学科。

博弈是指一些个人、团队或其他组织，面对一定的环境条件，在一定的约束条件下，依靠所掌握的信息，同时或先后，一次或多次，从各自可能的行为或策略集合中进行选择并实施，各自从中取得相应结果或收益。

博弈论的基本概念包括参与人、策略、行为、信息、次序、收益、结果和均衡。

博弈的分类可以从参与人行为的次序和参与人对其他参与人的特征、策略空间和支付的知识、信息是否了解两个角度进行。

从不同的角度，博弈有不同的分类。

1. 按照参与人的先后顺序、博弈持续的时间和重复的次数，博弈分为静态博弈和动态博弈。

2. 按照参与人对其他参与人所掌握的信息完全与完备程度，博弈可以分为完全信息博弈与不完全信息博弈，完美信息博弈与不完美信息博弈等。

3. 按照参与人之间是否存在合作，博弈可以分为合作博弈和非合作博弈，合作博弈强调的是集体主义、团体理性，是效率、公平、公正；非合作博弈则强调个人理性和个人最优决策。

现代博弈论研究的重点为非合作博弈。

4. 按照参与人支付的情况，博弈可以分为零和博弈（下棋、打兵乓球）和非零和博弈（囚徒困境）。

博弈论作为一门学科，是在20世纪50—60年代发展起来的，到20世纪70年代，博弈论正式成为主流经济学研究的主要方法之一。

近年来，博弈论的理论与应用迅速发展，在生物学、管理学、国际关系、计算机科学、政治学、军事战略及其他很多学科都有广泛的应用，也已经成为社会科学研究的一个重要的方法。

有人说，如果未来社会还有纯理论的话，那就是博弈论。

博弈论也为公安领域的许多问题的研究和解决提供了方法论的指导，并进一步拓宽了公安研究的领域。

一、博弈论与囚徒困境
囚徒困境模型是非合作博弈的经典模型，它精辟地诠释了一种广泛的决策是如何在相互独立的个体之间达成的。

仅从语义字面理解，囚徒困境是与侦查审讯关联最密切的博弈模型。

1.囚徒困境模型定义。

一位富翁在家中被杀，财物被盗。

警方在侦破过程中抓到两个犯罪嫌疑人(简设为A和B)，但他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。

于是警方将两人隔离审讯，说：“你们的偷盗罪确凿，所以可以判你们1年刑期。

但是，我可以和你做个交易。

如果你单独坦白杀人的罪行，我只判你3个月的监禁，但你的同伙要被判10年刑。

如果你拒不坦白，而被同伙检举，那么你就将被判10年刑，他只判3个月的监禁。

但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。

”
用一个支付矩阵来表示囚徒困境:
囚徒A
囚徒 B
坦白不坦白坦白
不坦白
在这个矩阵中，囚徒A、囚徒B是博弈的参与人，判刑多少即二人的支付(收益)，坦白与否与判刑的关系是博弈的战略规则，博弈将达到怎样的均衡是分析的结果。

一个貌似合理的结果是二人均不坦白,各判刑一年。

但博弈分析给出了的结果是:坦白—坦白。

这是因为给定A的任何一个战略，B的最优战略是坦白；同理给定B的任何一个战略，A的最优战略也是坦白。

于是“坦白-坦白”成为博弈的结果，A和B各判刑5年，这在博弈论中称为纳什均衡(非合作均衡)。

它反映了个人理性与集体理性的悖反,但对于侦查讯问则是可供利用的武器。

2．囚徒困境与侦查讯问的类比。

囚徒困境表面上是纯粹犯罪嫌疑人之间的博弈，不涉及侦查员的权威干涉。

但通过对博弈论研究范式的分解，可以看到在侦查讯问中，侦查员和嫌疑人之间也存在激烈冲突的利益,双方有不同的行为抉择；各自的最后决策都依赖于对方的行为和理性假设。

而且即使犯罪嫌疑人之间的单纯博弈，也需要外在权力维持或促成博弈环境，需要侦查员公布博弈规则。

在侦查讯问中，事实上存在侦查员与嫌疑人、嫌疑人与嫌疑人之间的双重博弈，贯彻其间的是各自对预期利益的判断，博弈规则总是自觉或不自觉地适用于讯问对抗。

囚徒困境为一两人博弈，对于只有一个嫌疑人、多人犯罪、团伙犯罪、有组织犯罪的案件，博弈分析仍然可以适用于侦查讯问，只不过模型中需要考虑的参量繁简有异。

二、博弈论与社会治安预防
公安部门、人民群众与犯罪分子三者之间即为三方博弈的过程。

根据公安学理论可知，公安部门即为公安主体，犯罪分子为公安第一客体，人民群众为公安第二客体，在这个博弈
中，公安主体与公安第二客体进行合作博弈.然后完成与第一客体的非合作博弈。

1. 公安主体I与公安第二客体K之间的博弈
在公安主体I与公安第二客体K之间的合作博弈中，K有积极的和消极的两种策略:积极的方式为“专群结合”；消极的方式为“配合不力”。

具体如图一所示。

图一公安主体I与公安第二客体K合作博弈过程图
在执法中如何调动群众积极性的问题，是社会治安防范的重要问题。

进一步增强人民群众对公安工作的信心，这对打黑除恶具有非常重要的作用。

2. 公安主体I与公安第一客体J之间的博弈
公安主体I与公安第一客体J之间为非合作博弈，而所得到的该博弈的纳什均衡，是不实施，不打击。

那么，占据主动地位的I和占据被动地位的J如何完成这一博弈呢?具体过程如图二所示。

图二公安主体I与公安第一客体J之间的非合作博弈过程图在这个博弈过程，治安规定及处罚措施是在对犯罪分子的犯罪行为实施打击或预防的过程中逐步完善的。

只有根据实际的情况不断调整规定及出台新的法律规定，才能有效防范犯
罪行为的发生，减少案件的发生率，促进社会治安的稳定。

基于以上各方之间的博弈过程的分析，可以预测和解释博弈双方在各阶段可能的策略选择、以及选择策略的原因，从而可以很好地从理性模型的深度，分析治安部门、罪犯和群众之间的对抗和合作行为。

在众多的社会治安防范现代化工具当中，博弈论非常值得治安管理部门深入研究并广泛应用。

三、博弈论与职务犯罪预防
在警察权委托代理机制的条件下,警察腐败行为发生在寻租人—警察—委托人三方的博弈行为之间，而委托人行使职权则是间接依赖于警务督察部门。

分别建立寻租人—警察博弈模型和警察—督察部门博弈模型进行讨论。

1. 寻租人—警察博弈模型
寻租人的策略空间={行贿;不行贿},警察的策略空间={腐败;廉洁}。

假定寻租人依照正常的事情办理程序即不行贿时，所能获得利益为1a ，采用行贿手段所获得的利益为2a ，行贿额度为1c ，显然211a c a ->，这是行贿行为发生的必要条件。

再假定按现行法律规定,受贿行为一旦被发现，处罚额一般为采用两种不同手段所获得利益差额的e 倍，这里0e >。

警察的正常收益为其工资与福利待遇之和w ，同时因为选择廉洁而在精神道德上获得满足1m ，在警察接受行贿时在道德上的付出代价2m ，如果行贿行为被发现，警察要被处以罚款f ，这里1f c >，且满足112c m m >+。

受贿行为未被发现时其博弈矩阵为：
寻租人
警察
腐败廉洁行贿
不行贿
受贿行为被发现时其博弈矩阵为：
寻租人
警察
腐败廉洁行贿
不行贿
由上可知，在行贿—受贿行为不容易被发现时，寻租人的策略是大肆行贿,警察的策略是腐败；在行贿—受贿行为容易被发现时，寻租人的策略是不行贿，警察的策略是廉洁。

假定委托方通过督察部门发现行贿—腐败行为的概率为p ，警察腐败的概率为q 。

则寻租人采用行贿策略的期望支付为: 1212121[()](1)()
E p a c e a a p a c =---+-- 212121()(1)()a c pe a c pe a c =---=--
寻租人采用不行贿策略的期望支付为:21E a =
由此可知，只有12E E >时，行贿的腐败活动才能发生，即21121()
a c a p e a c --<
-。

对于警察个体而言,选择腐败的期望支付为: 31212()(1)()E p w c m f p w c m =+--+-+-12w c m pf =+--
选择廉洁的期望支付为：41E w m =+。

因此，只有34E E >时，警察才有可能接受贿赂，即112c m m p f
--<。

如何增加发现行贿—腐败行为的概率p 是一个值得进一步深入研究的问题。

2. 警察—督察部门博弈模型
督察部门的策略空间={检查;不检查},其检查成本为2c 。

被查出有受贿行为者不仅要没收其所收受的财物,而且要处以一定的罚款f ，显然12f c c +>。

假设道德的代价与收益为0，警察—督察部门博弈矩阵为：
督查部门
警察
腐败q 廉洁检查p 不检查
由此看出,上述博弈模型不存在纯策略的均衡，是一个混合战略博弈。

根据纳什均衡存在定理，该博弈存在混合战略纳什均衡。

在前述假定的条件下,督察部门和警察个体的期望支付分别为: 512212[()(1)][()]E p q f c c q c p q f c c =+---=+-
61[()(1)](1)[()(1)]E p q w f q w p q w c q w =-+-+-++-11[()]q c p f c w =-++ 若50E p ∂=∂，则21
c q f c *=+。

60E q ∂=∂，则11c p f c *=+。

因此,混合战略纳什均衡是:1211(,)(,)c c p q f c f c **=++。

即警察以21
c q f c *=+概率受贿,督察部门以11
c p f c *=+的概率严格检查。

由此可知,为防止警察腐败现象蔓延,可以采取如下措施:
(1)当p p *>时,警察的最优选择是不受贿。

因此,降低p *门槛值是有利于防止警察腐败的。

由11
c p f c *=+知，增加f 值和减小1c 值均可以实现降低p *。

(2)当减小q *值，有助于降低督察部门的检查成本。

四、博弈论与信息安全
信息安全的攻击方与防守方之间存在显著的博弈关系,防守方的信息安全投资策略与攻击方的攻击策略相互依存,互相影响,构成了信息安全的攻防博弈。

1. 信息安全的攻防博弈模型
首先我们做如下假定：组织的信息安全资产价值为E ，防守方投资信息安全的成本为C ，防守方投资信息安全产生的商誉无形资产为I ，组织遭受的信息安全损失为L ，信息
安全攻击方进行安全攻击所需的成本为K，则信息安全防守方与攻击方的得益矩阵如下：
防守方
攻击方
攻击不攻击投资
不投资
上面的博弈模型的理想策略组合是（投资，不攻击），若想使之成为上述博弈的均衡解，则必有不论攻击方的策略为何，投资信息安全策略较不投资策略而言都是最优策略。

并且不论防守方的策略为何，不攻击策略较攻击策略而言都是最优策略。

因此有
E C I E
-+>，0
L K
-<，即,
C I L K
<<。

也就是说,为了实现信息安全防守方投资信息安全,而攻击方放弃攻击的均衡策略，必须使得信息安全投资的成本低于信息安全投资所带来的商誉无形资产,同时通过各种措施增大攻击方的攻击成本。

五、博弈论与交通政策制定
城市交通问题是世界各国在城市化进程中都不得不面对的现实问题。

缓解城市道路交通拥挤,除了通过新建和扩建道路直接改善交通外,鼓励公交出行、进行交通需求管理也是重要的办法,这个问题引起了许多经济学家、交通运筹学家的关注。

在城市交通体系里，道路扮演着“公共草地”的角色。

与博弈论中“公地博弈”类似，在交通个体自由选择交通方式模式下，理性个体偏好于从私利出发消费道路资源，最终结果是个体完全出于私利地使用公共资源的获利远远低于整体最优的获利,使得城市交通体系难以持续发展下去。

建立博弈模型来分析上述现象，假设：①全理性人假设；②人均收入达到一定水平，并不再成为相当部分家庭汽车消费的主要障碍；③政府不进行管制。

设有一公共道路资源，为N个人共同享有。

这N个个体都可以选择公交或私车出行。

不妨将这N个人分为2个行为群体A和B，假定选择小汽车出行获得收益为K，选择公交出行获得收益为J。

若①双方成员均选择公交出行,则双方各自收益为J；②一方选择小汽车出行，另一方选择公交出行，则选择小汽车出行的一方将获得超额收益I，而乘坐公交出行的一方则遭受损失，获极低的收益L；③双方成员均选择小汽车出行,两者均获得收益K，令I J K L
>>>。

这时A和B构成完全信息静态博弈。

其博弈矩阵为：
群体B
群体A
公交私车
公交私车
由于,I J K L >>，在选择出行战略时,群体A 和B 中的理性人均会选择私车出行战略，即该战略是他们的占优战略，其均衡得益组合为(,)K K 。

由此可知，在共享道路这种“公共物品”的交通体系里，每个人都追求各自利益的最大化是造成交通拥堵的根源。

如果我们允许博弈中存在一种“有约束力的协议”，个体利益和集体利益之间的矛盾就可以被克服，从而使博弈方按照集体理性决策和行为成为可能。

在交通体系里，能够提供这种有广泛“约束力协议”的是政府。

假定政府对公交的激励和管制效应为a ，政府对私车的激励和管制效应为b 。

在政府参与模式下的交通博弈收益矩阵如下：
群体B 群体A
公交私车
公交
私车
其中I J K L >>>。

若是使（公交，公交）成为最优策略组合，则有J a I b +>-，L a K b +>-，即，,a b I J a b K L +>-+>-，故{}max ,a b I J K L +≥--。

政府的有效激励和管制可使理性人自发地选择使交通体系整体性最优的公交出行战略，这不仅兼顾了个人与集体的理性，而且构成了交通管理所希望的纳什均衡。

优先发展公共交通，即提高J 值，加快城市公交系统的建设，提高公交出行方式相对于小汽车的竞争力，可以吸引私车拥有者在日常出行时放弃驾车而乘公交车，从而减少道路的拥挤，有利于城市交通体系的可持续发展。

适当控制小汽车拥有量，即间接提高J 值。

对新增小汽车征收汽车拥有税、牌照税、年检费等，并定额供应小汽车购车证，限制个人和家庭拥有多辆车，可在城市交通基础设施及管理水平发展相对缓慢的情况下，作为缓解交通拥堵的有效举措。

适当限制小汽车的使用，征收交通拥挤费，即降低I值。

这样就可能迫使一些人放弃驾车而改为乘公交车进入某区,从而减少了该区的车流量。

亦可对某条重要线路采用收费通行办法可将部分车辆分流到其他道路上，从而消除该线路交通拥挤。

实行私车分奇偶号行驶，即取I=0。

鼓励多人共乘小汽车，即间接提高J值。

使私人交通转变为广义的“公共交通”,亦是节省时空资源、提高运效、缓解交通压力的重要手段。

六、博弈论与警务危机中的媒体应对
随着商业化、产业化的发展，媒体对新闻信息量的需求迅速增长。

为了维持广告份额和经营利润，媒体不断地扩张新闻版面，延长新闻时段，需要大量的新闻资源去填充。

都市媒体和民生新闻随着平民意识形态的形成而发展壮大起来。

警务信息中的突发性事件、刑事案件、交通事故、户籍管理政策、出入境办事程序等，因与百姓生活息息相关，被迅速纳入民生新闻的行列，成为各媒体单位争相挖掘的“宝藏”，一方面媒体对公安警务信息求之若渴，另一方面公安宣传现有的理念和机制不能满足媒体需求，新闻资源供求之间出现的严重失衡现象，使警方与媒体围绕警务信息开放问题纷争不断。

警察与媒体之间的矛盾从根本上说是利益差异引起的矛盾。

无论是警方还是媒体。

在做出与对方利益相关的选择时，必须考虑到对方的利益，并在照顾对方利益的前提下，努力实现自身利益的最大化。

这种关系实际上就是合作性博弈关系。

合作性博弈关系的确立为解决警方与媒体关系提供了一个新思路，实践中必须牢牢把握合作性博弈的两个核心要素:合作与共赢。