博弈分析方法精选(九篇)

时间：2023-09-27 15:06:24

博弈分析方法

第1篇：博弈分析方法范文

一博弈理论简介

（一）博弈论的名称

博弈论，英文名称为Game theory是研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时，曾有过多种译法。有的学者根据其英文名称，直译为游戏理论；有的学者则从该理论本身的研究对象出发，转译为对策论或对策运筹论。近年来，学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外，更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

（二）博弈的要素

一个完整的博弈应包含如下四项要素：1，博弈的参加者（player）。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人，大到一个跨国公司乃至一个国家，只要能独立决策和行动，都可视作一个博弈方。比如柯达与富士公司的竞争，就可看作一个有二个博弈方的博弈。一般说来，博弈的参加者越多，情况就越复杂，结果越难预料。2，策略空间（strategy space）。是指各博弈方可选择策略的集合。strategy直译应为战略，不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多，博弈就越复杂。3，进行博弈的次序（the order of play）。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间，先后决策并行动和同时决策行动，其结果是大相径庭的。 4，博弈的信息（information）。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如，在各博弈方同时决策的博弈中，必须保证不能让对手知道自己采取何种策略，否则自己将永远是博弈的输家。得益（play off），也称支付，是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素，一个博弈也就随之确定了。值得注意的是，博弈论特别强调“理性人”的前提假定，即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要，否则不会考虑其他博弈方或社会利益。

（三）博弈论的结构

由于一个完整的博弈需具备上述四要素，因此博弈可以从不同的角度划分成不同类别：1，按博弈方划分，可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方，所以它已退化为一般的最优化问题。经济学中常见的求最优问题，实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂，而且两人以上的博弈会出现合作博弈问题。这样，多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中，竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献，即在非合作博弈方面。2，按策略空间划分，可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果，所以从理论上讲，有限策略博弈的结果必然是有限的，而无限策略博弈的结果则有无穷多种可能。3，按进行博弈的次序划分，可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然，严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此，同时决策是指可近似地看作同时作决定的过程，如乒乓球团体赛的出场顺序，虽双方决策可能有早有晚，但一旦敲定便谁也不许变更，因而可看作同时决策。各博弈方不是同时决策，而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈，双方的每一步都将取决于前面的情势。4，按信息划分，如按得益信息分类，可分为完全信息博弈与不完全信息博弈。完全（complete）信息，是指各方对自己每种策略的得益情况完全清楚，否则是不完全信息；在动态博弈中，如按博弈进程信息分类，可分为完美信息动态博弈与不完美信息动态博弈。完美（perfect）信息，是指博弈方在决策前对其他博弈方的行为完全了解，否则是不完美信息。5，按得益情况划分，可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失，这样的博弈叫零和博弈，零和博弈的博弈方始终是对立关系；各方都会有收益，但收益总和是一固定常数，这样的博弈为常和博弈；各方不同的策略组合会有不同的收益，这样的博弈称变和博弈。显然，零和博弈是常和博弈的特例，常和博弈是变和博弈的特例。6，综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准，可将博弈分为：完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论（Game Theory），是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此，博弈论又称为“对策论”，也就是说当一个主体，比如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上，博弈理论又译为“决策理论”。博弈论创立于20世纪40年代，到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域，而妾包括政治学、军事、外交、国际关系、公共选择等各个领域，因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域，具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

（一）政府和企业之间的博弈分析

1，政府和企业博弈的根源

企业，作为市场运行主体，在市场经济中具有强烈的追求利润的理性意识；企业的理性就是实现利润的最大化。企业一切经济活动的出发点和归宿都要以这个目标为指导。在利润最大化目标的指导下，企业必须研究市场上其他主体的战略并确定自己的战略，从而市场上各个经济主体都是企业博弈的对象。企业决策往往具有局部性、个体性和短期性的特点。与之相对，政府作为市场运行的监管主体，是社会理性的当然代表，其决策往往带有全局性、整体性和长远性。由于政府制定的各种市场运行规则客观上限制了企业理性的发挥；尤其是当社会理性和企业理性发生冲突时，作为被管理者的企业只能寻求“次优方案”。当然，企业也并非只是一味地妥协，也可以与政府进行博弈从而影响相应的法律、法规的制定。由政府所代表的社会理性和企业理性的冲突及其在现实经济生活中的具体表现——政府所代表的社会利益与企业追求自身利润最大化的矛盾，决定了二者都将对方视作自己的博弈对象，从而使具体的法律、法规，尤其是反垄断法的制定过程，表现为政府和企业的博弈过程。

2，政府和企业参与博弈的目的

企业，作为盈利性的经济组织，是以实现利润最大化为其根本宗旨的；并且在这一根本宗旨的指

导下组织各种经济活动。只要能够降低企业的生产成本，提高企业的利润，企业都不惜一试，包括采取垄断的方式。但是，垄断的存在，不仅侵害了广大的消费者的利益（具体表现是通过垄断价格，将相当大的一部分消费者剩余转化为超额利润。），而且凭借其“市场势力”阻碍了有效的竞争，打破了市场竞争的均衡状态。政府，作为社会利益的代表，具有保护消费者的合法权益和维护市场有效的竞争秩序的当然职能；其可通过制定法律影响着企业决策的“可选择集”，即企业只能在法律许可的范围内进行选择。显然，“可选择集”越大，对企业越有利；而决定企业“可选择集”大小的恰恰就是政府。因为政府通过确定其产业政策和竞争政策的具体内容和相互关系，影响认定垄断的界限，并通过反垄断立法决定了企业可选择范围的大小，从而间接地决定了企业的盈利空间。企业参与博弈的目的就是通过影响政府的反垄断法规，实现对企业行为的有效规制，进而最大限度地保护社会公众的利益。

3，反垄断法的博弈分析

反垄断法指的是国家为了保护竞争，针对一些限制竞争行为所规定的法律规范的总称。其目的就是政府通过法律的手段限制企业有碍于竞争的经济行为。政府在决定是否将一种企业的经济行为列入受限制之列前，政府要作如下的博弈分析：保持企业退出

政府面对一种限制竞争行为有两种选择：干预，即将其限制于合理的范围之内；或者放任自流。政府要进行干预需要支出相应的费用，设费用为5，占总收益10的一半，那么经政府干预给社会带来的净收益是5（总收益10减去干预费用5）。此时，企业针对政府的干预政策有两种策略：其一是保持原有的状态不变，继续从事具有垄断性质的经济活动。但是，由于法律的强制性，如果企业采取此策略无异于自取灭亡。此时，企业不但不会盈利，相反还会被强制清除出场。其二是企业选择退出。此时，企业只需要付出沉淀成本，设其为收益的一半为5；在这种情况下，企业的收益为-5.政府还有另外一种选择，就是放任自流。这样，如果企业保持原来的垄断状态，就将获得全部的利润所得，社会公共利益为0；如果企业选择退出，那么全部利润将自动流向政府所代表的社会公众，此时，企业还要支付相应的沉淀成本。由于政府干预经济的目的就是为了将“垄断利润”返还给广大的消费者，（0，10）所代表的状态正是政府介入的原因，并且是政府所要竭力改善的初始状态。（10，-5）所代表的是企业自动放弃高额的垄断利润，并且还要为此承担相应的前期投入，即沉淀成本。这是不符合企业追求利润最大化的理性目标的，因而是不现实的。由此，政府只能选择干预策略。企业根据其对政府选择的分析判断政府介入的可能性，然后在（5，-10）、（5，-5）和（0，10）三种状态中进行选择。由于（5，-10）的高成本和（0，10）的不现实性及由此决定的高风险性，迫使理性的厂商选择（5，-5）所代表策略。这样，可以将损失降低到最低。政府经过上述博弈分析，最终决定将该经济行为纳入禁止之列；而企业也会选择放弃该垄断行为。至此，反垄断法的目的得以实现。

4 对反垄断法进行经济分析的意义。

对反垄断法进行博弈分析的意义在于揭示反垄断法的制定过程从某种意义上讲就是政府和企业的博弈的过程，反垄断法律规范的具体规范则是政府和企业的博弈结果在法律上的认定。所以，在反垄断法的制定过程中，应该站在企业的立场上考虑企业可能做出的策略选择，然后再确定法律是否对该行为进行规制及如何规制。这样，才能保证制定出的法律能有效地规制企业的行为，有效地保证竞争。

（二）企业间通过价格等垄断协议的博弈分析

在寡头市场上，当寡头数量很少时，从理论上说，他们很容易通过谈判实行勾结定价，即像一个垄断者那样用高价格来宰消费者。这样做，交易费用（寡头进行价格勾结谈判达成协议所需要的费用）并不高，而勾结定价可以为参与者带来共同的利益。但为什么这种勾结定价在现实中成功的很少呢？尽管许多国家“反垄断法”中有禁止勾结定价的条款，但实际上这个条款的作用极为有限，因为寡头之间可以采用不易被发现的隐蔽性勾结——默契。我们可以用博弈论的分析来说明现实中的勾结定价难以成功的原因。

我们假设某地牛奶市场由两家寡头瓜分，这是寡头中最简单的寡头——双头，也是最容易达成价格勾结协议的寡头市场。如果这两家寡头（A与B）之间没有任何勾结，各自按成本最低时产量进行生产，各生产3000磅牛奶，成本为每磅6元。这时，市场总供给量为6000磅牛奶，价格为6元。各家都没有经济利润（经济利润为零）。

现在这两家寡头达成价格勾结。要实现高价必须减少产量。现实中寡头之间的价格勾结总是以限产为前提的（以后要谈到的欧佩克就是这样）。如果这两家寡头把产量确定为 2000磅牛奶，这时成本为每磅8元。市场总供给量减少为4000磅牛奶，需求并没有变，价格上升至每磅9元。在这种价格时，每家寡头可获得经济利润 2000元。当然，勾结起来对双方都是有利好的。

如果达成协议方有一方违约会有什么结果呢？如果一方违约，生产3000磅牛奶，它的每磅牛奶成本约为6元，另一方守约生产2000磅牛，每磅牛奶成本为8元。这时市场总供给量为5000磅牛奶，价格为7.5元。市场价格只有一个，是整个市场的供求总量决定的。违约的一方，成本仅6元，价格为7.5元，每磅牛奶的利润为 1.5元，总计经济利润为4500元。守约的一方，成本为8元，价格也是7.5元，每磅牛奶亏损0.5元，2000磅牛奶共亏损1000元。

这两个寡头的价格勾结协议的实施并没有法律保障，因为这种协议是非法的。守约的一方无法对违约的一方提出诉讼，即缺乏有效的惩罚。是否守约完全取决于各自的意愿。他们是否会守约呢？一方守约与否的结果还取决于对方是否守约，协议并没有保证对方守约的硬约束，因此，各方都有守约与违约两种选择，而对方到底会选择什么，无法确定，这时就可以用博弈论来分析各自的决策了。

我们来看A的决策过程。A要分析在B不同的选择下，自己的选择会有什么结果。A先假设B是守约的，这时A选择守约可以赚2000元，如果选择不守约可以赚4500元。两者相比，A守约时，B的占优战略是不守约。A再假设B不守约，这时A选择守约要亏损1000元，如果选择不守约可以不赔不赚（经济利润为零）。两者相比，A不守约时，B的占优越略也是不守约。A的结论是，无论B守约还是违约，对自己最有利的还是不守约。B的分析方法和结论与A完全一样。结果A、B都选择了不守约，价格协议成了一张废纸。

在这种情况下，A、B如何才能实现勾结呢？研究者发现，如果就是这两个寡头，同样的博弈会多次进行。双方最终会发现，达成勾结的条件是采用一报还一报的策略，即对方这次守约，我下次也守约，如果对方这次不守约，我下次也不守约。这种情况下，双方会发现，从多次博弈的结果看，违约是不利的，从而自觉守约。这种一报还一报就成为有效的惩罚。但在现实中这种情况极为罕见——只有两个寡头，而且多次重复同样的博弈。在常见的多头博弈，而且同样的博弈很少反复进行的情况下，价格勾结就难以成功了。

这种分析与现实一致吗？一个最常用的例子就是欧佩克（石油输出国组织）的价格勾结。欧佩克是一个限制产量并提高石油价格的寡头价格联盟（又称“卡特尔”）。他们在70 年代的成功更多的是共同的政治动机。但经济利益在长期中是高于政治的。随着时间流逝，博弈论分析的情况就出现了。各成员国都想，无论其他国家是否守约，我违约对自己是有利的，于是纷纷打破限产规定，增加生产，

结果到80年代，石油价格就大幅度下跌了。以后的石油价格上升不是价格协议起作用，而是供求关系变动的结果

在任何一种市场上，决定价格的最基本因素还是供求关系。在供大于求的情况下，任何价格勾结都不能长远地提高价格。在供小于求的情况下，无需价格勾结，价格也会上升。在价格决定中，价格勾结是无用的。过去我国出现过的汽车行业自律价和民航的禁折令等形式的价格勾结，哪一个实现了？人为的价格勾结当然阻挡不了供求决定价格的客观规律。博弈论分析的结论与现实是一致的。企业还是不要玩这种小权术，老老实实提高自己的市场竞争。

三、小结

本文通过对反垄断法的制定过程进行简要的博弈分析，旨在说明法律的制定不仅是立法机构的单方行为，还是一个规制者与被规制者——政府和企业相互博弈的互动的过程。如果在法律的制定过程中忽略了这一点，就很容易导致法律对于现实生活的无效和“无能为力”，从而不能有效地实现其价值。

参考文献

[1]张维迎。博弈论与信息经济学[M].上海人民出版社，1996。

第2篇：博弈分析方法范文

关键词：法律风险损失；合作博弈；审计质量

中图分类号：F239.43 文献标识码：A 文章编号：1003-3890（2013）11-0046-06

一、引言

法律风险，亦可称为法律性风险，是指主体方预期与未来实际结果发生差异而导致其必须承担法律责任，并因此为其带来损失的可能性。审计市场的审计质量关系到多方的利益，在分析影响审计质量的因素时，相关文献越来越倾向于法律风险对审计质量的影响。

本文基于法律风险损失的角度，通过建立合作博弈模型，分别从CPA与客户的角度进行阐述，得出在法律风险损失足够大（即文中的C2>（C0-C1）/δ）的情况下，二者理性地选择相互再合作，可提高审计质量。这里的合作是指，CPA与客户遵守法律法规而作出的行为选择，即CPA履行职责，客户提供真实信息。假设二者在业务约定书上已经对相互合作签订协议。二者其他行为决策的组合均视为不合作，并将开始合作以后的合作称为再合作。

二、文献综述

审计市场的审计质量关系到多方的利益关系，在影响审计质量的因素中，相关文献越来越倾向于法律风险对审计质量的影响。即决定审计质量的，不仅仅是一些技术性因素如审计标准、事务所规模与专业胜任能力、被审计客户素质等，一些制度环境，特别是法律风险等因素，是审计质量的决定性因素（Kotharietal，1988；Francis，2004；Khurana and Raman，2004）[1-3]。刘峰、周福源（2007）运用多种方式检验国际四大与国内所之间审计质量的差异，得出：从会计盈余的稳健性角度（指对会计盈余即会计利润的处理要遵循稳健性原则，又称谨慎性原则）来看，国际四大甚至比非国际四大更不稳健，原因是国际四大在我国资本市场上的法律风险比较低，进而导致了低的审计质量[4]。

法律风险对CPA而言，是指CPA在审计活动中因出具低质量的审计报告而承担法律责任的可能性（苗绘，2010）[5]。

借鉴Kotharietal（1988）[1]关于法律风险的三因素分析框架——谁可以审计师、诉讼门槛有多高、赔偿责任有多大，刘峰、许菲（2002）[6]对法律风险与审计质量进行研究，将法律风险表述为被发现的概率和发现后被惩处力度（主要指赔偿责任）的乘积。被发现的概率又是谁可以审计师以及诉讼的门槛要求（主要指诉讼的技术难度）两部分的联合乘积，他们的研究也是从谁可以、诉讼门槛的要求、惩处力度等三个因素来阐述我国法律风险较低的原因及其对审计质量的影响。研究发现，在惩处力度上，相对于美国天文数字般的赔偿责任而言，我国现有处罚措施太过薄弱，对CPA与被审计客户（以下简称客户）构不成足够的震慑作用。

刘峰等研究得出，从CPA的角度来看，若法律风险较高，CPA就会提高审计质量以降低可能承受的法律风险；若法律风险较低，CPA则不会尽力提高审计质量，反而会出于自身利益考虑，选择对自己更有利的行为决策。这个结论论证了法律风险对审计质量的决定作用。本文则是从法律风险的一个因素，即惩处力度（文中称法律风险损失）出发，通过构建博弈模型，得出法律风险损失大小对二者博弈行为的影响，在此基础上研究法律风险损失在提高审计质量中的作用。

在审计质量研究上，基于信息不对称的视角，已有很多学者进行过相关博弈研究，如任夏仪等（2006）[7]运用动态博弈模型对上市公司独立审计质量行为选择及其影响因素进行分析，提出了提高上市公司独立审计质量的相关政策建议。赵保卿等（2009）[8]建立了动态博弈模型，分析了公司管理当局、会计师事务所、政府监管部门等的行动策略对审计质量的影响。卢宁文（2012）[9]通过建立不完全信息动态博弈模型，对审计质量形成机理的博弈均衡进行分析，得出了审计质量的形成就是投资者、审计师、公司管理层、政府监管层之间进行博弈所达到的一种均衡状态的结论。可以看出，现有文献都是针对影响审计质量的各个因素进行分析，或者通过博弈来研究行为方决策的相互影响，没有通过合作博弈模型来探讨法律风险损失对审计质量的影响。

三、CPA面临的法律风险损失

法律风险损失是指CPA在审计活动中因未履行职责出具低质量的审计报告而承担的惩罚力度的大小，只是针对CPA而言的，是上述文献综述中提到的法律风险分析框架中的一个因素，即发现后被惩处力度（主要是赔偿责任）。

我国目前CPA面临的法律风险损失不高，国家对违反法律法规的CPA处罚不严，涉及上市公司审计业务时，违规会计师事务所及CPA所承担的法律责任极其低微。CPA的法律风险损失大多是警告、暂停执业（最长期限为12个月）、罚款等，导致出现了“被处罚而已，进去几年出来之后又是一个好汉”的不良风气。

如在金荔科技事件中，负责审计的万隆所受到的法律风险损失比以前审计失败案例中其他事务所受到的法律风险损失大了很多。金荔科技，全称衡阳市金荔科技农业股份有限公司，主要从事农业高科技产品开发、培育、销售等。万隆所是从事审计的会计师事务所，即万隆会计师事务所有限公司（现更名为万隆亚洲事务所有限公司）。万隆所在对金荔科技2006年年度报告审计过程中未按照中国CPA执业准则规定的程序审计，出具了含有虚假内容的审计报告，给报表使用者带来了损失，因而受到了中国证监会的处罚。

在此事件中，万隆所遭受的法律风险损失是：没收业务收入50万元并处50万元罚款，对四名CPA给予警告并处罚款33万元，另外对主要当事人即万隆所的副主任会计师卫宗泙处以3年证券市场禁入。法律风险损失中，市场禁入的处罚，是几乎不常用的处罚措施，追溯以前案例，也只有在1998年红光事件（指成都红光实业股份有限公司欺诈上市事件）中CPA受过此类法律风险损失。虽然金荔科技事件中，对CPA的处罚采取了更严厉的措施，可是这也只是很少见到的惩罚。由此可见，在我国的法律政策中，CPA所面临的法律风险损失总体上小而且惩处力度不够大，使得现有规定对CPA而言无足够的震慑作用。所以本文力从法律风险损失视角并结合博弈分析去研究法律风险损失与审计质量的关系，是基于我国现有法律风险损失现状的思考。

在审计市场上，CPA与客户之间应建立在合作的基础上。一方面，从客户的角度分析，企业可能因为个人利益隐藏真实信息，以期在短期或一个阶段会有很好的年报报出，可是这不能给企业带来长远的发展。企业需要年报审计，不仅仅是需要依法对外披露会计信息，更主要的是企业在整体风险管理中，需要借助CPA的专业意见来发现、识别和应对风险（李晓慧，2009）[10]。这就需要二者进行合作，在合作博弈的进程中达到某种双赢，各取所需，提高审计质量。

另一方面，从CPA的角度分析，由于信息不对称，CPA在审计过程中，不易获得客户各种真实信息，同时当CPA成为掌握信息优势的一方，因为自身利益可能隐藏行动或隐藏信息进而做出使客户受到损失的行为选择。从短期来看可能有利，而长期却会危及CPA行业的存在与发展。鉴于此，也需要CPA与客户进行合作，在相互博弈中发展各自业绩。

所以，CPA与客户应建立在合作的基础上，合作是一个行为决策，用在博弈中就是一个行为选择，所以可以从二者的合作博弈中分析，而且对合作博弈的分析应立足于二者合作可提高审计质量这一基础。由于审计质量低下的一方面原因在于我国对CPA法律惩罚力度不够，所以文章选择从法律风险损失的角度切入，通过对合作博弈模型的具体分析，来探讨法律风险损失在提高审计质量方面的积极作用。

因此，本文力求从法律风险损失的角度去研究CPA与客户之间的合作博弈，文章对法律风险损失表现出的各个方面给以总体上的一个量化，即文中的C2，在合作博弈的具体分析中去探求法律风险损失对二者行为选择的约束，并为法律法规制定者在对CPA的有关法律惩罚措施方面提供些许建议。

四、合作博弈模型的条件假设与模型建立

博弈分为不重复博弈与重复博弈两种，不重复博弈是指博弈进行一次便终止，重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，本文中的合作博弈基于重复博弈。文中研究的模型，假设只有CPA与客户两个主体，审计是必须的，所以研究的范围是二者长期的博弈，属重复博弈，即CPA与客户在重复博弈中去调整彼此的行为决策。

（一）合作博弈

合作博弈亦称为正和博弈，是指博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整个社会的利益有所增加。合作博弈属于“无限合作博弈”的演化类型，即博弈者都认为相互合作的长远利益要大于暂时得到的利益。研究发现，一方面，即使博弈双方要无限合作博弈下去，博弈者也有不愉快、不愿合作的时候；另一方面，即使博弈者不愉快、不愿合作，双方还必须合作下去（张朋柱，2006）[11]。

合作博弈模型是基于CPA与客户之间进行相互合作行为决策的博弈分析。在进行合作博弈模型的建立时，对现实中的一些常见情况予以简化，如：CPA不止有一个客户；客户也不只是由一家会计师事务所或者一位CPA审计；二者在审计中的行为决策是有可选择性的；客户对CPA提供的信息是分阶段进行，在审计任何过程都能根据需要提供与审计有关的信息等。

（二）条件假设

信息在博弈中很重要，掌握多少信息，决定着各个参与主体是否能正确地进行决策，乃至关乎整个博弈过程的成败。但在博弈过程中，得到的信息是很有限的，一般情况下，一方主体很难确切地知道另一方主体的行为选择，即CPA不知道客户是否对其已经提供真实信息；与此同时，客户也不能确定CPA是否要履行职责。这就是信息不对称。解决信息不对称问题就要提高信息透明度（在文中，信息透明度就是CPA与客户相互能知道对方的行为选择，能获得各种需要的信息），减少二者之间沟通交流的障碍，进而从总体上大大减少审计的难度，缩减人力、物力、财力等方面的浪费，以此提高审计质量。

博弈模型中的条件假设包括以下五个部分，即博弈的参与者、博弈的顺序、博弈的信息、决策主体的行为选择及博弈主体的支付。如表1所示。

（三）模型的建立

本文借鉴封[12]等“CPA与上市公司的审计博弈及其行为选择”中的模型，将审计费用加入到模型中，对重复合作的博弈模型进行展开分析，着重分析在法律风险损失足够大时，法律风险损失对CPA与客户行为决策的影响，进而分析如何影响审计质量。

在二者进行重复合作博弈过程中，会有四种具体的行为选择组合，分别为（审计收费为V）：

1. 当CPA履行职责而且客户提供全部真实信息时，CPA的支付为履行职责的成本，记为V-C0；客户的支付为0。

2. 当CPA履行职责而且客户不提供全部真实信息时，CPA的支付为审计费用，但没有法律风险损失，记为V-C0+C2；客户丧失了所获得的被处罚收益F，支付则为-F。

3. 当CPA不履行职责而且客户提供全部真实信息时，CPA的支付为审计费用，记为V-C1；客户丧失了所获得的被处罚收益F，支付则为-F。

4. 当CPA不履行职责而且客户不提供全部真实信息的时，CPA的支付包括审计费用及法律风险损失，记为V-C1-C2；客户获得了被处罚收益F，支付为F。

依此建立博弈模型，如表2所示。注：前面支付数字表示CPA的支付，后面为客户的支付。

五、基于法律风险损失的合作博弈分析

基于法律风险损失的分析，是在合作博弈模型的基础上，去探讨C2的大小对CPA与客户行为选择的约束。

博弈双方面对法律风险损失通常会慎重地权衡“终止合作所受到的惩罚”与“再合作的理性选择”之间的利弊。

博弈模型中，如果CPA与客户都选择再合作，即CPA履行职责，客户提供真实信息，只要一方未违约，双方便会相互选择再合作。如果一方有终止合作的意向，对方通常会觉得被“背叛”，便会对其进行惩罚，采取冷酷策略。冷酷策略是带有报复性的一种策略，又称为“触发战略”，因为任何参与人的一次性不合作将触发永远的不合作（张维迎，2007）[13]。在重复博弈的过程中，短暂的冷酷策略有时是可行的，长期的冷酷策略是不可行的。博弈者在长期的合作博弈中，根据双方以往的策略，不断调整自身的策略，才有可能取得长期的收益（张朋柱，2006）[11]，终止合作后，便会考虑采取再合作的理性选择。

下文将博弈过程，从双方的角度分别进行博弈分析，假设其中一方选择再合作，对方基于“终止合作所受到的惩罚”与“再合作的理性选择”的考虑是否选择再合作。

（一）CPA面对法律风险损失是否选择再合作

基于CPA面对法律风险损失是否选择再合作的分析，先假定客户是选择再合作的，分析当CPA首先违反约定，选择不再合作的情况。

首先，假设贴现因子为δ，即将来的单位现金流量折算成现值的介于0～1之间的一个数值。在博弈论中，重复多期的分析会用到δ，Gibbons将贴现因子定义为“货币的时间价值”，实际上就是贴现率1/（1+λ）。

其次，假设博弈的分析过程为：当t期时，若CPA选择再合作，则CPA与客户双方会一直相互选择再合作；因（V-C1）>（V-C0），则CPA有终止合作的意向，当t期时，CPA选择终止合作，便使得客户（支付由0变为-F）受到损失，则t+1期时，客户便采取冷酷策略，也选择终止合作，对CPA进行惩罚（支付由V-C1变为V-C1-C2），则t+2期以后，双方均会继续选择终止合作，直至最终使得CPA结合法律风险损失的大小权衡“终止合作所受到的惩罚”与“再合作的理性选择”之间的利弊，理性地分析是否选择再合作。具体博弈过程如图1所示：

图1的博弈过程分析如表3所示：

分析：当A>B时，表示终止合作的收益大于选择再合作的收益。

当A

当A=B时，表示终止合作的收益等于选择再合作的收益。

而这个大小关系的比较可由法律风险损失C2的取值情况得出，即得出法律风险损失大小与CPA是否选择再合作的关系。由此，便可推出CPA面临法律风险损失的大小是否选择再合作，也可以推出，若使得CPA选择再合作，法律风险损失应该制定为多大。法律风险损失大小与CPA是否选择再合作的关系如表4所示。

由上面分析知，倘若C2足够大，即法律风险损失足够大，使得任何情况下都有A

（二）客户面对法律风险损失是否选择再合作

假定博弈开始时CPA是选择合作的，则从客户的角度，分析当客户首先违反约定，在博弈开始时选择不合作的情况。

由上面的博弈模型可知，只要CPA遵守约定，选择合作，客户会一直选择合作。因为倘若终止合作，则支付是-F，对客户而言，完全没有终止合作的意图。因此，若有客户违反约定的情况，只能发生在博弈开始时就违约，即第一期开始博弈的时候，客户就选择终止合作，即不提供真实信息。但是客户却不知道CPA的行为选择，此中假设CPA选择合作，则客户第一期的支付为-F，受到了终止合作的惩罚。

假设第二期的时候，CPA鉴于开始时客户已经选择终止合作，仍会认为在第二期，客户仍会选择终止合作，此时，CPA如何做出行为选择，是站在自身利益的角度上考虑的。在法律风险损失的影响下选择对自己更有利的行为决策。从而客户从第三期（含第三期）开始以后各期是否选择再合作，取决于第二期时CPA面临法律风险损失进行的决策。如果第二期使得客户再次受到惩罚及损失，便会“逼退”客户理性地选择再合作，即最终使得客户结合法律风险损失的大小权衡“终止合作所受到的惩罚”与“再合作的理性选择”之间的利弊，理性地分析是否选择再合作。具体博弈过程如图2所示：

由图2可知，第二期CPA出于理性考虑选择再合作，此时履行职责的支付为C=V-C0+C2；若选择终止合作，此时不履行职责的支付为D=V-C1-C2，C-D=2C2-C0+C1，比较C与D：

当C

当C>D时，CPA选择终止合作的收益小于选择再合作的收益，便会理性选择再合作。

当C=D时，CPA选择终止合作的收益与选择再合作的收益相等，两种选择都可以。

上述的比较可以看出：CPA基于法律风险损失C2的大小而选择是否再合作。由此，客户面对法律风险损失的大小也可考虑是否选择再合作，若客户选择再合作，那么法律风险损失应该处于什么程度。法律风险损失大小与客户是否选择再合作的关系如表5所示：

当C

当C>D时，CPA会选择履行职责，同时对客户进行冷酷策略的惩罚，即客户的收益变成了-F，客户会选择再合作，即提供真实信息，提高了审计质量。

总结：由上面分析知，倘若法律风险损失C2足够大，使得在任何情况下都有C2>■（C>D），则客户的理性选择为再合作，即在CPA履行职责的前提下，提供真实信息。

（三）小结

六、结论

本文的研究意义在于为我国处理审计质量低下问题时有关CPA法律风险政策提供参考建议。我国目前法律风险的现状不容乐观，与此有关的法律制度不健全，对违规的CPA的惩罚力度不强，即CPA面临的法律风险损失力度小，致使违规现象难以避免，在审计市场上，使得审计质量低下，而政策制定者没有力从法律风险损失的角度着重分析法律风险损失对审计质量的重要影响。

由文章分析可知，为了提高审计质量，我们应该极力提高C2的取值，即法律风险损失应足够大（即C2>■）。这在一定程度上向我们的政策制定者提供了参考，应事先制定好审计违规的相关法律政策，对违反审计法规的CPA面临的法律风险损失应定得足够大，倘若不按规定进行行为决策，就应该严惩不贷，这样便可以使得CPA与客户在长期博弈中理性地分析，为了长远利益便会选择长期再合作，这样会从本质意识上提高审计市场信息透明度，进而提高审计质量。

当然，本文有一定的局限性。本文的局限性体现在两个方面，首先，假设的博弈模型是理想的情况，对现实中很多复杂的因素都进行了简化，比如开始就假设合作博弈的选择是遵守法律规定的，提供真实信息和履行职责的假设也不完全恰当。其次，具体分析中，一方不合作，对方的行为选择与后期二者重复博弈的行为选择，也给予了简化分析，并进行适当的假设。这样设置的模型与实际不能很好地切合，本文旨在为审计市场提高审计质量提供些政策及法律上的参考。

参考文献：

[1]Kothari， Lys， Smith， Watts. Auditor’s Liability and Information Disclosure[J]. Journal of Accounting Auditing and Finance，1988，（3）：307-339.

[2]Francis， J.， and Wang Dechun. Investor Protection， Auditor Conservatism and Earnings Quality：Are Big 4 Auditors Conservative only in the United States？ Working paper，2004.

[3]Khurana， Inder， and K K Raman. Litigation Risk and the Financial Reporting Credibility of Big 4 Versus Non-big 4 Auditors： Evidence from Anglo-American Countries[J]. The Accounting Review，2004，（3）：473-495.

[4]刘峰；周福源.国际四大意味着高审计质量吗——基于会计稳健性角度的检验[J].会计研究，2007，（3）：79-87.

[5]苗绘.对我国CPA法律风险的思考[J].生产力研究，2010，（7）：240-241.

[6]刘峰，许菲.风险导向性审计.法律风险.审计质量——兼论“四大”在我国审计市场的行为[J].会计研究，2002，（2）：21-27.

[7]任夏仪.独立审计质量缺失及其改进的博弈分析[J].生产力研究，2006，（3）：253-254.

[8]赵保卿，朱蝉飞.CPA审计质量控制的博弈分析[J].会计研究，2009，（4）：87-93.

[9]卢宁文.审计质量形成机理的博弈均衡分析[J].审计与经济研究，2012，（9）：41-48.

[10]李晓慧.基于企业价值增值的风险管理审计研究[J].学术研究，2009，（2）：49-52.

[11]张朋柱.合作博弈理论与应用：非完全共同利益群体合作管理[M].上海：上海交通大学出版社，2006.

第3篇：博弈分析方法范文

【关键词】斯坦克尔伯格模型不完全信息动态博弈双寡头厂商信号传递博弈

一、引言

博弈论从二十世纪初期的萌芽阶段逐步发展到70年代后期独自形成一个完成的理论体系并成为主流经济学的一部分，博弈论的出现与发展成为经济学中的重大发现与伟大变革。自从博弈论被广泛应用于经济学领域，分析方法从传统经济学中的以个人理为研究对象，以个体为中心进行决策分析的方法转变成以多个决策主体的决策行为为研究对象，研究他们的行为发生直接相互作用和影响时的决策均衡问题。而寡头厂商的决策行为一直是博弈论研究的重点，通过使用博弈论的分析方法对寡头厂商进行分析，可以准确地将寡头厂商的决策行为具体化与模型化，通过模型建立，分析出寡头厂商决策的最优策略。斯坦克尔伯格模型是产业组织理论中分析寡头竞争问题的重要模型之一，也是博弈理论中最早研究完全信息下寡头厂商竞争问题的对象之一。本文选取双寡头厂商为研究对象，基于斯坦克尔伯格模型的视角，将不完全信息引入该模型中，利用信号传递博弈对模型进行贝叶斯均衡的精炼，用以解决寡头厂商在信息不对称情况下的逆向选择问题。

二、文献综述

1、博弈论的相关理论

博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈理论开始于1944年由冯・诺依曼（Von neumann）和摩根斯坦恩（Morgenstern）合作的《博弈论与经济行为》（The Theory of Games and Economic Behaviour）一书的出版。博弈论中包含四个主要的要素，即博弈的参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的得益（即支付）。博弈论弈的类型可分为以下四种：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，与上述四类博弈相对应的是四个均衡概念：纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。

近年来，学术界将更多的关注点放在非合作博弈理论的研究与分析上，寡头厂商的竞争博弈逐渐成为非合作博弈的研究方向与重点。不完全信息动态博弈是指在博弈中至少有一个参与人不知道其他参与人的支付函数，参与人的行为有先后之分，后行动者能观察到先行动者的行动。参与人的行动依赖于其类型，每个参与人的行动都传递着有关自己类型的某种信息，后行动者可以通过观察先行动者的行动来推断其类型或修正对其类型的信念，而先行动者也会预测到自己的行动将被后行动者所利用，因此在不完全信息动态博弈过程中参与人在选择自己行动的同时也在不断修正对类型的信念。

2、国内外相关研究现状与趋势

克瑞普斯（Kreps）和威尔逊（Wilson）在1982年联合发表关于动态不完全信息博弈，将动态分析和不完全信息正式引入博弈论的研究中。信号传递博弈是不完全信息动态博弈中最具广泛应用意义的一类博弈理论，由斯宾塞（Spence）于1974年开创，并应用于经济管理领域，是该领域中重要的管理与决策工具和手段。Spence（1974）在其建立的劳动力市场模型中认为，劳动力市场上存在着有关雇员能力的信息不对称，雇员知道自己的能力，雇主不知道，但雇员的教育程度向雇主传递有关雇员能力的信息。这是信号传递博弈的最初模型。李华威（2005）利用博弈论基本理论，对中国移动通信市场的双寡头垄断结构的形成和存在的合理性等方面进行分析，认为从最初进入阶段的博弈到成熟阶段的博弈，后进入者都应该避免正面的同质竞争，而先进入者则应保持先动优势。叶佳彬（2007）在其对寡头厂商的行为决策进行研究的过程中，分别假设成本、市场上价格-产量比例变化和市场需求参数为随机变量，构造斯坦克尔伯格模型下的不完全信息动态博弈模型，对寡头厂商应如何选择产量竞争策略作出解释。罗超良（2007）对信号传递博弈理论进行了系统的介绍，分析垄断限价博弈模型，对该模型的均衡结果进行再精炼，并建立了房产交易信号传递博弈模型。

三、双寡头厂商不完全信息动态竞争博弈分析

1、传统斯坦克尔伯格寡头竞争模型

在斯坦克尔伯格模型中，双寡头企业可分为领头企业（leader）和尾随企业（follower），假设领头企业为企业1，尾随企业为企业2。企业1首先选择产量q1≥0，企业2观测到企业1的选择后，根据企业1的选择来选择自己的产量q2≥0。由于企业2在选择决策前可以观测到企业1的选择，根据q1来选择q2，所以这是一个完全信息动态博弈模型。假定逆需求函数为p（Q）=a-q1-q2，两个企业有相同的不变的单位成本c≥0，a为常数，那么支付（利润）函数为：？仔i（q1，q2）=qi（P（Q）-c），i=1，2

2、引入不完全信息的斯坦克尔伯格模型

（1）模型假定。在传统斯坦克尔伯格模型中，市场需求量和寡头企业的产品价格是由逆需求函数p（Q）=a-q1-q2所体现，可将其简化为：p（Q）=a-bQ，Q=q1+q2。

当b的类型分别为b，b时，可根据传统斯坦克尔伯格模型求解出在完全信息下的子博弈精炼纳什均衡的均衡产量与均衡利润，如表1所示。

（2）模型分析。在这里引入不完全信息动态博弈中的信号传递博弈，信号传递博弈即是不完全信息条件下的斯坦克尔伯格博弈，假设领头企业――企业1为信号传递博弈中的信号发送者，尾随企业――企业2为信号接受者，根据以上模型假设，b的类型为私人信息，在不完全信息条件下，尾随企业并不知道b的实际类型，只知道其类型分布，尾随企业只能等待领头企业发出信号。

根据以上假定与说明可绘制博弈树，如图1所示。

（3）模型计算。博弈的第二阶段：双寡头厂商最优决策的计算与求解。

模型建立后需要对信号传递博弈进行精炼贝叶斯均衡，由信号传递博弈的精炼贝叶斯均衡的构成条件可知，满足企业2的最大化期望支付为：

（4）均衡结果。对于领头企业――企业1来说，当2b>b，3b>2b，3b>b时，博弈模型将会实现混同均衡，此时b和b的值相对接近。在寡头市场中，市场的价格变化率是控制在一定范围内波动的，企业1则会倾向在较大概率下按照较高的市场价格变化率的新的斯坦克尔伯格模型计算自己的最优产量；当3b

四、以厨电市场为例的博弈实证分析

1、概况介绍

随着中国经济的快速发展，人民生活水平不断提高，生活习惯转变，以及房地产行业的高速发展，中国的厨电市场迅速扩张。该市场的主力消费者从60后、70后转变为85后、90后，由于消费人群和消费习惯的转变，使得厨电行业从迎合消费者需求创造产品向创造消费者需求的方向转变。本文选取中国的厨房电器市场为实证研究的对象市场，是因为目前中国的厨房电器市场中的高端品牌市场比较接近本文所研究的双寡头市场。根据中怡康监测数据显示，2014年吸油烟机高端品牌市场中老板电器和方太电器的总市场占有率为82.1%，这两个品牌在厨电市场具有较高的市场占有率与知名度，且主要占据高端市场，所以以老板电器和方太电器作为双寡头竞争对手来进行实证分析是可行的。

2、博弈分析

米尔格罗姆-罗伯茨（Milgrom Roberts）垄断限价博弈模型是解释在位者与进入者之间博弈的信号传递博弈应用模型。在此将现实实例引入模型与假设，使用米尔格罗姆-罗伯茨垄断限价博弈模型对实例进行验证。根据厨电市场多年的市场结构、市场占有率、品牌知名度来设定老板电器为在位者（领头企业/垄断者），方太电器为进入者（尾随企业）。老板电器有两个潜在类型：高成本（H）和低成本（L），高成本的概率是？滋，低成本的概率。

（4）实证结果。在分离均衡中，老板电器作为高成本在位者会选择高价格，作为低成本在位者会选择在某个满足上述公式条件的低价格区间；在混同均衡中，无论老板电器是高成本在位者还是低成本在位者，它的价格都不会偏离其垄断价格。在现实厨电市场中，老板电器的类型选择为高成本，选择高价格来垄断厨电行业高端市场，作为其竞争对手的方太电器接受到该信号选择进入市场，形成双寡头市场。

五、结论

本文选取双寡头市场为研究对象，在不完全信息条件下对双寡头厂商进行动态博弈分析，为了使模型能够应用于现实市场，通过将不完全信息引入到经典的斯坦克尔伯格模型中，用信号传递博弈的方法进行博弈分析，最终得出结论：在市场价格与市场需求变动比例（即市场的价格变化率b）为私人类型下，b值的波动控制在一定范围内时，双寡头市场中的领头者更愿意以较高的市场价格变化率选择高产量；b值波动超出一定的范围时，领头企业更愿意以一个新的价格变化率去选择自己最优产量；尾随企业会在推断领头企业的类型后根据领头企业的可能选择来计算自己最终的最优产量。文章最后还以厨电市场中的老板电器与方太电器为实例分析对象，将模型应用于现实市场，使得博弈模型更具现实意义。

【参考文献】

[1] 张维迎：博弈论与信息经济学[M].上海人民出版社，2014.

[2] 谢识予：经济博弈论（第二版）[M].复旦大学出版社，2011.

[3] Spenee，A.M：Market Signaling[M].Harvard University Press，1974.

[4] Peng Zhu，Wenzhen Gan，Zhigui Lin：Coexistence of Two Species in a Strongly Coupled Schoener’s Competitive Model[J].Acta Applicandae Mathematicae，2009（1）.

[5] Joon Hyuk Kang，Jungho Lee：Steady state coexistence solutions of reaction-diffusion competition models[J].Czechoslovak Mathematical Journal，2006（4）.

[6]李华威、杨舟：中国移动通信双寡头市场结构及企业行为的博弈分析[J].商业研究，2005（14）.

[7] 王愚、达庆利：一种多目标的斯坦克尔伯格模型[J].管理工程学报，2003（10）.

第4篇：博弈分析方法范文

关键词：不完全信息动态博弈；人行为；委托人行为

中图分类号：F832.2 文献标识码：A 文章编号：1003-9031（2012）09-0068-04 DOI：10.3969/j.issn.1003-9031.2012.09.18

一、问题的提出

西方经济学的研究表明，固定薪酬制往往导致企业的低效率，因此一些西方经济学家提出可以通过采取一些激励措施来激励员工更加努力工作，为企业带来更高的收益，如支付给为企业带来高收益的员工更高的工资，支付给为企业带来较低收益的员工较低的工资。但是在现实社会中，每个员工的工作水平是不相同的，这在招聘面试时企业很难判别出员工的工作水平，即会产生信息的不对称。企业不知道员工工作水平的高低，员工则很清楚自己工作水平的高低。员工为了使自己的收益最大化会选择能为自己带来高收益的企业，企业也希望招聘的员工都能给本企业带来高收益，但是在信息不对称的情况下是不可能实现的，企业需要决定按何种方式核算员工的工资使自己的收益最大化。

二、文献综述

对博弈论的研究主要可以分为早期研究阶段、形成阶段、成长和发展阶段、成熟阶段，而在二十一世纪博弈论方法越来越成为经济学研究的主流方法，在现代经济理论与实践中引起了学者的关注，在企业和员工行为关系研究中也取得了一些的成果。汪安佑（2008）利用博弈论分析了雇佣双方的行为选择，结果表明在信息不对称的情况下激励机制会出现失效，雇佣双方出于自身利益最大化的需求，其偏好和行为选择往往不一致，导致效率损失。信息失灵的存在还可能使激励机制产生副作用，导致低效率员工驱逐高效率员工的逆向选择现象[1]。陆义海（2008）利用不完全信息动态博弈分析劳动合同法约束下企业和员工的最优行为选择[2]。刘泽双（2008）应用演化博弈理论构造了企业外部招聘行为的演化博弈模型，揭示了企业外部招聘行为的演化进程，并探讨了系统演化方向的控制因素及可能的控制方法[3]。范如国（2009）用博弈理论分析了企业和员工在效率工资博弈过程中的行为和策略，揭示了该模型与均衡效率工资模型相比具有的更为丰富的经济内涵，并从八个方面阐述了效率工资对企业提高管理效率的价值，认为效率工资需要与其它激励机制相互补充，建立全面报酬体系才能实现其激励的目的[4]。邢晓柳（2010）建立一个完全信息的静态博弈，分析知识共享过程中企业和员工的行为，论述基于企业与员工博弈的知识共享影响因素，从企业和员工两个方面提出各自知识共享的对策[5]。

以上文献都指出了信息不完全和不对称可能会导致经济效率损失和逆向选择，但是大多数学者都停留于理论表面，当然也有学者基于模型分析企业与员工的行为，但是他们大多都选择完全信息静态博弈模型或者不完全信息静态博弈模型进行分析。本文基于不完全信息动态博弈分析企业与员工行为，考虑了参与人做出选择的时间先后顺序，这是本文新颖观点所在.。

三、理论

（一）基本理论

博弈论又称对策论，是研究在对抗性情况下，如何获得最优策略的一种数学方法，也可以说是研究决策主体的行为发生直接相互作用时候的决策及这种决策的均衡问题。

一个完整的博弈包含以下几个要素：参与人、行为或策略集、行动次序、得益、信息。参与人也称决策主体，可以是个人、组织和国家，但是与得益无关的人不能称为决策主体，如两个下棋的人是决策主体，而旁边观看者不是决策主体。各参与人各自可以选择的全部策略或行为的集合称为策略集，即规定每个决策主体在进行决策时可以选择的方法、做法或经济活动的水平等，在数学函数中相当于函数的取值范围。在现实的各种决策活动中，当有多个决策方同时存在时，有时候各决策主体的决策有先后之分，有时一个决策主体还要进行多次决策，这就涉及到决策次序的问题。决策主体的得益是指各决策主体的每一组可能的决策选择都应由一个结果表示该策略组合下各决策主体的得失。得益的信息是博弈中最重要的信息，即每个决策主体在每种情况下的得益情况。

按照不同的要素博弈可以分为多种类型：博弈根据参与人的多少可以分为单人博弈和多人博弈，根据行动的次序可以分为静态博弈、动态博弈（一次博弈）、重复博弈，按照信息分类又可以分为完全信息博弈和不完全信息博弈，按照得益可以分为零和博弈和常和博弈，按照行为分为有限博弈和无限博弈，根据集体理性还是个人理性可以分为合作博弈和非合作博弈。上述各种博弈分类都是交叉的，并不存在严格的层次关系，根据交叉分类可以分为完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈等。本文拟用不完全信息动态博弈分析人与企业委托人的行为，这里就只对不完全信息动态博弈进行说明。

（二）不完全信息动态博弈理论

动态博弈即行动有先后顺序，不完全信息条件下决策主体知道对方有哪几种类型以及各种类型出现的概率，即知道参与人的不同类型与相应选择之间的关系，但是并不知道其他参与人具体属于哪一种类型。由于行动有先后顺序，后行动者可以观察到先行动者的行为，获得先行动者的信息，从而证实或修正自己对先行动的行动。在不完全信息动态博弈一开始，某一参与人根据其他参与人的不同类型及所属类型的概率分布，建立自己的初步判断。当博弈开始后，该参与人就可以根据他所观察到的其他参与人的实际行动来修正自己的初步判断，并根据这种不断变化的判断选择自己的策略。

（三）海萨尼转换

海萨尼1967年提出了一种将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路，被称为“海萨尼转换”[6]。利用海萨尼转换也可以将不完全信息动态博弈转化成不完美信息动态博弈。海萨尼转换的具体方法如下：一是引进一个虚拟的“自然”博弈方，也称为“博弈方0”，其作用是在博弈中进行实际博弈的博弈方选择之前，为每个实际博弈方按随机方式选择，或者说抽取他们各自的类型，抽取的这些类型构成类型向量t=（t1，……，tn），其中ti？缀Ti，i=1，……n。二是这个“自然”博弈方让每个实际博弈方知道自己的类型，但不让（全部或部分）博弈方知道其他博弈方的类型。三是在前述基础上再进行原来的动态博弈，即各个博弈方按各自的先后顺序从各自的行为空间中选择行动方案a1，……an。四是除了博弈方0，即“自然”以外，企业博弈方各自取得得益，ui=ui（a1，……an，ti）其中i=1，……n。

四、员工与企业不完全信息动态博弈分析

（一）模型假设与构建

对于员工和企业做如下假设和说明：

假设1：这里的员工都是企业愿意与之签约的求职者，员工需要做出的选择是与何种类型的企业签约，只要求职者愿意与企业签约，企业都会愿意与之签约，企业要选择的是以何种方式核算员工的工资使自己的收益最大化。企业由于不知道员工是高水平还是低水平处于信息劣势地位，而员工知道自己的水平处于信息优势地位。

假设2：高水平的员工就会为企业取得高的效益，低水平的员工为企业获得低的效益。

假设3：企业要知道每个员工为企业带来的收益需要付出一定的成本，比如需要设立人事部门专门核算员工的工资，设监管成本为c。

假设4：根据将企业按照核算员工工资的不同方式分为两种类型，一种是对所有员工一视同仁，高水平和低水平的员工的工资相同，即员工工资不与员工为企业带来的收益衡量，这类企业用B表示，在现实生活中指按月支付员工固定工资的企业。另一种企业有两种方式核算员工的工资，第一种方式和B类企业相同，按月支付员工固定工资，第二种方式是根据员工为企业带来的收益衡量员工工资，这类企业用A表示。由于A类企业不知道员工水平的高低，因此A类企业选择何种方式核算员工工资的概率对高水平员工与低水平员工是相同的，都为P。因为B类企业员工工资不按收益核算，所以高水平的员工与低水平的员工得到的工资都为w1。A类企业按照第一种方式核算员工工资时，给予高水平和低水平的人相同的工资，用w3表示，并且w3>w1。当A类企业按照员工为企业带来的收益核算员工工资时，高水平的员工因为效益好而获得奖励，得到的工资用w2表示，高于不按为企业带来收益多少核算时的工资，即w2>w3。低水平的员工因为效益差而获得惩罚，得到的工资用w4表示，低于按为企业带来收益多少核算时的工资，即w4w1>w4。

假设5：A类企业签约到的员工具有高水平则A类企业的收益为a1，如果为低水平则A类企业收益为a2，且a1>a2。

假设6：如果A类企业按照为企业带来收益的方式核算员工工资，则员工为了争取更高的工资会更加努力，因此会给企业带来额外的收益，假设高水平员工带来的额外收益为b1，低水平员工带来的额外的收益为b2，且b1>b2。

根据以上假设构建基于不完全信息动态博弈的模型如图1所示。

其中1表示员工，2表示企业，H代表员工具有高水平，L代表员工具有低水平，方式1指不按员工为企业带来收益衡量员工工资，方式2指按员工为企业带来收益衡量员工工资。

（二）模型分析

第一阶段博弈：自然首先选择参与人的类型，较高水平的员工与较低水平的员工，是较高水平员工的概率为P（H），是较低水平人的概率为P（L），且P（H）+P（L）=1。

第二阶段博弈：不同水平的员工是否选择与A类企业签约取决于A类企业给员工带来的预期收益。E（tA|H）表示高水平员工与A类企业签约的预期收益，E（tA|L）表示低水平员工与A类企业签约的预期收益，E（tB|H）表示高水平员工与其他企业签约的预期收益，E（tB|L）表示低水平员工与其他企业签约的预期收益。根据构建的模型可计算出：

E（tA|H）=Pw2+（1-P）w3 E（tA|L）=Pw4+（1-P）w3 E（tB|H）=w1 E（tL|L）=w1

第三阶段博弈：A类企业需要知道劳动力市场中高水平员工和低水平员工的概率分布以及愿意与A类企业签约的情况下和不与A类企业签约的情况下高水平员工和低水平员工的概率分布情况。根据贝叶斯法则，在愿意与A类企业签约的情况下，员工水平高低的概率分布如下：

P（H|tA）==

在时P（tA|L）=1时，P（H|tA）=P（H），P（tA|L）=0时，P（H|tA）=1

同理可得P（tB|L）=1时，P（H|tB）=P（H），P（tB|L）=0时，P（H|tB）=1

P（L|tA）==

在P（tA|L）=1时P（L|tA）=P（L），P（tA|L）=0时，P（H|tB）=1

同理可得P（tB|L）=1时，P（L|tB）=P（L），P（tB|L）=0时，P（L|tB）=1

通过计算得知，只要P（tA|L）≠0，企业无法确定员工与愿意与A类企业签约和不愿意与A类企业签约的条件下高水平和低水平的员工的概率分布情况，因此企业会考虑根据员工为企业带来的收益核算员工工资，因为如果不按照这种方式核算员工工资的话，无论是低水平还是高水平的员工都会愿意与A类企业签约，而低水平的员工会给企业带来更低的利益，但是企业根据员工为企业带来收益核算员工工资需要付出一定的成本，但对员工也会起到激励作用，使员工更加努力工作带来额外的收益，站在企业的角度需要考虑两种核算方式带来的预期收益，通过计算自身的预期收益选择按照何种方式核算员工工资[7]。

E（G|方式2）=P（H）（a1+b1-c）+P（L）（a2+b2-c）

E（G|方式1）=P（H）a1+P（L）a2

因此，当按照第二种方式核算为企业所带来的收益大于按第一种方式核算的收益时，即按照第二种方式核算所需成本较低。而由于第二种方式可以激励员工更加努力工作带来较多的额外收益时，企业会选择按照员工为企业带来的收益核算员工工资。当按照员工为企业带来的收益核算员工工资所带来的收益小于按月支付员工固定工资所带来的收益时，即按照第二种方式核算所需成本较高，而激励制度也无法使人带来较高的额外收益时，企业不会选择第二种方式核算员工工资。

（三）对策分析

博弈反映出以下问题：一是由于信息不对称，A类企业在选择员工时有可能选到低水平的员工，因为在一定条件下低水平的员工选择A类企业的收益比选择B类企业的收益更大，低水平的员工会选择与A类企业签约，而A类企业无法从员工选择与自己签约还是与B类企业签约确定高水平和低水平的员工的分布。

在信息不对称和逆向选择的条件下，站在企业的角度看，为了选择高水平的员工，A类企业在签约前应该提高甄别低水平员工的能力，在签约后A类企业应该采取一定的激励措施，促使员工更加努力的工作。

1.签约前提高甄别低水平人的能力。签约前为了提高甄别低水平员工的能力可以提高准入门槛，比如对学历、对证书的要求等，也可以利用试用期传递重复的信号，根据人在试用期的表现选择是否与员工签约，并且通常试用期越长越能反映员工水平高低，A类企业判断的依据就越充分，签约到高水平的人的概率越大。

2.签约后采取激励机制。根据不完全信息动态博弈分析的结果，A类企业并不能排除与低水平员工签约的可能性。为了保障自己的利益可以根据员工为企业带来的收益高低决定员工的工资，通常这样可以刺激员工更加努力工作，为企业带来更多的收益，并且在签约后也可以采取其他的激励机制促使员工更加努力工作，获得额外的收益[8]。

参考文献：

[1]汪安佑，柴铎.信息不完全和信息不对称导致的企业激励机制失效[J].经济问题探索，2008（4）.

[2]范如国.员工效率工资与企业的管理效率分析[J].南开管理评论，2009（4）.

[3]刘泽双.企业外部招聘行为的演化博弈分析[J].中国管理科学，2008（S1）.

[4]陆义敏.不完全信息动态博弈：劳动合同法约束下员工和企业行为分析[J].首都经济贸易大学学报，2008（2）.

[5]邢晓柳.基于企业与员工博弈的知识共享影响因素及对策研究[J].科技管理研究，2010（23）.

[6]谢识予.经济博弈论[M].复旦大学出版社，2007.

第5篇：博弈分析方法范文

博弈论又称为“对策论”，一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象，因此很多领域都能应用博弈论，例如军事领域、经济领域、政治外交，解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪，1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成，随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖，使博弈论在经济领域中的地位和作用得到权威性的肯定。

2．博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来，博弈论模型可以用五个方面来描述

G={P，A，S，I，U}

P：为局中人，博弈的参与者，也称为“博弈方”，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。

A：为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限，可分为有限博弈和无限博弈，后者表现为连续对策，重复博弈和微分对策等。

S：博弈的进程，也是博弈进行的次序。局中人同时行动的一次性决策的博弈，成为静态博弈，如齐威王和田忌赛马；局中人行动有先后次序，称为动态博弈，如下棋。

I：博弈信息，能够影响最后博弈结局的所有局中人的情报，如效用函数，响应函数，策略空间等。打仗强调“知己知彼，百战不殆”，可见信息在博弈中占重要的地位，博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息，如果博弈各方对各种局势下所有局中人的得益状况完全清楚，称之为完全信息博弈（gamewithcompleteinformation），例如齐威王和田忌赛马，各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈（gamewithincompleteinformation），例如投标拍卖，博弈各方均不清楚对方的估价。在动态博弈中还有一类信息：轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈（gamewithperfectinformation），例如下棋，双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”（gamewithimperfectinformation）。由于信息不完美，博弈的结果只能是概率期望，而不能象完美信息博弈那样有确定的结果。

U：为局中人获得利益，也是博弈各方追求的最终目标。根据各方得益的不同情况，分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系，争取双赢的局面。

还有另一类型博弈称为多人合作博弈，例如安理会投票表决，OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上，它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域，特征函数表示各个联盟的得益（N是局中人的数目），它的分配解必须符合一定的合理性和稳定性，它的解的概念也发展成多种多样，包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要，针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步，博弈论模型的求解目标就是使自身最终的利益最大化，这种解建立在对方也采取各自“最好策略”为前提，各方最终达到一个力量均衡，也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品，它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中，遇到很多前所未有的新课题，运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场，模拟的结果可能更加接近实际，为市场模式设计提供依据。另外，电厂或用电用户作为市场的参与者，可以用博弈论来分析市场，研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如：力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法；而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题：如何识别合作伙伴，结盟利益如何在联盟内分配。电力市场环境下，电网输电作为一项服务，它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解：稳定集，核心，核仁，Shapely值等，如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息，采用什么样的信息披露政策是设计电力市场模式的一个方面。例如：电厂竞价上网，一个成功的报价不仅取决于自己的实力，还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息，因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来，博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学，两者都有广阔的发展天地，两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中，拥有自备电厂的用户是一类特殊的市场参与者，它既是用电用户，也可以是电力的供应者。随着电力市场深入发展和工业的进步，自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户（NCP）对定价的影响作用。NCP既可以从公用电网购电，也可以自己发电来满足自身需求。为解决两者的冲突，作者提出了三种博弈模型：非合作Nash博弈模型，合作博弈模型和超博弈模型。作者构造了三个局中人：公用电网，普通用户，带自备电厂的用户（NCP），并且假设它们的需求函数、边际成本、收益函数等均是线性的，通过数字模拟得出了一些有趣的结果：①NCP的加入促使公用电网降低出售给NCP的电价；②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进：①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况；②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场，如果公用电网规模很大，NCP数目很多但规模小，考虑Stackerlberg模型更符合两者实际；③该文假设公用电网的目标函数是整个社会利益最大化，而并非是自身利益最大化，这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题，它重点放在自备电厂和公用电网相互作用的方式的选择：公用电网回购NCP多余电力（buy-backsystem）或者公用电网收取NCP运转电力的过网费（wheelingcharges）。该文分析了在不同市场环境下，各方的得益情况，得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析，得出双方都可接受的交换功率和交易价格。在此基础上，文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策，采取合作型对策，应用Nash谈判公理作为仲裁程序，决策出双方都可接受的交换功率和交易价格。应该指出，白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息，又应该如何分析处理呢？这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价，这个定价能够给网络使用者一个信号，以达到全网最优化；并且能够补偿网络的投资者，网损、变动成本、固定成本等费用在网络使用者中合理分摊；同时能够正确激励网络增容。节点实时价格（nodalspotprice）制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资，为了解决双边贸易中输电系统固定成本公正分摊问题，作者提出了基于多人合作博弈模型，可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点：①使用“核仁”而不用Shapely值，因为“核仁”处于核心，分配值更加稳定和易于被各方接受；②提供了一种激励，减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性，这些特点都给建模和计算造成困难，从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中，通常需要假设或者估计对方的信息，方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下，市场参与者相对于市场规模都显得很小，市场影响力很小。在这种情况下，优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场，单个市场参与者对市场是有影响力的，其模型本质上属于不完全信息的非合作博弈。例如：每个参与者只知道自己的成本信息，而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题：在无法完全了解对方的信息情况下，参与者如何投标（选择高价投标还是低价投标）才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类，并对每一类的可能性进行概率估计，形成一个概率意义上的期望收益矩阵，用Nash平衡点的概念求解矩阵，得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时，都同时执行以下两个步骤：①对可能的合作对象按照一定的指标进行优先排序；②按照谈判优先顺序，逐一进行讨价还价，谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类，并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作，互相交换共享所拥有的信息，联合成博弈的一方，剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值，作为与B合作的优先指标。对每个局中人都进行一遍以上计算，得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序，各方同时进行合作谈判，谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点：正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息，并用这种反馈来更新自己的知识库，提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点：计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场，文献[13]提出了多理论模型，解决贸易合作问题，文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段：①确定自身成本等信息；②与对方互相交换信息，互相寻求合作伙伴；③按照预先设定的准则和协议进行联合分组，形成一个谈判对象优先顺序表，这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表；④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行，直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况，但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下，竞争各方均以实现自身利益最大化为目标，旋转备用的约束变得软起来，PX（powerexchange）机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的，松弛旋转备用的乘子被看作是提供备用的价格信息，各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整（例如：为t时段负荷）。根据优化原理，如果拉格朗日函数存在鞍点，则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处，如以上公式所示。基于此想法，作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益，它控制的决策变量是p，u（p向量表示各机组分配的有功，u向量表示机组启停），目标是使整个系统成本最低。另一个局中人Q，是一个假想的发电商，它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价，最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论，作者设计了自适应的次梯度算法寻求平衡点，其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间（例如：5%Dt-%Dt，Dtt时段负荷），形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数，模型可细分为两种：Nash模型（不了解对方反应函数）和Stackelberg模型（Q了解P的反应函数），作者认为后一种模型掌握的信息较多，因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学，不过它更具有人的逻辑思维的色彩，融合了一些用别的方法难以表达的信息。

第6篇：博弈分析方法范文

针对现实网络攻防环境中防御措施的滞后性以及攻防对抗过程中双方收益不完全相等的问题，提出一种基于非零和博弈的主动防御策略选取方法。首先依据攻击者与系统的博弈关系，结合网络安全问题实际情况提出网络安全博弈图；其次在此基础上给出一种基于非零和博弈的网络攻防博弈模型，结合主机重要度以及防御措施成功率计算单一安全属性攻防收益值，进而根据攻防意图对整体攻防收益进行量化；最后通过分析纳什均衡得到最优主动防御策略。实例验证了该方法在攻击行为预测和主动防御策略选取方面的有效性和可行性。

关键词：

网络安全；攻防模型；非零和博弈；主动防御；策略选取

0引言

随着网络的发展，网络安全研究的理念已经从被动防御转向了积极防御。积极防御的目的是为了提前识别系统潜在的安全威胁，采用针对性的措施阻止或减少系统的损失。因此能否选择合适的防御策略显得尤为重要，而选择的防御策略是否有效，不仅取决于系统自身，同时也要考虑到攻击行为对防御策略可能产生的影响，即攻防双方策略的依存性。对于这种攻防行为交互的关系可应用博弈论进行建模分析[1]。

博弈论是一种研究利益冲突主体在理性对抗情况下寻求最优策略的理论，由于在冲突理解和建模方面的价值，被广泛应用于系统安全相关问题。文献[2]将博弈论引入复杂、异构的军事系统，描述了如何用博弈论来分析网络攻击事件。文献[3-4]提出了一种基于动态博弈论的网络安全主动防御模型，但未充分考虑博弈过程中攻防收益问题。文献[5]应用随机博弈建立了攻防博弈模型，通过计算纳什均衡得到双方最优策略，虽然其收益计算较为简单，但具有很好的借鉴意义。文献[6]通过建立贝叶斯博弈模型，使用贝叶斯法则对网络中存在的恶意主机节点概率进行修正，对攻击行为进行预测。文献[7]在贝叶斯博弈的基础上引入粗糙集理论构建了粗糙攻防博弈模型，对攻防策略进行分析。文献[8-10]通过建立非合作博弈模型，对入侵检测场景、攻击概率计算以及攻防实验整体架构进行了分析，但其多将攻防行为看成零和博弈，而在现实网络环境下，攻击防御成本的不同导致了其攻防收益并非完全相等。

针对上述问题，本文给出一种基于非零和博弈的网络防御策略分析方法。首先结合网络安全实际给出网络安全博弈图，在此基础上构建非零和攻防博弈模型，并将攻防意图和网络安全属性相结合，给出攻防成本量化方法，进而通过求解纳什均衡得到最优防御策略。

5结语

本文针对网络安全问题具有利益对立性、策略依存性的特点结合博弈论提出了一种网络安全博弈图。在此基础上，结合实际攻防环境将网络攻防对抗理解为两人非合作、非零和博弈模型，从网络安全属性的角度给出了攻防成本量化方法。实验结果表明，本文所提出的评估模型能有效对攻击行为做出预测，并为系统做好主动防御提供最优防御策略选择。

参考文献：

[1]

林闯，，李泉林. 网络安全的随机模型方法与评价技术[J]. 计算机学报， 2005， 28（12）： 1943-1956.

[2]

BROWNE R. C4I defensive infrastructure for survivability against multimode attack[C]// Proceedings of the 21st Century Military Communication- Architectures and Technologies for Information Superiority. Washington， DC： IEEE Computer Society， 2000， 1： 417-424.

[3]

林旺群，王慧，刘家红，等. 基于非合作动态博弈的网络安全主动防御技术研究[J]. 计算机研究与发展， 2011， 48（2）： 306-316.

[4]

张少俊，李建华，陈秀真，等. 基于动态博弈理论的分布式拒绝服务攻击防御方法[J]. 上海交通大学学报， 2008， 42（2）： 198-201.

[5]

LYE K， WING J M. Game strategies in network security[J]. International Journal of Information Security， 2005， 4（1）： 71-86.

[6]

曹晖，王青青，马义忠，等. 基于动态贝叶斯博弈的攻击预测模型[J]. 计算机应用， 2007， 27（6）： 1545-1547.

[7]

王纯子，黄光球. 基于粗糙贝叶斯博弈的网络攻防策略[J]. 计算机应用， 2011， 31（3）： 784-789.

[8]

HADI O， MONA M， CHADI A， et al. Game theoretic models for detecting network intrusions[J]. Computer Communications， 2008， 31（10）： 1934-1944.

[9]

SALLHAMMAR K， HELVIK B E， KNAPSKOG S J. On stochastic modeling for integrated security and dependability evaluation[J]. Journal of Networks， 2006，1（5）： 31-42.

[10]

王元卓，林闯，程学旗，等. 基于随机博弈模型的网络攻防量化分析方法[J]. 计算机学报， 2010， 33（9）： 1748-1762.

[11]

司加全，张冰，荷大鹏，等. 基于攻击图的网络安全性增强策略制定方法[J]. 通信学报， 2009， 30（2）： 123-128.

[12]

ROBERT G. A primer in game theory[M]. Princeton： Princeton University Press， 1992.

第7篇：博弈分析方法范文

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

第8篇：博弈分析方法范文

【关键词】博弈论会计信息披露运用

一、引言

博弈论也叫对策论或赛局理论，是经济学中的标准分析工具之一。博弈论研究是的在博弈的双方或多方之间如何做出决策以及决策的均衡问题。在现代金融界和会计管理方面，不同的会计信息使用人员都会运用到博弈。目前，我国企业会计信息披露问题的大量出现，反映了企业各方人员在财务信息的博弈。

二、信息不对称是会计信息披露的博弈动机

在经济交易过程中，交易的双方所掌握的信息不对称，卖方为使经济利益最大化，运用自身信息优势使自己获得更多的利益，处于信息匮乏的买方则会利用各种手段和方法去获得更多的信息资源，以便自己做出合理的决策。在这种搜集信息和利用信息判断的过程中，每个参与者所做出的判断和行为都要考虑多种情况的发生，还要考虑其他参与者可能要采取的决策。在会计信息披露时，披露会计信息是企业作为主体向社会其他客体利益相关者输送信息的。在这里，企业作为主动方披露信息，接受者作为被动方接受信息。在会计信息披露过程中，披露会计信息是受到国家会计准则和相关会计制度和法律法规制约和监督的。在实际的会计业务操作中，往往会发生处理数据时，常常存在多种可选择的信息处理方法，在这种情况下，由于信息不对称，企业会更多地从自身利益去考虑有选择、有目的地提取对自身有帮助、能使自身利益最大的会计信息对外披露，从而掩盖、忽视对自身不利的一面信息，所以就出现了会计信息失真现象。

三、会计信息披露中的运用

（1）确定博弈的双方。企业的经营者和所有者之间的委托关系是企业最基本的委托关系，属于委托关系的最高层。经营者与所有者通过契约的形式，所有者把自身的企业产权如占有权、使用权、收益权和分配权通过法律手段赋予经营者一部分，而自身只有终极所有权和收益权，同时企业所有者要求企业经营者履行其资产增值和保值、破产清偿等经济责任。我国《会计法》有明确规定，单位的负责人要对本单位会计资料和工作的完整性以及真实性负责，还要对其违法行为承担法律责任。这就使企业的经营者和企业的会计人员形成委托的一种关系。会计部分对企业所有者和经营者两方的经济利益具有协调和监督作用。因为会计人员自身的利益与企业的经营者息息相关，尤其是工资与企业挂钩，一部分会计人员又是企业财务部门的主干，导致会计人员对本企业的监督和协调流于形式上的应付、走过场，在关键会计信息披露上与本企业经营者保持一致，孤立、敌对企业所有者，把企业所有者作为会计信息披露博弈的另一方来看待。在这里，企业的经营者作为博弈一方，企业的所有者作为博弈的另一方。两房博弈可以看成是合作博弈。

（2）博弈双发的战略选择。在会计信息披露的双方博弈过程中，企业的经营者可以选择按公平、公正、公开的原则，依照会计准则的要求、制度、法律法规等规定，客观、真实地披露会计信息。企业的经营者也可以选择披露虚假、捏造的对自身经营状况有利一面的会计信息。同样，企业的所有者在博弈过程中也有两者选择，如对企业经营者披露的相关文件盒会计信息进行核实、审查，也可以对其会计信息不进行审核查看。

（3）博弈双方的利益分析。我们可假设企业经营者选择隐瞒会计信息，从中可获得利益为2，如果真实、客观选择披露会计信息，从中可获得利益为1。假设对企业所有者来讲，，经营者隐瞒会计信息科从中获得利益5，如果真实、客观披露会计信息从中获得利益为10。通过分析可以知道一定时间段，经营者隐瞒真实情况时获利较多，对所有者不利。从长期看，经营者隐瞒会计信息，会使双方利益减少，如果真实披露会计信息，则是双方增加利益。设定前提条件为所有者检查的成本为1，所有者不对经营者惩罚和奖励，用中立的态度，分析博弈的过程，如图所示：

（4）对整个博弈过程的分析。从上图博弈分析中所知，不管企业经营者在短期内真实披露信息亦或隐瞒信息，企业所有者都会选择不检查。不管企业所有者在短期内检查与否，企业经营者都会选择隐瞒披露信息。这样的结果显然是令人不满意，这样造成的后果不堪设想。因此，要采取相应的措施改变现状，达到企业所有者不检查而企业经营者真实客观披露会计信息。

假设目前企业所有者发现企业经营者隐瞒、虚报会计信息，所有者对经营者惩罚为3，如果企业所有者没有发现企业经营者可以隐瞒、虚报会计信息给予奖励和附属福利待遇，从企业所有者资产收入利润的10%发放给企业经营者，其他的条件不变。如此，我们又会看到，无论是企业经营者真实、客观披露会计信息时，企业所有者就不会检查，当企业所有者检查与否，企业经营者都会如实、客观的披露会计信息。而博弈的峰值在（5.3，7.7）点达到平衡。这样，就达到了博弈的目的。

四、结语

博弈启示：我们在博弈的过程中，为了达到博弈的目的，必须加大惩处力度，同时要积极配合激励措施，实行博弈双发都有利的措施，既有利于企业的健康成长，又利于经营一方盈利，达到合作共赢。在惩处和激励应遵循适度和合理的原则，双发不能过激，惩罚力度大会使经营者一方压力过大。如果激励不够，又会使经营者隐瞒、捏造虚假会计信息。所以，博弈有长期、复杂的特点，我们要在合理、耐心的找到均衡点，这个均衡是双方互相忍让、达成合作的切入点，企业各方会经过多轮博弈过程才形成共识。

参考文献：

[1]上官萍.从博弈论看会计信息披露――兼谈上市公司会计信息披露现状及思考[J].南京工业大学学报，2002，（2）.

[2]李秀芬，张平.企业会计信息披露失真问题的多方博弈[J].西北民族大学学报（哲学社会科学版），2013，（2）.

第9篇：博弈分析方法范文

关键词：博弈分销渠道；渠道冲突

中图分类号：F713.3 文献标识码：A 文章编号：1674-7712 （2012） 18-0052-01

一、博弈论概述

（一）博弈论的提出。作为理理论的组成部分，美国数学家冯·诺伊曼（John von-Neumann）和斯卡·摩根斯顿（Oskar Morgenstern）创立了博弈论（game）。1944年，由2位学者合著的《经济行为与博弈论》，奠定了博弈论的基本框架。在1950—1954年，纳什（美国数学家、统计学家）发表了多篇博弈论的论文，第一次指出了合作博弈和非合作博弈的区别，并提出纳什均衡（Nsah equilibrium）。在这之后，博弈理论的主流地位由非合作博弈占领，非合作博弈被愈来愈多的人所熟知，在实践中得到愈来愈多的运用。

博弈论又叫对策论，它的目标是通过预测各个参与者的反应和行为，选择实现组织目标的最优决策方案。在完全竞争的环境下，博弈论可以帮助企业规避风险，对顾客、竞争者、中间商、供应商的决策行为进行理性的分析。因此，它经常被作为研究主体行为相互作用及均衡状态的方法，来指导企业的营销决策。

（二）博弈论中的“囚徒困境”收益模型。大家熟知的“囚徒困境”，反应的是博弈论中大家熟知的经典案例：有两个非法携带枪支的罪犯，被警察抓到，按律应各判入狱一年。但警察还怀疑这两人有别的罪行——合伙抢劫银行，但是目前没有证据证明这一点。于是警察隔离审讯两个罪犯，这样就可以防止他们事前沟通；并采取了“坦白从宽，抗拒从严”的政策，谁要是告发同伙，可以无罪释放，并得到一笔奖金，而同伙就会被处以重罚。

二、营销渠道活动中的博弈现象分析

（一）渠道冲突中的博弈分析。在渠道冲突中的表现形式上，最常见的冲突就经销商之间的降价、倾销和低价抛售。厂家价格体系的混乱主要由下面2个原因引起：一是不同区域市场之间的“窜货”；一是同一市场上的经销商之间争夺客户。这2个原因都跟降价有关。我们都知道，降价倾销对厂家和经销商都是不利的，对厂家来说，会引起价格体系的混乱甚至整个渠道体系的混乱；对经销商来说，会让他们的利润减少，甚至无利可图。但是为什么还是会出现降价销售呢？运用“囚徒困境”的模型，可以非常直观的解释经销商之间降价倾销的根本原因，并且能通过对降价倾销根本原因的分析，找到制约降价倾销的管理方法。

纳什均衡最后的结果是每个经销商的利益都受到了损害，这其实不是双方想要的结果。但为什么双方宁愿选择降价，也不愿意选择对双方都有利的做法呢？这就是“囚徒困境”反映出来的一个深刻的问题——因为双方的不信任以及经销商过分强调自己的个人利益和短期利益，使得个人理性偏离了集体理性。但因为每个经销商都是独立的实体，都会想办法追求自身的利益最大化，因此，降价倾销现象必然。要解决这个问题，就必须有外在的力量对经销商的这种行为进行干预。

（二）渠道成员的激励与控制博弈分析。针对上面2个经销商的短期行为，如果引入一个外界力量——制造商，让制造商参与管理，情况会怎样呢？假定制造商制定相应的政策，对渠道体系中的成员进行有效的管理，明确规定，谁擅自降价，就会处以重罚，并把处罚所得用来奖励遵守规定的经销商，让降价销售的经销商认识到，降价不仅不能给自己带来额外的收入，而且还会小于不降价的所得。

三、加强渠道管理的建议

（一）为减少销售渠道冲突，制造商必须介入，加强对经销商的管理。从前文的分析中我们可以看到，不管是什么类型的经销商，由于利益的驱使，他们的行为都会受到机会主义利益的影响，采取降价销售，扰乱整个渠道的价格体系，从而影响到整个渠道的稳定，出现表二中第一种结果。制造商应该在品牌经营方面做好各种工作，提升自己品牌的知名度和名誉度，保证产品的热销，做好企业的可持续发展工作。

（二）由以上的对经销商的激励与控制的博弈分析可以看出，经常性激励是控制渠道的理想选择。额外报酬是对经销商激励的一种最有效的方式。额外报酬是在经销商执行特定活动时，制造商给予的附加利益。为提高额外报酬的激励效应，一方面应尽力了解不同经销商的不同需要和欲望，另一方面要制定科学的考核指标。

博弈论最明显的特点是有自己的严格性和准确性，并且能做到与现代科学技术的发展保持同步。现代企业之间的竞争与以往相比，显然更明确、更直接、更激烈、更集中，而且高层次化。博弈论可以根据企业营销行为在不同的社会经济环境下的变化而改变，对企业新出现的行为特征加以概括，在此基础上找到问题的解决办法。

参考文献：

博弈分析方法精选(九篇)

相关热门标签

相关文章阅读

精选范文推荐

相关期刊推荐

玻璃艺术

宁波医学

船舶经济贸易

冶金信息导刊