博弈论及其应用精选(九篇)

时间：2023-09-25 17:28:42

博弈论及其应用

第1篇：博弈论及其应用范文

【关键词】无线电博弈论纳什均衡

一、博弈论的概述

1.1概念

博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论[20]。也就是说，博弈论研究当一个主体，譬如说一个人或一个企业的选择受到其他人（其他企业）的选择的影响，而且反过来影响到其他人（其他企业）选择时的决策问题和均衡问题。所以在这个意义上说，博弈论又称为“对策论”。博弈论是一种使用严谨数学模型来解决现实中利害冲突的理论，由于冲突、合作、竞争等行为是现实中常见的现象，因此很多领域都能应用博弈论，如军事领域、经济领域、政治外交等。

1.2博弈论模型简介

博弈论自产生到发展至今已形成了较成熟的理论体系，它并不是经济学的一个分支，它是一种方法，应用范围不仅包括经济学，政治学、军事、外交、国际关系、公共选择，还有犯罪学等都涉及到博弈论。不过博弈论也具有自身的基本模型，可以对一个博弈过程用5个方面来描述，G={P，A，O，I，U}

① P（player）：博弈的参与方。

② A（action）：博弈方可选择的全部行为或策略的集合

③ O（orders）：博弈的次序。

④ I（information）：博弈的信息。

⑤ U（utility）：博弈方的收益。

以上五个方面是定义一个博弈时必须首先设定的，确定了上述五个方面就是确定了一个博弈。博弈论就是系统研究用上述方法定义的各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，也既是均衡。

1.3博弈论的分类

现实中各种博弈可以按照不同的办法进行分类。根据参与人的多少，可以将博弈分为两人博弈和多人博弈；根据参与人是否合作，可以将博弈分为合作博弈和非合作博弈；根据博弈结果的不同，又可以将博弈分为零和博弈、常和博弈和变和博弈。

1.4纳什均衡

1.4.1纳什均衡的定义

纳什均衡（Nash Equilibrium）[20]是一种策略组合，它能够使得每个参与者的策略都是对其他参与者策略的最优反应。“最优反应”指的是该策略带给采用它的博弈方的利益或期望利益，大于或至少不小于其它任何策略能带来的利益。博弈的目的，就是为了寻求这样的一个最佳的策略组合。

1.5 一些特殊的博弈模型

1.5.1重复博弈模型

重复博弈是目前人们了解的最为透彻的一类动态博弈，参与人每一期都面对同样的“阶段博弈”或“选民博弈”，而且参与人的全部收益是每阶段所得收益的加权平均。参与者基于对博弈过程的认知，例如对过去行为的了解，对未来的预期和对当前情况的观察，在每一个阶段的博弈中选择自身的策略。这些策略可以是固定的，也可以随其它参与者行动的改变而变化，甚至可以是自适应的。

1.5.2潜在博弈模型

潜在博弈是一般形式博弈中的一种特殊类型，存在函数u：SR当单方面的背离发生时，u的变化Δu将被反映到单方面背离博弈者的效用上。

二、在无线通信系统资源分配问题中应用博弈论的可行性分析

随着无线通信系统的飞速发展，许多概念和技术与现有系统相比都有很大的变化。通信系统将具有智能的资源管理，采用大量动态的、分布式的、自适应式的资源管理方式。

三、基于博弈论的动态频谱接入方法

如何利用博弈论方法对认知无线电技术的研究进行分析，其中的关键是如何将博弈论引入到相应算法的设计和分析中，找到算法的纳什均衡点。在开始具体的算法研究之前，需要将所研究的问题抽象成博弈论问题模型。

3.1 分布式自适应频谱接入方法

博弈论模型适用于分析认知无线电系统各用户竞争频谱的分布式行为，各用户根据自己获得的信息单独进行决策。

第2篇：博弈论及其应用范文

关键词：博弈论；供应链管理；均衡

Abstract: Game theory focus on the status analyze of conflict and cooperation. With the development of competition and cooperation among modern enterprises， game theory is widely used in supply chain management（SCM）. This paper classified the applications of game theory in SCM into two groups: applications in traditional problems of SCM， and applications in SCM network equilibrium. The paper made a depth literature review of these two categories and gave out the future research trends.

Key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况（博弈）中，每位决策者的最优决策和这些最优决策所构成的可能结果，以及这些结果的相关特性[1]。博弈论关注于包含冲突与合作的状态分析[2]，目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理，以改善顾客服务和增加经济价值的流程[3]。近年来，随着供应链中企业间的竞争与合作不断增强，博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用，主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

供应链由不同的企业组成，企业间相互竞争的同时也相互合作，随着供应链由“链”向“网”的转变，企业间关系越来越复杂，不仅存在着上下游企业的竞争与合作，还包括不同供应链的核心企业间的竞争与合作问题。纵观供应链管理弈论的应用研究，本文将博弈论在供应链管理中的应用分为两大类：博弈论在传统供应链问题中的应用；博弈论在供应链网络均衡中的应用。

（1）博弈论在传统供应链问题中的应用

Cachon和Netessine根据供应链管理的应用，将博弈论分为四种类型：非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2]；Leng通过对130多篇供应链管理中运用博弈论的文献进行总结，认为博弈论在供应链中的应用主要有五种类型：固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈（能力决策、服务质量、产品质量等）及联合决策博弈（能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈）[2]。

在供应链的传统问题中，博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈，Parlar分析了单阶段，两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4]；Cachon研究了两阶段情况下，一个供应商与一个零售商的库存决策问题[5]；Monahan针对数量折扣现象，研究了供货商和购买者在顺序决策情况下，供货商的最优折扣决策[6]，而Kohli和Park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7]；随着市场竞争的加剧，企业需要在控制成本的前提下提供令顾客满意的服务和产品，Gans研究了M个供应商之间的服务质量竞争问题[8]，而Cohen和Whang研究了售后服务质量决策问题[9]；最近10年来，随着供应链问题研究的深入，多决策博弈问题也受到了重视，例如Bernstein和Federgruen研究了两阶段下，单个供应商和N个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

转贴于

（2）博弈论在供应链网络均衡中的应用

随着供应链成员的增加，供应链中“流”的复杂化，供应链由链状结构逐步发展成网络结构，而供应链网络的均衡问题也受到了越来越多学者的重视。

Nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型，指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件，即控制供应链网络的有限维变分不等式的解[11]；Dong在Nagurney的研究基础上对单一产品的随机需求情况进行了研究，以三方各自追求利益最大化（非合作）为目标，建立了相应的供应链网络均衡模型[12]；张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13]；藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究，由于企业间的博弈随着时间的变化而不停变化，如何解决供应链企业间存在的动态博弈成为研究的下一个方向；此外，在供应链网络中，不仅仅存在上下游企业间的竞争与合作，不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响，针对单产品供应链网络进行了上下游企业间的动态博弈研究[15]；黎继子针对不同供应链的核心企业间博弈进行了相应研究，但仅局限于同质产品的情况[16]。

2总结与趋势

博弈论在供应链管理中的广泛应用证明了博弈论在帮助解决供应链中存在的多种问题的有效性，包括库存决策、产品定价与产品数量、库存/定价/质量/广告等多决策问题，以及供应链成员间的竞争合作问题等，而且随着供应链网络的复杂化，也需要利用博弈论来解决相关网络均衡问题。

在当前研究中，Nash均衡和Stackeberg均衡常常作为解决非合作博弈的方法被广泛使用，而旁支付方法较多地运用于解决供应链成员间的合作问题，核、Shaply值及核仁的运用相对较少；而且多数研究是针对供应链的静态博弈进行分析，而在现实的供应链网络运作中，企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策，因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献：

[1] 杨荣基，彼得罗相，李颂志. 动态合作——尖端博弈论[M]. 北京：中国市场出版社，2007.

[2] Leng， M. and M. Parlar. Game Theoretical Applications in Supply Chain Management: a Review[J]. INFOR，2005，43(3):187

-221.

[3] B.J LaLonde. Supply Chain Management: Myth or Reality?[J]. Supply Chain Management Review，1997(1):6-7.

[4]M. Parlar. Game Theoretic Analysis of the Substitutable Product Inventory Problem with Ramdom Demands[J]. Naval Research Logistics， 1988(35):397-409.

[5] G.P. Cachon， et al. Competitive and cooperative inventory policies in a two-stage supply Chain[J]. Management Science，1999，45(7):936.

[6] J.P. Monahan. A Quantity Discount Pricing Model to Increase Vendor Profits[J]. Management Science，1984(30):720-726.

[7] B. Kohil and H. Park. A Cooperative Game Theory Model of Quantity Discount[J]. Management Science，1989，35(6):693-707. [8] N. Gans. Customer Loyalty and Supplier Quality Competition[J]. Management Science， 2002，48(2):207-221.

[9] M.A. Cohen and S. Whang. Competing in Product and Service: A Product Life-cycle Model[J]. Management Science， 1997，43(4):535-545.

[10]D.J. Reyniers and C.S. Tapiero. The Delivery and Control of Quality in Supplier-Producer Contracts[J]. Management Science， 1995，41(10):1581-1589.

[11]Nagurney A， Dong J， Zhang D. A Supply Chain Network Equilibrium Model[J]. Transportation Research: Part E， 2002(38):281-304.

[12]Dong， J.， D. Zhang， et al.. Multitiered Supply Chain Networks: Multicriteria Decision—Making Under Uncertainty[J]. Annals of Operations Research，2005，135(1):155.

[13] 张铁柱，刘志勇，滕春贤. 多商品流供应链网络均衡模型的研究[J]. 系统工程理论与实践，2005，25(7):61-68.

[14] 滕春贤，潘晓东. 供应链网络均衡中的利润协调问题[J]. 哈尔滨工程大学学报，2007，28(7):818-821.

第3篇：博弈论及其应用范文

[关键词] 博弈论　商务谈判

博弈即一些个人、团队或组织，在一定的环境中和一定的规则约束下，依据所掌握的信息，同时或先后，一次或多次，从各自允许选择的行为或策略进行选择并加以实施，从中各自取得相应结果或收益的过程。有关博弈的理论就是博弈论。

博弈论的本义是在下棋等休闲娱乐活动中，双方在遵守游戏规则的基础上，通过分析对手可能采用的方法有针对性地选择相应的策略或计谋，以制胜对方的理论。博弈论是研究各方策略相互影响的条件下，理性决策人的决策行为理论。博弈思想最早产生于古代军事活动和游戏活动，众所周知的田忌赛马就是典型的博弈论例子。现在博弈论广泛应用于军事、政治竞选、系统控制、企业经营管理和商务谈判等多个领域。

采用博弈方法是商务谈判的重要策略之一，将复杂的、不确定的谈判通过简洁明了的博弈分析，使研究进一步科学化、规范化、系统化，寻找某些规律性的东西，建立某种分析模式，从而构建谈判理论分析的基础框架。

商务谈判具有一般博弈论运用领域的共同特征。商务谈判是指市场主体之间在经济活动中，为了满足各自的需要，协调彼此的关系，通过协商而争取达到意见一致的行为和过程。它与竞技比赛、军事战争同样具有竞争性和利益冲突性，谈判双方或多方都希望对方多让步而己方少让步；但是，商务谈判又具有相互合作性，是“合作的利己主义”。双方合作是以双方互利为前提，互利来源于合作新产生的利益，争取最大限度地满足己方利益一般不以损害双方合作为前提。

一、在博弈基础上的谈判程序

1.商务谈判的准备――建立风险价值

风险价值是指打算合作的双方对所要进行的交易内容的评估确定。例如，要购买的货物，估计可能的价值是多少?最理想的价格是多少?总共需要多少资金？其他的附带条件是什么？可接受的最高价是多少，其中包括产品风险、资金风险、舆论风险、社会风险等。风险价值是双方谈判的基础，没有风险价值是构不成谈判的。

2.确定合作剩余

合作剩余即合作比不合作增加的价值。如何进行分配是最关键的问题，双方的讨价还价、斗智斗勇就是为了确定双方的剩余。合作剩余的分配一般取决于双方实力的对比和谈判策略与技巧的应用。谈判不是将一块蛋糕拿来以后商量怎么分，而是想法把蛋糕做大，让每一方都多分，即变和博弈。

维护双方的基本利益是谈判必须达到的基本目标，它是影响谈判成败的关键因素。在商务谈判中，假如双方合作所带来的利益总量为A+B（为弹性空间）+C:

谈判双方都有自己必须获得的最低利益(即临界点)，甲为A，乙为C，如果最低利益得不到满足，就会退出谈判。甲乙双方应将利益争夺空间定为B，而不能将C和A纳入双方争夺范围。当甲乙双方中任何一方的利益接近临界点A+B或C+B时，就应适可而止(如图所示）。

3.达成分享剩余的协议

如果难以继续谈判，各方就不能进行有效地合作，也就无法创造出新的价值，实现更大的利益，同时也有可能使自己自身的利益受损害。达成协议，是谈判各方分享合作剩余的保证，也是维系合作的纽带。

二、博弈论在商务谈判中的要素

1.博弈参加者

博弈参加者有法人、自然人和社会团体、组织等，各方都有各种策略，形形，增加了谈判的难度，所以在谈判时，首先必须清楚博弈方的实力，变不完全信息博弈转化为完全信息博弈，才能有希望在谈判中取得胜利和双赢。

2.策略空间

在商务谈判中，随着博弈方的不同，所采取的策略和方法也会有所区别。就是应用同一策略，实施时对人的方法也会有所不同，没有完全相同的策略空间。应用适当的策略空间，对谈判进程有时起到了决定性的作用。所以在博弈开始时，在各种情况中注意对方采取的策略，从而针对其策略做出反应，使零和博弈变为变和博弈。

3.博弈的次序

博弈次序对博弈双方来说是至关重要的，主要是看在什么时机采取的什么策略。

4.博弈的信息

博弈中的信息是相当重要的，信息时代要在博弈中占上风，就要有一个稳定可靠的信息来源，以及时掌握博弈中的各种情况，同时根据信息对博弈方的行为做出预测，料敌先机成为谈判的赢家。

三、博弈论对实现商务谈判双赢的启示

1.树立“双赢”理念是谈判双方合作的前提

博弈反映的是单方最大利益和合作所得利益之间的矛盾，在个体看起来最有利的选择，则可能带来整体的不利。一场成功的商务谈判，应该是各方的预期目标都得到满足，并为此达成协议，同时融洽和改善彼此的合作关系。

2.沟通是双赢的手段

在红黑博弈中，如果没有第四回合后的两次沟通，根本无法达成双赢。

3.诚信是双赢的关键

双方通过沟通“达成共识”后，“按约定出牌”是达成双赢的必经之路。

4.信息是双赢的法宝

“红黑博弈”显示，游戏双方相互了解的程度越高，越能快速沟通并达成共识，也能够诚信地按约定出牌，达成双赢要相对容易得多，这说明在博弈中信息具有非常重要的作用。在谈判实践中，谈判者面对的信息五花八门、千差万别，既有真实信息也有虚假信息，既有有用信息也有无用信息，。这就要求谈判者必须具有敏锐地辨别信息和处理信息的能力。

5.一次性利益和长远利益的关系

可以想象如果“红黑博弈”游戏规则不是10个回合，是永远地做下去，游戏者既会积极与对方沟通，也会诚信地选择“按约定出牌”。由此可见，谈判双方对合作时间长短的预期，会影响其利益选择行为。如果谈判当事人认为合作时间是有限的，往往会作出不顾他方利益而单纯追求己方一次性利益最大化的选择；如果谈判当事人认为合作是长久的，则会兼顾一次性利益和长远利益。

参考文献：

[1]张克夫:博弈论与商务谈判[J].吉林商业高等专科学校学报, 2003,（01）

[2]贺继红娄美珍.基于“红黑博弈”的商务谈判思考, [J].商场现代化, 2006,(16)

[3]吴春梅:现代商务谈判中的博弈分析 [J].商业研究, 2003，(01)

[4]丁黎: 国际商务谈判中的博弈行为分析，河南师范大学学报(自然科学版), [J].1999,(01)

[5]李泓欣郭淑芳:浅谈博弈论在商务谈判中的应用, [J].长春理工大学学报(社会科学版), 2002,(03)

第4篇：博弈论及其应用范文

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

第5篇：博弈论及其应用范文

关键词：博弈论；财经类院校；教学改革

中图分类号：G642.0 文献标志码：A 文章编号：1674-9324（2017）05-0185-02

博弈论是研究决策主体的行为发生直接相互作用时决策主体的决策以及这种决策的均衡问题的，也就是说，博弈论的研究对象是当一个主体，比如说一个人或一个企业的选择受到其他人或其他企业选择的影响，而且反过来影响到其他人或其他企业的选择时的决策问题和均衡问题。[1]

在经济学文献中对博弈论最早的研究是古诺（1838）、伯川德（1883）和埃奇沃斯（1925）关于垄断定价和生产的论文，但是这些都被视为特例而没有改变经济学家思考大多数问题的方法。约翰・冯・诺依曼和奥斯卡・摩根斯坦在他们1944年著名的《博弈论和经济行为》一书中引进了博弈理论的思想，书中提出大部分经济问题都应该被当作是博弈进行分析。[2]

20世纪五六十年代是博弈论发展和研究的重要阶段。纳什在1950年明确提出了“纳什均衡”这一基本概念，解释了博弈论和经济均衡之间的内在联系。到20世纪50年代，合作博弈的发展达到鼎盛时期，包括纳什和夏普利分别提出的“讨价还价”模型以及吉利斯和夏普利提出的合作博弈中的“核”的概念。泽尔腾于1965年将纳什均衡的概念引入到动态博弈，提出了“精炼纳什均衡”的概念；海萨尼于1967年把不完全信息引入博弈论，并提出了“贝叶斯纳什均衡”的概念。20世纪80年代以来，博弈论逐渐成为主流经济学的一部分。博弈论的应用范围也越来越广泛，包括经济学、政治学、军事、外交、国际关系、公共选择等。

由于博弈论在经济和管理领域的广泛应用，《博弈论》已经成为许多高校的经济与管理专业的本科生的必修课。我校也开设了《博弈论》课程。然而，由于博弈论课程开设时间较短，而且作为运筹学的一个分支，它对数学基础的要求较高，因此有必要对《博弈论》课程的教学进行深入的探讨。

一、博弈论课程的教学特点

1.数学描述比较抽象。博弈论的标准表达是函数形式和集合形式的表达。博弈论作为运筹学的一个分支，它和数学的结合非常紧密，需要比较严谨的数学表达和数学证明。例如，20世纪50年代纳什在证明纳什均衡的存在性定理时就使用了泛函分析中的不动点定理。学习博弈论，通常需要具备微积分、线性代数、概率论、泛函分析等数学基础。[3]

2.教学过程通常浅入深出。由于博弈论的概念和定理均采用严谨的数学表达形式，学生理解起来较为困难。因此，教师在教学过程中通常从简单直观的例子出发，引出博弈的抽象数学模型。简单直观的案例可以帮助学生理解博弈的思想，但随着讲授内容从完全信息静态博弈到完全信息动态博弈再到不完全信息静态博弈最后到不完全信息动态博弈，均衡的概念得越来越复杂，数学定理的证明过程也越来越困难。

3.具有广泛的应用领域。现实生活中存在各种各样的矛盾，这使得博弈论可以应用于多个领域，如商业、政治、外交等。在微观研究领域，交易机制的设计涉及博弈论；在中观研究领域，劳动力经济学和金融理论中都有关于企业要素投入品市场的博弈论模型。最后，从宏观的角度看，国际经济学中有关于国家间的相互竞争（或互相串谋）选择关税或其他贸易政策的模型；宏观经济学中也有货币当局和工资、价格制定者（厂商等微观单位）间的战略相互影响，最终决定了货币政策效果的模型。[4]

二、博弈论教学中存在的问题

1.缺乏足够的案例支撑。在案例的选取过程中需要考虑到案例的趣味性、贴近现实生活的程度、学生参与案例的程度、与知识点的结合程度等。虽然博弈论的教材中提供了一定量的案例，但仍显得不够丰富。特别是对于财经类学校的本科生而言，在学习理论知识的同时，需要将其与自己对经济社会活动的观察和认识相融合，以提高分析经济社会现象以及解决实际问题的能力。[5]因此，在教学过程中选择丰富的案例是非常有必要的。

2.偏重于理论教学。以往的博弈论教学，偏重于理论教学。采取的教学方式仍然是传统的灌输式的方法，老师在讲台上讲课，学生在台下听课，而且老师的讲课内容也只是教材上的理论知识，较为枯燥乏味，学生的课堂参与度不高。因此，在重视理论教学的同时怎样提高教学的趣味性并增强学生的课堂参与度是值得思考的问题。

3.考核形式单一。目前的考核形式仅限于笔试的方式，比较单一。由于博弈论是一门应用性比较强的学科，传统的笔试并不能很好地考察学生们对博弈论知识的掌握和应用程度。有的老师采取让学生做报告的形式进行考核。学生可以选择自己感兴趣的论文，在课堂上进行讲解，教师根据学生的报告情况进行打分。这其中存在的问题是学生选取的论文的难易程度很难掌控。因此，教师需要思考如何丰富考核形式并且让考核更加真实全面地反映学生的能力。

三、完善博弈论课程教学的建议

1.采用案例教学法。由于博弈论的数学描述通常比较抽象，老师通过分析案例来说明博弈论在经济和社会领域中的各种应用，既可以提高课程的趣味性，又可以帮助学生较深入地理解博弈论的基本原理。在案例的选取过程中，首先，要尽量选择简单的案例，使学生更加容易明白博弈的规则；其次，要注意选择契合现实生活的案例，有的案例不是学生的现实生活中的问题，学生理解起来可能较为困难；再次，要注意案例选择要尽量的多源化，由于博弈论在各个领域包括商业、政治、外交等均有应用，因此在选择案例的时候不要局限于某一个领域，应尽量选择不同领域的案例，帮助学生更加深入地理解博弈论的应用。

2.理论教学与实验教学相结合。传统的理论教学会让学生感觉枯燥乏味，学生的课堂参与度不高。我们可以将理论教学与实验教学相结合，设计丰富多彩的博弈实验，将学生分成小组，然后小组内进行角色扮演，小组内不同的学生扮演不同的博弈参与者，他们之间进行竞争、讨价还价或者合作。博弈实验可以提高课程的趣味性和应用性，增强学生的课堂参与度，这种互动式的教学将极大地提高学生的学习兴趣和效率。[6]

3.理论教学与实践教学相结合。由于博弈论是一门应用性比较强的学科，仅通过学习理论知识并不能很好地掌握博弈论的思想。因此，教师可以在笔试的基础上丰富考核形式。让学生针对现实生活中的博弈问题进行建模分析，在课堂上进行汇报并整理成小论文的形式上交。为了提高所有学生的课堂参与度，对于课堂汇报过程中提问的学生给予适当的分数奖励，提出的问题质量越高，分数的奖励越大，被提问的学生回答地越好，课堂汇报这部分的分数也将越高。这一方面可以激励学生认真地进行建模分析，认真地准备课堂汇报，也将鼓励所有的学生参与到课堂汇报中。[5]

四、结语

随着经济社会的发展，越来越多的问题将借助于博弈论进行分析。因此，财经类院校的本科生学习博弈论，掌握其思维方式和思想及在经济管理中的应用是非常有必要的。本文首先分析了博弈论课程的特点，然后指出了目前博弈论教学中存在的一些问题，针对这些问题，本文给出了具有针对性和可操作性的建议。本文将为财经类院校本科生博弈论课程的教学提供有益的启示。

参考文献：

[1]张维迎.博弈论与信息经济学[M].上海：上海三联出版社，1999.

[2]朱・弗登博格，让・梯若尔.博弈论[M].北京：中国人民大学出版社，2002.

[3]浦徐进.本科博弈论教学过程中的案例运用[J].江南大学学报：教育科学版，2009，（4）：372-375.

[4]吉本斯.博弈论基础[M].北京：中国社会科学出版社，1999.

第6篇：博弈论及其应用范文

【关键词】合作博弈行为策略股票博弈

一、博弈论相关理论

（一）博弈论

博弈论又称对策论。是这样一种理论：旨在冲突对抗的条件下，使用规范的数学理论和方法求解一个问题的最优策略。以上个世纪九十年代为起始点，博弈论一直作为一种创新性的经济剖析方法，涵盖了包括信息经济学在内的高等学科理论。二战期间，在军事领域方面，博弈论也最早发挥了用武之地。博弈论在诸多领域里的应用中，最成功的要属经济学。

（二）非合作博弈

非合作博弈研究的是，在非合作形式下，所有人的行动都被看成是个人行为，即一个人在总的策略环境下自主决策，主要强调个人自主性，也就是我们所理解的“博弈”一词的字面意思。博弈本身表达了一种较量，一种冲突，所以在很多情况下被误认为只包含了冲突因素，而实际上也包含了非合作元素，即冲突和合作是共存的。另外，根据参与博弈的人员之间是否完全了解彼此的信息，以及博弈进行的先后顺序，可以将其划分为四种类型：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈，以及不完全信息动态博弈。

1.完全信息静态博弈。

完全信息静态博弈，与其他三种类型相比，结构是最简单的，即便如此，它也同样涉及了很多非合作博弈中提到的概念。著名的“囚徒困境”博弈桥好能说明这类博弈的特征。

2.完全信息动态博弈。

完全信息动态博弈，指参与博弈的双方都能够完全掌握其他局中人选择的支付函数，且这种函数是在特定的战略组合模式下形成的。这种博弈中的后来者可以观察到前面参与者的行动，进而对其所有信息都有所了解。并且这种类型的博弈一般也都会持续一个较长时期。

3.不完全信息静态博弈。

不完全信息静态博弈，指的是至少有一个局中人对其他局中人的特征是不完全了解的，但却知道其他人所属类型出现的概率。虽然每个局中人不能完全掌握其他人的下一步行动和选择，但却是有路可循的，至少可以根据对方的类型预测到对方大体上会选择什么行动。由此可知，在这种博弈形式下，局中人的最终目的还是根据对自己和他人类型的概率分布进行分析预测之后，使自己的利益最大化。

4.不完全信息动态博弈。

这种博弈类型与精炼贝叶斯均衡相适应。在该博弈类型下，局中人可以根据自己所观察到的信息来推断其他参与者的类型，原因在于局中人之间互相并不清楚对方的类型。

（三）合作博弈

合作博弈包括两种情况：一是博弈双方的利益都有所增长；二是双方中一方的利益增长，另一方的利益不受损害。这两种情况都会使整个社会的利益有所增长。合作博弈研究的是收益分配问题。该博弈下采取的方式主要是合作，也可以说是一种妥协。博弈各方想要达成一致顺利合作，必须经过一个讨价还价进行妥协的过程。即合作剩余的分配，既是达成一致的前提条件，也是妥协后的结果。

二、关于股票市场的博弈特点

如今,博弈论对金融经济领域的影响越来越大。对期货期权市场、证券市场以及保险市场的审视也越多地以博弈论的研究范式为标准。博弈论这一研究方法在股票市场上的运用尚不多见,其中部分原因是由于股票市场构成了一个过于庞大的博弈,人数过多使得博弈论的应用受限。但是,股票市场所进行的的确是一场博弈,博弈论中不少的概念和理论都可以在这里得到应用。

（一）对股票市场的分析

现今，从市场有效理论来说，我国股市属于弱市场。而且“政策市”特征也越来越明显。在很大程度上，政策性因素阻碍了股市本身的正常运作，从发展的角度看，也会损害博弈双方参与者的利益。但是，分别从两者各自的利益角度而言，这种政策性操作确实已经成为当前国家和投资者赖以生存的支柱。因此，政策性因素既是我国股市正常运转的条件，也是我国股市处于制度变迁过程中的一个明显特征。

（二）对股票市场的博弈类型分析

根据博弈中参与者的数量多少，可将博弈分为双方博弈和多方博弈。多方博弈即包含两个以上的参与者的博弈，也更为复杂，而股票市场显然属于多方博弈。实际上，股票市场上存在的博弈到底是哪种类型，总结来说有两种不同看法：一种是把股票市场看作是饱和状态，自己的所得（所失）就是别人的所失（所得），即股票市场是一个零和博弈的市场；另一种观点是把股票市场看作是非饱和状态，自己的所得（所失）不等价于别人的所失（所得），即股票市场是一个非零和博弈的市场，这种观点的依据是股市的总价值总是处于不断的变化之中。相应地，也就有两种不同的方法来计算股市博弈的收益。第一种算法仅以钱作为计算标尺，而股票作为一种筹码，没有内在价值。那么股市就类似于一场没有休止符的赌局，原因在于筹码不能兑换。第二种算法下，计算收益时把股票的内在价值考虑在内。这种观点实际上是把股市看作是一个社会资源再分配的场所。若按第一种算法计算，人们会倾向于持币；若按第二种算法，人们会更倾向于持股，因为股票可以升值，而货币却是逐渐贬值的。

三、关于股票市场的博弈策略分析

（一）将对手分化，衍生出独立子博弈

有些博弈即使有多方参与，实际上也是可以分解为很多个由少数人参与的子博弈，并且各个子博弈间是相互独立的。这样参与整体博弈的过程就可以转变为参与一个个独立的子博弈。那么如果市场中的强者能找到一个只有少数人参与的子博弈，则对这个子博弈的解析也就变得相对简单化。即便参与者还是很多，至少也可以大大降低了这个子博弈的复杂性。也可以说是形成了一种分而治之的策略。

（二）联合其他参与者建立共同联盟

在股票市场上，如果有的参与者处于相对弱势的地位，那么这些人必然不愿意单独与强者对抗，也就很自然会想到与其他参与者联合起来共同对抗。所以，这种策略对应的是弱者积极促成对自己有利的联盟形式。但值得一提的是，这种形式的联盟是不由人的主观意志为转移的，每个参与者都是以自身的利益最大化为原则，来决定加入或者不加入某一联盟。由此可知，如果每个参与者都只考虑个人得失，那么联盟本身也就起不到明显的共同对抗的效果。即在这种策略下，组织对己有利的联盟时，不能只考虑个人利益，而应该联系实际（如对手或者同盟的力量强弱），尽量促成对己有利的联盟。

（三）中立策略和跟随策略

有时市场的投资者可以采取保持中立或者跟随的策略参与到多方博弈中来。但保持中立也是有前提的,一方面，既然决定保持中立就必须满足于较少的利益，如果追求利益最大化，就没办法保持中立。因为一场博弈中，自己的所得来自于其他参与者的所失，故而保持中立只能从博弈中获得较少的收益。另一方面，中立只存在于竞争不太激烈的博弈中否则竞争过于激烈，参与者的对抗就会大规模卷入，这种形势下保持中立就很困难。所以，中立者只能在对抗不那么激烈的博弈中才有立足之地。

参考文献

[1]王建华.对策论.北京.清华大学出版社.1986.

[2]刘德铭,黄振高.对策论及其应用.长沙.国防科技大学出版社.1995.

[3]约翰•纳什著.张良桥等译.纳什博弈论文集.北京.首都经济贸易大学出版社.2000.

[4]莱因哈德•泽尔腾著.黄涛译.策略理性模型.北京.首都经济贸易大学出版社.2000.

第7篇：博弈论及其应用范文

【关键词】博弈论；纳什均衡；重复博弈

博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。

一、博弈的主要类型

博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈

博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈

完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

3、完美信息和不完美信息博弈

在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参与人不完全了解自己行为之前的博弈进程），则称此动态博弈为不完美信息动态博弈。

4、合作博弈与非合作博弈

合作博弈允许参与人之间自愿签订有约束力的协议，而非合作博弈的参与人则完全按照个人理性做出策略的选择。在囚徒困境博弈中，非合作博弈得到的结果是双方均坦白，而在合作博弈的情况下则可能得到双方均不坦白的更好的结果。

5、完全理性和有限理性博弈

由具备完全理性的参与各方所进行的博弈称为完全理性博弈。存在有限理性博弈方的博弈称为有限理性博弈。

将上述不同的博弈类型进行组合，可以得到更多类型的博弈，如不完全、完全信息博弈和静、动态博弈可以组合为不完全信息静态博弈、不完全信息动态博弈，完美完全信息博弈、完美不完全信息博弈、不完美不完全信息博弈等。

二、博弈论主要的均衡概念

1、上策均衡

如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，那么该策略组合称为一个上策均衡。

2、纳什均衡

（1）纯策略纳什均衡

在博弈G={S1……Sn；u1……un}中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*，……sn*）中，任一博弈方的策略si*，都是对其余博弈方策略组合s-i*的最佳策略，即：

ui（si*， s-i*）≥ui（si， s-i*）对于任一（（1～N））都成立，则称（s1*，……sn*）为一个“纯策略纳什均衡” 。

（2）混合策略纳什均衡

混合策略：在博弈G={S1……Sn；u1……un}中，博弈方i的策略空间为Si=（si1……sik），则博弈方i以概率分布（pi1……pik）在其策略空间中进行选择，由此形成的策略称为“混合策略”。其中0≤ pij≤1，且。

将纯策略拓展到混合策略，相应的纳什均衡称为混合策略纳什均衡。事实上，纯策略纳什均衡是混合策略纳什均衡的一个特例。根据纳什定理我们知道，每一个有限博弈（参与人和策略空间均为有限）均存在至少一个混合策略的纳什均衡。

3、防共谋均衡

如果一个博弈的某个策略组合满足以下要求：1、没有任何单个博弈方的偏离了会改变博弈的结果；2、给定选择偏离的博弈方有再次偏离的自由时，没有任何两个博弈方的串通会改变博弈的结果；3、以此类推，直到所有博弈方的串通都不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”。

4、子博弈完美纳什均衡

如果在一个完美信息的动态博弈中，各博弈方的策略构成一个策略组合满足：在整个动态博弈及它所有子博弈中都构成纳什均衡，那么这个策略组合成为该动态博弈的一个“子博弈完美纳什均衡”。

5、颤抖手均衡

如果有限策略博弈的一个纳什均衡满足对每个博弈方i都存在一严格混合策略序列{}，使得（1），（2）对于任意正整数m，都是纳什均衡，那么，称为一个“颤抖手均衡”。这里的严格混合策略指的是每一个策略都有一个正的被选取的概率。

6、完美贝叶斯均衡

当博弈的一个策略组合及其相应的判断满足以下要求时，称为一个“完美贝叶斯均衡”：

（1）在各个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的判断，对非单节点信息集，一个判断就是博弈达到该信息集中各个节点的概率分布，对单节点而言，则可理解为判断达到该节点的概率为1。

（2）给定各博弈方的“判断”，他们的策略必须是“序列理性”的。所谓序列理性是指在各个信息集，给定轮到选择博弈方的判断和其他博弈方的后续策略，该博弈方的选择及其后续策略必须使自己的期望收益最大化。

（3）在均衡路径上的信息集初，判断由贝叶斯法则和各博弈方的均衡策略决定。

（4）在不处于均衡路径上的信息集处，判断由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。

7、贝叶斯纳什均衡

在静态贝叶斯博弈中G={A1，…，An；T1，…，Tn；p1， …，pn；u1， …un}中，如果对任意博弈方i和他的每一种可能的类型，Si*（ti）所选择的行动ai都能满足：

max

则称策略组合S*=（S1*，…，Sn*）为G的一个贝叶斯均衡。

8、分离均衡和混合均衡

在不完美信息博弈中，在不同情况下（如拥有商品的类型不同）的完美信息博弈方采取相同行为的市场均衡，称为混合均衡（pooling equilibrium）；反之，在不同情况下，完美信息博弈方采取完全不同行为的市场均衡称为分离均衡（seperating equilibrium）。

三、不同均衡概念的比较

上策均衡一般适用于静态博弈，虽然具有很好的稳定性，但是在对博弈进行分析的局限性较强，因为在很多博弈中，并不是所有的参与人都具有上策。在博弈论的各种均衡概念中，纳什均衡处于核心的位置。这是因为：1、纳什均衡是分析博弈的有力工具，可以对大量的博弈结果做出有效地判断，不论是静态还是动态博弈，比如运用纳什均衡可以预测古诺寡头市场上各个厂商的产量，也可以用纳什均衡预测动态的斯塔博格模型中的垄断厂商的产量；2、纳什定理表明了纳什均衡的普遍存在性，这说明了在博弈环境下纳什均衡概念本质上的合理性；3、其他的均衡概念基本上都是由纳什均衡衍生而来，如子博弈完美纳什均衡是将纳什均衡扩展到了每个子博弈上面，贝叶斯纳什均衡则是将纳什均衡延伸到了不完全信息博弈当中。纳什均衡的主要问题首先，一个博弈往往存在多个纳什均衡，而运用纳什均衡概念本身无法再对这些均衡进一步分析；其次纳什均衡不能排除博弈策略中所包含的不可信的行为设定，不能解决动态博弈的相机抉择所引起的可信性问题，这导致了纳什均衡的内在不稳定性。

利用逆推归纳法，子博弈完美均衡有效地排除了纳什均衡中不可信的行为设定，从而提高了纳什均衡的稳定性，但是逆推归纳法也有严重的弱点。首先，逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则、和收益情况都非常清楚，并且各个博弈方了解博弈结构，并相互指导对方了解博弈结构，而现实问题往往与这些要求相去甚远；其次对于阶段比较多，比较复杂的动态博弈，比如对弈，运用逆向归纳法的工作量则变得极为庞大，以至于借助计算机也无法完成；如果遇到两条收益相同的路径，逆推归纳法则无法继续进行下去。逆推归纳法更大的问题是对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许博弈方犯任何错误，而且要求所有博弈方了解和信任对方的理性，形成“理性的共同知识”，这些条件在现实中同样难以得到满足。

颤抖手均衡的概念在一定程度上解决了子博弈完美均衡和逆推归纳法所遇到的问题。颤抖手均衡考虑到参与人难免会犯一些错误而舍去了由于参与人小概率的偏移而导致整个策略组合不可行的均衡路径，因而具有更高的稳定性。但是颤抖手均衡本身并没有解决博弈方犯错误的问题，因而也不能保证它的预测就是实际博弈的结果。

贝叶斯纳什均衡和完美贝叶斯均衡是针对不完全和不完美信息博弈问题提出的。造成不完全和不完美信息博弈问题的根本原因是参与各方的信息不对称，而这在现实的经济活动中是普遍存在的，如在保险市场、信贷市场、劳动力市场、柠檬市场、拍卖市场上的情形。分析和解决信息不对称问题对经济活动造成的影响是现代信息经济学的核心问题，因而博弈论成为信息经济学研究的有力工具，现代信息经济学取得的迅猛发展和博弈论广泛运用分不开的。完美贝叶斯均衡是针对不完美信息博弈提出的均衡概念，而贝叶斯纳什均衡是针对不完全信息博弈提出的均衡概念。海萨尼通过引入一个虚拟的自然博弈方将原来的不完全信息博弈问题转换为完全但不完美信息博弈问题，使得动态贝叶斯博弈分析就可以利用完美贝叶斯均衡、分离均衡、混合均衡等概念和方法进行分析。

四、结束语

本文对博弈论中主要的均衡概念进行了描述和比较分析。上策均衡是最直观的博弈均衡概念，但适用范围非常有限。纳什均衡是博弈论的理论基石，从本质上刻画了处于博弈环境（即每个参与人的收益受到整个博弈策略组合的影响）的均衡状态。子博弈完美均衡解决了纳什均衡中不可置信威胁的问题，颤抖手均衡将博弈方犯错误的可能性考虑了进来；而贝叶斯纳什均衡和完美贝叶斯均衡则可以用来处理信息不完美和不完全问题。当然，本文所涉及的博弈均衡概念基本上都是关于非合作和完全理性下博弈（颤抖手均衡虽然考虑了博弈方可能会犯错误的可能性，但这并不意味这博弈方的有限理性）。关于合作博弈和有限理性博弈也发展出了一些均衡概念，如纳什谈判解、夏普利值、进化稳定策略等，另外关于非合作博弈也有一些均衡概念本文没有涉及。随着博弈论理论的不断发展和实际运用的日趋广泛，博弈均衡的概念将会得到不断地精炼和更新。

参考文献：

[1]谢识予，经济博弈论（第三版）[M]，复旦大学出版社，2006。

[2]朱.弗登伯格，让.梯若尔，博弈论[M]，中国人民大学出版社，2002。

第8篇：博弈论及其应用范文

关键词：博弈论；本科；教学改革

中图分类号：G642 文献标志码：A 文章编号：1673-291X（2012）22-0251-02

现代经济学、管理学的最新发展中有一个引人注目的特点，那就是博弈论在经济学和管理学的教学、科研以及在社会各个层面的应用中受到越来越多的重视。所以，许多高校的经济与管理专业都与时俱进地将《博弈论》作为本科学生的一门必修课程。然而，由于《博弈论》发源于运筹学，对数学理论的要求较高。尽管博弈论中许多案例（例如“囚徒困境”、“性别大战”等）具有较强的趣味性，但一旦从形象的案例讲解转入到抽象的理论推演，学生难免会遇到较大的学习困难。因此，如何使学生既掌握基本理论又能够加以运用，就有必要对大学本科阶段的《博弈论》课程从教学内容和方法上进行深入的探讨。

一、博弈论课程的教学特点

1.教学过程通常浅入深出。谈及博弈论，人们往往会想到“囚徒困境”、“田忌赛马”等经典案例，这使得博弈论的内容显得比较生动，也易于吸引人们的注意力。因此，通常博弈论的教学会以简单的案例分析为切入点，以激发学习者的兴趣。但随着讲授内容从纯策略的纳什均衡分析，逐渐向合作博弈、演化博弈、重复博弈等较为复杂的博弈分析过渡时，往往会涉及到一些较为复杂的数学定理和推演方法。这使得博弈论的教学体现出浅入深出的特点。

2.需要较好的数理基础。早期，博弈论又被称为对策论，它是现代数学的一个新兴分支，也是运筹学的一个重要组成部分[1]。因此，经过科学抽象化的博弈理论，一般采用严谨的数学语言来进行表述。例如，对问题的描述是以集合的形式表达，对关系的刻画是以函数形式表达，并通过严谨的数学证明得到最终的结果。这需要本科生在此前具有较好的高等数学、数理统计和运筹学基础。

3.应用范围广泛。由于真实的社会中存在各种各样的矛盾冲突，使博弈理论可用于经济、政治、外交乃至战争等广泛的领域。博弈论可以将生活中的经济现象进行数学的抽象，并通过严谨的数学推导，揭示该经济现象的发展趋势和可能产生的最终结果[2]。例如，演化博弈理论，有助于理解生物种群之间的进化行为；信号传递原理，有助于理解军事中的策略互信行为；委托—理论，有助于理解劳动力市场的抉择问题以及二手车市场的交易问题。

二、博弈论教学中存在的问题

1．案例支撑还不够丰富。博弈论的教学必须以案例作为引导，这需要课程案例具有以下特征：（1）案例必须紧密联系现实；（2）案例要能充分体现一方面的博弈思想；（3）案例需具备一定的参与性，使学生通过情景模拟的方式深刻地感受到博弈的法则。尽管在博弈论的教学中已经累积了一定量的案例，但仍显得不够丰富。特别是对于经管专业的本科生而言，需要把理论的学习融入对经济活动实践的研究和认识之中，以提高学生分析经济现象以及解决经济问题的能力。

2.数理推演比较枯燥。博弈论中的数理推演较为复杂。国外学者普遍认为，要理解博弈论的数学精髓，那么测度论、随机过程、实变函数与泛函分析、数学分析、拓朴学等知识是非常必要的[3]。例如，在纳什均衡存在性的证明，就需要用到Katutani不动点定理[4]。而现在许多高校经管专业本科生都是文理兼招，由此导致学生的数学功底不一。因此，教师讲授难度较大，学生也不易理解。

3.实验与实践教学重视不够。博弈论实践性较强，需要运用实验教学手段来使学生作为直接利益主体参与决策，并引导他们分析博弈结果背后的内在驱动机制，从而达到帮助学生理解知识和提升学生解决问题能力的目的。但是，许多学生受传统“填鸭式教学”的影响，参与的积极度有限；同时，实验教学的重要性也有待于进一步认识和深化。这使得实验与实践教学不充分，即使学生掌握了理论模型，也难以用于实践，导致“学”与“用”脱离。

三、互动式教学的应用探讨

从上述分析可见，将互动式教学引入博弈论课程具有鲜明的意义。第一，通过亲身参与，有助于学生理解博弈基本思想；第二，有助于学生掌握理论模型，并促进学与用的结合；第三，有助于活跃课堂气氛、提高教学效率。笔者在博弈论课程中，尝试性地进行互动式教学探索，主要包括以下几个方面：

1.尽可能地为博弈论中的基本思想寻找可供学生参与的游戏。例如，运用“猜数字”游戏来呈现重复剔除劣势策略的思想、运用“山地攻守战”游戏来讲述共同知识的含义、运用“模拟选举”游戏来分析中间人选民定理。在实际教学中，笔者通常会按照既定游戏规则让学生分组参与，并记录下游戏过程和结果。而在对博弈结果进行归纳和分析时，还往往采用情景再现的方式，让学生体会博弈中的奥妙，进而加深对理论的理解。

2.提升学生参与的积极性。这就需要任课教师深刻理解博弈的主要内容，恰当地设计游戏规则使得其趣味性更强；同时，需要赋予一定的游戏奖励，来提高学生的参与热情。①教育是一个兴趣导入的过程，然后才成为科学获知的一部分。要在一堂课里面始终吸引学生的注意力并不容易，这就需要教师合理掌控行课节奏，使趣味教学贯穿于课堂进行的始终，而不是头重脚轻。通过合理的实践教学安排，使学生感到博弈论的学习，是在“玩中学、乐中学”的氛围中进行的。

3.注重思想传授，淡化数学推演。互动式教学的目的，在于让学生理解博弈论的重要思想，能够运用该思想去分析一些现实问题。对于一些较为复杂的数学推演，只是简单介绍其基本过程，② 而将其内涵的思想融入互动式教学，引导学生运用知识来解决现实问题。

第9篇：博弈论及其应用范文

为了让读者对进化博弈理论的基本概念——进化稳定策略（Evolutionarily Stable Strategy）有一个基本的了解，本文主要介绍进化稳定策略概念的提出及其发展。为了便于理解，文中利用一些具体例子简要地介绍进化稳定均衡（就是系统选择进化稳定策略时所处的均衡）求法、应用以及它与纳什均衡之间的关系。最后指出了传统进化稳定策略定义的缺陷及经济学家们对此所作的进一步研究。

关键词：进化博弈；进化稳定策略；进化稳定状态；纳什均衡

Abstract:

This paper is mainly about the concept of Evolutionarily Stable Strategy (ESS) and its developments. For the convenience of the readers’ better understanding of this basic concept in Evolutionary Game Theory, we use some cases to introduce the solution of Evolutionarily Stable Equilibrium (ESE, that is, the equilibrium when the system selects ESS), its applications and the relationships between Nash Equilibrium and ESE. Finally, we point out the flaws of the traditional concept of ESS and some economists’ researches on this.

Key words:

Evolutionary Game; Evolutionarily Stable Strategy; Evolutionarily Stable Status; Nash Equilibrium

摘要

关键词：进化博弈；进化稳定策略；进化稳定状态；纳什均衡

引言

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。进化博弈理论由于对参与人的理性要求较少而与现实更为接近，因此在短短的时间内就获得了迅速的发展。特别是Maynard Smith（1973，1974）等提出基本均衡概念----进化稳定策略（Evolutionarily Stable Strategy ESS）及Taylor and Jonker(1978)提出基本动态概念----模仿者动态（Replicator Dynamics）以后，进化博弈理论被广泛地应用于生物学、社会学等领域。1992年进化博弈理论的国际学术会议在康奈尔大学的召开，正式确定了它在经济学上的学术地位。越来越多的经济学家应用进化博弈理论来解释并预测参与人的群体行为，在多数情况下，它比利用纳什均衡预测人的行为更现实、更准确。由于历史原因，我国经济理论界到目前为此还没有对进化博弈理论的基本均衡概念进行系统介绍的文献。本文试图对进化稳定策略作出简要的介绍，并把该概念与传统博弈论的基本概念—纳什均衡进行比较。

进化稳定策略的定义及性质

进化博弈理论（Evolutionary Games Theory）来自达尔文的生物进化理论。在生物进化过程中不同种群在同一个生存环境中竞争同一种生存资源时，竞争的结果只有那些获得较高适应度（后代成活率）的种群 ③生存下来，那些得到较低适应度的种群在竞争中被淘汰(即优胜劣汰)；在进化过程中个体常常会发生突变、迁移、死亡，同时自然条件也会发生剧烈变化等都会对生物进化过程产生影响，因而要对种群进化进行比较完整的分析就必须建立一些能够综合考虑这些因素影响的模型。一般的进化博弈模型主要基于两个方面而建立起来的：选择（Selection）和突变(Mutation)。选择即是指本期中好（能够获得较高支付）的策略在下期变得更为盛行（被更多的参与者采用）；突变一般很少发生，它是以随机（无目的性）的方式选择策略（可能是能够获得高支付的策略，也可能是获得较低支付的策略）。新的突变也必须经过选择，并且只有较好的策略才能生存（Survive）下来。选择也可能包括许多形成机制，这些机制可能是生态的（支付决定后代的数量），也可能是个人的（试验、刺激反应等），也可能是社会的（学习与模仿等）。就较好策略变得更为盛行而言，这个过程是适应性（Adaptive）且是不断改进（Improving）的。

Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适合度由其行为共同决定条件下个体对成功策略选择的效果时，提出了一个能够综合描述上述各种因素的均衡概念----进化稳定策略，它后来成为进化博弈理论的一个基本均衡概念。

进化稳定策略的基本思想是：假设存在一个全部选择某一特定策略的大群体和一个选择不同策略的突变小群体，突变小群体进入到大群体而形成一个混合群体，如果突变小群体在混合群体弈所得到的支付大于原群体中个体在混合群体弈所得到的支付，那么小群体就能够侵入大群体，反之就不能够侵入大群体而在演化过程中消失。如果一个群体能够消除任何小突变群体的侵入，那么就称该群体达到了一种进化稳定状态，此时该群体所选择的策略就是进化稳定策略。下面我们利用一个简单的模型来给出进化稳定策略的定义。

进化稳定策略是在研究生态现象时提出来的，生态学中每一个种群的行为都可以程式化为一个策略，所以在一个生态环境中所有种群就可以看作一个大群体，群体中个体之间进行的是对称博弈④ 。下面就以为对称博弈为例来介绍进化稳定策略的定义。假定存在一个个体数为n（N={1，2，…，n }）的大群体 ⑤，其中n是一个充分大的数。群体中每一个个体都有相同的纯策略集合（行动集），于是混合策略⑥集合S可定义为：

稳定状态，此时系统所达到的均衡称为进化稳定均衡（Evolutionarily Stable Equilibrium）。上面的假定（c）并不是进化稳定策略的定义，下面我们给出进化稳定策略的正式定义：

策略是一个进化稳定策略，当且仅当对任何策略，存在使得不等式（1）对所有的成立。

由进化稳定策略的定义，可以得到一些简单的性质，下面给出并证明其中的两个重要性质。为了说明的方便，定义符号为的最优反应策略集。如果一个参与人选择策略s而其对手选择策略，他的支付为，策略s就称为对策略的反应策略，对策略的所有最优反应策略集记为。

性质1、如果策略s是进化稳定策略，那么对任何都有。

证明性质（1）说明策略s是相对于其自身的最优反应策略之一，也就是。（下面用反证法证明）如果策略s不是其自身的最优反应策略，那么必定存在另一个策略满足，由期望支付函数的连续性及期望支付函数是关于混合策略概率的线性函数，条件（1）可变为：

间进行的是对称博弈，在此基础上提出了进化稳定策略的定义，那么这个在考察对称博弈时得出的概念对群体进行非对称博弈时是否适应呢？有许多博弈论理论家对此进行了详细的讨论并得出：传统ESS并不适应于非对称博弈（Selten 1980），并且存在这样的博弈：单群体时没有进化稳定均衡而在多群体时却存在进化稳定均衡。Selten同时证明在非对称博弈中传统的进化稳定均衡与严格纳什均衡是一个等价概念。此外，从Maynard Smith and Price 所提出的原初定义还可以看出：传统ESS定义仅考虑到系统受到独立且不重叠突变的影响的情形，而没有考虑到当系统受到离散且重叠或者连续冲击时对均衡的影响，因此传统的ESS不适合后一种情形。要对群体行为的动态调整过程进行更为全面的分析，传统的ESS定义作用的局限性就表现出来了。

为了克服这些缺点，使理论能够更好地与现实接近，许多经济学家及生态学家对传统的ESS概念进行了不断的修进并提出了许多新的均衡概念。Selten(1980)首次探讨了非对称博弈中的均衡问题，他通过引入角色限制行为（Role Conditioned Behavior）提出了极限ESS （Limit ESS）概念，从而把传统的ESS引入到非对称博弈中。Schaffer, M. E., (1988) 首次研究了有限群体的均衡问题进而提出了有限群体进化稳定策略的新概念，他同时证明了有限群体进化稳定策略并不总是纳什均衡策略；Foster, D., and P. Young (1990) 首次把连续随机因素引入动态系统，并提出随机稳定性（Stochastic Stable Set）概念；Gilboa and Matsui(1991)提出的循环稳定集（Cyclically Stable Set），他们把传统的ESS引入到随机动态系统。Maynard Smith(1982)提出了一个比ESS更一般的中性稳定策略（Neutrally Stable Strategy）的概念，Binmore and Samuelson(1992)提出了类似的修正的ESS（Modified ESS）概念。这些概念的提出进一步丰富和完善了进化博弈理论的基本内容。

进化博弈理论的发展简介

进化博弈理论于二十世纪六十年代被生态学家们用于解释生态现象就已经产生了；在七十年随着ESS(Maynard Smith and Price1973; Maynard Smith1974)概念的提出，它就被越来越多的生态学家们所利用，在这个阶段有少数经济学家(Jones 1976, Hirshleifer, J.,1977)开始把生态观点引入到经济学领域，Hirshleifer认为应用进化博弈模型来解释经济规律是一个很自然的事情，Jones（1976）利用进化理论来解释一些货币现象；八十年代随着对经典博弈论研究的深入，许多经济学家把进化博弈理论引入到经济学领域，用于分析社会制度变迁(Axelrod and Hamilton(1981); Axelrod(1984))、行业演化(Porter, M1980)以及股票市场(Conlisk 1980; Cornell and Roll 1981)等等，同时对进化博弈理论的研究也开始由对称博弈向非对称博弈深入（Selten 1980；1983），并取得了一定的成果；进入九十年代，尤其是1992年在关于进化博弈理论的会议在康奈尔大学召开，进化博弈理论在经济学上的学术地位得到正式的认可，在这个阶段经济学家对进化博弈理论的研究进入了一个崭新的阶段，理论家们不仅考察了离散非重叠冲击对演化系统的影响，而且也把离散重叠冲击（Kandori, M. G. Mailath, and R. Rob 1993; Bergin and Barton 1996）及连续冲击对进化系统的影响（Foster, D., and P. Young 1990; Fudenberg, D. and C. Harris 1992）纳入到模型之中并对之进行深入的研究，进化博弈理论的应用已经渗透到了经济学领域中的各个方面，如Peyton Young（1993，1998）等利用进化博弈理论来研究社会习俗的形成、Fudenberg（1995）等利用进化博弈理论来研究社会学习过程、青木昌彦等（1996）利用进化博弈理论来分析社会经济体制形成的原因等等。

结束语

在生态学中，由于不同种群的行为可以被程式化为不同的纯策略，因而种群之间的博弈是对称的，另外种群所受到的影响（自然灾害、基因突变等）也是不连续的，所以传统的ESS概念能够很好地解释生态现象。然而，把进化博弈理论用于解释人的群体行为时，由于人与动物不同，人可以通过学习、模仿、试验等活动而作出行动选择，这样就使得系统的复杂程度增加。研究人的群体行为所建立的博弈模型一般是非对称的，而在非对称博弈中，传统ESS概念等价于严格纳什均衡策略，而严格纳什均衡本来就显示出许多理想的性质，如果把注意力集中于对严格纳什均衡的研究是没有任何实际意义的。此外，进化博弈理论利用系统论的观点来考察群体行为的演化过程，其均衡概念与进化动态的调整过程有关，而群体行为的动态过程是相当复杂的，所以要用一个统一的均衡来描述进稳定状态的困难就比较大。到目前为止还没有一个既能描述对称博弈又能描述非对称博弈且对所有动态过程都适应的均衡概念，并且进化博弈的理论体系还比较粗糙且存在许多不完善之处，但从进化博弈的应用及其发展趋势来看，我们有理由相信在不久的将来该理论一定会走向成熟，会成主流经济学的一个重要组成部分。

附录：

下面我们利用模仿者动态来证明，定义，则由模仿者动态可得

由博弈的具体数据得到：，应用关系及模仿者动态可得：

考文献

王则柯（1999）：《博弈论评话》，中国经济出版社。

张维迎（1996）：《博弈论与信息经济学》，上海三联出版社。

青木昌彦，奥野正宽（1996）：《经济体制的比较制度分析》，中国经济出版社。

Axelrod, R. (1984): The Evolution of Cooperation, Harper-Collins, HBJ, Press.

Axelrod, R. and W. Hamilton(1981): The Evolution of Cooperation, Science 211, 1390-1396.

Bergin, J. and L. L. Barton (1996): Evolution With State-Dependent Mutations, Econometrica, 64, 943-956.

Binmore ,K. and Larry Samuelson (1992), Evolutionary Stability in Repeated Games Played by Finite Automata, Journal of Economic Theory 57, 278-305.

Conlisk, J., (1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1, 275-293.

Cornell, B., and Roll, R., (1981): Strategies for Pairwise Competitions in Markets and Organizations, Bell Journal, 12, 201-213.

Foster, D., and P. Young(1990):Stochastic Evolutionary Game Dynamics, Theoretical Population biology, 38, 219-232.

Fudenberg (1995): Learning in Games, Cambridge, MIT Press.

Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 57, 420-441.

Hirshleifer, J.,(1977): Economics from a Biological Viewpoint, The Journal of Law and Economics, 20, 1-52.

Jones, R.,(1976): The Origin and Development of Media of Exchange, Journal of Political Economy, 84, 757-775.

Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

Maynard Smith, J. (1974): The Theory of Games and the Evolution of Animal Conflict, Journal of Theor. Biol. 47, 209-212.

Maynard Smith, J. (1982): Evolution and the Theory of Games, Cambridge, United Kingdom: Cambridge University Press.

Maynard Smith, J. and G. R. Price (1973): The Logic of Animal Conflicts, Nature, 246, 15-18.

Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical . Biology. 84, 93-101.

Schaffer, M. E. (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of theoretical Biology, 132, 469-478.

Selten, R. (1983): Evolutionary Stability in Extensive Two-person Games, Math. Soc. Sci. 5, 269-363.

Taylor, P. D. and L. B. Jonker (1978): Evolutionarily Stable Strategy and Game Dynamics, Math Biosci. 40, 145-156.

Van Damme, E. (1991): Stability and Perfection of Nash Equilibria (2nd edn), Berlin: Springer-Verlag.

博弈论及其应用精选(九篇)

相关热门标签

相关文章阅读

精选范文推荐

相关期刊推荐

玻璃艺术

宁波医学

船舶经济贸易

冶金信息导刊