公务员期刊网 精选范文 博弈理论论文范文

博弈理论论文精选(九篇)

博弈理论论文

第1篇:博弈理论论文范文

论文关键词:供应链联盟,知识整合,博弈

 

一、引言

各节点企业通过供应链联盟这样一种组织形式,根据所处产业的不同特点,选择合适的知识整合模式,实现联盟内的知识整合,获取知识整合的创新价值,以增强核心竞争力。在供应链联盟内实施知识整合过程中存在着一个整合成本。所以供应链联盟内节点企业间的知识整合将是一个知识整合成本与整合创新价值的博弈过程。本文假设在核心企业与节点企业之间互相了解特征、战略空间效应函数的基础上,实行多阶段的动态博弈。在博弈中,寻求成本与知识收益的平衡点。

二、信息动态博弈模型的建立

(一)提出博弈的假设条件

在博弈过程中,为了简化分析,主要研究一个核心企业和一个其他节点企业间形成知识整合共享的过程,而多企业之间的这种知识整合共享关系可以依此加以推广。基于此,提出假设条件:博弈局中只有核心企业和其他节点企业;博弈双方具有完全的行为理性;博弈双方具有完全的信息;博弈双方有对知识的自我学习能力

(二)动态博弈模型建立

假定核心企业为C,其他节点企业为E,博弈模型为(C,E)。在动态博弈中:第一阶段,其他节点企业面临两难选择:由于知识的独有性和时效性的矛盾,导致知识创新价值的机会收益和知识学习成本的矛盾选择。其他节点企业此时有两种策略:即不共享知识或共享知识。

第二阶段,其他节点企业如果选择不向核心企业共享知识,核心企业有两种策略:即自学或不自学。如果核心企业不自学,各自的效用函数值都为0;根据知识的学习成本,如果核心企业花费自我学习成本(U0),获得这项知识工商管理论文,并利用此知识创造价值Q,则核心企业的效用是Q-U0,这时知识被其他人获得,其他节点企业丧失了机会收益为P0。

如果其他节点企业选择向核心企业共享知识,同时提出要按λ比例获取知识整合创新价值的回报。此时核心企业有两种策略:即同意或不同意。如果选择同意共享,并按λ比例与其他节点企业分享收益,此时,其他节点企业消耗本身的共享成本为U2,核心企业从其他节点企业处学习知识的学习成本为U1,则核心企业的效用函数为(1-λ)Q-U1,其他节点企业的效用函数为λQ-U2。核心企业的另一种决策是不同意共享,此时,核心企业又有两种选择:自学或不自学。要么根本不学这项知识,核心企业和其他节点企业的效用函数值都为0;要么自己学习这项知识,并利用此知识创造价值Q,则核心企业的效用是Q-U0,这时知识被其他人获得,其他节点企业丧失了机会收益为P0。

三、博弈双方效用值分析及模型均衡求解

(一)效用价值分析

1、其他节点企业的效用函数值有三个:0,-P0,λQ-U2。

(1)若λQ-U2>0,即λ>U2/Q;则选择在按λ比例获得回报的条件下向核心企业共享知识。

(2)若-P0<λQ-U2<0,即(U2-P0)/Q<λ<U2/Q;则其他节点企业在核心企业不自学的情况下效用最大。

(3)若λQ-U2<-P0<0,即λ<(U2-P0)/Q;则其他节点企业在核心企业不自学的情况下效用最大。

2、核心企业的效用函数值有三个:0,Q-U0,(1-λ)Q-U1

(1)若0<Q-U0<(1-λ)Q-U1,即λ<(U0-U1)/Q,且U0<Q;则答应其他节点企业条件,接受知识共享并学习知识。

(2)若0<(1-λ)Q-U1<Q-U0,即(U0-U1)/Q<λ<(Q-U1)/Q;则选择自学的效用最大。

(3)若(1-λ)Q-U1<0<Q-U0,即λ>(Q-U1)/Q,且U0<Q;则选择自学的效用最大。

(4)若Q-U0<0<(1-λ)Q-U1,即λ<(Q-U1)/Q,且U0>Q;则答应其他节点企业条件,接受知识共享,并学习知识。

(5)若(1-λ)Q-U1<Q-U0<0,即λ>(U0-U1)/Q,且U0>Q;则选择不学的效用最大。

(6)若Q-U1<(1-λ)Q-U1<0,即(Q-U1)/Q<λ<(U0-U1)/Q;则选择不学的效用最大。

(二)模型均衡求解

由于核心企业和其他节点企业共享知识的成本U1和U2与知识整合创新价值Q与其他节点企业的机会收益P0的大小关系不确定,使寻求纳什均衡解的过程变得非常困难。我们通过变量大小关系的变化,推出纳什均衡,进而剔除包含不可置信威胁策略的纳什均衡,求得子博弈精炼纳什均衡解。根据以上效用价值分析,可以看出,如果其他节点企业选择不共享知识,无论核心企业选择自学或不自学工商管理论文,都达不到均衡解;如果其他节点企业选择共享知识,同时提出要按λ比例获取知识创新价值的回报。核心企业如果接受这个要求,那么两者的收益函数为[((1-λ)Q-U1,λQ-U2)],需要λ的取值,从而得到两组子博弈精炼纳什均衡解:

解1:当U0>Q>U1+U2,且分配比例λ在[U2/Q,(Q-U1)/Q]之间时,核心企业和其他节点企业同时选取知识共享策略。

解2:当Q>U0>U1+U2,且分配比例λ在[U2/Q,(U0-U1)/Q]之间时,核心企业和其他节点企业同时选取知识共享策略。

从上述讨论可以看出,核心企业对于某项知识的自学成本与知识整合共享过程中双方耗费成本的大小关系,成为实现知识整合的决定性因素。在这种情况下,核心企业和其他节点企业双方通过交流,确定合适的λ值,促使其他节点企业知识共享过程的发生,实现知识的整合创新价值。供应链联盟各节点企业间,尤其是核心企业与其他节点企业之间的知识整合,目的在于促进各自核心竞争力的提高。如果整合成本太高,显然不利于提高核心竞争力。因此,在其他节点企业和核心企业的知识整合博弈过程中,明确各种知识学习成本的关系,是判断能否达到博弈均衡,实现知识整合的关键。

参考文献:

[1]杜漪,王志刚.知识管理的供应链核心竞争力提升研究[J]. 管理现代化, 2008,(04) .

[2]牟绍波.论产业集群动态能力的培育和提升[J]. 西华大学学报(哲学社会科学版),2005

[3]陈红丽,郗英.基于过程分析的知识共享对策研究[J]. 情报杂志, 2007,(07) .

[4]吴冰,刘仲英.供应链协同的知识创新价值链模型[J]. 软科学, 2007,(04)

[5]李崇光,胡华平.论生鲜农产品垂直渠道关系整合[J]. 中国流通经济,2009,(06) .

第2篇:博弈理论论文范文

【关键词】博弈论,发展,前景

一、导论

博弈论理论的发展为很多问题的研究提供了非常有效的研究思路。但是博弈论的发展历程是怎样的、它是如何受到大家重视的、它的未来发展前景又是如何?本文通过对相关文献的搜集和整理,对上述问题进行梳理,有助于对博弈论有个更为清晰的认识。对博弈论发展的历史、现状和趋势有所了解,对我们更好的掌握这门学科有很大的好处。

二、博弈论的早期研究

很多学者想追溯博弈论的起源,但是针对这个问题并没有一个公认的答案。如果按照把博弈问题应用到决策问题和对决策问题的研究标准,那么可以说博弈论的历史非常悠久。因为在人们的日常生活和生产中常常都会进行博弈分析。有文献记载的最早具有博弈思想的事例可追溯到两千多年前我国的“齐威王田忌赛马”、一千五百年前巴比伦犹太教法典中的“婚姻合同问题”等。如果按照现代经济学和博弈论中经常引述的最早包含博弈思想的文献标准,古诺1838年关于寡头之间通过产量决策进行竞争的模型可以看做博弈论早期研究的起点。1883年伯特兰德的通过价格进行博弈的寡头竞争模型也是包含博弈思想的经典文献。对博弈论问题比较系统密集的研究开始于二十世纪初期。齐默罗和波雷尔对象棋博弈等的系统研究可以代表系统研究博弈理论的开端。诺依曼和摩根斯坦一九二八年给出了扩展形博弈定义。但是,这些研究都没有完成博弈论的理论体系。尽管如此,这些早期的研究还是对博弈论理论的产生起到了非常重要的作用。

三、博弈论的形成

对于一个理论的真正发展来说,仅有一些零星的研究还是不足以发展出博弈论的理论体系的,更重要的不是谁曾经有过零星的研究,而是谁的工作或者文章发表以后,它的思想或方法就引起了人们的兴趣和重视,并开始有越来越多的追随者。就像哥伦布并不是到达美洲的第一人,但却因为他的发现新大陆没有“失落”过,所以哥伦布享有发现新大陆发现者的荣誉。同样的道理,冯・诺依曼和摩根斯坦1944年出版的《博弈论和经济行为》,应该被看做博弈论历史的真正起点。在《博弈论和经济行为》中引入了博弈论的扩展表示和正规形表示,并定义了极小化极大解,指出这种解在所有两人零和博弈中都存在。该书在总结以往研究成果的基础上,给出了博弈论研究的一般框架,概念术语和表述方法,提出了相对系统的博弈理论。尽管现在看来该书某些地方还不全面,但是,其对博弈理论发展所起的巨大作用是不可否认的。

四、博弈论的成长和发展

博弈论第一个研究高潮出现在20世纪40年代末和50年代初。在第二次世界大战期间,博弈论的思想和研究方法在军事领域的应用推动作用下,这时博弈论的研究队伍已经有了很大的发展。纳什加入到博弈论的队伍是这个时期最重要的事件之一。纳什在1950年将博弈论扩展到非零和博弈,并提出纳什均衡概念和证明了纳什均衡存在性的纳什定理,发展了非合作博弈的理论基础。除了纳什的研究成果以外,这个时期还出现了很多博弈理论家和博弈论研究成果。例如,囚徒困境博弈的实验。五十年代中后期一直到七十年代也是博弈论发展历史中产生重要理论成果的阶段。例如:“微分博弈”的概念、“强均衡”的概念、关于重复博弈的“民间定理”。这个期间最重要的成果有赛尔腾1965年提出的在博弈方选择“相机计划”的博弈中不是所有的纳什均衡都是合理的,因为可能存在空头威胁的问题。1975年又提出了“颤抖手均衡”的概念。70年代博弈论发展中最重要的事件还包括“进化博弈论”的发展。此外“共同知识”在博弈论中的重要性也受到重视。

五、博弈论的成熟与主流经济学的融合

80、90年代是博弈论走向成熟的时期,在这个时期博弈论在经济学中的应用领域越来越广泛,在经济学中的地位达到了最高峰。这个时期的重要理论进展包括“顺退归纳法”、“序列均衡”的概念、《进化和博弈论》的出版、“完美贝叶斯均衡”的概念。正是这个时期,博弈论受到经济学家真正的广泛的重视,并被看做经济学核心的分析方法。也正是这个阶段开始,博弈论的思想、词汇开始在经济学杂志上大量出现。博弈论之所以会在经济学中的地位上升的这么快答案首先是现代经济活动的规模越来越大,对抗性竞争性越来越强,因此,经济活动的博弈性越来越强。其次,信息技术和社会经济信息化的发展使得人们认识信息的作用和规律的要求不断提高。从而促进了信息经济学的发展要求。因此信息经济学的发展也对博弈论的发展起到了促进作用。

六、博弈论的发展前景

由于博弈论本身优美深刻的本质魅力,新的博弈分析工具和应用领域的不断发现,一定会吸引大量学者加入。而且随着博弈理论的发展和博弈研究的不断深入,人们认识到这种理论还存在不少问题,特别是它的理论基础方面还存在一些没有很好解决的根本问题,这充分保证了博弈论在未来相当长的时间内的发展潜力。在金融、贸易、法律、政治等领域不断提出新的博弈论应用课题这也是今后博弈论进一步发展的巨大动力。而且,在合作博弈和非合作博弈两大博弈中,非合作博弈是博弈的主流,但是,合作博弈也具有相当重要的作用,而且要比非合作博弈理论更加复杂。正是由于这些原因,博弈论在未来一段时间内必然会有更进一步的发展,也会对经济学和其他学科的发展做出更大贡献。

参考文献:

第3篇:博弈理论论文范文

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路,在上个世纪80年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间,涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后,有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物,这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视,是在2004年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008年10月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度,来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象,对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行,通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发,来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题,传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象,也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素,但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面,来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理:第一不完备性定理――任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想,扩展研究视域,在新闻传播领域内最合适的地方。找到双方的契合点,从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何。有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与

活动过程中,有没有相类似的情况?其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素,正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具,人们十分重视其方法论意义。从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点,自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究,实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中,许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式,第二版介绍了66个传播模式。除了个别早期线性模式外,在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说。研究当代传播模式离开了博弈的思维,其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代,在需要破除自然与社会科学鸿沟的时代,谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视,将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

第4篇:博弈理论论文范文

关键词 博弈论 课程教学 经管类本科

中图分类号:G642 文献标识码:A

1博弈论课程教学的特点

博弈论原是现代数学的分支之一,因此博弈论和数学的结合非常紧密,博弈论通常用严谨的数学模型来研究现实中理性决策者之间的冲突与合作,它从复杂的现象中抽象出基本的元素,以集合的形式描述问题,以函数形式刻画关系,并通过严谨的数学证明得到最终的结果。因此,一般来说在学习博弈论之前需要学生应该具备一定的微积分和概率论知识。另一方面,博弈论是一门实用性、应用性极强的课程,其应用领域可以从日常生活中的行为选择,到经济、政治、军事、国际关系等领域中的冲突与合作。博弈论综合了大量的一般原理,这些原理在不同背景和应用中是相通的,而通过博弈论的学习,不仅可以帮助学生认识一些经济现象的本质,还可以丰富学生对周围世界的理解,训练学生的思维方式。

2博弈论课程教学中存在的问题

2.1教学手段单一

由于博弈论具有较强的理论性,而博弈论学习过程中复杂的博弈分析过程往往和数学推导过程交织在一起,因此教师在教学中很容易将博弈论作为一门数学课对待,授课方式采用讲授式,课堂教学变成了数学推导,学生听课倍感吃力,无法与老师形成良性的互动,这很容易让学生失去学习的兴趣。同时,课堂教学如果过分强调数学推导,也会使学生的注意力过分地被吸引到数学推导上而忽视博弈过程的分析,进而影响学生对于博弈思想的理解,学习效果并不理想。

2.2理论教学缺乏足够的案例支撑

博弈论是兼具理论性和应用性的一门学科。对于经管专业的本科学生而言,博弈论课程教学的目的就是要将所学习的博弈论基本思想、理论及方法,应用于分析现实中的一些经济现象。因此,教师在课堂教学中通过案例分析来说明博弈论在经济学和社会学领域中的各种应用,不仅有助于学生更深入地理解掌握博弈论抽象的数学模型,而且有利于提高学生运用博弈论分析问题和解决问题的能力。但是,目前许多教师在教学过程中过于强调理论,重视数学推导,案例分析相对缺乏,这不仅不利于提高学生学习博弈论的兴趣,更不利于提高学生应用博弈论的能力。

2.3重视理论教学,轻视实验教学

经济学类课程的理论教学和实验教学是相辅相成、互相促进的教学方法,都可以引发学生的创造思维和探索精神,培养学生掌握学科知识。就博弈论课程而言,在教学过程中设计和组织适用于教学目的的实验,让学生作为被试参加实验,的确是有助于学生理解抽象的博弈理论,提高学生的创新意识和创新能力。但是,目前很多教师认为经济学类课程作为社会科学,没有必要像自然科学那样在实验室做实验,而且博弈论的课程内容是理论性的,实验教学可有可无,以致教学方法以教师讲授为主,忽视了学生的主动参与,教学呈现出“填鸭式”灌输状态。

3完善博弈论课程教学的建议

3.1注重思想传授,简化数学推演

学习博弈论的经管类学生大多为文科生,其人文知识比较丰富,但数学知识相对薄弱,因此他们往往对定量分析不感兴趣甚至抵触。因此,对于博弈论教学中一些较为复杂的数学推演,只需要简单介绍其基本过程。譬如,对于博弈论中的一些核心理论,如纳什均衡的存在性和多重性等,要进行阐述或证明对于经管类学生而言是极为复杂的,因此在教学时完全可以弱化复杂的数学表述过程,尽可能结合案例让学生明白这些理论的含义,避免学生因为复杂的数学运算而降低学习积极性。

3.2丰富案例教学,加强与学生互动

就从本科学生的知识结构和教学要求而言,博弈论的教学应该将案例教学和理论教学放在同等重要甚至更重要的位置。一方面,通过理论教学使学生掌握博弈论的基本理论、基本建模方法和基本分析方法。另一方面,通过案例教学使学生初步掌握博弈理论在实际问题中的应用。案例的选择要尽可能多源化,覆盖更多的学科,来自经济、管理、军事、历史、体育等方面的博弈事例都可以作为案例进入教学。同时,可以结合当今的一些社会热点问题,如医患关系、食品安全等问题也都进行案例教学,从而使学生感觉到博弈论是能够解释并解决现实问题的。在教学过程中,还可以尽可能地围绕教学主题寻找可供学生参与的游戏,如运用“猜数字”游戏让学生体会博弈中的奥妙,进而加深对理论的理解。

3.3引入实验教学

博弈论是实验经济学最重要的应用领域之一。经济学家对博弈论中许多著名的模型都进行了实验,出版了很多实验报告。这些研究成果可以帮助我们设计博弈论课程中的实验。一般来说博弈论课程中的实验都属于验证型实验,即为检验理论所设计的实验,通过实验环境的控制,揭示出各个变量之间的因果关系。通过最后通牒博弈实验、选美博弈实验、公共品供给等著名的博弈实验的引入,有助于学生深入理解博弈论的思想、培养学生的创新思维能力。

参考文献

[1] 张维迎.博弈论与信息经济学[M].上海三联出版社,1999.

第5篇:博弈理论论文范文

【关键词】语言交际 博弈论 关联论 关联博弈

【中图分类号】G【文献标识码】A

【文章编号】0450-9889(2015)02C-0052-03

当前,博弈论思想已被国内外学者运用到语用学领域来探讨人类的语言交际,例如Hintikka (1973)吸取博弈论和维特根斯坦的“语言游戏论”的思想精华提出了“语言博弈论”;Parikh(1991) 把博弈论引入语用学,构建Parikh模式,探讨与解释实际话语;Kibble(2003) 视语篇回指(discourse anaphora)视为一种博弈现象;国内学者钱冠连(2005)从博弈论的思想推衍出程式性语言行为的语用机制――“语用博弈论”。然而,博弈论的理论假设是每个参与者都是理性者,强调如何选择最优策略通向交际的纳什均衡,而最优策略无法完全体现交际的复杂性与多样性,亦无法保证交际者都做出理性选择。因此,博弈论对语言现象的解释存在着一定的局限性,其解释力需要待进一步探索。Allott(2001)、许宁云(2005)认为博弈论必然融合关联论的相关思想,最大程度地减少其博弈模型中的一些理想化成分才能拓展其解释力。基于此,本文试图在博弈论与关联论的基础上提出语言交际的关联博弈,以期待解决博弈论与关联论存在并需要解决的问题。

关联论是一个有关语言交际的理论,它关注的核心问题是交际与认知,包括两条原则:一是认知原则:人类的认知倾向于同最大程度的关联性相吻合;二是交际原则:话语会产生对关联的期待。交际的成功取决于两个基本条件:一是交际双方的互明(mutual manifestness),二是话语的关联性。按照关联论,关联性成为成功交际的核心,最佳关联期待成为理解话语的标准。关联期待可以说始终存在于交际中,因为关联性是制约人类交际的基本因素,它可看作交际的一个常量,而且“一旦关联期待得到满足或放弃,语用推导即时停止”。

博弈论是研究人们在诸种环境中做出决策(decision making)的方法。一个博弈包含三个重要的特征:其一,博弈中的参与者各自追求的利益具有冲突性;其二,博弈是一种过程集合,它不是一个孤立的事件,而是人们在对抗过程中有关的各方面的集合;其三,博弈的一个本质特征就是策略的相互依存性。一个最基本的博弈至少包括三个要素:参与者(player)、策略组合(strategy space)和收益函数(payoff structure)。参与者是博弈的决策主体,他们以实现自身利益最大化为目标;策略组合是博弈各方可供选择的策略或行为的集合;收益函数是在可能的每一个结果上,参与者的所得与所失。

关联博弈这一概念是整合了Sperber & Wilson的关联论与博弈论的思想而成的,它包含三个观点:其一,博弈是面向关联的博弈,是关联期待下的博弈;其二,关联期待是以策略为手段,是博弈过程中体现出来的关联期待;其三,博弈的每一阶段,都是以关联期待的满足为取向而进行的博弈;关联期待是博弈的每一阶段中以策略为手段来满足期待关联。以关联与策略为视角来看语言交际博弈,关联博弈具有一种内在性,又具有一种外在性。内在性体现于交际者对话语关联的期待,它推动交际博弈的发展,是交际博弈的内在机制;外在性体现于交际者对策略的选择与应用,它管辖语言交际博弈如何达到纳什均衡,是语言交际博弈的外在机制。策略与关联之间是一种张力关系,体现了它们寄生于博弈之中并以寻求交际博弈的纳什均衡为其栖居处。内在机制(即关联)促使交际者选择相应关联的话语作为策略进行博弈,外在机制(即策略)促使交际者选择相关策略去获取话语的最佳关联进行博弈。内在机制与外在机制的互动,构成语言交际的关联博弈过程中参与者寻求纳什均衡的语用机制。

一、语言交际的博弈树

语言交际的博弈是依据发话者与受话者的话语选择与应用一步一步地展开的,同时发话者与受话者的策略空间与交际语境等所体现出来的信息都在变化。博弈的每一个阶段进行,都体现了交际者的“心智路径”,刻画了交际者在可能期待的基础上对关联期待的放弃的动态性展现,也凸现了交际博弈中出现一种或一种以上的纳什均衡。对此我们可以用博弈论中的博弈树给予描述。博弈树能直观、有效地展示博弈中参与者以语言为媒介的行动顺序,轮到某一参与者行动时他可选择的行动以及他拥有的信息,在树的顶部还可以展示各种行动组合产生的各参与者的认知效果即博弈的收益。

(1)张:你的名字叫李四。(1)

李:什么意思?(2)

张:昨天的会怎么没去开?(3)

图1

博弈树是由关联结(relevant nodes)和关联枝(relevant branches)组成的图。博弈树上的枝是关联结与关联结之间的连线,如发话者S(张)的结与受话者H(李)的结之间的连线构成了博弈树的枝。博弈树上的关联结是动态博弈依顺序一步一步进行过程中的时点,例如,发话者S先选择话语1作为策略进行博弈,受话者H根据S的策略选择话语2作为策略进行博弈,S根据博弈语境选择话语3,使话语1到3之间取得了关联性,博弈获得了均衡,即交际意图得到实现。关联结是由决策关联结和终点关联结。决策关联结是博弈进行到某个时点上参与者(S或H)的决策点。决策关联结体现了参与者选择语言的顺序,如先由发话者S开始行动,然后到受话者H,最后又到S,即直到交际意图实现为止。终点关联结表示博弈进行到某一时点,博弈终止,如到发话者S选择话语3这一点,博弈终止。因此,在各个终止结处每一个参与者都可以根据博弈进行的过程计算各自的收益,如图1博弈树中的收益{1,1}或{-1,-1}。当然,从上面的博弈树可以看出,发话者S与受话者H选择语言作为策略进行博弈不是唯一的,如S、H双方除了分别选择1、3与2进行博弈外,也可以分别选择1'、3'与2'进行博弈,只要能使话语具有关联性就可以。

关联期待可以从上面博弈树的收益效用可以看出,当H选择2作为策略时,在决策关联点H处有两种情况:一是表面看起来话语无关联,如果没有动态的信息集的启动或者说受话者没有通过策略激活新的博弈空间,那么收益效用为{-1,-1},即H没有推理出S的交际意图,H的关联期待没有产生;二是在某个阶段的博弈上表面上似乎没有关联,但信息集弈语境是动态的,在另一个阶段的博弈上却是有关联的,即S通过扩展博弈的语境来明示自己的交际意图,H的认知语境得到改变,产生了语境隐含(即李四应该参加昨天的会议的交际意图),那么收益效用为{1,1},即交际意图得到实现,关联期待随着信息集弈语境的延伸与博弈的扩展而产生。博弈就会产生这样的结果:一是博弈参与者直接推导出对方的交际意图,即博弈成功;二是博弈参与者在某一阶段的博弈不能得到博弈的认知效果时,就可以启动另一个博弈阶段,经过博弈参与者双方的策略互动推导出交际意图,即博弈成功,如图1博弈树上收益为{1,1}的博弈空间;三是放弃对博弈信息的处理,导致关联期待得不到满足,交际意图落空,即博弈失败,如图1博弈树上收益为{-1,-1}的博弈空间。

二、语言交际的纳什均衡

关联博弈是一种以关联为取向的博弈现象,那么关联博弈就预设了这样的命题:语言交际的关联博弈一定存在纳什均衡,而且可能存在多个纳什均衡。所谓纳什均衡,就是参与者将如何博弈的“一致性”(consistent)预测:如果所有参与者预测一个特定的纳什均衡将会出现,那么,没有人有兴趣做不同的选择。换言之,每一个参与者要选择的战略必须是针对其他选择战略的最优反应,这种理论推测结果可以叫做“战略稳定”或“自动实施”,因为没有参与者愿意独自离弃他所选定的战略,我们把这一状态称为纳什均衡。纳什均衡其实就是博弈双方都想获得的交际均衡,它表现为话语是关联的,策略是互动的,信息意图是互明的以及交际意图最终得到实现。它不仅是参与者选择策略的过程,而且是参与者不断修正对先行参与者策略类型的推断过程。当某个阶段的博弈因某种原因找不到纳什均衡或没能实现纳什均衡的解,参与者会自动地重新依靠其认知系统的信息集以及对刚刚进行的博弈所形成的交际语境,重新评估博弈的话语关联性与策略选择的合适度,然后转移到另一个阶段的博弈中去寻求纳什均衡的解。那么看似无关联的话语或没有纳什均衡的博弈在另一个阶段的博弈就有了话语的关联性与纳什均衡的解。例如:

(2)Two flies are copulating in front of a boy and his mother.

Child: Do you know what these two flies are doing? A1

Mother: No. B1

Child: Ils font l’amour. [French for ‘they are making love’] A2

Mother: OK, OK. B2

Child: You know, if l’d said this in Arabic, you would have left the room immediately. A3

当小孩选择话语A1时,其母亲拒绝了他的请求,语用失误产生了,那么如何挽回语用失误产生带来的交际后果呢?博弈的纳什均衡在哪里?我们上面讨论过,只要是博弈就会存在着一个或多个纳什均衡。当小孩与母亲的博弈在第一阶段失败时,小孩意识到自己的博弈“出错”,对博弈语境进行重新评估后选择A2(即以语码转换回避社会禁忌的方法)作为补救策略,启动另一个层面的博弈空间,将原先的博弈镶嵌到新的博弈空间中去,改变了博弈的不利局面;而母亲则根据自己小孩的策略选择评估博弈的效益,最终选拔B2作为容忍策略,小孩通过原先的博弈镶嵌到新的博弈空间支持了自己的博弈结果。从例2可以看出,它的策略组合是{补救策略,容忍策略},从而使博弈产生了纳什均衡,即交际继续进行,双方的交际意图在博弈过程中得到显现。交际中我们经常遇到语用失误,但语用失误之所以得以容忍,归根结底在于交际博弈中总是存在纳什均衡,其策略组合是{补救策略,容忍策略}。纳什均衡的存在使人们在博弈过程中对关联期待不容易放弃。对关联期待的放弃只能是实现不了纳什均衡的基础上的期待才是对关联期待的放弃。因为语言交际的博弈是面向关联的博弈,总是存在着一个或多个的纳什均衡,所以,语言交际不存在着对关联期待的放弃,只是对信息处理的放弃。

三、相应关联与相关策略

以关联博弈为视角,人们在交际博弈中主要是以关联与策略这两个维度来掌握与刻画语言交际的博弈。博弈是面向关联的博弈,关联是以策略为手段来取得的话语关联。关联与策略之间的优化组合是语言交际博弈的驱动器,关联越大,策略的选择越优,交际博弈的纳什均衡就越容易实现它的解。博弈中的策略选择是为了追求博弈的相应关联,而关联是为了相关策略提供可能性。因此,要取得纳什均衡的解,关联与策略在交际博弈中不只是限于“最佳关联”与“最优策略”的需求,而是通向纳什均衡的相应关联与相关策略。原因何在呢?在关联博弈中,一个策略的选择总是内在地蕴涵着另一个策略选择的存在,一个话语的关联选择也总是内在地蕴藏着另一个话语关联的存在,从而有可能使不同程度的关联、不同程度的策略之间成为一个连续体,联成一个可以由参与者进行多样性选择的、可互存的、可预测的最终通向一个或一个以上的纳什均衡的网络,这个网络促使博弈的每一阶段都是有关联的。因此,关联与策略在语言交际博弈过程中是相对的,它们只是一个程度的问题,只是一个适合与否的问题,只是一个能否促使博弈通向纳什均衡的解的问题。这表明了,对于交际双方的一个博弈不可能要求每一个参与者都采取最大程度的最优策略,也不可能总是发话者产出最佳关联的话语。这就是关联博弈框架下的“相应关联”与“相关策略”。正因为关联与策略的相对性,不同程度的关联与不同程度的策略之间处于一个连续体,参与者通常是按交际语境的需要与可能在这连续体中选择恰当的或能推进博弈发展的具有关联的话语作为策略。如果把关联与策略理解为“相应关联”与“相关策略”,而不是最佳与最优问题,那么,即使是一个表面无关联的话语,在特定的博弈语境下也是有关联的,那么博弈论的“最优策略”与关联论的“最佳关联”过于绝对化与主观化的症结就在关联博弈的过程中得到消解。例如:

(3)(Situation: coffee shop in Berkeley, California, in 1981)

Customer [ just coming in ] to waitress: Is this non-smoking? A1

Waitress: You can use it as non-smoking. B1

Customer [sitting down]: Thanks. A2

(Verschueren 1999: 160)

顾客以A1作为博弈的策略,就表明了自己是非吸烟人士团体中的成员这一身份,同时也宣称了她想使用不受吸烟人士干扰这一既定权利。正是由于这个原因,女招待做出回答是基于这样的一个假定;作为一位吸烟人士,此顾客是通过她所提之问题来表白自己身份的,于是以B1作为策略默认了顾客原来的问题被女招待的回答转化成为的请求,表面上不关联的话语在双方的认知语境下取得了关联:女招待的回答使得顾客对她原本不是真正意义上的请求得到了满足而表示感谢,博弈的纳什均衡的解得到实现。其实,女招待所选择的策略并不是最优,话语的关联也并不是最佳,因为女招待可以以表面上最佳关联来回答,如干脆以“不,不是”来使顾客的问句得到作为问题应得的待遇,也可以以“很抱歉,我们还没有设立非吸烟区”或“很抱歉,我们还没有决定将非吸烟区设在哪里”来表示店主就尚未使用非吸烟人士的权利制度化表示歉意。然而,女招待并非如此。可见,在语言交际的博弈过程中,参与者由于博弈的需要并不是选择最优策略或最佳关联的话语进行博弈,而是从众多的策略或话语中选择能通向纳什均衡的相关策略或相应关联的话语。

综上所述,交际策略不只是就策略而论策略,而是在交际者对关联期待的驱动下而发挥作用的相关策略。关联也不只是就关联而论关联,而是在交际者的策略的驱动下而寻求的相应关联。在交际博弈过程中,参与者不但要有一个策略作为驱动器,还要有一个对关联的期待,两者的互动促使纳什均衡的解得到实现。参与者的策略与关联就像一个人的两只手,相互协调实现博弈的共同目标。

【参考文献】

[1]Allott, N. Game theory and communication[A]. http://phon.ucl.ac.uk/home /PUB/WPL/03papers/ allott.pdf, 2001

[2]Hintikka, Logic, Language-game, and Information[M]. Oxford University Press, 1973

[3]Kibble, Rodger. Towards the elimination of centering theory[A]. Proceedings of the Seventh Workshop on the Semantics and Pragmatics of Dialogue[C]. University of Saarlandes, Germany, 2003

[4]Parikh, P. Communication and strategic inference. Linguistics and Philosophy, 1991(14)

[5]Parikh, P. The Use of Language[M]. Stanford, California: CSLI Publications, 2001

[6]Sperber, D,Wilson, D. Relevance: Communication and Cognition[M]. Cambridge, Mass.: Harvard University Press, 1995

[7]Verschueren, J. Understanding Pragmatics[M]. London: Edward Arnold(Publishers)Limited,1999

[8]王雪玲.语言哲学视阈下的语言交际博弈论[J]. 当代外语研究,2010(4)

[9]许宁云.语篇回指博弈论[J].外国语,2005(6)

[10]张维迎.博弈论与信息经济学[M].上海: 上海人民出版社,2004

【基金项目】2013年度广西高校人文社科研究项目(SK13LX604)

第6篇:博弈理论论文范文

关键词:博弈论;供应链管理;均衡

abstract: game theory focus on the status analyze of conflict and cooperation. with the development of competition and cooperation among modern enterprises, game theory is widely used in supply chain management(scm). this paper classified the applications of game theory in scm into two groups: applications in traditional problems of scm, and applications in scm network equilibrium. the paper made a depth literature review of these two categories and gave out the future research trends.

key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况(博弈)中,每位决策者的最优决策和这些最优决策所构成的可能结果,以及这些结果的相关特性[1]。博弈论关注于包含冲突与合作的状态分析[2],目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理,以改善顾客服务和增加经济价值的流程[3]。近年来,随着供应链中企业间的竞争与合作不断增强,博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用,主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

供应链由不同的企业组成,企业间相互竞争的同时也相互合作,随着供应链由“链”向“网”的转变,企业间关系越来越复杂,不仅存在着上下游企业的竞争与合作,还包括不同供应链的核心企业间的竞争与合作问题。纵观供应链管理弈论的应用研究,本文将博弈论在供应链管理中的应用分为两大类:博弈论在传统供应链问题中的应用;博弈论在供应链网络均衡中的应用。

(1)博弈论在传统供应链问题中的应用

cachon和netessine根据供应链管理的应用,将博弈论分为四种类型:非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2];leng通过对130多篇供应链管理中运用博弈论的文献进行总结,认为博弈论在供应链中的应用主要有五种类型:固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈(能力决策、服务质量、产品质量等)及联合决策博弈(能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈)[2]。

在供应链的传统问题中,博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈,parlar分析了单阶段,两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4];cachon研究了两阶段情况下,一个供应商与一个零售商的库存决策问题[5];monahan针对数量折扣现象,研究了供货商和购买者在顺序决策情况下,供货商的最优折扣决策[6],而kohli和park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7];随着市场竞争的加剧,企业需要在控制成本的前提下提供令顾客满意的服务和产品,gans研究了m个供应商之间的服务质量竞争问题[8],而cohen和whang研究了售后服务质量决策问题[9];最近10年来,随着供应链问题研究的深入,多决策博弈问题也受到了重视,例如bernstein和federgruen研究了两阶段下,单个供应商和n个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

(2)博弈论在供应链网络均衡中的应用

随着供应链成员的增加,供应链中“流”的复杂化,供应链由链状结构逐步发展成网络结构,而供应链网络的均衡问题也受到了越来越多学者的重视。

nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型,指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件,即控制供应链网络的有限维变分不等式的解[11];dong在nagurney的研究基础上对单一产品的随机需求情况进行了研究,以三方各自追求利益最大化(非合作)为目标,建立了相应的供应链网络均衡模型[12];张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13];藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究,由于企业间的博弈随着时间的变化而不停变化,如何解决供应链企业间存在的动态博弈成为研究的下一个方向;此外,在供应链网络中,不仅仅存在上下游企业间的竞争与合作,不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响,针对单产品供应链网络进行了上下游企业间的动态博弈研究[15];黎继子针对不同供应链的核心企业间博弈进行了相应研究,但仅局限于同质产品的情况[16]。

2总结与趋势

博弈论在供应链管理中的广泛应用证明了博弈论在帮助解决供应链中存在的多种问题的有效性,包括库存决策、产品定价与产品数量、库存/定价/质量/广告等多决策问题,以及供应链成员间的竞争合作问题等,而且随着供应链网络的复杂化,也需要利用博弈论来解决相关网络均衡问题。

在当前研究中,nash均衡和stackeberg均衡常常作为解决非合作博弈的方法被广泛使用,而旁支付方法较多地运用于解决供应链成员间的合作问题,核、shaply值及核仁的运用相对较少;而且多数研究是针对供应链的静态博弈进行分析,而在现实的供应链网络运作中,企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策,因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献:

[1] 杨荣基,彼得罗相,李颂志. 动态合作——尖端博弈论[m]. 北京:中国市场出版社,2007.

[2] leng, m. and m. parlar. game theoretical applications in supply chain management: a review[j]. infor,2005,43(3):187

-221.

[3] b.j lalonde. supply chain management: myth or reality?[j]. supply chain management review,1997(1):6-7.

[4]m. parlar. game theoretic analysis of the substitutable product inventory problem with ramdom demands[j]. naval research logistics, 1988(35):397-409.

[5] g.p. cachon, et al. competitive and cooperative inventory policies in a two-stage supply chain[j]. management science,1999,45(7):936.

[6] j.p. monahan. a quantity discount pricing model to increase vendor profits[j]. management science,1984(30):720-726.

[7] b. kohil and h. park. a cooperative game theory model of quantity discount[j]. management science,1989,35(6):693-707. [8] n. gans. customer loyalty and supplier quality competition[j]. management science, 2002,48(2):207-221.

[9] m.a. cohen and s. whang. competing in product and service: a product life-cycle model[j]. management science, 1997,43(4):535-545.

[10]d.j. reyniers and c.s. tapiero. the delivery and control of quality in supplier-producer contracts[j]. management science, 1995,41(10):1581-1589.

[11]nagurney a, dong j, zhang d. a supply chain network equilibrium model[j]. transportation research: part e, 2002(38):281-304.

[12]dong, j., d. zhang, et al.. multitiered supply chain networks: multicriteria decision—making under uncertainty[j]. annals of operations research,2005,135(1):155.

[13] 张铁柱,刘志勇,滕春贤. 多商品流供应链网络均衡模型的研究[j]. 系统工程理论与实践,2005,25(7):61-68.

[14] 滕春贤,潘晓东. 供应链网络均衡中的利润协调问题[j]. 哈尔滨工程大学学报,2007,28(7):818-821.

第7篇:博弈理论论文范文

关键词:博弈;委托与;经济行为

一、博弈论发展简述

博弈论思想古已有之,博弈论最初主要研究象棋、桥牌、中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初对于博弈论的研究,开始于策墨洛、波雷尔及冯・诺伊曼,今天博弈论已发展成一门较完善的的学科。目前已成为经济分析的主要工具之一,对产业组织理论、委托理论、信息经济学等经济理论的发展做出了非常重要的贡献。由于博弈论重视经济主体之间的相互联系及其辨证关系,大大拓宽了传统经济学的分析思路,使其更加接近现实市场竞争,从而成为现代微观经济学的重要基石,也为现代宏观经济学提供了更加坚实的微观基础。

有一只看不见的手引导他去促进一种目标,而这种目标决不是他所追求的东西。由于追逐他自己的利益,他经常促进了社会利益, 其效果要比他真正想促进社会利益时所得到的效果为大。二百多年来,西方经济学家坚持斯密的信条, 他们相信自私自利的个体在利益驱动下会使社会达到和谐一致。博弈论专家认识到,理性人在进行经济决策时,但由于目标(或经济利益)不一致时常发生冲突, 理性人的最优选择要受对方选择的影响, 理性人之间的这种互动行为使他们的决策均依赖于两个或更多的人们的交互式战略。冯.诺依曼和摩根斯坦因以合作博弈为对象, 主要对二人零和博弈进行了分析。此后,合作博弈有了长足发展,提出了稳定集,解概念, 核等重要概念与思想, 来研究人们发生冲突时的合作问题。1950年,纳什发表了他的博士论文非合作博弈,最先对合作博弈与非合作博弈进行了区别, 提出了博弈论中最为重要的概念:纳什均衡, 为非合作博弈一般理论奠定了基础, 非合作博弈发展起来。事实上,合作博弈可以看作非合作博弈的特殊情况, 它略去了非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。非合作博弈对分析理论更为适用, 因此,我们今天所说的博弈论主要是指非合作博弈。

二、博弈论与经济行为结合

(一)委托人与人之间约束与激励机制

作为产权经济学的一个重要分支,委托一理论是从信息不对称条件下的契约形成过程出发,探讨委托人如何设计出一种契约,以促使人为最大限度地增进委托人的效用而努力工作。标准的委托一理论是基于以下两个基本的假设:信息不对称与经济人假设委托一关系一旦确立期,委托人期望人忠诚为其服务,通过不断提高个人能力水平,来提高企业的产出绩效,进而实现其自身效用最大化。但因人利己主义倾向及信息不对称,这一前提经常与现实经济生活相背离,从而导致了委托一关系失效。

1.委托人与人之间的目标函数不一致

2.信息不对称所导致的问题

在信息不对称的前提下,委托人无法准确判断人是否在忠诚且有能力地为企业服务,因而也就无法有针对性地对其进行有效监督,此时,问题的产生也就具有了现实的可能性。在社会经济生活中,问题主要是指逆向选择和道德风险两个方面。 逆向选择,是指委托关系确立之前,人利用其相对于委托人的信息优势,使得契约的签订对自己有利 。

3.委托人和人之问契约不完备

委托一关系实质是一种契约关系,但现实经济生活存在诸多不确定性,使得委托双方不可能事前签订一个完备的契约。此外,契约的完备程度也与契约的成本密切相关,完备程度越高则其代价越大。

(二)讨价还价的博弈与情侣模型

在现实中,我们经常会遇到讨价还价的问题,这其实就是买主与卖主的一场博弈。博弈理论表明,当谈判的多阶段博弈是单数阶段时,先开价者具有“先发优势”;而双数阶段时,后开价者具有“后动优势”。这在商场竞争中是十分常见的现象:非常急切想买到物品的买方往往要以高一些的价格购得所需之物;急切于推销的销售人员往往也是以较低的价格卖出自己所销售的商品。

商业谈判中,有一种“情侣博弈”谈判的模式。“情侣博弈”说的是一对热恋中的情侣,在如何安排度周末,而提出了这样的问题:男士想要看球赛,女士想要听歌剧。如果从其中的某个个体来看,这样的结局不是最优,但是如果有一方的稍许让步,就可以换来情侣组合整体的最佳满意度,同时自己也得到相对较佳的满意度;反之,如果男士单独去看球赛而女士单独去听歌剧,由于缺少情侣陪伴,必然会造成或多或少的满意度下跌。对于这样一个模式,博弈论告诉我们,双方都去看球赛或者双方都去听歌剧,是博弈的两个“纳什均衡”,也就是对双方整体而言,满意程度最高的两个结局。

(三)寡头垄断

寡头垄断:又称寡头、寡占,一种由少数卖方(寡头)主导市场的市场状态。英语中这个词来源于希腊语中“很少的卖者”。寡头垄断是同时包含垄断因素和竞争因素而更接近于完全垄断的一种市场结构。它的显著特点是少数几家厂商垄断了某一行业的市场,这些厂商的产量占全行业总产量中很高的比例,从而控制着该行业的产品供给,寡头垄断又称为双占垄断或双头垄断。 寡头垄断的形成首先是由某些产品的生产与技术特点所决定的,寡头垄断行业往往是生产高度集中的行业,如钢铁、汽车、石油等行业。其次,寡头厂商为保持自身地位而采取的种种排他性措施,以及政府对某些寡头厂商的扶持政策等,也可促进寡头垄断市场的形成。

三、博弈论的不足与发展

虽然博弈论已经形成了比较完整的理论体系, 而且在经济学中得到了广泛应用, 但博弈理论仍存在很多不足,首先就是均衡解的多重性。在很多情况下, 博弈模型的均衡解不止一个, 而是很多个。可以说这是一种富余的均衡, 因为面对多重均衡解, 经济学家并不知道那一个均衡解最终会发生, 这就限制了博弈论对现实问题的解释力和对未来问题的预测能力。相信在博弈论的发展中, 对博弈均衡的精炼是博弈论专家们一项长久的任务。此外, 博弈的建模技术、分析方法和求解手段如何进一步发展; 博弈论的应用领域如何逐步拓宽; 博弈论在经济学的研究和应用中如何求得更广泛的普及等, 这些问题仍未得到满意的解决。

参考文献:

[1]杨瑞龙,杨其静.企业理论:现代观点[M].北京:中国人民大学出版社,2005

[2]张维迎.企业的企业家:契约理论[Ⅵ].上海:上海人民出版社,1995

[3] 蒋殿春. 博弈论如何改写了微观经济学[J]. 经济学家, 1997; ( 6): 86~ 95

[4] 张培刚, 方齐云. 博弈论的应用及其展望[J]. 经济评论, 1998; ( 2): 13~ 14

[5] 张维迎. 博弈论与信息经济学[M].上海人民出版社与上海三联书店, 1999

第8篇:博弈理论论文范文

关键词:博弈 会计准则 纳什均衡

中图分类号:F233文献标识码:A

文章编号:1004-4914(2010)04-151-02

20世纪初,会计学从经济学中分离出来,成为独立的学科,这丰富了会计学的理论和方法,促进了会计学的发展。会计准则是随着社会经济发展的需要而发展起来的,在会计准则乃至整个会计理论的产生与发展过程中,始终贯穿着强烈的经济色彩。经济学的各种理论在不断地影响着会计的行为规范与会计准则模式的取向。会计准则就是在这种经济学科的影响下得到演变和发展并且变得更加完善。会计准则规范会计信息的生成和供给,从而影响信息使用者的决策行为,进而促进资源的优化配置、经济利益协调和社会经济的可持续发展。

制度既是社会的博弈规则,也是社会的博弈均衡。会计准则作为社会制度的组成部分,它是约束利益相关者行为的规则,也是利益相关者相互重复博弈的结果。本文拟借鉴博弈论的研究思路分析会计准则的制定问题。

一、博弈论与会计准则

一般认为,博弈理论始于1944年。数学家约翰・冯・诺伊曼(JohnvonNeumann)和经济学家奥斯卡。摩根斯坦(OskarMorgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。

自上个世纪80年代以来,博弈论在经济学与管理学中得到了广泛运用,并已逐步成为经济与管理理论研究的主流方向,近年来诺贝尔经济学奖多次授予博弈论方面的学者也充分说明了博弈论受到的高度重视。随着张维迎教授的《博弈论与信息经济学》的问世,中国的经济学界和管理学界也掀起了对博弈论研究的高潮。在会计领域,应用最广泛的是关于会计准则的制定,因为会计准则本身就是各方博弈的结果。目前,国内已有了一些运用博弈论分析关于会计准则制定的文献,如王建新提出“会计准则作为一种公共选择的公共契约与博弈论有着广泛的联系,准则的制定是一个博弈的过程,形成是博弈的均衡”;李高亮提出“子博弈精炼纳什均衡”是会计准则制定的标准等。纵观这些文献,一般都是在宏观的层面,通过对会计准则的制定进行博弈分析,得出了“高质量的会计准则需要各方进行充分博弈,而我国目前在这方面的博弈过程极度不充分”的结论。但是,根据运用博弈论研究会计准则的宗旨不仅仅是接受均衡结果,还要充分了解形成过程,从而创造条件达到良性均衡。

二、会计准则制定中的博弈均衡

制度既是社会的博弈规则,也是社会的博弈均衡。会计准则作为社会制度的组成部分,它是约束利益相关者行为的规则,也是利益相关者相互重复博弈的结果。

会计信息的使用者是非常广泛的,包括政府、债权者、投资者、企业经营者、供应商等,他们均会从各自的利益出发,关注会计信息的披露。但是他们所拥有的资源各异,对会计信息的需求各不相同,在会计准则产生过程中的决策也不相同。利益相关者的决策过程显然构成了一个重复博弈过程,我们把博弈重复进行的方式等同于博弈规则,并认为博弈规则是由参与者的策略互动而自发产生的,存在于参与者的意识中。

在准则的制定过程中,理性的参与人均会从各自的利益出发在充分衡量自身的收益和成本的前提下作出最佳选择。但是还应当看到,各个参与人之间的决策并不是相互孤立的,而是相互影响的。一方的决策必须以其他各方的决策为前提,他们的决策过程显然构成了一个重复博弈的过程。

政府、经营者、投资者、债权人和供应商构成这一博弈的主体,他们各自的利益出发点不同,行为特征也存在明显的差异。具体而言,政府部门关注企业的持续发展能力、社会经济运行状况、资源有效配置等方面的会计信息,以便履行其宏观经济调控的经济职能;企业经营者关注企业的利润水平、经管责任的履行等方面的会计信息,以在实现企业利润最大化的同时实现自身效用的最大化;投资者关注企业资产的安全性、流动性、收益能力、发展能力等方面的会计信息,以进行合理的投资决策,取得最大的投资成果;债权人关注企业资本结构、资产的流动性、偿债能力等方面的会计信息,以保证其债权的安全性;供应商关注企业的偿债能力、获利能力和发展潜力等方面的会计信息,以便与企业之间保持着广泛、持久、高级的合作关系。

虽然博弈参与者的行为特征存在很大差异,但是通过重复博弈, 他们的行动会逐步演化成一个稳定结果(行动组合)。博弈参与者基于个人经验对博弈进行的方式形成了大致的认识,认识的趋同导致其决策结果也逐步趋于相同。换句话说,参与者虽然不了解其他参与者的行动决策规则的全部细节,但可以知道一些概要表征或称为浓缩信息。博弈参与者依靠这些浓缩信息得出自己在各状态下的行动规则。当博弈参与者关于其他参与者行动规则的信息稳定下来的时候,他们自己的行动规则才能趋于稳定,成为博弈的指南。当他们在反复博弈中获得充分的信息?形成某种共同的信念,使博弈参与者的行动规则趋于一致并成为公认的博弈规则时,会计准则也便随之产生。我们称这种状态为“纳什均衡”。

在这种均衡状态下,只要参与者对别人行动规则的信念是可维持的,偏离自己形成的行动规则就是不合算的。违背这一信念只会使自己的利益受损。由此可见,会计准则可视为对应着利益相关者共享的那部分均衡信念,可定义为利益相关者的共有信念,即制定者、执行者、监督者相互重复博弈的结果。利益相关者的博弈次数越多,会计准则的完善程度越高,利益相关者之间的关系便越接近纳什均衡状态。

博弈形成的会计准则是一种相对的均衡规则,即在时间和内容上都具有相对性。这样,会计准则制定机构与利益相关者就必须随着会计环境的变化而不断进行博弈,如此循环往复,纳什均衡就会不断地被打破,并从低级的一般纳什均衡向高级的子博弈精练纳什均衡迈进。同时,在整个博弈过程中,应注意保护弱势利益相关者的利益,使个人理性(各个利益相关者追求自身效用最大化的偏好)与团体理性(追求全社会福利水平最大化的偏好)趋于一致,从而提高会计准则的效力,提高整个社会的福利水平。

三、博弈理论在准则制定中的应用

博弈理论应用于会计准则制定过程中的研究,拓展了会计准则制定的思路和方法――从一般纳什均衡到子博弈精练纳什均衡,从不完全信息静态博弈到不完全信息动态博弈,体现的是会计准则的制定从不完善到相对完善,以及伴随会计环境变迁而螺旋上升的一种动态博弈的过程。

作为博弈规则的会计准则,它能否得到有效执行,直接与会计准则是否为利益相关者的重复博弈结果相关。博弈规则是内在产生的,他们通过博弈参与者之间的策略互动最后成为自我实施的某种制度或信念。只有制定者、执行者、监督者在掌握相对充分的信息基础上,通过合作博弈才能形成一套公认的、最终实现自我实施的会计准则。因此,会计准则的制定过程要提高公开性和公正性,才能推动策略的互动。

在均衡决策下所产生的会计准则将是社会各界普遍愿意接受的市场规则,任何人若为暂时获得收益而违反这一均衡策略,必然遭到更大的损失。这一均衡可以使会计准则制定者、执行者和监督者各自利益兼顾,也只有在这个时刻,会计准则才可以发挥长期的效力。这样,会计准则经过多次博弈而不断得到改善,更严格地说是纳什均衡的均衡点会不断地由低层次向高层次逼近,使个人效用最大化与全社会福利水平最大化趋于一致,从而实现帕累托改进。

博弈理论认为,制度是一种历史的和现实的长期重复博弈的结果。会计准则及其制定权制度安排作为一种基本的社会经济制度也是利益相关者长期重复博弈的结果。要保证会计准则的科学、公正、公平、权威和效率性等高质量特征,就必须保证会计准则制定过程中利益相关者的充分参与及其制定机构的独立性。因此,基于博弈理论的会计准则制定者参与范式研究,具有重要的理论研究价值和实际应用指导意义。

参考文献:

1.张维迎.博弈论与信息经济学[M].上海:三联出版社,2002

2.谢识予.经济博弈论[M].上海:复旦大学出版社,2006

3.李高亮.博弈论在我国会计准则制定过程中的应用[J].现代企业,2004(10)

4.王建新.会计准则制定的博弈过程与我国会计准则[J].中南财经大学学报,2001(1)

第9篇:博弈理论论文范文

引言

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

相关热门标签