公务员期刊网 精选范文 博弈论案例范文

博弈论案例精选(九篇)

前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的博弈论案例主题范文,仅供参考,欢迎阅读并收藏。

博弈论案例

第1篇:博弈论案例范文

关键词 博弈论 课程教学 经管类本科

中图分类号:G642 文献标识码:A

1博弈论课程教学的特点

博弈论原是现代数学的分支之一,因此博弈论和数学的结合非常紧密,博弈论通常用严谨的数学模型来研究现实中理性决策者之间的冲突与合作,它从复杂的现象中抽象出基本的元素,以集合的形式描述问题,以函数形式刻画关系,并通过严谨的数学证明得到最终的结果。因此,一般来说在学习博弈论之前需要学生应该具备一定的微积分和概率论知识。另一方面,博弈论是一门实用性、应用性极强的课程,其应用领域可以从日常生活中的行为选择,到经济、政治、军事、国际关系等领域中的冲突与合作。博弈论综合了大量的一般原理,这些原理在不同背景和应用中是相通的,而通过博弈论的学习,不仅可以帮助学生认识一些经济现象的本质,还可以丰富学生对周围世界的理解,训练学生的思维方式。

2博弈论课程教学中存在的问题

2.1教学手段单一

由于博弈论具有较强的理论性,而博弈论学习过程中复杂的博弈分析过程往往和数学推导过程交织在一起,因此教师在教学中很容易将博弈论作为一门数学课对待,授课方式采用讲授式,课堂教学变成了数学推导,学生听课倍感吃力,无法与老师形成良性的互动,这很容易让学生失去学习的兴趣。同时,课堂教学如果过分强调数学推导,也会使学生的注意力过分地被吸引到数学推导上而忽视博弈过程的分析,进而影响学生对于博弈思想的理解,学习效果并不理想。

2.2理论教学缺乏足够的案例支撑

博弈论是兼具理论性和应用性的一门学科。对于经管专业的本科学生而言,博弈论课程教学的目的就是要将所学习的博弈论基本思想、理论及方法,应用于分析现实中的一些经济现象。因此,教师在课堂教学中通过案例分析来说明博弈论在经济学和社会学领域中的各种应用,不仅有助于学生更深入地理解掌握博弈论抽象的数学模型,而且有利于提高学生运用博弈论分析问题和解决问题的能力。但是,目前许多教师在教学过程中过于强调理论,重视数学推导,案例分析相对缺乏,这不仅不利于提高学生学习博弈论的兴趣,更不利于提高学生应用博弈论的能力。

2.3重视理论教学,轻视实验教学

经济学类课程的理论教学和实验教学是相辅相成、互相促进的教学方法,都可以引发学生的创造思维和探索精神,培养学生掌握学科知识。就博弈论课程而言,在教学过程中设计和组织适用于教学目的的实验,让学生作为被试参加实验,的确是有助于学生理解抽象的博弈理论,提高学生的创新意识和创新能力。但是,目前很多教师认为经济学类课程作为社会科学,没有必要像自然科学那样在实验室做实验,而且博弈论的课程内容是理论性的,实验教学可有可无,以致教学方法以教师讲授为主,忽视了学生的主动参与,教学呈现出“填鸭式”灌输状态。

3完善博弈论课程教学的建议

3.1注重思想传授,简化数学推演

学习博弈论的经管类学生大多为文科生,其人文知识比较丰富,但数学知识相对薄弱,因此他们往往对定量分析不感兴趣甚至抵触。因此,对于博弈论教学中一些较为复杂的数学推演,只需要简单介绍其基本过程。譬如,对于博弈论中的一些核心理论,如纳什均衡的存在性和多重性等,要进行阐述或证明对于经管类学生而言是极为复杂的,因此在教学时完全可以弱化复杂的数学表述过程,尽可能结合案例让学生明白这些理论的含义,避免学生因为复杂的数学运算而降低学习积极性。

3.2丰富案例教学,加强与学生互动

就从本科学生的知识结构和教学要求而言,博弈论的教学应该将案例教学和理论教学放在同等重要甚至更重要的位置。一方面,通过理论教学使学生掌握博弈论的基本理论、基本建模方法和基本分析方法。另一方面,通过案例教学使学生初步掌握博弈理论在实际问题中的应用。案例的选择要尽可能多源化,覆盖更多的学科,来自经济、管理、军事、历史、体育等方面的博弈事例都可以作为案例进入教学。同时,可以结合当今的一些社会热点问题,如医患关系、食品安全等问题也都进行案例教学,从而使学生感觉到博弈论是能够解释并解决现实问题的。在教学过程中,还可以尽可能地围绕教学主题寻找可供学生参与的游戏,如运用“猜数字”游戏让学生体会博弈中的奥妙,进而加深对理论的理解。

3.3引入实验教学

博弈论是实验经济学最重要的应用领域之一。经济学家对博弈论中许多著名的模型都进行了实验,出版了很多实验报告。这些研究成果可以帮助我们设计博弈论课程中的实验。一般来说博弈论课程中的实验都属于验证型实验,即为检验理论所设计的实验,通过实验环境的控制,揭示出各个变量之间的因果关系。通过最后通牒博弈实验、选美博弈实验、公共品供给等著名的博弈实验的引入,有助于学生深入理解博弈论的思想、培养学生的创新思维能力。

参考文献

[1] 张维迎.博弈论与信息经济学[M].上海三联出版社,1999.

第2篇:博弈论案例范文

1.博弈论的内涵。博弈,即组织或个人在一定的环境条件和规则下,同时或先后,一次或多次从各自允许选择的策略集或者行为集中进行选择并付诸行动,以期取得其目标的过程。在博弈的过程中往往需要四要素,分别为博弈方,各方可选择的策略集,博弈的次序以及博弈方的得益。以上四要素确定后,博弈就确定了。博弈论就是系统的研究可以用上述方法定义的各种博弈问题,寻找在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结构的经济意义、效率意义的理论和方法。

2.合作博弈的内涵。博弈论包含合作博弈与非合作博弈,合作博弈的产生早于非合作博弈理论,合作博弈各方之间可以通过运用有约束力的协议对各方之间的行为进行约束,而非合作博弈则不允许。合作博弈,是指博弈各方可以通过订立协议处罚博弈各方偏离协议的行为,当然必须通过协调、协商等达成合作协议或者形成默契。个体理性并不是人类经济行为背后的唯一逻辑,现实中联合理性的集体决策行为相当普遍。事实上人们在个体理性决策行为遇见困难时,经常会通过或明或暗的协议等协调行为摆脱困境。因此,即使非合作博弈非常有效,但由于它无法分析现实中普遍存在的联合理,在解释人类的经济行为和社会经济规律时需要合作博弈。

3.合作博弈的特征与结构。合作博弈的本质特征亦即其与非合作博弈的根本区别是合作博弈的各方之间允许存在有约束力的协议,这说明合作博弈的各方之间既存在共同利益又存在利益冲突,博弈各方通过订立协议就可以用个体理性决策解决问题。因此,合作博弈的特征主要有以下三点,即博弈各方之间存在协议的约束;博弈各方之间存在共同的利益;博弈各方之间的利益不完全一致。合作博弈主要有两种结构类型,即两人谈判博弈和联盟博弈。

4.三种合作博弈解的概念。①核。核是合作博弈中最早出现的概念,它也是合作博弈中最基本的概念,在其众多的合作博弈解中占有重要地位。即对于若干人的联盟博弈,分配集中不被任何分配向量所优超的分配的集合称为该联盟博弈的核,亦称“核心”。在实际问题的解决过程中,通常认为核中的分配向量可以作为联盟博弈问题的解。因此,如果联盟博弈中存在核,就可以将总收益按照分配向量分配给每一局中人,在此我们假设每一局中人都是理性人,任一局中人核将会使得自己的利益受损,然而在解决现实问题时核的解集往往为空或者是一个集合,这使得局中人无法选择,因此人们为了解决该种情况,提出了各种对策,例如运用夏普里值。②夏普里值。夏普里值是夏普里于1953年提出的,夏普里值的提出解决了核所存在的问题。假设联盟博弈中的每一位局中人达成一致意见同意以联合出资的方式进行投资,联盟的建立将会增加每一位成员的收益或者节约成本,增加整体利益。此时,如何分配收益成为亟待解决的问题,夏普里认为我们可以根据各局中人给联盟带来的收益增值来进行利益分配。然而各局中人加盟的次序是不确定的,不同的加入次序将带来不同的收益分配结果,n个次序将会产生n!种分配方案,夏普里值就是这n!联盟增值的平均值。夏普里在提出夏普里值算法的同时指出夏普里值需要建立在以下三个公理的基础之上,即对称性公理:即夏普里值与局中人的排列次序无关。有效公理:全体局中人的夏普里值之和分割完相应联盟的价值。加法公理:两个独立的博弈合并时,合并的夏普里值是两个独立博弈的夏普里值之和。③核仁。在合作博弈的过程中我们认为在分配核仁时最不理想的联盟也要优于其他联盟,核仁中将超出值作为合作博弈中联盟对各分配向量的满意程度,这个数越大,则表示联盟对该分配向量越不满意,比较不同联盟下的分配向量,选出超出值最小的分配向量作为合作博弈的解,该解称为“核仁”。核仁都具有以下四条性质即满足个体和集体的合理性,合作博弈中有且只有一个核仁,若存在核心则核仁必在核心之中,处于相同地位的局中人所得收益一样。

二、夏普里值在企业员工团队收益分配中的应用

1.实例。假设销售部有三个成员,A、B、C员工,各员工都可以独立工作或以团队合作的形式工作。公司规定,为激励员工努力工作,员工实行提成制,即给公司创造收益的0.3%作为提成。现假定几种工作方案方案以及各方案的收益情况如表1所示。

2.实例分析。通过该案例中的收益分配结果,可以看出夏普里值法体现了公平和效率,夏普里值法确定的各成员收益,不是按照各成员独立工作时的收益比例计算的,而是按各成员在联盟中边际贡献的大小来进行分配;夏普里值算法保证了各成员工作的积极性,因为各成员合作时的收入大于他们单独工作时的收入。然而夏普里值算法也有他的局限性,夏普里值算法考虑到了边际贡献的问题却未能将各成员的重要程度考虑进去。例如,在团队协作过程中,A成员有良好的社会关系;B成员肯吃苦,抗压能力强;C成员经验丰富,市场方向把控能力好。在这种情况下,假设A、B、C在团队中的重要程度分别为40%、25%、35%。则此时就需要对夏普里值算法进行修正。将三人的重要程度考虑进去。

3.对夏普里值算法的修正。虽然三者中C的边际贡献大于B的边际贡献大于A的边际贡献,但由于考虑到三者在团队协作中的重要程度不同,需要引进修正量φ ,三方重要程度平均为1/3,实际重要程度分别为 =0.4、 =0.25、 =0.35,则φ=(0.6-0.15-0.165-0.18)*( -1/3),则修正后A的收入为0.1745万元,B的收入为0.19625万元,C的收入为0.2292万元。

三、本文小结

第3篇:博弈论案例范文

【关键词】通识教育;博弈论;教学改革

博弈论又被成为对策论(Game Theory),研究的是在对局中各方利用对方的策略而变化本身的策略,进而取得自身利益最大化的学科,在近现代,博弈论的研究主要在于公式化的激励结构间的相互作用,该理论已经成为主流经济学的主要分析工具之一,并广泛的应用于生物学、国际关系、计算机、政治学、军事战略等学科。

一、作为通识教育的《博弈论》的教学目标

与专业学习的目的不同,如果将所有的学科比作整个森林,那么通识教育就是要学生尽可能的知晓这森林有些什么树,即“博通”,而专业学习就是深入去研究某一棵或者某几棵树,即“专精”。哈佛大学的前校长、通识教育的启蒙者劳威尔先生曾说:“每个受教育的人对什么事物都应该懂一点,但对个别的事物懂得更多”。通识教育的本质是,学生应当学习在任何时代、任何变迁下最核心、最基本的知识,作为通识教育之一的《博弈论》教学目标,显然也不能违背这一原则,即“培养学生综合素质,以人文与科学素质为核心”的基本要求,同时要兼顾知识、能力、素质等三方面的目标。第一,要让学生了解博弈论的基本知识与核心思想,掌握博弈论的基本分析方法,明确博弈论是一门研究不同参与者相互决策、互相影响的行为结果理论;第二,要培养学生用博弈论的基本方法去分析、解释现实问题;第三,要理论结合实际,通过经典的实践、案例教学等,培养学生用博弈论的思维去感知社会,并提高其理性分析的素养。

二、《博弈论》教学的特点与教学中存在的问题

博弈论内容庞杂、对数学要求较高,师资水平相对欠缺。博弈论最早应用于对弈问题中,如棋牌、轮盘赌注等,相较于其他学科,博弈论课程的内容庞杂、体系松散,在一般的教科书中,都将其按照完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈再到不完全信息动态博弈的教学方式进行授课。课时安排较少,选课人数较多。在博弈论的教学中,一方面由于博弈论对人们的行为有一定的预测性,既能帮助大学生理解广泛而具体的社会事件,又能够从理论上佐以抽象分析,且其研究的深入与应用的进一步拓展,使得越来越多的学生希望能得到这一门课程的学习,在笔者的实地考察中发现,大多数学校的该课程都出现了选课人数超员的现象。另一方面,该课程的主流教学方法偏向于抽象和推理行的科学,其中数学是其主要的工具,因此,大多数高校的博弈论教学尤其是本科阶段的教学都有一定的难度。

三、教学改革的思路与实践

作为通识教育的《博弈论》课程,也需要秉承通识教育让“每个人都知道一点”的博通精神,在教学改革过程中,要体现通识教育的基础性、价值导向性、内容基本性原则,让该课程成为培养大学生基础性知识与能力的重要课程之一,使高校的整体课程体系更加科学、完善。由于博弈论的应用范围非常广泛,因此在授课中,可以有很多的切入点,从而给了授课教师更广阔的主题选择。

大学生有着强烈的关注现实问题的意愿,教师在教学过程中也应当引导学生更多的关注现实,并用所学的知识去理解、分析现实情况,培养自身的思维方式与独立思考的能力。以经济学专业为受课对象为例,学生们普遍较为熟悉现阶段推行的“营改增”的税制改革,这里就有着几各博弈方,比如从全社会的收入分配来看,营改增在一定程度上改变了政府与市场的收入分配,从政府内部财政收入的分配来看,存在中央与地方财政的博弈,在改革的过程中,由于改变了现有的利益格局,如何达到的新的博弈均衡,是改革成功的关键。教师可以在课堂中设计一些与现实游戏场景相同或相似的环境,通过情景再现,将一些抽象的理论具象化,以风险偏好、风险规避与风险中性的概念为例,在游戏中,不同的同学表现有着明显的差异,而通过这种方式,能较大的提高学生们理解与掌握基本的概念。当然,在游戏的设计中要综合考虑游戏的趣味性。

增加不同行业的典型性案例分析,简化知识模块。通识课程的特点之一就是学生来自于各个学科,尽可能的“自成模块、减少关联”的安排知识模块,既可以照顾到学生的学科差异,也可以考虑到学生的积极性差异,从不同的角度重复性的阐述大家都熟知的案例,有助于降低知识门槛。以《博弈论》课程中有一部门关于拍卖理论的内容为例,笔者在具体的教学实践中,让学生拿出一些二手物品,通过荷兰式拍卖、英式拍卖、第一价格密室拍卖与第二价格密室拍卖,通过讲解不同拍卖的风险与成本,使学生真正参与到创新实践中,对于博弈论的理论的掌握与理解都有较大的帮助。

参考文献:

[1]Bell D. The reforming of general education[M]. New York: Columbia University Press, 1966.

[2]De Mesquita B B, Morrow J D, Siverson R M, et al. An institutional explanation of the democratic peace[J]. American Political Science Review, 1999, 93(04): 791-807.

第4篇:博弈论案例范文

博弈论的一般描述

博弈论研究的是决策主体的决策行为以及这种决策的均衡问题,即一个主体的决策行为要受到其他主体行为的影响,同时其行为又会影响到其他主体的决策。博弈论是系统研究各种博弈问题, 寻求博弈方合理的策略选择和合理选择策略时博弈的结果, 并分析结果的经济、效率意义的理论和方法。

博弈论可以分为合作博弈和非合作博弈, 前者主要强调的是集体理性和集体主义, 是指博弈者之间能达成一个有约束力的协议所进行的博弈。而后者是博弈者之间不能达成一个有约束力的协议所进行的博弈。从参与行动的先后顺序看, 博弈论可以分为静态博弈和动态博弈,静态博弈指博弈者同时行动, 或虽非同时行动但后行动者并不知道先行动者采取了何种策略,动态博弈指博弈者的行动有先有后, 且后行动者知道先行动者所选择的策略。从博弈者对其他博弈者的特征、策略及支付状况的了解程度, 博弈论还可划分为完全信息博弈和不完全信息博弈,完全信息博弈指每个博弈者对所有博弈者的特征、策略集及支付状况有准确的了解, 否则, 就是不完全信息博弈。

价格战的博弈原理分析

·“囚徒困境”的博弈分析

“囚徒困境”博弈是纳什非合作博弈的著名案例,它讲的是警察抓住了两个合伙犯罪的罪犯, 但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一人供认犯罪, 就能确认罪名成立。为了得到所需的口供, 警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟, 并给他们同样的选择机会: 如果他们两人都拒不认罪, 则他们会被以较轻的妨碍公务罪各判2年徒刑;如果两人中有一人坦白认罪, 则坦白者从轻处理, 入狱1年, 而另一人则将重判8年徒刑;如果两人同时坦白认罪, 则他们将被各判5年监禁。其得益矩阵如图1。

在此例中,囚徒不论对方如何选择,个人的最优选择都是坦白,但是,如果他们都选择不坦白,那么,他们的境况就要比在其他选择下更好一些!如果他们能够确信另一方会抵赖,并且他们也愿意守口如瓶,那么,每个人最终能够得到收益—2,从而使他们的境况变得更好,(不坦白,不坦白)是帕累托效率的组合,而(坦白,坦白)则是帕累托低效率的策略组合。问题在于这两个囚徒无法协调他们的行动,如果每一个囚徒都能够信任另一个囚徒,那么,他们的境况就会得到改善。这个例子讲述了一个自利的理性人采取使自己利益最大化的决策却使自己的利益及各个博弈方的利益下降的全过程, 这就是囚徒的困境。

·竞争企业的博弈分析

如果把这个案例中的囚徒换成市场竞争中的企业,我们就不难理解行业中的价格大战了。假设市场上有企业A和企业B,他们生产同类的产品,为了扩大市场份额,他们会采取降价的措施。如果企业A和企业B都降价,他们将获得300元的利润,如果有一方降价,则不降价的那一方获得200元的利润,而降价的另一方将会获得更高的利润800元,如果企业A和企业B都不降价,他们都将获得更高的利润600元。

从企业A角度看,无论企业B降不降价,他都会选择降价,因为300的利润高于200,800的利润高于600,在概率均等的情况下,降价的期望收益为300?0﹪+800?0﹪=550,不降价的期望收益为200?0﹪+600?0﹪=400,为了自身的利益,显然还是降价好;同样企业B也是降价比不降价好。此博弈中,双方都选择了降价的策略,然而却是整体收益最差的。这就是“ 囚徒困境”现象, 各个局部都寻求利益的最大化, 而整体利益却不是最优。有时企业间考虑到整体收益,他们也会约定都不降价,但是由于各自的私心,这种局面并不长存,又会有企业率先降价,在市场竞争条件下, 这样的价格不断下降是无法避免的, 降价成了不断重复的过程。

在完全自由竞争的卖方市场上,每一个企业在做出自己的决策时,虽然不能完全确定对方的选择,但却不能忽视对方的选择给自己的收益带来什么样的后果。因此,每一个企业都会根据对方面临的选择机会而做出最有利于自己收益的选择。由博弈论中的“囚徒困境”案例知:面对这种局面,每一个企业都会选择降价以保持自己在市场上的既得利益,而且这种价格大战会一轮接着一轮无休止的进行下去。一些企业也曾试图建立“价格联盟”,但是在事关企业市场份额的价格战中,价格联盟是无效的。

走出价格战的对策及建议

·加强产品创新和质量竞争

如果厂商的竞争产品在内部质量上、外观设计上或产品性能上不能形成自己的独特优势,而是和其他厂商的同一类型的产品没有区别,那么它就很难吸引消费者的眼光。所以,厂商应选用质量竞争方式,通过强化对现有产品或服务特点的市场沟通,以增强产品质量或服务质量的差异化。还要结合消费者需求和偏好,凭借自身的技术优势和管理优势,生产出在性能上、质量上优于市场上现有水平的产品,这样才能以产品的特色增加产品收入,提高市场占有率。

·注重品牌竞争,稳住客户群

品牌是将产品的独特内涵和定位向消费者的一种意思传达,品牌在营销中表现为对消费者的一种价值承诺,可以提升产品在消费者心中的品位,所以企业应根据产品的定位和消费群体的特征,找准侧重点,使消费者对公司产品产生信任感和归同感。另外,企业应与顾客建立良好的关系,忠诚、持久而稳定的顾客群成为企业最宝贵的资源。建立起企业与消费者之间牢固的情感纽带, 是摆脱价格战的有效选择。

·与竞争者学会共存,提高合作意识

第5篇:博弈论案例范文

关键词:法律经济学;研究方法;述评

一、法律经济学研究方法概述

我们首先要探求法律经济学的内涵,以便更好地把握法律经济学研究的主要方向。如果从研究方法上来定义,可以称其为“法律的经济分析”,即运用经济学方法和理论全面分析法律问题的经济学和法学整合的交叉学科。法律经济分析的核心在于引进微观经济学中理论、观点来探索法律背后的逻辑。主要目的在于,通过对立法、司法、执法等过程中遇到的问题所作出的决策进行定性、定量分析,以使社会资源得到有效配置与社会控制总成本最小化。

二、法律经济学的主要研究方法

(一)实证经济分析

实证经济分析,是将经济分析看作是一种工具,一种预测未来行为预期的工具,因为法律经济学是后果主义的,将一项法律事件或行为可能产生的各种效果予以预先考虑,并进行综合分析判断,以此来促使人们选择和预测他人的行为来指引自己的行为。也就是说,实证经济分析的理论关键在于其强大的预测能力,被用以进行定性预测,并用这些预测的经验来着重分析某项法律制度的实施后果,检验法律制度实施效果是否符合立法者的预期立法目的。

那么,实证经济分析的理论分析工具又有哪些呢?主要以定量分析、个案研究为主要的分析工具。即检视某项立法制度的预测能力、有效性的事实证据或经验证据的取得,它们都依赖于定量分析和案例分析的理论工具的运用。

当然,实证经济分析也有其局限性,一方面,这种理论模型如今只在侵权法领域、契约、犯罪学领域等法律关系领域适用,但不能否定所做出一定的贡献。另一方面,实证分析模型不能涵盖所有的变量,因此就有可能导致根据该理论模型得出的结论不可靠,为法律人士所怀疑,不具有真实性。甚至有可能会产生依据理论模型得到的结果与立法预期的实施效果截然不同,大相径庭。尽管如此,也不能否认该研究方法在预测行为变动方面的能力和分析判断某项法律制度的必要性与可行性。其优越性在于能有较高的评估立法所要达到预期效果的成功率。

(二)规范经济分析

与实证经济分析注重实践效果的目的不同,规范经济分析的目的在于为某项法律制度提出改革建议,为立法改革寻求理论支撑。其基本的理论分析工具有激励分析和最优化分析,前者是考虑一项即将颁行的法律制度对各方法律关系主体是否有激励、有何种激励来遵守该法律;后者是指,比如,罪犯在实施犯罪时,要考虑犯罪所花费的成本、所得到的收益、被抓获的概率以及惩罚的刑期等因素,并追求犯罪收益的最大化。

规范经济分析与实证经济分析并非完全割裂开来,二者的划分是一种理论上的相对的区别,实证经济分析是规范经济分析的前提,并服务于规范经济分析。规范经济分析需要实证经济分析提供实施效果来支持其合法性与合理性。

(三)公共选择分析

公共选择理论由布坎南、托里森合创的、一种将经济学理论运用于政治科学中,包括宪法学、行政法学等法律部门,以此来分析政府行为是否符合公共利益的经济理论。它的理论逻辑分析起点是个人主义和功利主义,布坎南指出,“私人偏好的满足是集体活动存在的首要目标。”①个人在制度环境中被视为理性效用最大化的发现者,是决策的基本单位和集体行为决策的最终掌控者。这一理论分析工具的首要假定是理性的、寻求自身效用最优化的经济人假设,并通过运用成本――收益分析的研究方法,对市场经济体制下的政府行为进行实证研究。

在市场经济制度环境下,政府是公共利益的捍卫者,是“市场失灵”的调控者。但滥用行政决策权会导致“政府失灵”,即效率低下的决策会使社会资源遭受浪费,与政府是公共利益代表的梦想设定大相径庭。因为政府官员不是超凡脱俗的圣人,他们同样会犯错误,他们有自身的利益追求,可能与公共利益相违背,比如自身职务的升迁等。

因此,只有事实上压倒性的证明市场解决手段等其他办法明显比政府干预手段成本更高时,才会选择公共理论分析工具。

(四)成本――收益分析

成本――收益分析主要依据成本和收益来制度的取舍,此方法是将微观经济学理论中运用的成本收益分析方法引入制度变迁理论,正是依靠成本收益分析法,新制度经济学才实现了制度分析与新古典理论的整合,使经济学分析的体系框架纳入了制度分析。

法律经济学中的成本收益分析为某一法律的成本、收益进行定性、定量和比较提供了系统分析框架,从而在不同的法律决策方案中进行选择提供了一种实用的客观标准:取决于哪种法律方案的净收益高。并为法律决策带来了定量分析工具。

不可否认地是,成本收益分析法在适用范围上,有其自身的局限性,比如无法解决非市场经济行为的预期评估和非货币成本与收益问题。

最后,成本――收益分析方法不仅仅应当关注成本和收益的最终结果,还应当关注成本和收益的构成情况。

(五)博弈理论分析

博弈理论或称对策论,是微观经济学中主要解决决策在极为关键时的境况。通常情况是:存在着一些决策者,且每一个人的最优化选择依赖于其他人的行为。②其中博弈论有三个基本要素:决策者、决策者的策略、决策者的每一种策略的支付。

著名的“囚徒困境”③是博弈理论中经常使用的一个理论分析模具。这一模型分析的前提假设是在多次博弈中,博弈双方的合作大于不合作。合作将产生帕累托最优,不合作将产生纳什均衡,但帕累托最优与纳什均衡之间并无必然的联系。而合作的一个重要条件是博弈双方的交流不存在障碍,且博弈的次数在理论上是趋于无限。假设博弈次数是有限的,那么每位博弈者在每次博弈中的最优选择是不合作;相反,在无限次博弈中,最优的策略是“一报还一报”。④

博弈论在法律中主要运用于法学理论部分,并成为法律经济学中的主流分析范式。一方面,在博弈论的视野里,法律通常被看作通过权利的激励机制进行社会资源配置的方式。因为博弈理论也遵循理性经济人的假设,寻求所有可能方案中的最优策略,以便最小化所支出的社会成本,获得符合法律规则的最佳结果。在这一点上,是与法律经济学分析的目的是不谋而合的。但不同的是,博弈论所坚持的个人理性最大化的假设,是将其他参与者的决策考虑在内的最大化假设,这说明了决策者之间的相互牵制是人们选择不利制度并长期存在的关键因素。

另一方面,博弈理论分析更清晰的阐释了法律经济分析所寻求的目标,即设计出一种理想的行为模式。除此,博弈论突破了新古典经济学中没有外部性、信息完全和竞争充分的假设,并且二者的分析方法也不同,前者具有比新古典经济学更强大的解释力和预测力。⑤

总之,博弈理论分析将法律制度下的人们之间的涉他行为归结为对策行为比新古典经济学中的行为假设将更为精确。这一理论分析工具广泛适用于法律的诸多领域,比如反垄断法、群体间的隐私、公司法、环境侵权以及诉讼和解等等,因为法律中存在着许多处理策略的。

(六)案例分析

案例分析在新制度经济学⑥中普遍适用,其目的在于证实经济原理,或者阐释一定的经济学理论。案例研究得出的结论在司法案件中,可以成为支持当事人诉讼请求和法官进行司法审判的依据。在法律经济分析的案例研究中,主要分析两方面的内容:其一是对法律实践的分析,特别是在司法裁判方面;其二是对一些地区的习俗、习惯等不成文法规则的分析。前者分析的意义在于通过对一些经典案例进行实证研究,分析法律规则适用的特征,从而总结出对法律实践具有普遍性的规则。例如最高人民法院每年都会指导性案例,目的在于统一疑难案件的法律适用标准,最大限度的保护公民的正义,其背后也隐藏了法律经济学的影子。后者分析的意义在于,法律是地方性知识,国家立法机构颁布的成文法可能会“水土不服”,与民间习惯法产生冲突,甚至被“搁浅”。所以有必要对特定地区的风土文化进行实证分析,以使国家成文法与民间法在中国土地上更好的兼容。

三、对法律经济学研究方法的批判

法律经济学的发展时间虽短,在学术领域内却产生令世人惊讶的丰富成果,展现了其强大的解释力和生命力。不可否认,每门新兴学科在不同方面都会受到大量的反面意见或者批评,这些意见对于改进法律经济学的缺陷有巨大帮助,下面主要谈谈在学术界的三种主要批评意见:

首先,深受传统注释法学影响的一些学者较为强烈地抵制运用经济学理论分析法律规则,他们认为,法律经济分析方法忽视了传统法学所倡导的公平、正义、人权等抽象价值理念。还认为,其研究方法只注重效率等价值,抛弃了情感等伦理观念。对此我想论证的是,法律经济学并非有意不考虑这些价值,而是因为正义、公正等这类的词没有统一的内涵界定,它们往往迎合世人的思维懒惰,掩盖因果关系;而且追求公平不能忽视成本,也就是说,正义有价,因为站在决策者的层面上,任何东西都是有价的,包括生命。⑦

其次,从哲学上讲,法律经济学的研究方法是注重行为后果的,通常被认为具有功利主义色彩,这是和直觉主义的观点相违背的。后者通常用道德哲学作为攻击法经济学的利器,因为运用法律经济分析所得出的结论往往会偏离人们道德直觉的认知,这也是至今为止,法经济学不为一些学者所接受的因素。

最后,对法律经济学的研究方法的一种批评意见是由于这种研究方法在实证运用中的失败,认为它并没有解释法律制度中的每一项重要的规则、原则、制度和结果。⑧但这种缺陷不能法律的经济理论成为更加强力和实用的实证理论,除非其没有任何希望。(作者单位:西南政法大学行政法学院)

注解:

① 詹姆斯・布坎南和戈登・塔洛克(James M・ Buchanan & Grodon Tullock):《同意的计算》(The Calculus of Consent),第5页,1962年。

② 参照[美]罗伯特・考特 托马斯・尤伦著:《法和经济学》(第六版),史晋川 董雪兵等译,史晋川审校。格致出版社,第31页。

③ “囚徒困境”的例子是指,两个嫌疑犯A和B合谋犯罪,逮捕后被分别关在两个房间,无法交流。如果两人都抵赖罪行,则只会被判处1年有期徒刑;如果两人都坦白,则都将被判处5年有期徒刑;如果一人坦白,另一个抵赖罪行,则分别判处6个月和7年有期徒刑。所以嫌疑犯A和B都有两个策略:坦白和抵赖。

④ 即如果另一个决策者在上一轮博弈中选择合作,那么你在这一轮也合作;如果他在上一轮选择不合作或者背叛,那么你在一轮也选择背叛。

⑤ 参照:周林彬著:《法律经济学:中国的理论和实践》,北京大学出版社,第56页。

⑥ 正是新制度经济学将法律正式引入经济学的研究范畴并引发了法律经济学的产生,这一点上与我国从20世纪80年代的经济体制改革不谋而合。

第6篇:博弈论案例范文

【关键词】 博弈论; 企业; 合理避税

税收是国家重要的经济杠杆之一,是无偿性、强制性和固定性的统一。政府通过税收维护国家机器的运转、调节宏观经济的运行,企业以创造利润、追求剩余价值的最大化为最终目标。随着我国市场经济的不断深化,企业与政府在税收方面的博弈愈加激烈,相对于偷税、漏税等行为所受到的严重处罚,在不违反税法的前提下,企业的合理避税手段也不断多样化。博弈论起源于数学和地理学科,近年来越来越广泛的应用于经济领域。从博弈论角度出发,探讨企业与税务部门的博弈关系,根据纳什均衡,实现最优化策略组合,促使企业纳税与税务部门征税协调发展,成为摆在我们面前的课题。

一、企业与税务部门的博弈关系

企业的避税手段通常有以下几种。一是关联企业的转让定价。一些企业尤其是跨国企业,在货物、劳务、资本等方面与关联方进行价格协商,从我国向税率较低的国家进行货物销售、劳务输出时,制定较低的价格,从而达到避税的目的。例如:2001年的日本千代田化工建设株式会社营业税征税事件,该企业与我国一家公司合作某化工项目,却签订了境内、境外两个不同的合同,企图通过利用我国税法空隙(对国外的劳务行为不予征税),把劳务行为强行转移到国外从而达到避税的目的。二是资本弱化。企业在投、融资上人为降低权益资本与借贷资本的比例,从企业税前利息找突破口,以获得更丰厚的税前利息扣除。三是利用电子商务避税。近些年来,随着互联网经济的快速发展,B2C、B2B、C2C等电子商务形式层出不穷,一些企业以此为契机,把传统的“有纸”交易转到互联网上的“无纸”交易,从而实现躲避税收的目的。

从政府方面看,针对企业花样百出的避税手段,相应的政策法规也在不断完善。例如:目前美、德、英等国家只把个别反避税写入税法,而我国在2008年已把一般反避税条例写入新税法之中,对关联转让、资本弱化等行为做出了详细的规定,加大了对避税的处罚。2009年我国出台了《特别纳税调整实施办法(试行)》,强调纳税人在关联交易过程中必须向税务机关提供有关材料。近年来,随着我国引资规模不断壮大,虽然我国相应出台了一定的政策,但避税与反避税间的博弈却没有丝毫平息,两者的博弈愈加激烈。例如:2003年,我国最大轻工业纳税大户宝洁公司的避税案,补税达8 149万元。据国家税务局统计,2008年我国转让定价案件共涉及企业174户,追补亏损7.5亿元;2009年全国转让定价案件涉及企业179户,结案167件,追回亏损8.7亿元。其中2008年深圳市地税局对当地一家企业补税金额达到4.23亿元,是我国至今为止个案补税金额最大的案件。在当前形势下,基于博弈理论,探索一条兼顾政府与企业双方利益的最佳策略组合显得尤为重要。

二、企业与税务部门的均衡状态分析

从企业与税务部门的博弈关系上看,相对于博弈论中合作式最优策略组合,政府与企业间的税收博弈则是一种“非合作式”博弈。企业合理避税与税收部门间的博弈可根据“纳什均衡”理论进行分析,在企业合理避税与政府税务部门的策略选择组合中,两个参与者都面临当对方不改变策略时,自己的策略是最优的。在纳什设置的博弈均衡点上,无论是企业还是税务部门都不会有单独改变策略的冲动。如在表1中,企业与税务部门都不了解对方的具体行动。将企业不避税与税务部门不查处设置为“1”,将企业合理避税与税务部门反避税设置为“0”,将负收益设置为“-1”。企业与税务部门两者则拥有“不避税”、“合理避税”、“不查处”、“反避税”四种状态,在表1中,每个元素均由两个数字组合而成,分别代表两个对抗者的收益。从表1中可以看出,当企业与税务部门坚持不避税与反避税时,面临的结果只能是0、1或-1,而当两者选择合理避税与反避税时,各自收益为“0.5”,才是最为互惠的策略组合,最终形成帕累托最优策略。

三、基于博弈论基础上的企业与税务部门的策略选择

通过帕累托最优策略可以得出结论,企业以追求税后利润最大化为目标,必须从自身出发,在不违法的条件下做好合理的避税,税务部门要不断加大反避税力度,加强相关制度、法规的建设,调整税收筹划空间,完善相关税收优惠政策,才能实现双方利益的最大化。

(一)企业

企业要在不违反税法的前提下加强合理避税。首先,要在充分纳税筹划的基础上,除可在沿海口岸等地区利用“保税区”进行合理避税,还可以探索利用区域经济的税收优惠政策,通过内陆地区“避税港”进行合理避税。近年来我国沿海地区经济体系不断完善,税收政策逐渐收敛。而随着西部大开发、振兴东北老工业基地等政策的出台,在我国中西部和东北地区,新的经济开发区、技术合作区大量涌现,这些都成为企业新的“避税港”,企业可将产业向中西部转移,以获得更大的税收优惠政策。其次,可以利用国家的投资导向来安排合理避税。近年来我国税收优惠政策逐步由区域经济发展、招商引资,演变为产业引导和宏观调控。尤其是2008年金融危机以来,我国的制造业大受影响,出口额锐减,发展高新技术产业、提高产品附加值、延长产业链,成为国家鼓励的投资方向。传统的高耗能、劳动密集型产业(如:化工、钢铁等)增加了相关的税收,以达到抑制产能过剩的目的。发展高新技术产业成为未来的趋势,低碳、环保、清洁能源产业成为新的税收优惠产业。针对这一现状,企业可以通过进行技术改造和自主创新,以获得国家高新技术企业认定,享受15%的所得税优惠税率。第三,虽然新税法在关联企业转让定价、资本弱化等方面有了严格规定,但企业仍可在新税法允许的情况下利用转让定价、资本弱化、避税政策等策略组合来进行合理避税。在“独立交易”原则下,与税务部门充分沟通协调的基础上,合理使用转让定价方法,在限定的扣除比例内进行税费的筹划。在资本弱化的使用中,可在坚持权益资本和借贷资本在1:1比例前提下,最大限度地进行纳税的筹划。例如:企业可把投资方向转入内地免税区,发展高新技术产业和低碳产业,保持一定的权益资本与借贷资本比例,在税务部门预定价的基础上对劳务、原材料成本进行适当的调整,以获得最大的节税收益。

(二)政府

一方面,税务机关要认识到企业的合理避税是企业的正当理财行为,纳税人的节税动机与税的征收是一对客观的矛盾,以客观的态度对待企业的合理避税。首先,政府要从引导产业方向和宏观经济调控的角度,出台相关的税收优惠政策,为纳税人营造一个良好的投资环境。其次,要在法律方面明确税收筹划是纳税人的合法权利,划清合理避税的界线,使纳税人避税有法可依。第三,税务机关要贯彻好我国的税收分配公平与效率原则,主动对合理避税手段进行督导。

另一方面,税务机关要强化对非合理避税的制约力度。首先,针对企业关联转让定价、资本弱化等传统避税手段,要加强关联企业的举证责任,审慎企业是否属于“独立交易”,重点做好外资企业转让定价的监管。充分发挥好海关、工商等协税力量进行避税的监督,审查企业避税的“合理性”。针对资本弱化,虽然我国《企业所得税法》中规定了关联方与企业的债权性、权益性投资比例超过规定标准而发生利息支出时的计算方面内容,但仅限于“关联企业”之间,很容易造成企业通过负债经营的方式进行避税。因此,我国应借鉴国际上通用的方法,在核实企业的债权性与权益性融资额基础上,将企业不符合“独立交易”的债权性融资利息在计算企业所得税后进行扣除。同时要设定债权性与权益性融资的最低比例标准,而不是通过笼统的法律条文进行规定。在比例设定时要采取“差别化对待”的原则,对不同行业设定不同的比例标准。同时,税务机关要建立与商业银行的合作联动机制,争取银行的支持,共同对企业避税行为进行监管。其次,针对目前逐步炙热化的电子商务避税,应加快电子商务避税相关法律、法规的完善,制定相应的反避税政策。实施电子商务备案制度,规范纳税人的网上行为,对其网上交易进行详细规定,监督网上交易。为每个网上交易的企业设置税务备案号,要求电子商务的企业按时对相关网络交易材料进行申报。将电子商务嵌入增值税、营业税、消费税、所得税、关税等税种,完善现行税法。完善会计法、经济法等法律,大力开展电子商务纳税审计,对纳税人的商务流通、支付、会计系统进行实时审计。针对电子商务交易,税务部门要及时与网络支付组织(如:支付宝)进行沟通与协作,共同对电子商务行为进行监督。

总之,企业与税务机关作为不同的决策体是一种非合作式博弈,只有当两者同时选择合理避税与加强反避税时,才能形成帕累托最优策略。企业要在纳税策划的基础上及时与税务部门进行协调,充分利用好国家区域经济、投资导向等相关优惠政策,在税法允许范围内选择合理的资本弱化、关联企业成本转让等避税方式,达到节省税款、扩大税后利润的目的。政府要不断完善相关法律、法规,划定合理避税界线,在反避税的前提下加强相关税收优惠政策的制定,引领产业发展方向,最终促进经济的健康可持续发展。

【参考文献】

[1] 李伟.国际转让定价:利益博弈与税制安排[J].西南财经大学学报,2007(4).

[2] 王娟.我国国际反避税研究[J].西南财经大学学报,2009(11).

第7篇:博弈论案例范文

[关键词]博弈论 经典博弈模型 博弈行为 博弈决策

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。从对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。“博弈论”的英语原文是Game Theory,直译过来就是游戏论、运动论或竞赛论。譬如在足球比赛中,双方都想在努力巩固防守的同时,积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中是下棋的意思,下棋中的双方行为特征也如同足球比赛中双方的行为。当然,扩展开来讲,企业之间的竞争、国家之间的角力等等,都是“游戏”,只是游戏的内容不同而已。

一、博弈简介

“博弈论”就是分析博弈行为和博弈决策的一门科学。

今年的诺贝尔经济学奖,已于前不久为“博弈论”研究专家罗伯特·奥曼和托马斯·谢林所获得,1994年度和1996年度的诺贝尔经济学奖,也分别由纳什、泽尔滕、海萨尼、莫里斯和维克瑞等“博弈论”专家分享。如此众多的“博弈论”研究专家的频频获奖,凸现了“博弈论”在主流经济学中日益重要的地位。

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。

我国古代有个“田忌赛马”的故事,说的是齐威王与大将田忌各出三匹马,一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0∶3告负。后来田忌的谋士孙膑给田忌出主意,让最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2∶1取胜。但我们还可进一步设想,如果齐威王知道了田忌的花招后,便会在以后的比赛中也更改出马的次序,当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深一层次研究的问题了。

二、一个非技术性的定义

博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。从定义我们可以看出,规定或定义一个博弈需要设定下面四个条件。

1.博弈的参加者。即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

2.各博弈方各自可选择的全部策略或行为的集合。即规定每个博弈方在进行决策时,可以选择的方法、做法或经济活动的水平、量值等。

3.进行博弈的次序。在现实的各种策略活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方同时作出选择,以为这样能保证公平合理,而很多时候各博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。

4.博弈方的得益。对应于各博弈方的每一组可能的决策选择,都应有一个结果表示该策略组合下各博弈方的所得或所失。

以上四个方面是定义一个博弈时必须首先设定的,确定了上述四个方面就确定了一个博弈。博弈论就是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略的选择和合理选择策略时博弈结果,并分析这些结果的经济意义、效率意义的理论和方法。

三、博弈的结构和博弈的分类

由于博弈研究的问题多种多样,因此博弈模型相互之间的差别可能会很大。这些差别可以理解为都是博弈问题的结果差别。当博弈结构有差别时,博弈的结果和分析方法往往也有不同,因此对博弈的结构特点有所了解是很有价值的,在此我们提出博弈论问题的分类和博弈理论的结构。

1.博弈中的博弈方:博弈中独立决策、独立承担博弈结果的个人或组织为博弈方。因此我们把博弈方分为“单人博弈”、“两人博弈”和“多人博弈”。这里的“单人博弈”和“两人博弈”,并不一定是自然人,而是指前面所说的博弈方,既可以是个人,也可以是经济社会组织。

2.博弈中的策略:博弈中各博弈方的策略内容称为“策略”。

3.博弈中的得益:得益即参加博弈的各个博弈方从博弈中所获得的利益,它是各博弈方追求的根本目标,也就是他们行为和判断的主要依据。

(1)零和博弈:它是常见的博弈类型,同时也是被研究得最早、最多的博弈问题。

(2)常和博弈:它也是很普遍的博弈类型。常和博弈可以看作零和博弈的扩展,零和博弈则可以看作常和博弈的特例。

(3)变和博弈:零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。

(4)博弈的过程:博弈的过程也是博弈结构的重要方面。根据博弈过程方面的这些差异,博弈问题通常分为“静态博弈”、“动态博弈”和“重复博弈”几个大类。

①静态博弈:所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。

②动态博弈:指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。

③重复博弈:所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈也成为“原博弈”或“阶段博弈”。

我们研究的大部分是重复博弈的原博弈都是静态博弈,或者说是由静态博弈构成的。这种由同样一些博弈方,在完全同样的环境和规则下重复进行的博弈,在现实中有很多实际的例子。如:体育竞技中的多局制比赛、商业中的回头客问题、企业之间的长期合作或竞争等等,如果不考虑环境条件方面的细小变化,都可以看作是重复博弈问题。

5.博弈的分类和博弈理论的结构

博弈结构这些方面的差异对博弈结果和博弈分析都有重要的影响,而且博弈分类相互之间都是交叉的,并不存在严格的层次关系,但我们还可以根据各种分类对博弈分析方法影响程度的大小排除大致的次序。

(1)是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。

(2)是分为零和博弈、常和博弈与变和博弈。

(3)是分为静态博弈与动态博弈。

(4)是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。

四、“博弈论”中的经典博弈模型

根据博弈定义,小到企业之间的竞争和合作,国家之间的倾销反倾销、制裁和报复等,都有可以归结为博弈问题。“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。

第8篇:博弈论案例范文

关键词:耕地保护主体;纳什均衡;蛛网理论;成本分析

中图分类号:F321.1文献标志码:A文章编号:1673-291X(2011)19-0043-03

一、博弈论及其在耕地保护中的应用

博弈论(Game Theory)又译为对策论,博弈论研究的是人与人之间利益相互制约下策略选择时的理及相应结局[1]。博弈论是在1937年由美国数学家约翰•冯•纽受(John von Neumann)提出,运用旨在解释各种博弈的分析方法来解释政治与对手行为。所有的博弈有三点是共同的:局中人、策略与支付(或译为效用)。在博弈中每个参与者的目的是使利润最大化,博弈规则由法律框架决定,策略是每个参与者所有可能的行为,支付是参与者的利润或损失。

博弈论在耕地保护中有着重要应用,政府与农户都是博弈的局中人,为了便于分析,我们将首先讨论直接决策者――农户之间的策略博弈,且讨论是农户之间的完全信息动态博弈。完全信息动态博弈是指局中人对自己与其他的局中人的所有的与博弈有关的事前信息(策略空间、支付函数等)有充分的了解的有决策先后次序的博弈。

为了便于分析,农户可以简化为两个即为甲和乙,在初始阶段t0,耕地的机会成本大于耕地收益。对于甲和乙两个参与者,每个参与者都有两种战略:保护耕地或将耕地转化为其他用途。由于有两个参与者,每人都有两种战略,所以就有四种可能的结果:(1)都选择保护耕地;(2)都选择将耕地转化为其他用途;(3)甲选择保护耕地,乙选择将耕地转化为其他用途;(4)甲选择将耕地转化为其他用途,乙选择保护耕地。每个参与者都可以知道在这四种情况中的每一种情况下自己的结局。可以将每个参与者四种可能的结局列成博弈的结局矩阵(PayoffMatrix)。参与者的处境是带有纳什均衡(Nash Equilibrium)特性的博弈,也即优势战略均衡 [2]。

参与者都知道,无论对方怎样做,自己最好的选择是将耕地转化为其他用途,将保护希望寄托在对方身上,这样就实现两人的非零和博弈。但是,两人分别从自己的利益出发决策时的结果是耕地的大量侵占。

二、农户博弈行为的后果分析

粮食的生产周期较长,我们作如下假设:(1)从开始生产到生产出产品需要一定时间,而且在这段时间内生产规模无法改变;(2)本期的产量决定本期的价格;(3)本期价格决定下期产量。在分析时我们还假定土地是均质的,即单位面积耕地产出一定为u。在初始时期t0,甲和乙分别拥有面积为L1和L2的土地资源,耕地面积分别为C1和C2,此时粮食的价格为P0,供需均衡点的粮食童是A。对于任何一个决策者而言,效用最大化要求当单位面积边际收益(ML)大于单位面积耕地收益时,将耕地转化为其他用途,随耕地逐渐转化,边际收益递减,当单位面积耕地的边际收益高于单位面积非耕地收益时,达到均衡状态。

(一)农户单次博弈

每个参与者都会认识到,由于耕地面积减少,粮食供给量也随之减少,从而引起粮食价格上升,在时间为t时,效用最大化的实现可用下式表达:

Ut(max)=ptctu+f(L)dL

其中,Pt和Ct是时间为t时粮食的价格和耕地面积;Ml =

f(L);Lt是时间为t时的非耕地的面积;Lt+Ct=Tl,Tl是土地总面积。

参与者的优势战略是在时间为t时将耕地面积减少至Ml等于单位面积耕地的收益,但每一个参与者只能预计出自己的供给发生变动时粮食价格的相应变化。甲考虑到采取优势战略后,耕地面积由C1减少到C3,粮食供给由A0减少到A2,对应的粮食价格上升至PT1,Al=A0-(C1-C3)u;同理,乙考虑到采取优势战略后,耕地面积由C2减少到C4,粮食供给由A0减少到A2,对应的粮食价格上升至Pt2,A2=A0-(C2-C4)u,我们则看到由于双方都减少了耕地面积,粮食供给实际上由A0减少到A3,粮食价格上升至Pt3,A3=A0-(C1+C2-C3-C4)u,此时单位面积非耕地的边际效益小于单位面积耕地的收益,双方都受到了不同程度的经济损失。

(二)农户多次博弈及其后果

在前面的分析中,粮食供给的减少导致粮食价格上升,同样出于利润最大化的考虑,在下轮博弈中,甲考虑采取优势战略,增加耕地面积至C5,粮食供给由A3增加到A4,粮食价格下降至Pt4,A4=A3+(C5- C3)u;同理乙的优势战略中耕地面积增加至C6,粮食供给由A3增中到A5,粮食价格下降至Pt5,A5=A3+(C6-C4)u,这样实际上双方都增加了耕地面积,粮食供给由A3增加到A6,粮食价格下降到Pt4,此时单位面积非耕地的边际效益大于单位面积耕地的收益,双方仍然受到了不同程度的经济损失。

当这种博弈行为多次进行时,我们会观察到周期性的波动,当粮食价格上升时,耕地增加,耕地增加使下期粮食价格下降,粮食价格下降导致耕地减少,耕地的减少使粮食价格上升,开始新一轮循环。当决策者的数量逐渐增多时,耕地面积和粮食生产状况更将趋向无序,周期性的波动更为明显。这就是在自由市场中农户在没有政府参与时对于粮食生产的博弈。经过多次博弈形成了粮食生产的发散蛛网型结构 [3~6]。

三、农户与政府在粮食生产的博弈

上述的农户之间在粮食生产的博弈只适用完全的自由市场,没有考虑政府这个局中人,而在现实的市场上政府这个局中人在粮食生产起到非常重要的作用,从而对耕地保护产生重要的影响。由于中国特殊的国情,农民没有完整的土地所有权,土地所有权属于集体经济组织所有,而集体经济组织主体不明确,政府对集体经济组织的影响特别大,政府的政策对粮食生产的影响特别大。下面我们来讨论中国的农户与政府在粮食生产的博弈,而且我们讨论的这些博弈都是完全信息动态博弈。

政府在农户多次博弈的粮食生产的发散蛛网型结构的结果中发现,粮价的不稳定导致社会不稳定,大量耕地非农化,造成耕地资源大量流失,危及国家粮食安全,不适应国家的可持续发展,同时大量耕地非农化也造成了经济系统的非效率的生产。国家出于经济有效率生产和稳定社会的角度出发,针对农户将耕地在耕地与非耕地之间频繁转化的策略,制定耕地的中部分不能转化的策略,如果转化这部分耕地将受到法律制裁。这部分耕地足以满足国家粮食安全,也即是基本农田,基本农田必须种植农作物。农户在国家强势的策略下,除去种植满足自己需要的粮食外,在粮食生产有利润时就大量生产,在粮食生产没有利润时,就进行休耕和撂荒。由于近几年农资生产成本和劳动力成本的日益升高,农产品收益日益降低,一度陷于亏损的泥潭,一部分的农户将基本农田撂荒,一部分的农户甚至直接非农化,他们的基本农田成为废弃土地,集体经济组织主体缺乏也无法使农户交出撂荒的基本农田,这样仍造成了粮食生产的发散蛛网型结构。

政府在农户再次博弈的粮食生产的发散蛛网型结构的结果中发现,仅靠基本农田的保护策略不能起到多大作用,必须把大量的农村城市化的居民手中的耕地收回到集体经济组织重新分配,大量的撂荒耕地进行农户之间的流转,最重要的是解决农产品收益亏损的问题。国家在下轮博弈中打出三个方面的策略。第一,继续完善基本农田的用途管制机制。第二,集体经济组织重新分配耕地,允许耕地进行农业用途的流转。第三,减免全部农业税费,按耕地面积多少象征性补贴。农户在这轮博弈中发现减免全部农业税费,按耕地面积多少象征性补贴仍不足满足农户追求社会平均利润的需要,一部分农户采取继续非农化策略,一部分农户采取流转自己耕地的策略,另一部分农户采取扩大种植规模,集约化生产的策略,但是粮食生产的成本与收益仍有巨大的亏损,粮食生产仍在较小规模上呈现发散蛛网型结构。2006―2010年粮食市场的产量就是明显的例证。

四、政府在对粮食生产进行补贴的三种方案

分析政府与农户在粮食生产上的多次博弈中,农户追求的耕地最大效用化与政府追求经济系统的最大有效率化生产和粮食安全的目标相悖,如何才能把非合作博弈转化为合作博弈呢?分析政府与农户博弈的核心在于粮食生产的利润与其他耕地和非耕地相比有巨大的亏损,农户不会为经济系统的最大有效率化生产和粮食安全买单。研究政府的策略,政府也不愿为经济系统的最大有效率化生产和粮食安全负主导作用,考虑到政府的公共服务的职能,政府应该是最主要的买单者。

政府作为稳定粮食生产的主要的买单者,应该补贴农户在粮食生产中与其他耕地和非耕地的亏损。政府如何补贴农户在粮食生产中与其他耕地和非耕地的亏损,我们认为有三种方案。

第一种补贴方案:政府补贴的金额必须保证粮食生产不亏损,计算公式为:P-C+A=0

公式中P、C和A分别为某种粮食农产品在单位面积上的总产值、总成本和总补贴。

第二种补贴方案:政府补贴的金额必须保证农户在粮食生产中与其他耕地平均收益一致,计算公式为:P-C+A=PA

公式中P、C和A分别为某种粮食农产品在单位面积上的总产值、总成本和总补贴,PA表示其他耕地单位面积的平均收益。

第三种补贴方案:政府补贴的金额必须保证农户在粮食生产中收益与社会平均收益率一致,计算公式为:=RA

公式中P、C和A分别为某种粮食农产品在单位面积上的总产值、总成本和总补贴,RA表示社会平均收益率,在统计上一般取当年的一年期的存款利率。

如果按第一种方案进行补贴,仅能保证农户在粮食生产时做到不赚不赔,农户在追求效用最大化的作用下,粮食生产积极性仍不会高,粮食生产仍呈现较小规模上呈现发散蛛网型特征,耕地撂荒仍有大面积发生。如果按第二种方案进行补贴,农户在粮食生产中可以获得与其他耕地平均收益一致的利润,加上粮食生产市场风险比其他农作物生产风险小,可以刺激农户发展粮食生产,仍有部分农户追求比农业生产更高的收益率,转移出农村,这部分留下的耕地可以通过集体经济组织的重新分配与流转而参与进粮食生产。这时粮食生产将随市场农产品的波动而波动,市场作用正常发挥,能保证经济系统的有效率化生产和社会的粮食安全。如果按第三种方案进行补贴,大多数农户考虑粮食生产市场风险比其他行业生产风险小,大量发展发展粮食生产,同时其他行业人员同样出于风险考虑,会大量流入粮食生产中,导致其他行业产值降低,社会平均收益率降低,进而导致社会无效率生产。按第三种方案进行补贴,成本极高,也不适用产业转移规律。

比较三种方案,第一方案到第三方案成本依次升高;在适用上第一方案与第二方案比较适用,第三方案不可能适用实际情况;在比较使用结果方面,第二方案最好,能达到经济系统的效率化生产和粮食安全,起到耕地保护的目的。

五、耕地保护成本的案例分析

重庆市黔江区位于重庆市的东南边缘,地处武陵山腹地。根据黔江区的粮食生产的农经资料[7],我们可以计算出政府要达到经济系统的效率化生产和粮食安全的耕地保护的成本。由于在现阶段,政府的补贴水平较低,我们采用第一方案来计算耕地保护的成本,进行相关评价。由于农业补贴在2005年才开始出现,我们采取2005年的粮食生产的农经资料来计算耕地保护的成本(见表1),便可以发现耕地保护的成本并不低。

六、结论

在没有政府参与下的农户与农户的完全信息动态博弈的基础上,农户为了追求利润最大化,都选择将耕地转化为其他用途,导致耕地的大量侵占。这种博弈行为会随着粮食价格的波动而出现耕地数量的正相关变化,从而导致耕地面积和粮食生产状况周期性的波动更为明显,在经过多次博弈后形成了粮食生产的发散蛛网型结构。

政府与农户博弈的核心是在于粮食生产的利润与其他耕地和非耕地相比有巨大的亏损,为了避免耕地面积和粮食生产无序化,解决粮食生产的发散蛛网型结构,政府承担起耕地保护的最主要的实施主体。政府在对粮食生产进行的补贴有三种方案:粮食生产的收入必须保证与粮食生产成本一致;在粮食生产中耕地与其他耕地平均收益一致;在粮食生产中收益与社会平均收益率一致。在这三种方案中,其中第二方案能达到经济系统的效率化生产和粮食安全,起到耕地保护的目的。

参考文献:

[1]黄涛.博弈论教程――理论、应用[M].北京:首都经济贸易大学出版社,2004:3-6.

[2]徐梦洁.耕地保护的利益驱动机制探讨[J].农业系统科学与综合研究,1999,(2):101-104.

[3]刘星彦.蛛网理论与中国的粮食安全[J].粮食流通技术,2002,(5):6-8.

[4]邵正芝.蛛网理论与弹性理论[J].青岛大学学报,2005,(6):11-12.

[5]王思亮.蛛网理论分析释疑[J].苏州大学学报,2006,(5):77-78.

[6]孟大生.弹性理论和蛛网理论两种数学模型的比较与选择[J].广东农工商职业技术学院学报,2004,(8):19-24.

第9篇:博弈论案例范文

关键词: 囚徒困境 规则 主体间性 理性

一、关于理性人和囚徒困境的介绍

囚徒困境这个事例常常在有关博弈论的讨论中出现,它最主要贡献是突出反映了个体理性与群体理性的冲突,并且在目前学界的讨论下,这一冲突似乎尚未能得到完美的解决。造成这一冲突的原因,并不是由于该博弈的前提――理性人假设出现了问题,而是基于囚徒困境中或者博弈论中理性人的假定在不同条件(规则)下的作用。正是由于没有分清这一前提在不同背景知识下的运用,一方面保证了囚徒困境这个博弈能够用逻辑的或者说是理性的方式解决(找到这个博弈的纳什均衡点),另一方面也导致了事件的解决结果并不是那么的令人满意(因为我们面临的是不同的条件与知识背景)。“‘博弈参与人是理性的’是博弈论的公设,然而理性人的假定存在许多博弈困境。囚徒困境与公地悲剧反映的是个体理性与集体理性之间的冲突”(潘天群《博弈论中理性人的假设困境》,《经济学家》2003.4,)。

起初,博弈论专家假定博弈中的参与人是理性的――具有使自己效用最大化的推理能力,然而,奥曼等人发现,这样的假定是不够的,我们必须假定,“一个博弈中的每个参与人都是理性的”是该博弈所有参与人组成的“群体”所知道的,即每个人都是理性的是群体中的“公共知识”(或翻译成共同知识)。(潘天群《群体推理的逻辑与群体理性》,《东南大学学报(哲学社会科学版)》,2007年7月第9卷第4期)。

有关囚徒困境我们可以这样表述。

假设有A、B二人,因为偷盗被警察抓捕归案。为了防止两人串供,因此将两人分开审问。这时A、B二人均面对了两种选择,一是招认,二是不招认。例如,对于A来说,A面临着招认与不招认的选择。我们可以假设,如果A招认,B可以选择招认,也可以选择不招认。当A招认B不招认时,A当场释放B判刑8年;当A招认B也招认时,各判刑5年。如果A不招认,B也可以选择招认或者不招认。当A不招认B招认时,B当场释放,A判刑8年;当A不招认B也不招认时,两人各判刑1年。

同理,当审问B的时候,只需要参考上面的过程就可以很容易地得到答案。

我们可以简单地列一个表,用来表示上述的过程:

以A为例,对该博弈进行分析。

由于参与博弈的双方均为理性人,且为公共知识,那么A会有如下的思考:

当B招认时,A可以选择招认或者不招认。

当B招认而A不招认的时候,B被当场释放,A被判刑8年;当B招认A也招认时,B与A各判刑5年。判刑5年远远好于判刑8年,因此,当B招认时,基于理性人的假设要使自己的收益最大并且损失最小,A会毫不犹豫地选择招认。

当B不招认时,A也可以选择招认或者不招认。

当B不招认并且A也不招认时,两人各判刑1年。当B不招认而A招认时,B被判刑8年,A被当场释放。A基于理性人假设作出了以上的推理,显而易见的是,当场释放要好于判刑1年。为了使自己收益最大并且损失最小,A会毫不犹豫地选择招认。

因此,不管B是否招认,A都会毫不犹豫地选择招认。

同理,作为一个理性人,B也会按照A的思维模式那样作出选择,答案是――毫不犹豫地招认。

两人均招认就是囚徒困境这个博弈的纳什均衡点。很明显也很抱歉,通过理性手段进行推理,想使自己的收益最大而损失最小,但是结果却不是那么的令人满意。在我们看来,两者均不招认各判刑1年的损失要远远小于两人各判刑5年,或者单就A或B一个人来说,当场释放的收益要明显地大于个人的判刑5年,因此,在某些人看来,理性的参与人在这个博弈中并不能使自己的收益最大损失最小,相反的,个人理性在这个囚徒困境的博弈中成为了获得最大利益的障碍,在这样的情况下,就出现了“两难”决策。

二、“囚徒困境”博弈的潜在规则,以及阿克塞尔罗德的实验及其规则变动

应该得出的一个认识就是,上文所提到的那个“囚徒困境”博弈属于一次性的完全信息静态博弈,它本身所具备的规则与阿克塞尔罗德所做的实验有着显著的区别――一次性的囚徒困境博弈与重复性的囚徒困境博弈的规则区别。为了便于分辨,我们依次将上文的两个囚徒困境博弈分别简称为Game1与Game2。

G1应该具备以下的这些规则。

(1)对策者(谋求合作的双方)没有什么手段可以用来实施威胁或作出许诺。由于对策者不会许诺他们自己采取某种特定的策略,因此每个人都得考虑对方可能采取的所有策略。此外,每一个对策者都可以使用所有可能的策略。(2)没有什么办法能够确定对方在某个特定的对局中将如何选择,这就消除了使用元对策”分析的可能。“元对策”允许诸如“选择与对方相同的策略”的选择,同时也消除了通过观察对方与第三者局而形成某种信誉的可能。因此对策者唯一可利用的信息(积累的知识)是他们相互作用的历史。(3)不能消灭对方,也不能放弃对局,因此对策者在每次对局时只能选择合作或背叛。(4)不能改变对方的收益值。这个收益值已经包括了每个对策者关于对方利益的考虑之中。(周海林《“合作”的条件与机理――从囚徒困境谈谈可持续发展的制度基础》,《软科学》2001年第15卷第3期)

我们可以试着列出一个表格,以更清晰地对几个步骤中的规则的区别作出清晰的划分。

博弈前(step1)博弈中(step2)博弈后(step3)

[?摇?摇?摇?摇?摇?摇一次博弈的完成?摇?摇?摇?摇]

对于G1的第一条规则,G2由于是重复多次的囚徒,将会出现一些不同的情况。阿克塞尔罗德所提出的例如宽容性和可激怒性就可以在step3之后体现出来。可激怒性可以简单地看成是规则1中所说的实施威胁。当参与博弈的双方A和B进行一次博弈时,A作出不合作的决定时(第一次博弈),B在step3得知了这个消息之后,也就是下一次博弈时(第二次博弈),可以选择不合作,对A进行威胁,表示自己是可激怒的。这里的威胁,是分属于两次博弈的,而这在一次性博弈中明显无法做到。宽容性也同样如此,当A表示悔过(在第三次博弈选择合作时),B可以立即在step3中得知,并在第四次博弈时原谅A,作出合作的选择。当然,如果仅从理性人的角度出发,在有限次的囚徒困境博弈中,次次不合作才应该是这个博弈的纳什均衡,但是在阿克塞尔罗德的试验中,次次不合作这个策略的得分明显低于某些策略,并且选择这个策略的人并不是绝大多数,理论和现实有着明显的差异。

对于G1的第二条规则,同样也是如此。一次性的囚徒困境G1作为某个特定的对局(特地被警察隔离开而无法串供),博弈双方都无法确定对方将采取何种策略,从而致使使用“元策略”的可能性变为0。G2作为多次重复的囚徒困境,由于能够清楚地知道对方在每一轮的选择(指已经选择过的步骤),因此可以对接下的自我的选择和他人的选择做出推断。甚至像“一报还一报”策略直接选择与对方上一步策略相同的策略。还有的参与者对博弈对手的合作与不合作的次数进行概率计算,并由此作出自己的选择,如道宁策略,这在G1中是无法出现的。阿克塞尔罗德甚至做了两次重复多次的囚徒困境实验,这样对于G2的参与者来说,他们的选择不仅仅可以基于与自己的博弈对手相互作用的历史,更可以基于博弈对手与参与这次试验的每一个人的相互作用的历史。道德博弈中所说的个人信誉问题在这里凸显出来。

总的看来,在step1中,作为囚徒困境的博弈参与者A可以了解到B以往的策略选择以及信誉问题,并可在一定程度上影响到自身策略的选择。例如贪婪的策略在面对比较仁慈的策略时,总是比较占优势。并且在step2中,A与B可以看到对方是如何选择,并进一步影响到step3之后,选择宽容还是惩罚――合作还是不合作。

从step1到step3就显示出主体交互性在博弈中的重要作用,因为G1中,G1(step1)到G1(step3),A与B做为博弈参与者并没有真正的形成交互(双方被隔离了),即主体间性。而在阿克塞尔罗德的试验中G2(step1)到G2(step3)中,博弈的双方A和B不但互有信息交流,而且在一定程度上影响到自我决策的选择。

三、主体间性对囚徒困境的影响

主体间性从定义上来说是主体与主体之间的统一性,但在不同的领域中,主体间性的意义是有差异的。

在主体间性概念的形成历史过程中,事实上涉及了三个领域,从而也形成了三种涵义不同的主体间性概念,这就是:社会学的主体间性、认识论的主体间性和本体论(存在论、解释学)的主体间性。这里就不一一详细叙述。

博弈论是交互的决策论。2005年诺贝尔经济学奖的获得者奥曼曾经给博弈论下过一个非常描述性的定义:博弈论是“交互的决策论”,其定义十分简洁凝练。展开来说,博弈论是研究发生直接相互作用的行为者采取的决策以及这种决策的均衡问题。换言之,一个经济主体(行为者)在决策时必须考虑到对方的反应,所以用“交互的决策论”来描述博弈论可谓言简意赅。(张践明《“囚徒困境”・理性悖论・交互认知论》,《湘潭大学学报(哲学社会科学版)》,2007年11月第34卷第6期)

而交互认知是主体间性的具体化例证。在重复囚徒困境这个博弈中,就充分地体现出交互认知的重要性。

如step1的中,博弈的双方可以对彼此过去的决策选择进行详尽的考察,基于生存博弈的道德博弈也可因此而建立起来。双方的私有信息(在这里可以简单地看做自己和对方的博弈历史选择)是否可以交换,交换的方式与程度,均可在一定程度上影响到后来的决策。阿克塞尔罗德进行第二次重复囚徒困境博弈的一部分原因也在此――建立在双方知己知彼的基础上的合作应该如何产生,知己知彼是源于上一轮的博弈参与者参与博弈并决策的历史。这样就把双方的私有信息公开化,变成了公共知识。

在step2中,G1博弈双方从完全不知道对方做出什么决策发展到G2可以看到对方的决策,这又是一次交互的行为,由于是多次重复博弈,step2的交互致使博弈双方A和B不仅仅看重眼前的利益,更会看中将来的利益,从而使合作有可能发生,当然其中也包括从不合作决策与报复性决策等。

在G2(step3)中,A或者B完全可以借由这个环节来告诉对方自己对于对方的选择是满意还是不满意,并在以后的多次博弈中体会到对方的感受,对方同样可以表达出来并由此形成第三次交互。

还是拿一报还一报策略进行说明。A使用策略未知,而B使用的是一报还一报策略。设在第200次博弈中(我们称为N1、N2、N3……),A选择不合作,B选择合作,G2(N200(step3))中,B发现A不合作,并想表达自身的不满,因此立即在G2(N201(step2))中选择不合作以此来警告A。A在G2(N201(step3))中感受到了B的不满,如果双方进行了重复多次的博弈,A通过G2(N202(step1))回顾双方合作的历史发现,B对于犯错的人具有宽容性,于是立即在G2(N202(step2))中选择合作表示自己悔过,B在接下来的步骤中感受到A的悔意,在下一次的博弈中选择合作表示自己知道并安慰A……从而形成了重复性的三次交互、信息交换。当然,以上的只是基于交互理论的假想,但是在阿克塞尔罗德的实验中,我们不应该仅仅把双方固有的策略选择看作是电脑程序的自动化,而应该看作是在理性人基础上的信息交互,从而修正自己的策略。

四、结语

可否像人工智能体Agert那样在博弈中具备自主交互的学习参与博弈的理性能力,并由此改变自己的策略?

有关新型智能体Agent的设定,有这么几条可以作为囚徒困境这个博弈的参考:

①能够面向陌生状态与不确定性,积极主动地进行认知与行动。②每个智能体都有自己不同的知识背景、心智品质、能力与个性,甚至具备诸如友善性、真诚性等人类特征。它的这些能力与特征都不是被设定为一成不变的,它可以随着情况的变化而不断地进行能动的自我更新。它不是在一个一步到位的、静态的模式中模拟智能,而是在一系列过程性的、动态连续的进程中发展智能。

如果在多次重复的囚徒困境的理性人设定中附加如上的设定,是否可以使G2更加地清楚明白,更容易地走向合作?

当然,以上的附加只是基于多次重复囚徒困境的假设。面对G1的一次性的完全信息静态博弈,我们只能持以悲观的态度。

宾默说,理性参与人的独立选择行为又会产生非帕累托效率的结果,这并不存在任何自相矛盾的地方。囚徒困境的规则不利于实现理性合作,就像把一个人双手反绑之后要他表演手技一样。因此,不要希望在囚徒困境规则约束下理性参与人会成功地达成合作。

参考文献:

[1]罗伯特・阿克塞尔罗德.合作的进化.合作的复杂性――基于参与者竞争与合作的模型.

[2]宾默.博弈论与社会契约.

[3]格若赫姆・罗铂.博弈论导引及其应用.

[4]张践明.“囚徒困境”・理性悖论・交互认识论.湘潭大学学报(哲学社会科学版),2007.11.

相关热门标签