博弈基本要素精选(九篇)

时间：2023-09-27 15:02:49

博弈基本要素

第1篇：博弈基本要素范文

关键词：博弈论最后通牒博弈三方互动实验公平感应与决策

博弈论概述

博奕论又称“对策论”，被认定开始于1944年，由数学家John von Neumann和经济学家Oskar Morgenstern所合写的经典著作《博弈理论和经济行为》一书。书中提出博弈的基础模型，并且将两人的博弈延伸到n人的博弈结构。此后，博弈论便被引入经济学的领域中，因此这本书被视为是博弈论的重要开始。另一位数学家John Nash提出了纳什均衡的概念，并且证明这种均衡确实存在；纳什均衡是指当双方选定了某种策略组合，而使其在另一方不动的情形下，任一方的单独改变策略并无法获得更高利益时，此时的策略组合与后续结果就构成纳什均衡（齐格弗里德，2011）。此外，数学家Albert Tucker在1950 年定义了一种后来被广泛应用于各领域的博弈——囚徒困境，进而奠定非合作博弈论的当论基础。接着，Reinhard Selten 将纳什均衡引入动态分析，创立子博弈完美纳什均衡的概念；John Harsanyi 则发现纳什均衡是以完全信息来分析，他将不完全信息引入博弈理论，并且在纳什均衡中纳入贝氏学习法则，进而定义出贝氏纳什均衡（Bayesian Nash equilibrium）。至此，博弈论的架构基础已臻完整。

（一）博弈的基本要素

任何博弈都会包含三项基本要素（范如国，2011）：

一是玩家（player）：在一场弈局中，有决定权的参与者就为一个决策主体，即玩家。玩家的主要目的是通过行动来使自己的结果达到最大化。两个决策主体的博弈就称“两方博弈”，而多于两个人以上的博弈就称为“多方博弈”。二是策略（strategy）：玩家在给予的信息下所采用的行动，即指玩家应该在何种条件下选择何种行动，以保证自身最大利益。玩家的策略又会交叉影响，能不能提早推估出对手的下一步，进而去选择有利的策略行动。三是效用（utility）：指在一个特定的策略组合下，决策主体可以得到的确定效用。简单说，就是参与者可以从博弈中得到的收益。

（二）博弈的区分

从决策行为顺序的时间点来看，博弈可分为两类，一是静态博弈，另一是动态博弈。静态博弈是指在博弈中，玩家同时进行选择，或者即使他们的选择顺序有先后之分，但是后行动者并不知道先行动者所采取的行为。动态博弈是指在博弈中，玩家在行动上有着先后顺序，而且后行动者可以观察到先行动者所采取的行为而再作行动。

从玩家对其他玩家信息的掌握程度来说，可分为完全信息和不完全信息博弈。完全讯息博弈是指在博弈过程中，每个玩家对其他玩家的策略、策略组合及收益掌握完整的信息；相对地，在不完全讯息博弈中，玩家对其它玩家的策略、策略组合和收益情形没有完整的信息来源可供掌握。

若按照玩家能否形成约束性的协议以便集体行动这个角度来看，则可以分为合作与非合作博弈（宋杰鲲，2011）。合作博弈是指所有玩家都先从自己的利益出发，以便与其它玩家进行谈判、协商并且达成具有约束力的协议。这种弈局设计主要在研究当人们达成合作时，如何分配彼此合作所得到的利益。典型的合作弈局是指行业里企业间的同谋。一般而言，合作博弈比非合作博弈更为复杂，因此在理论上的成熟度并不如非合作博弈理论。非合作弈局依照玩家对其他玩家的信息掌握程度和决策行为顺序，又可分为下列四种不同类型及其相对应的均衡概念：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈与不完全信息动态博弈。

最后通牒博弈分析

最后通牒博弈是常见的一种弈局。最早是在1982 年由三位德国经济学家Guth，Schmittberger和Schwarze所提出。他们将42位经济学系的学生分成两组，一组扮演提议者角色，另一组则扮演回应者角色。每一个提议者将c马克的钱，分配给自己和响应者。如果提议的出价x被回应者接受了，则提议者可获得c-x马克，而响应者可以得到x马克。但是如果出价被拒绝了，那么两个人都得不到钱。如若确实像传统经济学理论的理性经济人一样，则响应者便必须接受提议者所提供的任何分配建议。因为任何分配建议只要大于0马克，相比于响应者回绝的后果（也就是0马克）都能够带来更高的获益（Guth，W.，van Damme E.，1998）。基本核心思想为：根据传统经济学的基本假设，完全理性经济人在进行最后通牒博弈时应该做出这样的反应，提议者应该给予响应者最少的金钱，而响应者无论如何都应该接受提议者的分配（张元鹏，2005）。然而，实际生活中进行最后通牒博弈却得到这样的结果：当提议者分配给响应者的比例过低时，响应者会选择拒绝而让两方都无法获利。实际结果和传统的理性经济人模型显然不符，从而导致学者探讨其中主要心理因素的动机。

第2篇：博弈基本要素范文

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80 年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90 年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004 年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008 年10 月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

第3篇：博弈基本要素范文

【摘要】本文分别对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,主要讨论有关知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景。

【关键词】知识型员工监管激励演化博弈研究综述

1 前言

随着全球化竞争和区域竞争的到来和加剧,如何提高企业的核心竞争力是关系到企业生存发展的关键。但是,就目前在对知识型员工的管理即如何监督、激励等过程中仍存在不少问题。正是基于此,我们选择“企业中知识型员工的监管激励演化博弈分析模型”作为研究方向,针对企业中的实际情况,在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,对知识型员工的激励机制进行研究;在此基础上,设计可行的激励机制,激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定激励政策提供理论依据和决策参考。

2 知识型员工的定义和特征

2.1 知识型员工的定义

管理大师彼得·德鲁克首先提出知识型员工这一概念,即知识型员工是指那些掌握和运用符号和概念、利用知识或信息工作的人。

概括来说:知识型员工是凭借自己所受教育,实用脑力劳动创造价值,与一般员工相比,具备较强的学习知识和创新知识的能力,拥有知识资本和创新能力,利用现代科学技术知识提高工作效率为企业带来知识资本增值,并以此为职业的脑力劳动者。

2.2 知识型员工的特征

(1)强烈的自我价值实现愿望,他们往往更加在意自身价值的实现,并强烈期望得到社会的认可,他们往往更加热衷于具有挑战性的工作,希望展示自我价值。

(2)对权威的蔑视性,知识型员工由于渴望展示自己的价值,往往表现出权威的蔑视。

(3)具有高度的独立性。由于知识型员工拥有丰富的知识资本,因此往往主观上不愿受制于人。他们更强调自我控制、自我管理、自我引导和自我发展。

(4)学习愿望强烈,富于创造精神。他们喜欢做前沿性、挑战性的研究,在易变不完全确定的系统中发挥个人的资质和潜力,创新是他们体现自我价值的方式。

3 关于知识型员工监管激励的研究状况

3.1 国外知识型员工监管激励的研究状况

美国著名的管理学家彼得·德鲁克(2001)提出了知识工作的概念:知识型员工是指“那些掌握和运用符号和概念,利用知识或信息工作的人”。知识型员工一方面能充分利用现代科学技术知识提高工作效率,另一方面知识型员工本身具有较强的学习知识和创新知识能力。知识创新能力是知识型员工最主要的特点。此外,知识型员工的工作主要是一种思维活动,知识的更新和发展往往随环境条件的变化而有所适应,具有很大的灵活性。所以知识型员工兼具知识型、创造性、灵活性等方面的特征。加拿大的著名学者、加拿大优秀基金评选主审官弗朗西斯.赫瑞比(2000)认为:简而言之,知识型员工就是那些创造财富时用脑多于用手的人们。他们通过自己的创意、分析、判断、综合、设计给产品带来附加值。在西方发达资本主义国家,员工监管激励在管理界已经是一个相当古老的话题,早在十八世纪末,十九世纪出,企业界和管理界就对监管激励员工、提高劳动生产率进行广泛而深入的研究。

3.2 国内知识型员工监管激励的研究状况

国内学者张伶,张正堂(2008)认为虽然双因素理论和工作特性理论都说明与工作有关的内在激励因素对于员工行为重要的激励作用,但是,双因素理论因素中关于“激励因素”和“保健因素”的划分是模糊的,而不同学者对于工作特性唯独的划分也是模糊的,因此,他们基于知识型员工的特性分析,提出内在激励特性包括工作自、晋升机会、上级支持、人与组织匹配等4个方面,并建立了这些内在激励因素对知识员工工作态度、工作绩效影响关系的假设模型和以苏北地区企业的知识型员工为研究对象,通过实证检验发现,工作自、晋升机会、上级支持、感知的人与组织匹配通过工作满意度、组织承诺对工作绩效有正向显著影响。郝敏怀(2009)从如何培训开发、职业生涯规划和薪酬激励等方面针对企业专业技术人才这一典型的知识型员工的人才激励策略进行了探讨,同时认为按照马斯洛需求层次理论,为满足专业技术人员各个层面的需求还必须多种激励方式相结合,实现多渠道激励。余莉(2009)通过阐述激励的机制和基本理论,在分析研发人员个性特征和主导性需求的基础上,提出了针对研发人员的激励方法策略,其指出在物质激励中的薪酬激励的设计上,既要注重刚性工资的竞争性、成本性,更要突出激励性因素的作用,加大基于绩效的弹性工资力度,并且在这方面拉开差距。

3.3 对国内外知识型员工监管激励的评价

纵观国内外研究,我们可以看到目前对监管激励的研究主要是沿着监管激励的作用机理展开,在分析诸如专业技型员工,科技研发人员这些典型的知识型员工的特征的基础上,分析激励因素和激励过程,建立监管激励模型,监管激励模型基本上是在企业利润最大化和“经济人”的人性假设,以主客体的博弈研究各种监管激励机制。但目前对于监管激励模型的构建大多都是基于传统博弈论 ,传统博弈论假设行为主体都是具有完全理性即行为主体始终以自身最大利益为目标,具有各种环境中追求自身利益最大化的判断和决策能力,具有在存在交互作用的博弈环境中完美的判断和预测能力,不会发犯错,不会冲动,没有不理智。很显然,现实世界中这种假设通常是得不到保证的。同时,纵观国内外研究,我们发现,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工监管演化博弈机制尚不多见,因而本课题采用演化博弈论的方法,对行为主体采取有限理性的假设,即行为主体被假设为程序化地采用某一既定行为,他对于经济规律或某种成功的行为规则、行为策略的认识是在演化过程中得到不断地修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益,这与现在情况更符合。因此,我们在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方面均具有有限理性的情况下,运用演化博弈的方法构建知识型员工监管的演化博弈模型,运用复制动态方程对企业和知识型员工的演化稳定策略进行分类讨论,找出政府、企业和知识型员工三群体类型比例变化复制动态关系,对如何有效监管和激励企业知识型员工提出对策和建议。

4 基于演化博弈论对知识型员工监管激励的研究思路

本课题将通过基于行为主体有限理性假设的演化博弈理论,打开对企业知识型员工监管激励的新思路。

4.1 演化博弈论基本理论的概述

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。

演化博弈论(evolutionary game theory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(bounded rational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。随后,经济学家将之引入经济分析中,将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(adaptive evolution)的过程中产生并发展起来的。演化博弈论的产生、发展在本质上就是起因于博弈论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。

4.2 基于演化博弈论方法的知识型员工监管激励的研究思路

纵观国内外的相关研究,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工的监管博弈机制研究尚不多见。正是基于此在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,构建知识型员工监管的演化博弈模型,运用演化博弈论的方法对相关职能部门、企业与知识型员工之间相互作用时的策略选择行为进行分析,对知识型员工的监管激励机制进行深入研究;在此基础上,设计可行的监管激励措施,从而能最大程度激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考。

5 结语

本文对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,在简要概述知识型员工的内涵及其特征的基础上,对知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景进行了探讨。特别需要强调的是,演化博弈理论摒弃了博弈论完全理性的假设,比博弈论能更好的解释和分析现实中的经济和管理问题,因此,期望通过对知识型员工监管的演化博弈模型的构建能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考,从而在对知识型员工的监管激励机制问题的研究上迈出更加深入的一步。

参考文献

[1] 弗朗西斯·赫瑞比:managing knowledge workers [m].机械工业出版社,2000.

[2] [美]约瑟夫m.普蒂.海茵茨.韦里奇.哈罗德·孔茨著.丁彗平、孙先锦译.管理学精要(亚洲篇) [m].机械出版社,2005:363.

[3] 斯蒂芬.p罗宾斯.组织行为学.中国人民大学出版社,1997:81-92.

[4] 余莉.研发人员个性特征与有效激励方法研究[j].中国钼业.2009.33(1).53-56.

[5] 胡恩华.刘洪.企业中知识型员工的监管博弈分析[j].工业技术经济.2005.24(4).53-55.[j].2009.23(1).10-13.

第4篇：博弈基本要素范文

关键词：投资者股价波动信息协议归纳博弈

引言与文献综述

股市频繁而剧烈的波动不仅严重影响了市场的稳定健康发展，而且在很大程度提高了投资风险，使投资者闻风丧胆，失去投资消费信心。因此，“股价异常波动之迷”一直是学术界和实务界研究的热点，研究股价异常波动对市场稳定和投资者保护具有深远的意义。

对于“股价异常波动之迷”的研究，研究理论依据、方法、角度不同，得出的结论也不同，国内外学者对这一问题的研究一直处于争议之中。De Long等（1990）用市场噪声理论研究发现，投资者的正反馈交易增加了资产价格的波动性。Jegadeesh等（2001）认为投资者的“过度自信”会导致“过度交易”，“过度交易”推动了资产价格波动。Leuz（2004）认为投资者因不能从价格中获得有关股票的完整信息，只能从其他人的行为、决策中获得信息，这种行为加剧了股价波动。国内学者有关股价波动的研究，主要关注机构投资者对股价波动的影响。赵涛、郑祖玄（2002）研究发现机构投资者通过资产重组、关联交易等方式提高该股业绩、制造炒作题材改善股票基本面信息，使散户投资者跟风，加剧股价波动。李竞（2008）通过机构投资者之间的博弈分析发现，由于我国资本市场法制不完善，在不担心违规受到惩罚下，机构投资者可能联合坐庄，一起操纵股价，加剧股价波动。王静涛（2006）认为股价是政府、机构投资者、个人投资者等相互之间博弈的结果，许多机构投资者利用自身的资金、信息、人才、技术等优势，在股市上大肆炒作，加剧了股价的波动。

回顾国内外的相关研究文献可知，从博弈论角度分析投资者对股价波动的影响的文献较少，存在的文献大都用经典博弈论来分析，没有学者运用信息协议下归纳博弈来分析；而且，经典博弈论假定参与人对其所进行的博弈形式拥有充分的认识，是在外生给定的博弈形式下进行博弈，这不符合经济现实中的参与人，主观博弈或归纳博弈更符合假定参与人对博弈形式的客观认识是有限的、主观的，每个参与人在各自的主观博弈模型下学习对手的策略并通过策略互动来学习主观博弈规则并以此为基础进行博弈（黄凯南，2010）。此外，经典博弈论虚构了博弈树中的博弈分枝、决策节，而这些在现实经济博弈中是不存在的，信息博弈下的归纳博弈有形的信息碎片和行为代替无形的博弈分枝和决策节，更加科学合理（M. Kaneko and J.J.Kline，2008）。

因此，本文运用信息协议下的归纳博弈理论来初探股价波动的机理，探析投资者对股价波动的影响，更加符合经济现实，也具有一定的理论意义。

信息协议下归纳博弈的基本分析结构

（一）归纳博弈论的基本假定

1.博弈参与人对客观博弈认识的有限性和主观性。在博弈中，参与人是有限理性的，不可能完全掌握所进行博弈的相关知识，对客观博弈的认识带有主观性；参与人在博弈的时候，最初并不知道他们所进行博弈的博弈规则，对其他博弈参与人的数目、信念、博弈策略知之甚少，甚至完全不知；参与人通过个人积累的经验、教育以及从其他博弈参与人那里学习客观博弈的知识，并进行归纳推导得出自己关于客观博弈的认知信念（Mamoru Kaneko and J.Jude Kline，2008）。

2.博弈参与人对客观博弈认知信念的不断完善性。归纳博弈论区分了客观环境和参与人对博弈的个人认知观念，参与人被假定为最初博弈时拥有对客观环境的认识很少，不断地重复面对给定的客观环境，通过选择可行的行为来积累经验，从经验中构建对客观环境的认知观念，再通过下一次相同或相似的博弈来完善这种认知观念，以此类推，不断地进行博弈，不断根据以前认知观念的记忆来完善对客观环境的认知（Koji HASEBE and Ryuichiro ISHIKAWA，2011）。

3.博弈参与人对客观博弈认知信念的差异性。在同一个博弈中，每个博弈参与人在个人认知观念的构建过程中，因经验不同，即使面对完全相同的客观环境，也会形成不同的客观环境认知观念；而且，每个参与人用以前形成的并能记住的经验不断修正对客观环境的认知观念，每个参与人的记忆能力不同，以记忆中的经验修正后的认知观念自然不同。因此，博弈参与人对客观博弈认知信念的差异性（Koji HASEBE and Ryuichiro ISHIKAWA，2011）。

4.博弈参与人博弈行为的规律性。参与人在博弈时，倾向于遵从一些有规律的行为方式；在短期内，博弈参与人对客观环境的认知观念具有一定的稳定性，他以之前形成的观念进行博弈，认知观念没变，博弈行为也就不会变；除非当博弈参与人掌握更多新信息或客观博弈环境发生重大变化，使博弈参与人认为改变博弈方式进行博弈所获得的收益大于不改变的收益的可能性较大时，才会修正之前的认知观念并进行博弈（Mamoru Kaneko and J.Jude Kline，2008）。

（二）用信息协议表述的归纳博弈

1.信息协议的定义。在经典博弈论中，客观博弈形式是给定的，用博弈树来描述博弈的过程，博弈参与人对博弈树具有完全的认识能力，参与人在决策的任何一步都知道自己所处的决策结在博弈树中的位置，即在博弈树中的哪一个分枝和哪一个决策节，并清楚地记得上一次决策节和下一个决策节是什么。然而，这并不符合现实的决策行为，在动态博弈过程中，这些博弈树的分枝和决策节是不存在的，参与人对自己所进行的博弈处在连续博弈的哪个环节也不清楚，他只是了解博弈的一些信息片段，并以这些信息片段进行决策。为了克服经典博弈论的这个缺陷，归纳博弈论提出信息协议，用有形的信息碎片和行为代替无形的博弈分枝和决策节，进而简化拓展博弈。信息协议由信息碎片、行为和因果关系构成，具体描述如下：信息协议Π=（W，A，），其中，W是信息片段的有限非空集合，A是行为的有限非空集合，是因果关系，为U∞m=0=（（W×A）m×W）的一个子集。将W分为决策碎片（Decision Pieces）WD={w∈W：[（w，a）]u，a∈A且u∈W}和末尾碎片（End pieces）：WE=W-WD（M.Kaneko and J.J.Kline，2008）。

2.用信息协议描述的归纳博弈。如下所示：

参与人、记忆与行为。具体的操作过程是：将信息协议Π=（W，A，）拓展为Π=（（W，A，），π，h），π为参与人函数，h=（h1，...，hn）为支付函数。假定每一个决策信息碎片WD只能由一个参与人接收到，而每一个末尾信息碎片WE，所有参与人都能接收到，参与人在接收到末尾信息碎片后取得支付。m=（m1，...，mn）表示参与人的记忆函数，参与人的行为由其记忆函数描述的记忆决定。参与人在（Π，m）的行为模式σi在是被限定为i的函数，i为对于一些u，有σi∈{a：∈i}；mi=mi隐含σi=σi，这意味着参与人的行为模式函数给其分配一个符合信息协议Π=（（W，A，），π，h）和记忆函数mi的行为（M.Kaneko and J.J.Kline，2008）。

客观环境和经验域。归纳博弈论认为，记忆函数和记忆的积累域决定了参与人的归纳推导观念，在支持完美记忆函数的同时也考虑一些积累域，用信息协议Πo=（（Wo，Ao，o），πo，ho）来描述客观博弈环境。假定参与人通常会遵从特定的行为方式σo =（σo1，...，σon），但是有时也会偶尔偏离这些给定的行为组合，每个参与人在不断重复的客观环境博弈之后，不断通过试误和其他所回忆得起来的记忆来学习客观环境。每个参与人以小的概率进行试误，两个或更多的参与人同时尝试偏离他们行为模式是罕见的事，而且罕见事的记忆可能会在参与人的思维中消失或被遗忘，但是来源于一些经验的其他形式的记忆可能会保留下来成为长期记忆。将参与人的经验域分为积极经验和混合经验（包括积极和消极经验）两部分，积极经验来自参与人自己的尝试，消极经验来自其他参与人的尝试，参与人就是通过自己尝试以及学习其他参与人的尝试来积累经验，并以此形成客观博弈形式的个人认知观念，进而进行博弈（Kaneko M.and J.J.Kline，2008）。

（三）归纳博弈过程与主观博弈均衡

首先，当博弈参与人最初接触到博弈的客观环境Πo=（（Wo，Ao，o），πo，ho），通常依据其记忆函数mo =（mo1，...，mon）从特定的行为方式σo=（σo1，...，σon）中选择符合客观环境的一种行为进行博弈，积累记忆内存（TDi，YDi）；其次，通过积累的记忆内存归纳推导个人观念Πi =（（Wi，Ai，i），πi，hi）；再次，用形成的个人观念进行决策，选择主观策略σi；最后，用决策制定过程积累的经验修正客观环境Πo=（（Wo，Ao，o），πo，ho）并形成新客观环境 ΠoN=（（WoN，AoN，oN），πoN，hoN），并以此为基础再进行新一轮的博弈，如此反复，不断通过重复的博弈，不断修正自己的个人观念。依此类推，每个参与人在每次博弈中都按以上步骤进行博弈，当所有参与人都以个人观念进行决策且其选择的博弈策略是最大化效用的，此时便达到主观博弈均衡。当客观环境Πo =（（Wo，Ao，o），πo，ho）发生重大变化或观察到其他博弈参与人选择某种行为获得更多收益时，更可能改变个人观念Πi =（（Wi，Ai，i），πi，hi），完全尝试新的行为σN=（σN1，...，σNn），通过博弈积累记忆内存（TDi，YDi），归纳推导形成新的个人观念∏Ni=（（WNi，ANi，Ni），πNi，hNi），导致新主观博弈均衡的产生（Kaneko M.and J.J.Kline，2008）。

投资者对个股股价波动影响的归纳博弈分析

（一）投资者买卖股票的交易—信息协议下的归纳博弈

1.股票交易方—归纳博弈参与人。股票市场中的参与主体可以分为投资者、证券机构、交易所和政府监管机构；其中，投资者是股票市场中最重要的主体（李竞，2008）。公司确定股票发行价格并发行后，虽然证券机构、交易所和政府监管机制对股票的交易有一定影响，但是，股票的价格及波动主要由二级市场中投资者的买卖行为决定。因此，股票买卖博弈的参与人是股票的交易方。交易方在买卖股票时，对其交易的股票的业绩、经营管理能力以及对其他交易方类型、交易策略的认知能力是有限的、主观的，不可能完全掌握这些所有真实信息，只能用以前通过经验积累形成的个人认知观念去认知股票买卖交易，通过不断的交易积累经验，不断完善对股票交易的个人认知观念。在不断的股票买卖交易过中，每个交易方经验不一样，对交易的个人认知观念也就不一样，这就导致了股票交易各方个人认知观念的差异性。此外，在短期内，股票交易方对股票交易的个人认知观念具有一定的稳定性，依此选择的交易策略也具有一定的规律性，除非客观环境发生重大变化使其不得不改变个人认知观念，不然会遭受更大的损失，一般情况下，他是不会改变投资策略的。综上分析，股票交易方满足了归纳博弈参与人的基本假定，可以用归纳博弈对股票交易进行深入分析。

2.股票交易中信息协议。在现实生活中，投资者买卖股票成功与否，通常不在于一次交易的成败，而在于在较长时期的多次不断交易，这种多次交易可以用动态博弈来表述。然而，在每一次交易过程中，每一个交易者只知道自己交易在自己交易计划的哪一步，只掌握了有关整个动态博弈的某些信息片段，并不知道自己处在整个动态博弈的哪个位置，也不知道其他交易者处在哪个位置，就不存在博弈树中的决策分枝和决策节，也就不能用经典博弈论中的博弈树来分析，用信息协议来描述更加合理。

3.股票交易—信息协议下归纳博弈。投资者在进行每一次股票买卖时，并不完全了解他所交易的对象—公司股票，并不清楚公司业绩、经营管理能力等基本面的真实信息，也不知道有多少投资者会进行交易，也不清楚每个投资者的类型及其投资策略，对这些信息，由于认知能力的有限性，投资者只掌握有关信息的某些片段；而且，当股票投资者刚从事股票投资时，缺乏投资经验，只能通过观察其他投资者交易股票的行为和有关股票投资的理论知识，凭借自己的记忆归纳推导形成股票投资的个人认知观念。

首先，最初面临股票市场，即股票投资的客观环境Πo =（（Wo，Ao，o），πo，ho），通常会在其个人认知观念中认定的投资组合σo=（σo1 ，...，σon ）中选择一种符合客观环境的方式进行投资，积累记忆内存（TDi，YDi）；其次，通过积累的记忆内存归纳推导个人认知观念Πi =（（Wi，Ai，i），πi，hi）；再次，用形成的个人观念进行决策，选择投资策略σi；最后，用决策制定过程积累的经验修正客观环境Πo =（（Wo，Ao，o），πo，ho）并形成新客观环境∏N0=（（WN0，AN0，N0），πN0，hN0），并以此为基础再进行新一轮的博弈，如此反复，不断通过重复的博弈，不断修正自己的个人观念。依此类推，每个投资者进行每次股票交易都按以上步骤进行博弈，当投资者都以个人观念进行决策且其选择的博弈策略个人主观认为是最大化个人效用的，此时便达到主观博弈均衡。当股票市场Πo=（（Wo，Ao，o），πo，ho）发生重大变化或观察到其他博弈参与人选择某种行为获得更多收益时，股票投资者更可能改变个人观念Πi=（（Wi，Ai，i），πi，hi），完全尝试新的行为σN=（σN1，...，σNn），通过博弈积累记忆内存（TDi，YDi），归纳推导形成新的个人观念∏Ni=（（WNi，ANi，Ni），πNi，hNi），导致新主观博弈均衡的产生。因此，可以认为，投资者进行股票交易即进行信息协议下的归纳博弈。

（二）股价形成、波动机理

在股票市场中，每一次个股股票的交易，并不是所有的股票持有者都会出售股票，只有投资者对个股的个人认知观念发生了变化，认为继续持有该股票不会获得更多的收益或受到更多的损失时才会选择交易股票，也不是所有的投资者都会认为该只股票值得购买持有，因此某只股票某次价格的形成是该只股票的该次交易方进行信息协议下归纳博弈的结果；当有新的投资者愿意购买该只股票或该只股票的部分持有者改变个人认知愿意增持更多股份，同时其他股票持有者改变个人认知观念愿意减持或抛售所持股份，就会进行新的交易，再次进行归纳博弈，形成新博弈均衡价格、新的股价，如此不断交易，不断进行归纳博弈，旧的均衡价格不断破裂，新的均衡价格不断形成，也就导致了股价波动。此外，投资者买卖股票成功与否，通常不在于一次交易的成败，而在于较长时期的连续多次不断交易的结果，也就是说投资者的股票交易是动态连续的。因此，个股股价是股票交易方进行信息协议下动态归纳博弈形成的均衡价格，个股股价波动是信息协议下动态归纳博弈均衡更替的结果。

（三）股价波动的原因分析

1.投资者个人认知观念的变化是股价波动的内在驱动因素。在公司未发行新股前，股票发行后其供给量就由股票的持有者决定，如果个股持有者的个人认知观念没有发生变化，仍然看好所持有的股票，是不愿意交易所持股票的，同时，股票市场上没有持有该股票的投资者对该股的认知观念也没有发生变化，也仍不看好该只股票，仍不愿意购买该股票，也就没有人愿意交易该只股票，就不会进行交易。除非，股票持有者个人认知观念发生变化，部分持有者愿意增仓，部分持有者愿意减仓、清仓；或股票持有者都愿意减仓、清仓，市场上的其他未持有该股票的投资者个人认知观念发生变化，愿意购买；只有出现这两种情况时，个股股票的交易才会进行，否则就不会有交易，个股股价就维持上一次交易价格。因此，投资者个人认知观念的变化是个股股价波动的内存驱动因素，是决定性因素。

2.股票市场环境的变化是股价波动的外在驱动因素。股票市场环境，会影响投资者个人认知观念的形成，通过使投资者个人认知观念的变化而导致股票交易方进行新的一次博弈，形成新的博弈均衡价格，从而影响股价波动。但是，股票市场环境变化对股价波动不起决定性作用，他只能通过改变投资者个人认知观念来影响股价波动，即使股票市场环境发生重大变化，投资者对股票认知观念没有发生变化，股价也不会发生波动，它会保持上一次的博弈均衡价格。只有当股票市场环境发生的变化足以使投资者改变其个人认知观念，股票价格才会发生波动。所以股票市场环境的变化是股价波动的外在驱动因素，不是决定性因素。

结论与启示

本文从投资者角度运用信息协议下的归纳博弈理论来初探股价波动的机理，分析投资者对股价波动的影响，通过研究得出以下结论：第一，投资者进行的股票交易实质上就是信息协议下的归纳博弈。第二，股价是股票交易方进行信息协议下动态归纳博弈形成的均衡价格，股价波动是信息协议下动态归纳博弈均衡更替的结果。第三，投资者个人认知观念的变化是股价波动的内存驱动因素、决定性因素。第四，股票市场环境的变化是股价波动的外在驱动因素、非决定性因素。

本文的结论对稳定股价波动具有重要的启示：一是提高我国上市公司的信息透明度，减小投资者因所掌握的个股信息的变动而不断改变个股的个人认知观念。二是遏制投机的投资者，培育价值投资理念，稳定投资者的个人认知观念。三是完善资本市场法制，创造稳定的、健康的投资环境。

参考文献：

1.De Long，J.Bradford，Andrei Shleifer，Lawrence H.Summers，and Robert J.Waldmann.Noise Trade Risk in Financial Markets[J].Journal of Political Economy，1990，（198）

2.Jegadeesh，N.，S.Titman.Profitability of Momentum Strategies： An Evaluation of Alternative Explanations[J].Journal of Finance，2001（56）

3.Leuz，C.and Verrecchia，R.Firms’Capital Allocation Choices，Information Quality，and the Cost of Capita[R].Work-ing paper，University of Pennsylvania，2004

4.赵涛，郑祖玄.信息不对称与机构操纵—中国股市机构与散户的博弈分析.经济研究，2002（7）

5.李竞.中国个体证券投资者的行为博弈探析.复旦大学硕士学位论文，2008

6.王静涛.发展机构投资者是否有利于股市的稳定—基于博弈角度的分析.金融与经济，2006（6）

7.黄凯南.主观博弈论与制度内生演化.经济研究，2010（4）

第5篇：博弈基本要素范文

关键词：人民币升值；纳什均衡；博弈论

Abstract：After the global financial turmoil，RMB exchange rate has increasingly becoming a new strategic areas of competition，contention and gaming between China and U.S..This paper applies the infinitely repeatedly complete information game model to investigate Sino-U.S. exchange rate issues，and we conclude that Sino-US exchange rate game belongs to sub-game perfect Nash equilibrium. The equilibrium result depends on each party’s patience. More favorable equilibrium result is inclined to the party who has the greater patient coefficient. Therefore，faced by the RMB revaluation proposed by the U.S.，China should insist on the principles of exchange rate adjustment according to our situation and wage a war on a long-term basis，besides，actively participate in international monetary system reform and improve our rights of financial discourse.

Key Words：RMB exchange rate，Nash Equilibrium，Game Theory

中图分类号：F830.7文献标识码：A文章编号：1674-2265（2012）02-0034-04

美国次贷危机席卷全球引发金融海啸后，中国出口市场虽然遭遇欧美需求萎缩的冲击，但中国政府通过实施较为积极的财政政策和适度宽松的货币政策刺激国内需求，在全球率先实现经济复苏，2010年取代日本成功问鼎世界第二大经济体。相反，美国政府虽然推出了出口倍增计划、实体经济回归、投资基础建设和新能源等经济举措，无奈受制于政治僵局、财政赤字等多种因素掣肘而知易行难，仍然缺乏缓解经济困局的有效途径。于是，美国一些国会议员和经济学家以中美贸易失衡为幌子，批评中国实施重商主义的人民币“低估”政策，强烈要求人民币升值，威胁将中国列为“货币操纵国（Currency Manipulator）”并征收惩罚性关税，试图通过“以邻为壑”的汇率政策转嫁危机，提振美国经济。因此，无论中国愿意与否，中美两国都在事实和体系上呈现出一种汇率博弈的格局。一个是逆差大国，一个是顺差大国，两者共同构成全球经济失衡的“主战场”之一。为此，本文立足于金融危机后中美汇率博弈的客观现实，试图从合作与不合作的策略组合中，构建一个无限次重复博弈模型，对人民币汇率中美博弈策略及其影响因素进行分析，并据此提出中国的应对之策。

一、文献综述与问题的提出

西方经典汇率决定理论，如购买力平价理论（PPP）、利率平价理论（IRP）、汇率超调模型（Overshooting Model）、资产组合理论和新闻理论等从不同的角度剖析了汇率决定的根源及其生成机理，但这些理论由于忽略了国家之间复杂的利益争夺与博弈，因而不能很好地解释现实世界中的汇率决定。于是，许多学者另辟蹊径，从国家博弈视角重新审视汇率决定。

波拉尼（Karl Polanyi，1957）、泰勒（Taylor，1995）、古德哈特（Goodhart，1998）认为货币的精神意识是一国的象征，在实质利益上也是国家在国际间追逐权力的基础。大国尤其是意识形态不同的国家，不会放弃其控制货币汇率的权利。苏珊（Susan Strange，1970）、基奥恩和奈（Keohane R.和Nye J.，1977）认为在经济领域选择什么衡量货币价值的问题上，最起作用的是结构和相互关系――谁依赖谁更多。坎佐涅里和亨德森（Ganzoneri和Henderson，1991）从国家博弈后果的角度，认为当博弈双方反复进行决策行为时通常都可能实现某种程度的合作，除非某方认为博弈即将结束。贾瓦齐和帕加诺（Giavazzi和Pagano，1988）、弗里登（Frieden，2001）认为政府出于党派选举、政治周期以及追求社会福利最大化的考虑，尤其关心与汇率密切相关的出口部门的利润及其背后的就业。弗兰克尔（Frankel，2004）认为美国凭借其经济霸权对人民币升值要求过高。克鲁格曼（Paul Krugman，2010）、伯格斯滕（Fred Bergsten，2010）认为美国应该采取行动对抗中国“保护主义”的汇率政策。

张宇燕、张静春（2005）提出对汇率的纯经济学分析固然重要，但是从相当程度上讲，一国的汇率―尤其是大国的汇率，是由现实中的各种政治经济因素及其互动决定的。赵春明、王怀明（2005）认为人民币升值后，如果美国仍进行报复，中国的最优选择是进行反报复，并可通过合理选择报复对象以实现最优。王松奇、史文胜（2007）认为大国汇率博弈实质是大国经济关系再调整的反映，随着中国经济崛起，人民币汇率大国博弈具有长期性。李成、姚洁强、王超（2008）认为单纯运用汇率工具调节两国贸易会形成双方谈判力量的“掠夺性”均衡，非经济因素会使中美汇率博弈形成暂时均衡，但不稳定。张讫山、孔灵柱（2010）认为基于经济权力的博弈决定了汇率的变动，各方博弈的基础是自身的经济权力。经济权力越大，在汇率变动中越能争取到有利于自身的结果。

综上所述，国内外已有研究主要从大国汇率博弈的根源、方式、后果以及应对策略等方面进行了大量富有成效的研究，认为汇率决定过程中不仅包含市场因素，而且遵从国家意志。然而，从人民币汇率中美博弈均衡及其影响因素着手的文献偏少。因此，本文以此为基础展开进一步的研究。

二、人民币汇率中美博弈均衡及其影响因素

博弈（Game Theory）是一种有牵连的博弈方之间的决策协同现象，实质是各博弈主体在一定规则框架下谋取自己利益的行动，本质就是联合创造博弈结果并分享成果的集体行动。纳什均衡（Nash Equilibrium）是其中一种最为常见的博弈类型，是指所有决策主体最优策略的组合，而非每个博弈主体利益最大和所有决策主体总利益最大的策略组合。它代表的是在每个博弈主体利益最大化的策略组合无法实现的情况下，所选择的一种“次优”（Second Best）策略，即对每个策略主体而言，纳什均衡是一种不得已而为之的策略组合。

（一）博弈相关要素

1. 博弈参与主体。假定博弈参与者为中国与美国，两国都是经济大国。在开放经济条件下，中国对美国拥有贸易顺差，但出口对美国有较强的依赖性。美国认为人民币被低估，因此强烈要求人民币升值。

2. 信息完全和理性人假设。中美作为世界上最大的两个经济体，假设双方在博弈过程中对彼此的经济结构、产业特征、汇率制度、策略选择以及支付函数（Payoff Function）等都拥有完全的信息。同时，假设中国和美国完全理性，在特定条件下都选择最优策略，并为实现本国利益最大化，进行无限次重复博弈。

3. 博弈策略组合。（1）不合作、不合作策略组合，表示双方在汇率问题上互不让步，即美国要求人民币升值，但中国拒不升值，美国进行报复；中国为维护自身利益，对于美国予以反报复。（2）合作、合作策略组合，表示双方一致认可当前汇率水平，中国权衡多重因素，认为没有改革的必要，本国利益处于最优；美国对华贸易逆差，对人民币汇率制度虽有不满，但一直忍让没有采取行动，因为互打“贸易战”是双方都不愿意看到的结局。（3）不合作、合作策略组合，表示虽然美国对人民币有升值要求，但中国对美国的诉求不予理会，仍一如既往地实施既定的汇率政策安排，或者认为人民币根本没有低估，对美贸易盈余继续扩大；美国国际收支继续恶化，对人民币汇率虽然有升值的诉求，但又不敢贸然采取行动。（4）合作、不合作策略组合，表示美国对人民币有升值要求，并对中国进行施压和采取温和的行动；中国接受美国的部分升值要求，或者双方经过谈判协调达成一致，人民币小幅升值。

根据上述博弈策略组合，假设双方利益分配是对称的（，）。其中，是中美两国选择不合作或者强硬策略下的真实收益或者支付，即策略组合（不合作，不合作）下的支付；是中美双方都作出让步下的真实收益，即策略组合（合作，合作）下的支付；和是中国选择不合作策略下美国选择合作的真实收益，或者中国选择合作策略下美国选择不合作的真实收益，即（不合作，合作）与（合作，不合作）策略组合下的支付（见图1）。

图1：不同汇率博弈策略下的中美支付组合

（二）人民币汇率中美博弈均衡解析

根据博弈论原理，如果博弈只进行一次，此博弈为静态博弈（Static Game），理性的双方都会选择占优策略，不合作、不合作是此博弈纳什均衡，即双方各不相让，你报复我，我反报复你，最终陷入“囚徒困境”（Prisoner Dilemma）。事实上，随着经济全球化、经济金融化和金融全球化的迅猛发展，中美两国已经处于一种相互依存（Interdependence）的状态，如果双方都表现强硬或不合作的态度，最终会导致两败俱伤，这是彼此都不愿意看到的结果。因此，假设中国和美国进行汇率博弈无限多次且合理，那么无限次重复博弈有多个子博弈精炼纳什均衡，以下讨论均衡解可能出现的情况。

假设在博弈的初期双方都选择合作，但在以后的博弈中，一旦一方选择了不合作，另一方将永远选择不合作，这就是所谓的“冷酷策略”（Grim Strategy）。令、分别为A、B两国的贴现因子，在此称之为“耐心系数”（Patience Coefficient）。如果美国在博弈的某个阶段不进行合作，它在该阶段获得收益，当期的净收益是，但它的机会主义行为将会引发中国“永远不合作”的惩罚，以后每次博弈的收益都为。当下列条件满足时，美国不会选择不合作：

（1）

即（2）

解上述条件，得到“耐心系数”。换言之，如果条件满足，美国不会首先选择不合作。如果美国选择了不合作，中国选择不合作的收益是，选择合作的收益是，，即不论它自己的耐心系数为多少，它都选择不合作。坚持冷酷策略，即使惩罚自己也是最优的。因此，冷酷战略是一个纳什均衡，而且是子博弈精炼纳什均衡，（合作，合作）是均衡解。同理，当时，冷酷战略也是一个纳什均衡，而且也是子博弈精炼纳什均衡，（合作，合作）是均衡解。

在人民币汇率中美博弈过程中，只要双方都有足够的耐心，任何机会主义行为都没有市场，中美两国都乐于建立一个合作的声誉（Reputation）。对于一方的任何报复行为，另一方也有积极性予以反报复。中美双方在汇率博弈中采取（合作，合作）、（不合作，不合作）的可能性是非常小的，因此支付组合和在现实中不会是最终的纳什均衡结果。根据无名氏定理（Nash Folk Theorem）①，只要中美两国有足够的耐心（即、足够大），那么，任何介于和之间的支付，即图2中EOFO′阴影部分任意一点所代表的支付，都可以通过一个子博弈精炼纳什均衡得到。因此，在此支付下的汇率水平是中美博弈的均衡汇率。当双方耐心系数发生变动时候，均衡也会相应发生变动，直至再一次达到均衡。

图2：中美在子博弈精炼纳什均衡下的支付集合

（三）人民币汇率中美博弈均衡的影响因素

由上可知，无限次汇率博弈的均衡结果取决于耐心系数、。影响耐心系数的因素主要包括各自政府与国内利益集团的态度、国家综合实力、经济发展水平、当前经济形势以及世界主要大国的态度等。国内利益集团与政府的态度越强硬、国家综合实力越强，经济发展水平越高、国内经济越稳定、在世界上拥有越广泛的支持率，耐心系数越大。更有耐心的一方在博弈中就越能争取到主动、更有可能获得更多的利益。

金融危机爆发前，美国在人民币汇率问题上更有耐心（即），拥有更多的主动权，博弈的均衡既不是完全的合作，也不是绝对的强硬。美国虽然扬言要对中国商品征收进口附加税（Import Surcharge），但其又绝不会贸然采取行动而招致中国强烈的反报复，因为双方深知互不合作获得的收益是最坏的结果。中美合作的基础是共同利益，双方可以通过加强沟通、争取合作使双方的收益提升到（0，0）至之间的某个值。可以预计，经过三十多年的改革开放，中国经济飞速发展，综合国力和国际影响力显著提高，金融危机后更是在全球率先实现经济复苏，因此中国的耐心系数在未来会不断上升（即），甚至有可能超过美国（即），在复杂的中美汇率博弈和利益分配中将争取到更多的收益。

三、人民币汇率中美博弈的应对之策

由于中美两国在全球经济金融领域既是竞争对手，又是相互依存的利益共同体，这就决定了双方只能是在竞争中求合作。面对美国在人民币汇率问题上的强势要求，我们必须学会用政治乃至国家竞争战略的眼光来看待问题的实质，切不可按照简单的市场原则出牌（白钦先、刘刚，2010）。因此，中国应权衡自己的综合实力，在不引发中美全面贸易战的基础上及时采取有效措施，以保证中国出口、就业、经济结构转型和金融安全与等核心利益不受损害。

（一）必须做好长期准备

中美汇率问题不是一次性就能解决的，博弈具有持久性。中美双方对人民币汇率改革的方向虽然认识一致，但中方坚持改革的目标是继续深化人民币汇率形成机制，而美方更强调人民币一次性大幅升值。然而，问题是一旦人民币汇率放开、升值幅度过大，中国数以万计的中小企业将面临破产倒闭，更何况人民币升值根本解决不了美国对华贸易逆差。

（二）坚持“以我为主”的博弈原则

在复杂的国内外政治经济坏境下，中国不要因为外界有压力就动汇率，也不要因外界没有压力就不动汇率，人民币汇率形成机制改革应坚持“以我为主”的博弈原则。事实上，自2010年6月中国汇改重新启动后，人民币对美元累计升值超过6%，此举在一定程度上减缓了人民币升值预期和热钱流入，降低了国内的通胀风险，这是新时期中国主动应对国内外复杂环境的综合体现。

（三）积极参与国际货币体系改革

世界上越来越多的国家，尤其是东亚等出口导向型经济体，深受美元本位制的困扰。因此，中国可以和上述国家共同呼吁美国停止弱势美元政策，推动国际货币体系朝着公平、公正和有效的方向发展。如果中国只是被动地应对美国要求人民币升值，而不是积极成为国际货币体系改革的创导者和参与者，就很难脱离被动局面。当前的世界政治经济格局仍处于不断变革中，中国作为一个日益崛起的大国应积极倡导和参与国际货币体系改革。

注：

①无名氏定理认为在无限次重复博弈中，只要博弈参与人具有足够的耐心、贴现因子足够大，那么，任何满足个人理性的、可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。

参考文献：

[1]Karl Polanyi.1957.The Great Transformation[M].Boston：Beacon press （originally publisbed in 1944）.

第6篇：博弈基本要素范文

关键词：高校考试；学生；老师；博弈

一、前言

高校考试作弊现象是高校的一个通病，每场考试都或多或少存在这一现象。考试作弊行为指的是在监考者通过书面、口头提问或实际操作等方式考查参试者所掌握的知识和技能时，参试者通过不正当途径参试、考核过程中在考核不允许的范围内寻求或者试图寻求答案，与公平、公正原则相悖的行为。本文试图从博弈（gametheory）的角度出发，对大学生考试作弊行为进行理性分析，从而为减少这一现象提供一种对策建议。

二、研究现状

目前对于考试作弊的研究，绝大多数学者停留在宏观层次，侧重于主观的定性分析，主要从道德层次来透析考试作弊的原因。如邓希冯、刘列认为，考试作弊受两大类因素影响，个人因素中个体的人格特征、动机取向、自我效能感、学习成绩、道德水平以及情境因素中的课堂目标结构、教师教学质量等都会对作弊产生影响。李鸿雁认为，考试作弊作为大学生思想道德缺失的严重表现，为提高大学生思想道德素质，消除考试作弊则迫在眉睫。

总体来说，当前关于考试作弊行为微观层次的研究不是很多，缺乏定量分析，且绝大多数研究成果都是基于学生的视角，强调要加强对学生的思想政治教育，而忽视考试行为的另一方——老师的因素。事实上，考试作弊行为的形成是一个师生之间不断适应和动态调适的复杂演化过程。既有学生的内在因素，又有老师的外在因素。本文应用演化博弈的思想和方法，建立学生与老师的博弈模型，分析考试作弊行为的演化规律，提出建立考试诚信机制的策略方法。

三、考试作弊原因

高校考试作弊现象，原因是多方面的。唯物辩证法认为，事物的内部矛盾（即内因）是事物自身运动的源泉和动力。外因是变化的条件，外因通过内因而起作用。没有外因的刺激，内因就无法起到作用，双方共同推动事物向前发展。高校考试作弊现象最根本原因是学生自身的素质对外界的诱惑抵制力不够，对自己要求不严，缺乏必要的正确是非观念，对考试作弊有一种依赖侥幸心理。为了获得更好的成绩，到处寻找捷径，动歪脑筋，不惜抛弃诚信。根据唯物辩证法，要想杜绝高校考试作弊，除了大学生的自律内因外，还必须从外部原因找到推动力。事实上，大学生的自律，在当今社会主义市场经济条件下，还要依靠外部的各种监督。只有这样，诚信考试才能够做到内外兼修，实现和谐的社会主义校园环境。本文从师生双方博弈的角度人手，主要从内外部两个方面分析导致高校考试作弊现象的原因，通过分析得出结论并提出相应的对策。

四、博弈分析

本文试图从演化的博弈角度，分析学生考试诚信的树立离不开内外双方的有效约束，只有这样，学生考试诚信才能成为一种长效的最优化选择。博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。理论的基本出发点是具有个体理性的经济人追求自身利益的行为，主要研究行为和利益有相互依存性的经济个体的决策和相关均衡问题。尊弈论的主要研究方法是把现实世界中的行为体的冲突与竞争抽象概括为某种简化的博弈模型进行分析，当一个主体例如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来也影响到其他人、其他企业选择时的决策问题和均衡问题。当将交易看作双方的策略行为时，对于各方的策略选择，可以通过博弈模型，分析交易双方的行动动机，并通过求解，确定交易的绩效。

（一）基本假定

假定一，监考老师认真监考的成本C1（清理、巡视考场，留意学生，发现舞弊现象的后期处理，恶化与学生关系）；认真监考的收益R1。（现实学校生活中，老师认真监考的收益很小，除了相应的和其他老师一样的监考费外，基本没有额外的精神和物质奖励。同时，认真监考发现作弊学生后还要付出更多的精力来处理善后工作。）

假定二，不认真监考的成本C2（被巡视发现批评、通报、纪律处分、内疚）。不认真监考的成本也很小，如果不是发生什么重大的责任事故，学校对老师的惩罚也就是通报，纪律处分，实际上都流于形式，故C1>C2；监考老师不认真监考的收益R2（更多的闲暇时间支配：聊天、看报纸、玩手机等，学生及格率提高，博得学生喜欢），故R2>R1。

假定三，学生诚信考试的收益G1（内心不准备作弊，所以只能破釜沉舟一心做好答题）。

假定四，学生舞弊考试的收益c2（舞弊及格后不用重修，有资格评选奖学金，竞选干部，有保研的资格，简历光彩），故G2>G1。

（二）博弈分析

在上述假定条件下，本文先对两种拟定的极端情况下老师和学生之间就考试行为选择进行博弈分析。即老师认真监考和不认真监考下学生所采取的诚信和作弊二种应对措施。当然在现实生活中上述两种情况存在的可能性都非常小。很多是介于这两者之间，但这并不影响结果的分析，区别的只是程度问题。

基于以上的参数，得出以下矩阵（第一个数字代表学生，第二个数字代表老师）。

博弈方的最终目标都是实现自身的最大利益。在具体策略和利益相互依存性的博弈问题中，各个博弈方的利益既取决于自己选择的策略，还与对手博弈方选择的策略有关。因此，博弈方在决策时必须考虑对手博弈方的存在和策略选择。基本思路和方法包括上策均衡法、严格下策反复消去法、划线法和箭头法等。他们各有特点。上策均衡法、严格下策反复消去法适宜绝对优劣关系的博弈，而划线法适用于较强盼博弈分析方法，是以策略之间的相对优劣关系为目标。基于本文的特点，采用划线法来进行博弈分析。

在表1中，老师和学生作为参与人（players）都有两种战略，即老师是认真或敷衍；学生是诚信或作弊，它们共同构成四种战略组合，每种战略组合下的两个数字分别代表老师和学生的受益，前一个数字代表学生的受益，后一个数字代表老师的受益。

在这个博弈中，对老师来说，假设博弈方学生采用的策略是“诚信”，则博弈方老师认真监考得效益R1-C1，敷衍监考得效益R2-C2，由于C1>C2，R2>R1，可以得山R2-C2>R1-C1，此时老师的最佳对策是敷衍。为了便于记忆和分析，我们在矩阵中策略组合（诚信，敷衍）对应的博弈方老师的效益R2-C2（矩阵右上角数组中第二个数字）下划一短线，表示这是博弈方老师在I尊弈方学生选择诚信时的最大得益。同样，对于老师来说，博弈方学生采用作弊策略时，老师选择敷衍为最佳策略。对应的是（作弊，敷衍）里的R2-C2，我们也在下面划一短线。

同理，对于学生来说，思路同老师是一样的，当老师认真监考时，学生诚信考试可以获得G1的利益，根据假设，由于老师认真监考，学生作弊就会被抓，这样，学生就获得G2的利益，肯定是小于G1，这样，学生选择诚信考试是最佳方案，因此，我们在（诚信，认真）里的G1下划横线；同时，如果老师敷衍监考，学生作弊获得的利益G2也比诚信考试所得的利益G1更大，因此，我们在（作弊，敷衍）G2下面划上短线。

在表1中，只有（作弊，敷衍）下两数字有短线，就是意味着，这个组合无论对于学生还是老师来说都愿意接受的结果，具有相对稳定性。

这种博弈反映了一个深刻的问题，即学生的理性与老师的理性的冲突，双方的理性最终形成了（作弊，敷衍）为最佳选择。在该博弈中，对于学校而言，最理性的选择是学生诚信考试，老师认真监考，整个校园出现和谐的环境。事实上，由于当前的基于现实考虑的一些假定存在（C1>C2，G2>G1，R2>R1），那么在高校要想减少考试作弊的现象，在目前的状况下是根本不可能，这也证实了现在高校作弊现象为什么越来越严重的原因了。

五、对策建议

缺乏诚信的考试代价是巨大的。然而“冰冻三尺，非一日之寒”，实现校园和谐的考试氛围是一个长期的、持之以恒的过程，需要学生、老师、学校共铸诚信考试的氛围。通过师生之间的博弈模型分析我们可以看出，为了打破这种博弈的纯纳什均衡，必须改变C1>C2，G2>G1，R2>R1的状况，从而使（作弊，敷衍）的最佳选择转变为（诚信，认真）的最佳选择。基于此分析，我认为，改变高校考试作弊必须从以下二个方面来加强：

（一）从学生的角度来看，要加大学生作弊的成本，减小作弊的收益

首先，从道德层次上加大对违纪的作弊学生思想政治教育，使其建立“作弊可耻”的准则。其次，建立诚信档案。一旦有不良的信用记录（比如考试作弊），就会得失去学校的奖励机会。毕业后，其个人信用档案也将与其他档案一起寄往工作单位。这样一来，学生从长远的利益博弈出发，不会轻易作出作弊的选择。那就是要让学生明白，作弊的收益成本G2要远远小于诚信考试的收益即G2

（二）从老师的角度来看，要加大老师认真监考的收益，减小不认真监考的收益；同时，加大不认真监考的成本，缩小认真监考的成本

首先，加大对老师的政策宣传，进行必要的思想政治教育，加大工作的责任心意识宣传。实际生活中，老师到底有没有尽职并不能作出定量的考核，也很难测量，基本上要靠监管人自身的素质和意识来制约，这样强化对老师的思想政治教育是完全必要的。其次，为了降低认真监考的强度，减少认真监考成本C1，可以改革考试模式，能开卷考试的就不闭卷考试，这样学生作弊的可能性就会降低很少。最后，强化对监考教师监督和约束的机制。加强流动监考的力度和强度，增加老师的不认真监考成本C2。尽可能减少老师在监考期间聊天、看报纸、玩手机的机会，减少监考老师不认真监考的收益R2。

通过上述的二种措施，改变了原定的假设，最终形成了c1

第7篇：博弈基本要素范文

不确定性多属性决策的方法很多，“动态博弈网络技术”问题是研究在进展过程中，项目内容动态变化下的网络技术，包括在动态网络下阶段状态的评估定级、关键链的管理、资源优化配置与调度等主要问题。动态博弈网络技术常常用于突发事件的管理，突发事件管理的博弈双方为“突发事件”与“突发事件管理者”。针对于我国石油供应危机所对应的突发事件及其应对可看成双方在不完全信息下的博弈，又由于应对主体需利用资源的调度去减缓或消除危机，故可利用网络计划予以刻画。这一过程会随着应对主体的应对而使博弈双方的博弈地位不断地发生变化，动态博弈网络技术的应用使然。

二、基于动态模拟网络技术的国外石油供应策略

根据动态博弈模型，对我国石油开发策略的选择进行博弈分析。设定：

1.局中人。

“危机管理者”与“危机事件”，其中“危机管理者”为我国政府，“危机事件”为石油供应危机。

2.策略空间。

危机事件：根据我国进口石油运输线路的安全情况，将石油供应危机事件划分为两种状态S1、S2，危机事件的状态空间表示为S={S1，S2}，其中S1代表我国石油进口通过马六甲海峡处于正常通航条件下的石油供应状态；S2代表马六甲海峡处于不能正常通航条件下的石油供应状态。两种状态之间的转移概率为pij（i，j=1，2）。危机管理者我国政府在石油供应危机中可选择的策略。

3.石油供应量与保障率的关系。

根据策略选择的不同，石油供应保障的程度也不同。石油供应保障程度用供应保障率表示，其取值范围为0到100%；按照我国石油的需求量与各方案的相关因素，结合专家调查法确定石油供应量与保障率之间的关系。

4.方案评价。

根据我国石油进口各路径、管线的长度、运输能力、预期投资及成本等因素对各方案评价。假定博弈双方危机管理者（我国政府）与危机事件（石油供应危机）共进行两轮博弈：在博弈的第一阶段，危机管理者先将本国生产的石油用于消费，将其记为方案Ⅰ；在博弈的第二阶段，我国政府有五大类方案可供选择，即{d1，d2，d3，d4，d5}。按照方案的评价结果d1，d2为较优的备选方案，分别将它们记为Ⅱ，Ⅲ；由此形成的博弈第一阶段的策略空间为{Ⅰ}，在博弈的第二阶段的策略空间为{Ⅱ，Ⅲ}

5.支付函数。

设危机管理者的支付向量为二维向量，其中第一分量表示供应保障率，第二分量表示成本。

6.状态转移函数。

在博弈的第一阶段，危机事件以概率pi选择第i种危机状态，定义第二阶段的状态转移函数为pij=（fa1,i,j），其中，a1表示在博弈第一阶段针对危机采取某种方案后预计达到的保障率；i表示转出状态，j表示转入状态。根据预先的信息设p11=0.95，p12=0.05；p21=0.5，p22=0.5。

7.两阶段动态博弈过程及支付情况。

8.危机管理者的决策目标、决策准则与预案的生成。

（1）决策目标：在第二阶段博弈结束后，石油供应危机应能被控制（即第二阶段的预期保障率要尽可能达到100%），在此约束下成本越小越好。如果第二阶段博弈结束时保障率没有达到相应的标准，可以通过支付较高的补偿成本，预计补偿1%的保障率所需支付的成本为5单位，决策准则采用期望成本最小原则，成本用C表示。（2）预案生成。通过计算、比较可知：如果在博弈的第一阶段危机事件以状态S1出现，则危机管理者的最优策略是在博弈的第一阶段选择方案Ⅰ，在博弈的第二阶段选方案Ⅱ；如果在博弈的第一阶段危机事件以状态S2出现，则危机管理者的最优策略是在第一阶段选择方案Ⅰ，在博弈的第二阶段选方案Ⅲ。即若我国石油进口通过马六甲海峡处于正常通航条件下，我国政府的选择为在利用本国石油资源的基础上，加大建设泰舍特至纳霍德卡石油管道的力度；而在马六甲海峡处于不能正常通航条件下，我国政府的选择为在利用本国石油资源的基础上，积极建设中缅线，即把来自中东和非洲的石油，经远洋油轮从印度洋运至缅甸实兑港输送上岸，再通过长达900公里的输油管线经过缅甸曼德勒、云南瑞丽，直达昆明，或延伸至重庆。

三、结论

1.我国石油供应危机事件可以博弈双方危机管理者（我国政府）与危机事件（石油供应危机）进行动态博弈来模拟刻画。

2.在马六甲海峡处于不能正常通航条件下，我国政府的选择为在利用本国石油资源的基础上，积极建设中缅线。

第8篇：博弈基本要素范文

民主平等的师生关系、和谐的学习氛围是学生积极主动学习的前提，孔子曰：“亲其师、信其道、乐其学。”课堂教学中，学生举手发言是师生教学互动的一种良好的表现形式。积极举手回答问题，可以使学习变得更扎实、可以锻炼学生的逻辑思维能力、有利于学生养成良好的学习心态与积极的人生态度。但是，当下的大学课堂教学过程中，学生保持沉默，老师们发现调动学生回答问题的积极性十分困难，这既影响了学生学习的积极性和主动性，也影响到教师的授课情绪，教学效果自然也不尽如人意。

难道是因为大学生天生“含蓄”吗？显然，将举手中的尴尬完全归咎于性格缺陷是错误的，不举手已成为大多数人的倾向，这是一种集体理性的选择。本文将利用博弈论中的相关知识，对课堂中举手的问题做出一些讨论。

二、博弈理论介绍及问题分析

信息是指参与博弈的博弈方在决策（策略选择）时对其条件的知识。在完全信息博弈中，各博弈方都不存在私有信息，所有信息都被博弈方共同占有，包括该博弈中共有哪些博弈方，各博弈方可选择的全部策略或行为的集合是什么，所有博弈方的得益是什么。

博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。一般而言，主体在进行决策时不仅要考虑自己行动的后果，而且也要考虑对手对自己行动可能产生的反应及由此可能发生的后果，在综合考虑对手的一切可能做法的条件下，作出能使自己目标最优的决策。

博弈论对博弈方的基本假定是“理性人”假设，博弈方始终追求自身效用最大化。博弈论研究的是理性人之间是如何进行策略选择的，博弈论已经成为经济学的标准分析工具之一，在很多情况下能够完美体现出博弈方之间策略选择的依存关系。

现实生活中，由于一方想获得更大的收益而做出与其他人相异的决策时，常常会面临两种结果：①获得比其他人更大的得益；②遭到其余人的排挤，而被孤立。在举手博弈中也存在类似的现象。作为“理性人”，如果没有充足的把握，主动举手回答问题，意味着有犯错的可能，也许会遭到大家的嘲笑，嘲笑带来负效用，在一定程度上可以说举手回答问题是需要付出“成本”的。而安分地隐没于众人之中，既没有被嘲笑的可能，也可以不用思考。所以，选择“不举手”策略对学生来说其实是有正得益的。

但是在激励机制前，再“含蓄”的学生也有举手的愿望，有做出偏离集体理性的决策的可能。一旦举手的同学获得正收益（老师表扬或者加分）时，不举手的同学的效用相对为负。为了弥补这种不平衡的心理，在条件允许的情况下，不举手的同学也会选择“举手”。

三、举手问题的博弈分析

为了研究的方便，按照“理性人”假设，分析中作出如下假定：

（1）剔除学生个体的因素以及其他无关因素，只讨论两个体（博弈方1、2）间的博弈，虽然现实情况下参与举手博弈的主体包括个人、群体，但是个人与个人之间的博弈是最基本的，因此这个假定具有一定的代表性；

（2）博弈双方同时决策，都清楚对方可能采取的所有策略，但并不能确切知道具体策略，且双方彼此了解各自得益，即博弈属于完全信息博弈；

（3）博弈双方所有可选策略只有两种：举手与不举手；

（4）回答问题正确的得益为r，犯错的成本为c，犯错的概率为p，不举手的得益为b，与别人拉开差距后带来的满足感为s，显然，不举手者的得益相对于回答问题正确者的得益要大，所以r>b；r，c，p，b，s>0；举手回答问题则要承担pc的机会成本，当然也可能回答正确，则举手回答的博弈方的得益记为r-pc，应该高于面临其他同学回答正确而自己不举手的博弈方的得益，即r-pc>b-s。而s-pc与b的大小是不确定的。

该博弈中有两个重要变量，即p和c。p指犯错的可能性，若老师提出的问题难度很大时，p很大。c指犯错的成本，在激励机制（老师作出加分等奖励措施的承诺）不存在时，c也会很大。建立如图1所示的得益矩阵。下面我们将分两种情况讨论。

（一）s-pc>b时的情形

当pc较小，即s-pc>b时，依据划线法得该博弈存在唯一纯策略纳什均衡（举手，举手）。说明当问题难度较小，或者激励机制存在时，pc减小，举手的得益增大，此时学生们都倾向于举手。在现实生活中，如果s-pc>b，学生们都会积极举手回答问题，课堂上的气氛会活跃很多，但是当这个条件不能满足时，就会出现另一种情况。

（二）s-pc

当pc足够大，即s-pc

现实生活中，人与人之间长期稳定的相处往往使得博弈重复发生，将每次举手情况作为博弈的一个阶段，此时，举手博弈就成了一个有多个纯策略纳什均衡的有限次重复博弈问题。在重复博弈这种结构特殊的动态博弈中，所有博弈方过去的策略选择都是可以观测到的，因此某个参与人可以通过在本阶段博弈中的策略选择，来回应其他参与人在上一个阶段博弈中的行为。在这个重复博弈中两博弈方将采用“触发策略”，即在第一阶段博弈中，学生们会首先试探“合作”，也就是不举手，如果对方采用的也是“不举手”策略，则下一阶段中学生们会继续“合作”，博弈的结果为（b， b），集体不举手的局面也就随之出现了。然而，一旦发觉对手“不合作”，学生则在下一阶段博弈中采用“不合作”相报复的策略，即以举手作为“报复”，博弈的结果为（r-pc， r-pc），课堂上学生们也就集体倾向于举手了。

四、结论及建议

上述博弈理论的分析对现实情况有一定的解释作用，在现实生活中，第一次“博弈”形成的上课气氛几乎就决定了这门课之后的氛围。如果第一次课学生们就倾向于举手，那么以后这门课的课堂气氛也就不会太差，而如果第一次课堂中就没有同学举手，那么以后也就很难调动学生回答问题的积极性了。

本文认为，可以从以下两个方面来调动学生的积极性，激励大学生在课堂上积极主动举手发言：

（一）减少pc值

有两种方法：①降低问题的难度，即降低学生回答问题出错的概率p。学生害怕出错而不愿意举手，教师的问题可以贴近学生的生活，让其有话可说；②降低学生犯错的成本c。老师可以建立激励机制，采用加分、精神上的鼓励等措施，创设“民主和谐”的课堂环境是学生进行良好自我表现的必要条件，也能使得学生“无所顾忌”地发表自己的看法。教师可以抓住一个特别的时机与学生就课堂踊跃发言的问题专题讨论，晓之以理，动之以情，让同学们充分认识到课堂发言不但能激发自己听课和思考，还能有利于任课教师的课堂发挥，并且师生的互动能够使双方心情舒畅，变教学为探究，变工作为游戏，变苦旅为乐途。

（二）促进大学生群体间的重复博弈

根据“触发策略”反应的博弈问题的实质，教师应当想办法打破大学生间的“合作”局面，找一些平时课堂爱发言的同学开个打招呼会，让他们在课堂上踊跃发言，在同学们中间起带头作用。如果这样的同学占有相当的比例，在班内能够起到带头的作用，那么大学生群体会出现“不合作”的情况，学生们集体倾向于举手，目前的现状会得到改善。

当然，学生个体的差异也是不能忽略的因素，学生的个性、上课的认真程度，还有一些偶然因素等也会影响博弈的结果，这些都可以进一步讨论。

第9篇：博弈基本要素范文

【关键词】博弈论会计信息失真纳什均衡

一、博弈的基本理论

博弈论又称对策论、竞赛论,用于分析竞争的形势。在博弈论的研究中,一个核心问题就是均衡,即纳什均衡。在经济学中,均衡意即一些相关量处于稳定值。

所谓博弈论(Game Theory),是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的一种方法。博弈论把现实世界中不同参与者之间的各种行为抽象概括为不同参与人之间利益的冲突与一致,进而通过构建博弈模型来研究不同参与人的策略选择问题,使分析更加准确。同时,博弈论把信息的不完全性作为基本前提之一,这就使得博弈论所研究的问题和所提出的结论与现实非常接近,具有现实性。

二、会计信息失真的博弈分析

1.博弈分析的基本要素

博弈分析的基本组成要素有三个:一是博弈主体,即指参与博弈的各方,包括企业、投资者、政府监管部门和其他有关的个体等。二是博弈规则,即一切规范会计行为的会计法规、准则和制度。三是社会监督者,即会计理论界、社会公众、政府审计以及其他经济监督人员。

2.博弈分析的基本假设

会计信息失真博弈的基本假设主要有六个:一是各主体之间存在信息的不对称性。二是强调个人理性和有限理性。三是企业和政府监督部门、投资者都完全了解自己和对方在各种情况下的利益。四是非合作原则,即企业与政府监督部门、投资者不能“串通”以谋取双方利益的最大化。五是不存在会计做账技术上的障碍或政府监管部门检查技术上的缺陷。六是会计准则留有灵活性和“真空地带”。

3.博弈分析

(1)企业与政府监管部门的博弈

随着我国会计法规的不断完善,政府加强了对企业的监管力度和措施,但也不乏疏漏之处。有些企业仍抱着侥幸心理,偷偷做假。下面,构造企业和政府监管部门两个参与人的对策模型。企业有两种选择策略:做假账和做真账。政府监管部门也有两种选择:检查与不检查。两者博弈过程可用图1表示。

图1 政府监管部门与企业战略对策模型

第一个数字表示企业的得益;第二个数字表示政府监管部门的得益。R 表示监管部门查出假账后所得的奖励;L表示政府监管部门的检查成本;R -L 表示政府监管部门查出假账后的净得益;C表示企业做假账被查出后的损失;d表示政府监管部门没有查出假账的损失;e表示企业做假账没被查出所得好处.

一给定企业做假账的概率P,政府监管部门选择检查和不检查的期望收益分别为∏查=(R-L)×P+(-L)×(1-P)=RP-L和∏不查=(-d)×P+0×(1-P)=-dP.

要达到纳什均衡,政府监管部门检查和不检查的期望收益一定要相等,否则政府监管部门将改变现在的策略获得更大的收益。因此,政府部门预期收益最化的一阶条件是∏查=∏不查,即RP-L=-dP.解得P=L/(R+d).

也就是,如果企业做假账的概率小于L/(R+d),则政府监管部门的最优选择是不查;如果企业做假账的概率大于L/(R+d),政府监管部门的最优选择是检查;如果概率等于L/(R+d),政府监管部门随机选择检查或不检查。

二给定政府监管部门检查的概率q,企业选择做假账和做真账的期望收益分别为∏假=(-C)×q+e×(1-q)=e-q×(e+c)和∏真=0×(1-q)+0×q=0.同理可得∏假=∏真, 即e-q×(e+c)=0,解得q=e/(e+c).

若政府监管部门检查的概率小于e/(e+c),则企业的最优选择是做假账;若政府监管部门检查的概率大于e/(e+c),则企业的最优选择是做真账;若政府监管部门检查的概率等于e/(e+c),则企业随机选择做假账或做真账。

(2)企业与投资者的博弈

企业作为独立的经济人,追求的是企业利益最大化。所以,企业作为会计信息的提供者有时会少披露、不披露甚至歪曲披露企业的某些会计信息。投资者对企业进行投资是为了取得投资收益,为使投资效用最大化,投资者也并非完全需要企业提供真实的信息。因而,在企业与投资者之间博弈的最后均衡很可能是企业做假账,提供虚假的会计报表。

为了进一步说明导致会计信息失真的原因,将企业与投资者之间的相互影响、相互制约的过程引入一个博弈模型。在该博弈模型中,博弈双方为企业(即会计信息提供者)和投资者(会计信息的使用者)。在相关假定的基础上,企业与投资者战略对策模型构成如(表2)所示(表中的数字分别代表了企业和投资者选择相应战略的效用水平)。由(表2)可知如果企业提供真实的会计信息,投资的效用比不投资的效用大,则理性的投资者必然倾向于选择投资,即有MX组合而不存在MY组合;当企业选择提供虚假的会计信息时,此情况下不投资的效用比投资的效用大,投资者更倾向于放弃投资,即有NY组合而不存在NX组合;而无论投资者是否选择投资,对于企业来说,提供虚假信息的效用比提供真实信息的效用要大,因此有XN和YN组合,无XM和YM组合。综上所述,只有Y与N的组合是唯一能在给定对方决策的条件下,双方都能对自己的战略选择满意的战略组合,这个组合达成了纳什均衡。

表2 企业与投资者战略对策模型

三、结论

会计信息失真是一个历史问题,也是一个现实问题。通过本文对会计信息失真问题的探讨,提出如下治理建议:同时从企业内部和外部改善博弈环境;必须充分发挥政府监管部门的监督作用,以法律手段震慑造假行为,有效防止会计信息失真;提高会计信息使用者对所提供会计信息的参与程度和对信息的分析能力,改变其在会计信息披露博弈中预期的非理;加强和完善社会独立审计体系,健全注册会计师审计制度和职业道德素质。

参考文献:

博弈基本要素精选(九篇)

相关热门标签

相关文章阅读

精选范文推荐

相关期刊推荐

玻璃艺术

宁波医学

船舶经济贸易

冶金信息导刊