简答题:
1、无限次重复博弈与有限重复博弈的区别:
a. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。
b. 无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。
c. 无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键,是构造高效率均衡战略的核心构件。
2、纯策略和混合策略的区别
简单来说,纯策略就是参与人始终坚持一个对其最有利的策略,而不论对手采取何种策略;而混合策略就是参与人为了不让对手明白他的行动原则以及选择偏好从而加以利用,而不断选择对其最有利(或相对有利)的策略,这些策略往往是随谈判阶段或环境(或其他因素)而不断变化的。
3.完全信息和完美信息的区别
完全信息,是针对策略集和赢利(payoffs)集的。如果任何参与人的策略集和支付集合皆为所有参与人共知,此为完全信息。
完美信息,是针对记忆而言的。如果一个参与人在行动时观察到其所处的信息结点是唯一的,那么可称他对其他参与人在他之前的行动有完美的记忆;如果所处的信息结点是不唯一的,则他对其他参与人在他之前的行动就没有完美记忆。
很显然,完全信息不一定完美的;不完全信息必定是不完美的。
4.静态和动态的区别(标准式和扩展式的区别)
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动; 动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
标准式 一次性,局中人策略空间确定 盈利矩阵
扩展式 有先后顺序 局中人行动空间和获取的信息随时变化 博弈树
二者可互相转换
5.纳什均衡定义
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
6.博弈扩展式的六要素
1局中人 2行动的次序 3行动的选择 4当局中人做出决策时,局中人的信息集5局中人的盈利和效用 6外生时间的概率分布
7.策略和行动的区别:策略是关于行动的完整
。
(1) 将博弈的信息特征和行为时间特征结合,博弈分为哪几类,并分析几种类型博弈的特点?
答:将博弈的信息特征和行为时间特征结合,可以把博弈细分为下面四种类型的非合作博弈:
静态博弈:是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。
动态博弈:是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、行动的博弈。
完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。
不完全信息博弈:是指参与者只了解上述信息中的一部分的博弈。
(2)博弈论博弈论产生与发展过程?
答:1、萌芽阶段(1944年以前):古诺(Cournot,1838,法国经济学家)模型(同时决策的产量博弈);斯坦克尔伯格(1934,Stackelberg,德国经济学家) (不同时决策的产量博弈)
2、产生阶段(1944年-1959年):冯·诺依曼和摩根斯特恩合著《博弈论与经济行为》(1944年),博弈模型的解的概念和分析方法,理论基础,主要合作博弈,非合作零和博弈;纳什均衡(完全信息静态)(1950,1951),论文“N人博弈中的均衡”点(50年),“非合作博弈”(51年),提出了非合作博弈均衡解,并证明了均衡解的存在,纳什均衡基本思想:在解集中所有博弈者的策略都是对其他博弈者所用策赂的最佳对策
3、发展阶段(1960年-1979年):精练纳什均衡(完全信息动态)(泽尔腾,1965),1965年论文《一个具有需求惯性的寡头博弈模型》,德国波恩大学教授,数学家、经济学家;贝叶斯纳什均衡(不完全信息静态,海萨尼,1967)与贝叶斯精练纳什均衡(不完全信息动态,海萨尼,1975),美国加州大学教授,经济学家
4、繁荣阶段(1980年以后):纳什,泽尔腾和海萨尼共同获得诺贝尔经济学奖(1994);维克里和莫里斯获诺贝尔经济学奖(1996),2001,2005,2007年诺贝尔经济学奖,不对称信息下激励理论。
(3)博弈论成为经济学主要课程的成因是什么?
答:1)博弈论在经济学中的应用越来越广泛. 博弈论许多成果也是借助于经济学的例子来发展的, 相比其他领域来说,在经济领域应用最为成功的,已经形成了一套完整的经济博弈理论,并且发挥了巨大经济效益。
2)经济学和博弈论的研究模式是一样的,这就是强调个人理性.也就是在给定的约束条件追求效用最大化。在这一点上,博弈论与经济学是完全一样的,使得博弈论分析方法在经济分析中发挥着重要作用。
3)传统经济学研究个人行为时,总是假设其外部环境是给定的。现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,这与博弈论研究内容相一致,所以,随着现代经济学的发展,博弈论显得更加重要。
4) 经济学越来越重视对信息的研究,特别是信息不对称对个人选择及
安排的影响。而博弈论不完全信息博弈模型正是解决这类问题的有效工具。
5) 博弈论和信息经济学专家获得了诺贝尔经济学奖,凸现了“博弈论”在主流经济学中日益重要的地位。
(4)博弈有哪几大要素,并解释几大要素的内涵?
答:规则:规定博弈各方的行动顺序、方式、以及最终的结果等。
局中人(Player, 选手,玩家):博弈参与人
战略:一整套的行动
,规定了各种情况下的行动。如人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人行为。
信息:在行动时所掌握的信息。
报酬(payoffs, 支付):博弈结束时,各方得到的收益。
(5)混合策略和不完全信息博弈联系与区别
答:共同点:博弈参与人不能够确切知道其他博弈参与人的选择行为,只知道选择行动的概率分布;不同点:前者的不确定性只是因为各博弈方为了不让其他博弈方占任何先机而必须故意随机选择行动,后者的不确定性源于其他博弈方的类型,即类型的不确定性,按照期望支付选择最优战略(纯战略)。
(6)战优均衡、重复剔除劣战略的战优均衡和纳什均衡相互之间的关系是什么?
答:几个均衡之间的关系如图:
在重复剔除的占优策略均衡中.最后剩下的惟一策略组合,一定是在重复剔除劣战略过程中无法被剔除的战略组合。因此,重复剔除的占优战略均衡也一定是纳什均衡。
(7)简述子博弈精练纳什均衡的理性要求
答:逆向归纳法理论要求的“所有参与人是理性的,并且要求参与人知道其后续参与人是理性的;参与人知道其后续参与人知道其后续参与人是理性的”,等等。上述理性要求大大高于静态博弈中的理性要求。在动态博弈中有时不能满足理性要求导致子博弈精炼纳什均衡不存在。
(8)信息经济学与博弈论不同点
答:信息经济学是非对称信息博弈论在经济学上的应用,非对称信息指的是某些参与人拥有但是另一些参与人不用有的信息。
1)博弈论是方法论导向的,而信息经济学是问题导向的。
2)博弈论研究目的:结定信息结构,均衡结果是什么;信息经济学研究的目的:给定信息结构,契约安排是什么。
3)博弈论研究方法涉及经济、军事、政治、日常生活等,信息经济学只研究经济领域方面的问题。
4)博弈论包括完全信息和不完全信息模型,而信息经济学重点研究非完全信息博弈问题。
(9)信息经济学的基本分类
答:信息的非对称性划分标准:非对称信息发生时间和非对称信息的内容。
按非对称信息发生时间分:
1)事前非对称:在签约之前存在的非对称信息。相应的研究问题为逆向选择问题,相应的模型为逆向选择模型。
2)事后非对称:在签约之后存在的非对称信息。相应的研究问题为道德风险问题,相应的模型为道德风险模型。
按非对称信息的内容划分:
1)隐藏行动:研究不可观测行动的模型
2) 隐藏知识(或称隐藏信息):研究不可观测知识的模型
一、下面哪些问题适用博弈来模型化∶
1、 石油输出国组织(OPEC)成员国选择其年产量;
2、 通用汽车公司向USX购买钢材;
3、 两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制;
4、 公司董事会为其总经理(CEO)设立一项期股安排;
5、 联合果品公司决定招募工人;
6、 一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。
问题1和3可以用博弈来模型化
二、博弈论与经济学的关系是什么?经济学的变化趋势是什么?
答:(1)博弈论与经济学的关系:
1、博弈论在经济学中的应用最广泛、最成功。
2、经济学家对博弈论的贡献越来越大。
3、经济学和博弈论研究的模式是一样的。经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。
(2)经济学发展的几个趋势
博弈论成为主流经济学的基石,反映了经济学发展的几个趋势∶
1、经济学研究的对象越来越转向个体。
2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。
3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。
三、博弈论的构成要素有哪些?
答:广义上讲博弈论则主要由以下五大要素构成:
一,决策主体(Player):又称局中人或博弈方,指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。
二,策略空间(Strategy space):又称策略集,是指供参与者选择的策略和行动空间。
三,效用(Utility):也就是博弈者之间相互争夺的利益。博弈双方或多方都是围绕一定利益展开的,因此博弈胜负的评判结果主要是靠策略选择后的得失来衡量。
四,次序(Orders):即各博弈方在决策时有先后之分,因为博弈方在决策选择上要不时地调整改善,一定要十分注重次序轻重的问题。如果决策的次序和实施时间不同,则博弈的结果必会有所差别。
五,博弈均衡:博弈虽然是为了利益和胜利,但并非是利益尽占,而是要遵循均衡理论。
四、二人博弈有何特点?
答:双人博弈(即有且只有两个参与人的博弈,称为双人博弈),有如下一些特点∶
1.两参与人之间的关系并不总是相互对抗的,有时会出现利益一致的情况;
2.信息多的一方不能保证得益也较多;
3.个人理性并不一定导致集体理性。
五、如何理解完全信息与不完全信息,完美信息与不完美信息?
答:(1)完全信息与不完全信息:
1、如果参与人完全了解所有参与人各种情况下的得益(支付函数),称此参与人具有完全信息。
2、如果参与人不完全了解其他参与人的得益,则该参与人具有不完全信息。
(2)完美信息与不完美信息
1、在动态博弈中,若参与人完全了解自己行动之前的整个博弈过程,称此参与人具有完美信息(完美回忆)。
2、若参与人不完全了解自己行动之前的整个博弈过程,则该参与人具有不完美信息。
六、如何理解静态博弈与动态博弈?
答:从行为的时间序列性,博弈论可分为两类:
静态博弈,是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;
动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
例如,"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
七、如何理解纳什均衡?占优均衡,反复剔除严格劣战略均衡与纳什均衡的关系。
答:(1)纳什均衡的直观意义
在n人参与的博弈中,给定其他参与人战略的条件下,每个参与人选择自己的最优战略,所有参与人选择的战略构成一个战略组合。所有参与人的最优战略构成的战略组合,称为纳什均衡。纳什均衡是完全信息静态博弈的解。
(2)纳什均衡的数学表达:
有n个参与人的战略表述博弈∶ G={S1,. . . ,Sn ;u1 ,. . . ,un } ,战略组合:
, 是一个纳什均衡,如果对于每一个i, 是给定其他参与人选择
的情况下第i个参与人的最优战略,即
(3)占优战略均衡、重复剔除占优均衡、纳什均衡的关系
1、每一个占优战略均衡、重复剔除占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除占优均衡。
因为构成纳什均衡的唯一条件是参与人对其他参与人均衡战略的最优选择。而占优战略均衡则要求它是对所有其他参与人的任何战略组合的最优选择,则自然它也是对所有其他参与人的某个特定的战略组合的最优选择。而重复剔除占优均衡则要求它是在重复剔除过程中剩下的唯一的战略组合。
2、纳什均衡一定是在重复剔除严格劣战略(不适合弱劣战略剔除)过程中没有被剔除掉的战略组合,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。
八、实际中如何分析预测博弈的结果。
答:实际中描述一个博弈至少必须包括:参与人,战略,支付。而行动与信息则是建筑
。参与人,行动的结果合起来称为博弈规则,建模者目的在于运用博弈的规则来确定均衡
一、什么是子博弈精炼纳什均衡?
答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。
二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?
答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。
三、纳什均衡和精炼纳什均衡存在哪些问题?
答:纳什均衡存在的问题:
(1)不是所有博弈都存在纳什均衡 如纯策略就不存在混合策略则一定会存在纳什均衡, 它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。
(2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。
精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。
四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?
答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取; 此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。
五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?
答:
博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。
六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?
答:不一定。例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。这种条件下,博弈无限次重复也不能提高一次性博弈的得益。
七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?
答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。所以,触发战略构成的均衡都是子博弈精炼纳什均衡。
八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?
答:冷酷战略也称为触发战略,这种战略做法是∶
1、参与人在博弈开始时均选择合作;
2、只要对方一直选择合作,则继续合作下去,但当某一时刻对方选择了不合作,则一直永远选择不合作来惩罚对方的背叛行为。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛。
最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略(相应的,违规者为了减少惩罚对自己的影响,而使自己得益最大的战略。
论述题:
1、 解释囚徒困境,并举商业案例说明。
(1) 假设条件举例
(2) 囚徒困境的策略矩阵表
(3) 分析
(4) 商业案例:
2.用小偷与守卫的博弈说明激励(监管)悖论
(1)假设条件举例
(2)小偷与门卫的支付矩阵表
(3)分析