为了正常的体验网站,请在浏览器设置里面开启Javascript功能!
首页 > 复杂网络上的演化博弈

复杂网络上的演化博弈

2011-11-08 14页 pdf 903KB 111阅读

用户头像

is_670683

暂无简介

举报
复杂网络上的演化博弈 第2卷第2期 2007年4月 智 能 CAAITransactions 系 统学报 onIntelligentSystems V01.2№.2 Apr.2007 王 复杂网络上的演化博弈 龙,伏 锋,陈小杰,王 靖,李卓政,谢广明,楚天广 (北京大学工学院,北京100871) 摘要:主要介绍了近年来复杂网络上的演化博弈研究现状和研究方向.复杂网络理论的发展为描述博弈关系提供 了系统且方便的框架,网络上的节点表示博弈个体,边代表与其邻居的博弈关系.介绍了经典演化博弈论中的演化 稳定策略概念和复制动力学方程,...
复杂网络上的演化博弈
第2卷第2期 2007年4月 智 能 CAAITransactions 系 统学报 onIntelligentSystems V01.2№.2 Apr.2007 王 复杂网络上的演化博弈 龙,伏 锋,陈小杰,王 靖,李卓政,谢广明,楚天广 (北京大学工学院,北京100871) 摘要:主要介绍了近年来复杂网络上的演化博弈研究现状和研究方向.复杂网络理论的发展为描述博弈关系提供 了系统且方便的框架,网络上的节点表示博弈个体,边代表与其邻居的博弈关系.介绍了经典演化博弈论中的演化 稳定策略概念和复制动力学方程,以及二者的相互联系.介绍了混合均匀有限人口中随机演化动力学问,并给出 了与确定复制方程的相互转化关系.介绍了小世界、无标度等复杂网络上演化博弈的研究结论,给出了复杂网络上 演化博弈论的未来发展方向. 关键词:演化博弈论;复制动力学;演化稳定策略;复杂网络;有限人口;合作 中图分类号:N949文献标识码:A文章编号:1673—4785(2007)02—0001—10 Evolutionarygamesoncomplexnetworks WANGLong,FUFeng,CHENXiao—jie,WANGJing,LIZhuo~zheng, XIEGuang—ming。CHUTian~guang (CollegeofEngineering,PekingUniversity,Beijing100871,China) Abstract:Inthissurvey,recentdevelopmentsandfuturedirectionsofevolutionarygamesoncomplexnet— worksarepresented.Thedevelopmentofcomplexnetworktheoryprovidesasystematicandconvenient frameworkfordescriptionofthedynamicalinteractionsofgames.Theverticesrepresentplayers,while theedgesdenotethelinksbetweenplayersintermsofgamedynamicalinteraction.First,someimportant conceptsofevolutionarilystablestrategyandreplicatordynamicsareintroduced,andtheconnectionbe— tweentheev01utionar订ystablestrategyandreplicatordynamicsisestablished.Then,thestochasticevolu— tionarydynamicsoffinitewell——mixedpopulationsandtheirrelationshiptothedeterministicreplicatordy—— namicsarepresented.Someresultsonfixedprobabilityandtimearealsogiven.Furthermore,somerecent resultsofevolutionarygamesoncomplexnetworkssuchassmall—·worldandscale—·freenetworksareintro—— duced.Finally,unresolvedopenproblems,futureresearchdirections,andpossibleapplicationareasfor evolutionarygamesoncomplexnetworksarepointedout. Keywords:evolutionarygame;replicatordynamics;evolutionarilystablestrategy;complexnetworks;fi— nitepopulations;cooperation 博弈论是研究依据其他参与者的效用(utility) 情况,理性参与者策略之问相互作用的一门科学Ⅲ. 博弈论的要素有两点:参与博弈者的目标或利益相 互冲突,且他们都是理性的.现代博弈论已成为一门 横跨数学、生物、心理学、计算机科学、运筹学、经济、 收稿日期:2006—12-18. 基金项目:国家自然科学基金资助项目(60674050,60528007);973 国家重点基础研究发展资助项目(2002CB312200); 863国家高技术研究发展计划资助项目(2006AA042258); “十一五”规划资助项目(A2120061303). 哲学、政治、军事战略等领域的交叉学科.公认的现 代博弈论起源于数学家VonNeumann和经济学家 Morgenstern的合著:博弈理论和经济行为[2].尽管 当时这本著作中的博弈论的理论框架只适用于一些 有限的特例,如只讨论了零和非合作博弈问题等,但 它第一次用数学语言描述和解决了博弈问题.此后, 经过许多学者的努力,特别是Nash在非合作博弈 理论中创造性地引入策略均衡的概念,博弈论日渐 成为非常重要且有用的工具[3].近十多年来,诺 万方数据 智能系统学报 第2卷 贝尔经济学奖先后授予研究博弈论的科学家Nash、 Selten、Harsanyi、Aumann、Schelling等人,说明博 弈论越来越得到更多人的重视,博弈论的威力也得 到越来越广泛的承认. 1 博弈论和复杂网络 所谓Nash均衡(Nashequilibrium)是指给定博 弈中其他个体(player)的策略时,任何一个个体都 不能单方面改变自己的策略来增加自己的收益 (payoff)的情形.换言之,在Nash均衡中,相对其他 个体,个体的所选策略已经是最佳的反应,此时 Nash均衡成为一致解的概念.但是,作为博弈一致 解的概念,在有些情况下Nash均衡并不是必要条 件而是充分条件.因此,博弈论的后Nash均衡时代 主要是针对博弈的假设和前提的重新修改和扩展. 其中最主要的2个分支:动态博弈和非完全信息博 弈.非完全信息(incompleteinformation)和非完美 信息(imperfectinformation)的区别在于:前者表示 博弈中的个体不精确地知道博弈收益的大小或其他 博弈个体的类型(type);后者表示博弈过程的信息 集合的元素个数超过一(即不知道博弈中其他个体 的行动(actions)).通过Harsanyi转换(Harsanyi transformation),可将“非完全信息博弈”转换成“完 全但非完美信息博弈”.在动态博弈中,个体决策的 时间(即行动的先后次序)将对博弈结果起作用.田 忌赛马就是动态博弈的例子之一.本文将介绍完全 信息下非合作博弈的基本概念和演化博弈理论.演 化博弈这一概念最初是由MaynardSmith和Price 在研究对称人口博弈时提出的[4],他们成功地把博 弈论应用到生物背景中去.其主要思想就是采用依 赖于接触频率的适应度(frequency-dependentfit— ness,对应于博弈论中的效用或收益)的策略更新方 法.近些年,演化博弈论不仅在理论生物学中得到充 分的发展,也在其他学科,如经济学、社会学、心理学 等得到广泛的应用. 近年来,由于复杂网络研究的兴起与发展,使得 人们对各种现实网络的结构演化、复杂性有了比较 清晰的认识.特别是1998年Cornell大学的Watts 和其导师Strogatz在Nature杂志上撰文给出了小 世界网络模型r5],复杂网络研究迅速引起了诸多领 域中科研工作者的兴趣,特别是物理学界、生物学 界,复杂网络理论得到了充分的探索和发展.1999 年美国NotreDame大学的Barabasi和其学生A卜 bert在Science杂志撰文指出[6],很多复杂网络的 度分布近似服从幂率分布,也就是常说的无标度网 络(scale—freenetworks),并给出了一个偏好连接 (preferentialattachment)的模型,简单探讨了这一 现象的内在机制.自20世纪60年代以来,随着匈牙 利数学家Erdos和Renyi的关于随机图论的论文的 发表,人们对真实世界网络的认识停留在随机网络 的认识水平上.Barabasi和AIbert的发现,改变了 以往人们对现实网络的认识,从而成为复杂网络研 究的催化剂.很多有关复杂网络的重要性质、组织规 律及其复杂网络上的动力学的研究论文相继发表, 特别是无标度网络上传染病的阈值问题、复杂网络 的层次性、结构性、自相似性等方面重要的结 果[7-1⋯.有关复杂网络研究的现状,读者可参考文 献[11—15],这里不再赘述. 复杂网络理论为描述博弈个体之间的博弈关系 提供了方便的系统框架.网络上的节点表示博弈个 体,边代表与其邻居的博弈关系.这样一来,就可以 利用复杂网络拓扑关系,来研究一些复杂的博弈关 系下的博弈.比如,以前的博弈理论中的混合均匀 (well—mixed)假设就可以看成是在全连通图上进行 的博弈.在空间二维格子(1attice)或一维格子(ring) 上博弈即可转化为规则网络上的博弈.然而,真实世 界的网络是异质的(heterogeneous),大部分节点的 邻居数目存在差异,甚至成幂率分布.因此,研究接 触网络(networkofcontacts)的异质性对其上的博 弈动力学的影响是非常有意义的. 在演化博弈研究中,一个重要的方向就是研究 理性的博弈者之间如何涌现出合作行为.比如,在囚 徒困境博弈(Prisoner'sDilemma)中,每个纯策略的 个体都有2种选择:合作(cooperation,C)与作弊 (defection,D).D策略个体利用C策略个体,获得 丁收益,而c获得s.双方都合作获得R,都作弊获 得P,其中T>R>P>S,2R>T4-S.在单轮博弈情 况下,无论对手采取何种策略,个体的最佳策略总是 作弊(defect).然而,在双方都采取合作(cooperate) 策略的情况下,二者总的收益才是最大的.这一现象 说明了社会两难(socialdilemma)问题的实质.当囚 徒困境博弈在2个个体之间进行多次时,每个个体 都可以根据上次博弈的结果选择进行下次博弈的策 略(即迭代囚徒困境博弈)(iteratedprisoner’Sdi— lemmagame).在20世纪70年代末的Axelrod锦 标赛(Axelrodtournament)中,英国数学家、生物学 家Rapoport提出的Tit—for~Tat(TFT)策略脱颖而 出,打败了其他策略.所谓TFT是一个偏向合作的 策略,第一步采取合作,然后重复其对手上一步的策 略.但是TFT在有环境干扰时表现并不好,此时 万方数据 第2期 王龙,等:复杂网络上的演化博弈 Pavlov策略就能打败TFT.Parlor策略是属于更一 般的Win—Stay—Lose—Shift(WSLS)策略类型. WSLS策略是指个体如果现在的策略获得的收益大 于某个期望水平(aspirationlevel),那么下一步就保 持这个策略不变,否则就切换到另外一个策略.在演 化博弈中使用较多的另外一个范例是雪堆博弈 (snowdriftgame).假设合作的收益为b,成本为 c(6>c),两个个体都选择合作则得到收益6一c/2, 如果都作弊则收益为0.合作者遇到作弊者,则收益 为6一c,作弊者则得到收益b.由于在雪堆博弈中, 选择合作总比选择作弊要好,Nash均衡为混合策略 (合作的频率为X+一(6一c)/(b—c/2).因此雪堆博 弈被广泛地用于研究生物之间的合作行为.TFT策 略和WSLS策略是建立合作和作弊策略基础上的 宏策略(meta—strategy).一般在博弈中只考虑最简 单的策略(合作或作弊),如果囚徒困境博弈在相同 的多个个体之间进行多次,其中个体可以通过记忆 或学习、或者对作弊者进行惩罚,那么在合适的内在 机制之下,合作行为将会涌现并逐渐占据优势.对合 作机制的研究,特别是在复杂网络上的演化博弈背 景中,是目前演化博弈研究的一个热点. . 2 演化稳定策略与复制动力学 演化稳定策略(evolutionarilystablestrategy, ESS)相关概念最早由英国学者MaynardSmith提 出[16].策略,是ESS,必须满足条件:如果几乎所有 的个体(population)都采取策略I,那么这些J策略 的个体的适应度要比任何可能的变异策略要大.否 则变异策略可以入侵种群并且_『将不稳定. 有了ESS的概念,就可以判断策略的稳定性。 由于经典博弈中最重要的概念是收益矩阵(payoff matrix)和收益,因此可以把经典博弈中的想法应用 到ESS中来.假设生物的适应度跟收益成正比(或 是收益的函数),或就等于收益,并且经典博弈中参 与者理性(rationality)选择的策略就对应于ESS.与 传统的Nash均衡相比,ESS这个概念要更加严格 一些,因此可用于平衡点选择.因为所有的ESS必 定是Nash均衡,但只有严格对称Nash均衡才是 ESS.值得一提的是,这里的ESS是一个“静态”的概 念,其假设只要求表现更好的策略具有更快的复制 (增长)速率,并不涉及具体的博弈动力学. 复制动力学(replicatordynamics)在1978年由 Taylor和Jonker引进[1“.其主要假设为给定的策 略类型的单位复制率丝正比于适应度之差: P_L—fitnessoftypei—averagefitness.(1) pi 复制动力学是关于博弈动力学(策略更新)的连 续确定性方程,从而可以赋予前面介绍的ESS这一 静态的概念以动力学含义.复制方程在不动点附近 的稳定性将对应于策略的稳定性(ESS).复制动力 学与演化稳定性的关系可以总结如下m1引: 1)ESS对应于吸引子; ’ 2)内部ESS对应于全局吸引子; 3)对势博弈(potentialgame)而言,某个不动点 是ESS当且仅当它是吸引子; 4)对2×2矩阵博弈而言,某个不动点是ESS 当且仅当它是吸引子. 3 有限人口上的演化博弈动力学 以往复制动力学及ESS的概念均假设人口为 无限且混合均匀.但更实际一点,往往需要考虑人口 非无限情形,此时演化动力学将受到有限人口因素 的影响而满足随机动力学基本性质(Markov过 程). 2004年Nowak等人在Nature上发表文章指 出在有限人口的情形下,采用依赖于频率的Moran 过程(birth—deathprocess),经典的ESS的判据需要 做修改,并提出了在弱选择下的“1/3规则”E20].假设 种群由N个混合均匀的策略为A或B的个体组 成,收益矩阵为 A B A 口 b B C d 假设有i个A策略的个体,那么策略A和B的适应 度分别为 ^一1~叫+叫[盘(i一1)+b(N—i)]/[N一1], g。一1~W+叫[d+d(N—i一1)]/[N一1]. (2) 这里适应度由个体原有的基线(baseline)1加 上通过博弈获得的收益经过加权得到.训∈E0,1], 表示自然选择的强度,即博弈收益对适应度贡献的 大小.在每一时间步长,按照正比于适应度的概率选 择一个个体进行复制,并替代一个随机选取的种群 中个体.A类型的个体可能增加一个,减少一个或保 持不变.因此Markov过程的转移矩阵为三对角矩 阵(tri—diagonalmatrix),矩阵元素为‰一再‰等,%一藉畿寿, ㈤^一1一万了可矿j。压Ⅳ’ ¨’ 万方数据 智能系统学报 第2卷 P。一l—Pi,升1一P。,l, 其他元素为零.这个随机过程具有2个吸收态(ab— sorbingstate)i一0和i—N.如果种群达到这2个吸 收态之一的话,系统将永远保持状态不变.以z:表 示种群从i个A个体开始演化到i—N终态的概 率,即固定概率(fixationprobability),那么有以下 关于5C:的递归方程(recursiveequation)嘞_2引: z。一P:,汁1z。+1+P。z。+P。一1zr_1,(4) 边界条件为z。一0和zN一1.方程的解由Karlin和 Taylor在1975年给出[2“: }1 i 1+∑Ⅱ笋 1—1k一1J k (5) 1+∑Ⅱ笋 j一1^一1J女 考虑单个A个体能入侵并占据所有的B个体的概 率: NI| pA—z,一1/(1+∑Ⅱ譬),(6) 、 ,一l^=1J々7 对于中立博弈(neutralgame)来说,此时w=0,zI一 1/N.若m>1/N,那么自然选择偏向于A取代B. 在有限人口N的情况下,B策略是ESS,记作 ESSN,如果以下条件满足[2⋯: 1)选择不利于A入侵B,这意味着B种群中的 一个变异A具有较低的适应度; 2)选择不利于A取代B,这意味着固定概率 pA标准
的Moran 更新过程,在N一。。时,人口演化的随机动力学将 对应于调整复制方程(adjustedreplicatorequation )或MaynardSmith形式的复制方程.如果采用对 比较(paircomparison)更新方式,在N一∞时,人口 演化的随机动力学形式上将对应于标准复制方程. 如果记5C—i/N,以p(x,£)表示人口在t时刻处于z 状态的概率密度,那么P(z,£)满足Fokker—Planck 方程(FPE)[25。26]: 刍(z,£)一一是[n(z)J0(z,£)]+ 专参[62(z)ID(川)]·(7) 式中: f rb卜万干溉“卜曲, 7"-b卜万下奇i孝q--x), a(z)一r(z)一TL(z), 6(z)一~/(1/N)[7-+(z)+r(z)], 使用Ito积分,式(7)FPE方程变成Langevin方程: 主一口(z)+6(z)∈, (8) 式中:£为非相关高斯噪声.在N一。。时,b(z)一o, 式(8)方程由随机微分方程变成了确定性的复制方 程.文献E26]推广了Nowak的有限人口时弱选择下 ESSN的充分条件:当Nw((1时,“i/3规则”是有效 的;对W固定且N》1时,传统的ESS判定条件成 立. 有限人口因素对人口策略演化的影响是当前研 究的一个热点问题.更详细的内容可以参考文献 [27—30]. 4 复杂网络上的演化博弈 上面所讨论的混合均匀的有限人口中的博弈动 力学,相当于在全连通图上的演化博弈问题.复杂网 络或图为描述博弈关系提供了方便的框架:顶点表 示博弈个体,边表示博弈关系.在每一时问步长,节 点与其所有邻居进行博弈,累积博弈获得的收益,然 后根据更新规则进行策略更新,如此这样重复迭代 下去.近年来,复杂网络上演化博弈问题,尤其是对 合作行为产生的机制的探索,引起了学术界广泛的 注意和兴趣口’33].尽管对合作行为提出了一些可行 的机制,但合作行为的本质和真正内在机理,仍然是 一个尚未解决的问题m_3⋯.复杂网络上的演化博弈 研究主要可分为2种:一种是研究网络拓扑对合作 的影响,主要是静态(static)网络的拓扑性质对合作 水平的影响;另外一种是网络拓扑和博弈动力学的 共演化(CO—evolution),主要是自适应(adaptive)网 万方数据 第2期 王龙,等:复杂网络上的演化博弈 · 5 · 络上博弈动力学,即网络拓扑调整受博弈动力学影 响. Nowak等人首先研究了空间二维格子上的囚 徒困境博弈,即每个博弈个体跟邻近的4个或8个 邻居进行博弈.在此基础上发现了美妙的空间混 沌[36--373,并发现了对于囚徒困境博弈,博弈个体的 空间分布会加强合作(spatialcooperation).但是, Hauert等人发现对于雪堆博弈,博弈个体的空间分 布结构往往会削弱合作水平[38。.Szab6等人利用平 均场(mean—field)、对估计(pair—approximation)等 方法,系统地研究了二维平面各种规则格子上的演 化博弈问题[3”41|. 由于社会网络具有小世界和无标度等特性,因 此研究拓扑特性对合作的影响是十分有意义的.小 世界网络上的空间纯策略博弈主要分为2类:一类 是基于环的小世界网络;另一类是基于方格的小世 界网络.Samos等人研究了同质(homogeneous)和 异质(heterogeneous)的小世界网络上的演化博弈 问题[42_44I.异质小世界网络是由规则网络演化而 来:由一个具有N个节点的环开始,环上每一个节 点与两侧各有Ⅲ条边相连.对每条边以概率P随机 进行重连(自我连接和重边除外).重连以后,如果保 持网络的平均度不变,此时的网络就为异质小世界 网络;而同质小世界网络也是由规则网络演化而来: 由一个具有N个节点、平均度为z的规则网络开 始,其边数为E—N·z/2.以概率P进行交叉换边 重连(同样避免重复连边).这样重连以后不改变节 点的度的网络就为同质的小世界网络(此时每个节 点的度相等,亦称之为规则随机图(regularrandom graph).对于上述2种小世界网络,当概率p一0时, 相应的网络为规则网络,而当概率P一1时,相应的 网络为随机网络.Santos等仿真了环型小世界网络 上的“弱”囚徒困境的博弈情形.他们发现平衡态时 异质小世界网络上的合作策略比例比同质小世界网 络上的要大.在异质小世界网络上,当概率P不断 增大时,平衡态时合作策略比例也不断增强n2“引. 而在同质小世界网络上,对于囚徒困境博弈,存在一 个临界作弊收益值b。,当6<6。时,随着概率P不断 增大,对应平衡态时合作反而不断降低;当b>b。 时,随着概率P不断增大,对应平衡态时合作不断 增强[42|.Ren[4目等发现在均匀小世界网络上,同时 也存在一个临界概率P。,当概率pP。时,平衡态时合 作水平反而不断降低.这说明P,为最优概率值,能 保证合作最强.大部分工作采取策略演化更新规则: ⋯一1 ,o、⋯≮一5, 1+exp[(M,~M。)/T]‘、“’ 式中:叫。+。表示节点z模仿邻居节点Y策略的概 率,腹、M。表示节点z、Y的累积收益,T表示节点 的理性程度.当T一0时,表示完全理性选择;当 T一。。时,表示完全随机选择.适当的T也可以加强 合作,即存在一个最优的能使博弈合作程度达到最 强‘4引. 7 Szab6等人也研究了方格小世界网络上的带有 loner的囚徒困境博弈问题(即带有志愿者参加 (volunteeringparticipation)的囚徒困境博弈),发现 重连概率大于一定的阈值时,相图会发生振荡[47|. 有趣的是,若分别用优先选择邻居和随机选择邻居 的演化规则,在方格小世界上会发现优先选择邻居 能促进合作[48_4⋯.Tomassini等仿真研究了方格小 世界网络上的鹰鸽博弈(hawk—dovegame,数学上 等价于前面所提到的雪堆博弈),发现平衡态的合作 与演化规则、收益比(gain-to—cost)r以及重连概率 P相关‘5⋯. Santos和Pacheco等采用同步更新的策略模仿 (strategyimitation)更新方法对无标度网络上的空 间纯策略博弈行为进行了较系统的研究[43’51-53|,发 现与规则网络、随机网络相比,无标度网络更有利于 合作行为的产生.因此网络拓扑的异质性(度分布为 幂率分布)是提升合作水平的一个重要因素.Ren等 采用“优先学习”方法,即优先选择邻居来进行模仿 演化,数值仿真显示平衡态时合作水平得到加 强[5“.类似于亲缘选择中的合作判据Hamilton规 则[55|,Ohtsuki等人发现在网络上合作行为产生的 一个充分性判据:b/c>k,其中b、c分别为合作行为 的收益和代价,k为网络的平均度[5引.这一合作行为 简单判定规则适用于二维格子、随机网络和无标度 社会网络.考虑在网络上的人侵和固定动力学(dy— namicsofinvasionandfixation),即一个变异A入 侵种群B的固定概率,Antal等人发现在度不相关 无标度网络上的一个变异的固定概率跟它发生的节 点的度相关,且发现对投票模型(votermodel),固 定概率正比于度,对生灭(birth—death)过程,固定概 率反比于度[57I.除了网络的异质性对合作行为有影 响外,网络的平均度也是影响合作涌现的重要因素 之一.文献E58]研究了随机图、小世界、无标度3种 网络中平均度对合作水平的影响,发现对于每种网 络均存在适当的平均度使得合作水平最优. 另一方面,博弈动力学与网络拓扑共演化的问 题也得到一些关注和研究.网络拓扑影响博弈结果, 而博弈结果反过来作用于网络拓扑,调整网络拓扑 万方数据 智能系统学报 第2卷 (或社会关系),这种情形更符合实际.Zimmermann 等人认为个体可以依据博弈结果调整与邻居的边来 实现合作者与合作者之间的联合,从而有利于合作 行为的涌现和维持口9_6⋯.Santos等人考虑了网络拓 扑调整与博弈演化之间的时问尺度的关系,并假设 不满意博弈结果的节点以一定概率断开与邻居中作 弊者的边,并随机重连到作弊者的邻居,发现存在时 间尺度之比的临界值,一旦超过这个临界值,合作将 会占上风[6“.Pacheco等人考虑了简化的情形,提出 了活跃连接(activelinking)的假设,在一定条件下, 自然选择将偏向于合作凹2I.目前文献中关于这方面 的结果比较少,但这个问题又为大家所关注,因此这 个问题将是今后研究的一个重点. 5 演化囚徒困境博弈中的合作涌现 真实社会的网络拓扑除了具有小世界、无标度 等性质外,还具有社团结构(communitystructure) 这一重要的性质.社团结构是指整个网络是由若干 个“群(group)”或“团(cluster)”构成的.每个群内部 的节点之间的连接相对比较紧密,但是各个群之间 的连接却比较稀疏.因此,研究社团结构对合作水平 的影响是很有意义的.笔者研究了具有社团结构的 无标度网络上的囚徒困境博弈问题[63|.不失囚徒困 境博弈的一般特性,博弈矩阵M取为嘞1 M一(::). 。㈣, 式中:lP,,则以概率 眠,~,一≮≥. Ⅲ,】 )hb 采用节点y所用的策略S,,其中b为节点z和y的 度中的较大值.初始时刻,合作者与作弊者等比例随 机分布在网络顶点上.系统演化10000时间步长 后,再取1000步时间步长上合作者比例的平均数, 得到平衡态时合作者的比例.每个数据点对应于40 次不同的网络实现和初始分布条件下合作者比例的 平均值.图1显示了相同网络规模,但不同平均度 m+咒及不同社团内外连接数之比m/n时的合作频 率对参数b的变化情况.可以发现,在具有社团结构 无标度网络上,随着平均度m+n的增加,合作水平 也相应地减小.同时,在保持平均度m+理不变,改 变内外连接数之比m/n时,合作水平随着m/n减小 而降低.另外,在没有外部连接时(对应于行一0),合 作水平总是最优的.此时对应于3个Barabasi—A1一 bert(BA)无标度网络,而无标度网络是利于合作的 涌现的[51I,因此此时合作水平最高.随着外部连接 数的增加、内部连接的较少,网络结构中的一些hub (网络中度较大的节点)并不直接相连,并且网络中 回路(100p)减少了,这些因素影响了合作水平[63|. 1.0 0.9 0.8 0.7 0.6 O.5 0.4 髓 骚 薷1.o 0.8 0.6 0.4 0.2 0 b (a) 囚徒困境博弈 1.2 1.6 2.0 b (c) 1.0 0.8 0.6 0.4 0.2 0 1.2 1.6 2.0 b (d) 图1对应于不l司m+n与m/”时合作频率 对参数的变化情况 Fig.1FrequencyofcooperatorsVS.6correspondingtO differentm+”andm/n 文献[51—53]指出复杂网络的异质性是影响合 作水平的重要因素.但复杂网络的异质程度大小会 对合作水平产生什么影响呢?考虑了异质New— man—Watts小世界网络上的演化囚徒困境博弈问 题[6“.与Watts—Strogatz小世界模型中断边重连机 制不同[5],本文采用改进的Newman—Watts小世界 模型,即在低维规则环上添加m条长程边形成小世 界网络.首先随机地从N个节点中选出N。个节点 一≮、、『婿\一一≮¨N一 -/.、. 习 、¨\部一 『 ~弋. 嘉 百 卅、 乙_: 1 ■气 == 一 ■一 历M 一,。 州 焉 t 万方数据 第2期 王龙,等:复杂网络上的演化博弈 图2对应于不同参数b时合作水平随看 网络异质程度N。/N的变化情况 Fig.2FrequencyofcooperatorsVS.N^/N correspondingtOdifferent6 作为hub.然后使添加的长程边至少保证每条边一 个端点随机地与选出的M个hub中的一个相连, 另一个端点则随机地与N个节点中的一个相连(避 免自连和重边).可以看出,参数N。/N可反映拓扑 异质性的大小.N。/N一1时,网络退化到一般均质 小世界的情形,而N。/N一1/N对应网络最异质的 情形,即所有的长程边都与唯一的hub相连.博弈 矩阵采用式(10),更新规则采用式(11).网络节点规 模N一2001,长程边数m一1000.所有的数据点对 于i00次运行取平均,即10次网络拓扑实现对应于 10次不同的初始条件分布.初始时刻,合作者和作 弊者等比例随机分布在网络上,在经过10000步演 化后,再取2000步结果作平均,作为平衡时合作者 的比例.图2给出了对应于不同参数b合作水平随 着网络异质程度N。/N的变化情况.可以发现,对 于固定的b,总存在适当的网络异质程度N。/N,使 得合作水平最高.也就是说,合作水平在N。/N取 某个值时达到最大值,此时网络的异质程度既不是 最大的也不是最小的.图3显示了合作水平在参数 空间(6,N。/N)中变化情况.合作水平的大小由右 边的色带标记.同样地,可以发现,对于固定的b,合 作水平在N。/N≈0.01时达到最优.另外,在更新 规则使用节点的平均收益,而不是累积收益时,会削 弱网络异质性对合作水平的影响[65|. 6 结论与展望 复杂网络上的演化博弈研究是近年来随着复杂 网络研究兴起而逐渐引起关注的一个重要研究课 题.目前大部分工作都集中在囚徒困境博弈或雪堆 博弈研究上,其他类型的博弈还缺乏系统的研究.因 此有必要进一步考虑多人博弈的情形,如公用品博 弈(publicgoodsgame)或者多策略的博弈,如石 图3合作水平在参数空间(6,Nh/N)中的变化情况 Fig.3Frequencyofcooperatorsasafunction ofparameterspace 头一剪刀一布(rock—scissors—paper)博弈.近来一些 文献开始关注这些问题,也得到了一些有趣的结 果‘66 68|. 目前很多工作只是一些数值仿真结果,由于数 学工具的不足,对复杂网络上的博弈动力学进行解 析分析是非常困难的,目前的一些近似方法,如平均 场方法、对估计方法在异质程度很大的网络很有可 能失效.因此寻求有效的数学工具,探求更好的理论 结果,将一些数值结果命题化、严格化,将是十分有 意义的. 在演化网络上的博弈动力学还没有得到充分的 研究.研究网络拓扑和博弈动力学共演化将是一个 非常有前景的方向.另外,还可以对个体的学习、记 忆等能力上进行更为合理的描述,使得模型能更好 地反应现实,解决一些社会、经济中的公开问题.对 合作机制的研究,目前还没有统一的认识,依然是演 化博弈研究中的一个重要方向.当前演化博弈主要 集中在合作行为的研究上[6⋯,除了考虑可能的内在 合作机制外,还可以考虑复杂网络上的其他动力学 行为,应用演化博弈的思想,解决一些实际问题,如 在“路由问题”、“传染病传播问题”、“生物进化”、“最 优控制”[70|、“市场经济行为规律”等问题上做 进一步的探索将是十分有意义的. 近年来有关复杂系统和复杂性科学的研究蓬勃 发展[7卜76|,这对人们原先的还原论的认识带来革命 性的新思潮.物理学家Hawking说:21世纪将是复 杂性科学的世纪.复杂网络上的演化博弈研究,对当 前国际上关注研究的多智能体(multi—agent)协作、 群体行为(collectivebehavior)控制等热点问题,也 将带来新的视角和方法[77—84|.总之,复杂网络上的 演化博弈可作为研究复杂系统、复杂性科学一个可行 的切入点,并将会在生态演化、神经网络、群体智能、 万方数据 ·8· 智能系统学报 第2卷 认知科学、自组织涌现行为、网络化系统(networked systems)、经济动力学等研究中彰显它的作用. 参考文献: F1]ROSSD.Gametheory[EB/OL].StanfordEncyclopedia ofPhilosophy:http://plato.stanford.edu/entries/game- theory/。2006——03——10. EelVONNEUMANNJ,MORGENSTERNO.Thetheory ofgamesandeconomicbehavior:2ndedEM].Princeton: PrincetonUniversityPress,1947. [3]NASHJ.Equilibriumpointsinn-persongames[J].Proc NatlAcadSci(USA),1950,36:48—49. [4]SMITHJ M,PRICEGR.Thelogicofanimalconflict [J].Nature,1973,246(5427):15—18. [5]wATTSDJ,STROGATZSH.Collectivedynamicsof sman~world’networks[J].Nature,1998,393(6684): 440—442. [6]BARABAsIAL,ALBERTREmergenceofscalinginran— doranetworks[J].Science,1999,286(5439):509--512. E7]PASTOR-SATORRASR,VESPIGNANIA.Epidemic spreadinginscale-freenetworks[J].PhysRevLett, 2000,86(14):3200—3203. [8]RAVASZE,BARABASIAL.Hierarchicalorganization incomplexnetworks[EB/OL].arXiv:cond—mat/ 0206130. [9]RAVAszE,SOMERAAL,MONGRUDA,OLTVAI ZN,BARABASIAL.Hierarchicalorganizationof modularityinmetabolicnetworks[J].Science,2002,297 (5596):1551—1555. [10]SONGC,HAVLINS,MAKSEHASelf-similarityof complexnetworks[]3.Nature,2005,433(7024):392--395. r11]ALBERTR,BARABASIAL.Statisticalmechanicsof complexnetworks[J].RevModPhys,2002,74(1):47 —97. 1-12]STROGATZSH.Exploringcomplexnetworks[J]. Nature,2001,410(6825):268—276. F13]WANGXF,CHENGR.Complexnetworks:small— world,scale-freeandbeyond[J].IEEECirSysMag, 2003,3(1):6—20. [14]NEWMANMEJ.Thestructureandfunctionofcorn- plexnetworks[J].SIAMReview,2003,45(2):167— 256. [153BOCCALETTIS,LATORAV,MORENOY,eta1. Complexnetworks:structureanddynamics[J].Phys— icsReports,2006,424:175~308. [16]SMITHJ M.Evolutionandthetheoryofgames[M]. Cambridge:CambridgeUniversityPress,1982. [17]TAYLORPD,JONKERL.Gamedynamicsandevolu— tionarystablestrategies[J].MathematicalBiosciences, 1978,40:145—156. [183HOFBAUERJ,SIGMUNDK.Evolutionarygamesand populationdynamics[M].Cambridge:CambridgeUni— versityPress,1998. [19]HOFBAUERJ,SIGMUNDK.Evolutionarygamedy— namics[J].BullAmMathSoc,2003,10(4):479— 519. [20]N0wAKMA,SASAKIA,TAYLORC,FUDEN— BERGD.Emergenceofcooperationandevolutionary stabilityinfinitepopulations[刀.Nature,2004,428 (6983):646—650. [21]TAYLORC,FUDENBERGD,SASAKIAKIRA, eta1.Evolutionarygamedynamicsinfinitepopulations [J].BullMathBio,2004,66:1621—1644. [22]ANTALT,SCHEURINGI.Fixationofstrategiesfor anevolutionarygameinfinitepopulations[J].Bull MathBio,2006,68(8):1522—1906. [23]KARLINS,TAYLORHM.Afirstcourseinstochas— ticprocess:2ndedEM].London:AcademicPress, 1975. [24]TAYI,ORC,IWASAY,NOWAKMA.Asymmetry offixationtimesinevolutionarydynamicsI-J].Journal ofTheoBio,2006,243:245—251. E25]TRAULSENA,cLAUssENJC,HAUERTC.Coev— olutionarydynamics:fromfinitetoinfinitepopulations [J].PhysRevLett,2005,95(23):238701. [26]TRAULSENA,PACHECOJ M,IMHOFLA.Sto— chasticityandevolutionarystability[J].PhysRevE, 2006,74:021905. [27]CLAUSSENJC,TRAULSENA.Non-Gaussianflue— tuationsarisingfromfinitepopulations:exactresults fortheevolutionaryMoranprocess[J].PhysRevE, 2005,71:025101. [283TRAULSENA,CLAUSSENJC,HAuERTC.Coev— olutionarydynamicsinlarge,butfinitepopulations[J]. PhysRevE,2006,74:011901. [29]TRAUSLENA,NOWAKMA,PACHECOJ M.Sto— chasticdynamicsofinvasionandfixation[J].PhysRev E,2006,74:021905. r30]FORSTERR,ADAMIC,WILKECO.Selectionfor mutationalrobustnessinfinitepopulations[J].Journal ofTheoBio,2006,243:181—190. E31]SZABOG,FATHG.Evolutionarygamesongraphs [EB/OL].arXiv:cond-mat/0607344. [32]DOEBELIM,HAUERTC.Modelsofcooperation basedonthePrisonersDilemmaandtheSnowdrift game[J].EcologyLetters,2005(8):748—766. [33]NOWAKMA,SIGMUNDK.Evolutionarydynamics ofbiologicalgames[J3.Science,2004,303:793—799. [34]PENNIsIE.Howdidcooperativebehaviorevolve? 万方数据 第2期 王龙,等:复杂网络上的演化博弈 · 9 · [J].Science,2005(309):93. [35]COLMANAM.Thepuzzleofcooperation[J].Nature, 2006,440:744—745. [36]NOWAKMA,MAYRM.Evolutionarygamesand spatialchaos[J].Nature,1992,359:826—829. [37]NOWAKMA,MAYRM.Thespatialdilemmasofe— volution[J].InternationalJournalofBifurcationand Chaos,1993,3(1>:35—78, [381HAUERTc,DOEBELIM.Spatialstructureoftenin— hibitstheevolutionofcooperationinthesnowdrift game[J].Nature,2004,428:643—646. [39]SZABOG,TOKEC.Evolutionaryprisoner7sdilemma onasquarelattice[J].PhysRevE,1998,58:69~73. [40]VUKOVJ,SZABOG,SZOLNOKIA.Cooperationin thenoisycase:Prisoner’sdilemmagameontwotypes ofregularrandomgraphs[J].PhysRevE,2006,73: 067103. r41]SZABOG,HAUERTC.Phasetransitionsandvolun— teeringinspatialPublicGoodsGames[J].PhysRev Lett,2002,89:118101. r42]SANTOSFC,RODRIGUESJF,PACHECOJ M. Epidemicspreadingandcooperationdynamicsonhomo— geneoussmall—worldnetworks[J].PhysRevE,2005, 72:056128. [43]SANTOSFC,PACHECO.Anewroutetotheevolu— tionofcooperation[J].JournalofEvolBio,2006,19 (3):726—733. [44]PACHECOJ M,SANTOSFC.Networkdependence ofthedilemmasofcooperation[A].Scienceofcomplex networks:frombiologytotheinternetandWWW. AlPConferenceProceedings[c].AIP,2005. [45]ABRAMSONG,KUPERMANM.Socialgamesina socialnetwork[J].PhysRevE,2001,63:030901. [46]RENJ,WANGWX,QIF.Randomnessenhancesco— operation:c
/
本文档为【复杂网络上的演化博弈】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索