Electronic Sci. & Tech. /Dec. 15,2017
图像•编码与软件
doi:10. 16180/j. cnki. issnl007 -7820. 2017. 12. 029
基于LabVEW的复杂网络演化博弈实验软件
刘海洋,刘歌群,任宁春,张嘉楠
(上海理工大学光电信息与计算机工程学院,上海200093)
摘要复杂网络演化博弈能够揭示丰富的物理现象和规律,复杂网络演化博弈实验软件对于演化博弈过程的理
解和认知具有重要作用。目前对网络演化博弈进行可视化的软件并不多见,因此文中基于LJVIEW开发了一种演示网 络演化博弈过程的实验软件。软件在LJVIEW开发环境下,规划人机交互界面,实现软件流程。软件的输入包含了网 络模型、博弈模型和策略更新规则,对节点策略、节点收益以及网络合作频率进行动态显示。可以对众多网络演化博弈 过程进行演示,并文中给出了软件运行结果。
关键词复杂网络;实验软件;演化博弈;LJVIEW
中图分类号TP311.5 文献标识码 A 文章编号1007 -7820(2017)12 -109 -05
Experimental Software Developed with Lab VIEW for Evolutionary Games onNetworks
LIU Haiyang,LIU Gequn,REN Ningchun,ZHANG Jianan
(School of Optical -
Electrical
and
Computer
Engineering \"University
of
Shanghai for
Shanghai 200093,China)
Evoliutionary games on complex net\"worlcs can reveal abundant physical phenomena and lws
Scie
Abstract
. Experi
mental soft'ware for net\"wor!ced evoliutionary games plays an important role in the understanding and cognition of evoliu- tionary game process. Because the visualized software for the networked evolutionary games are rare,so we developeda software with LabVIEW to display the process of networked evolution games. In the LabYIEW development environment, we designed the human
- machine interface and programmed the soft'ware process. The
cludes the network model,the game model and the strategy update rules. The soft'ware can dynamically show the
types of networks. At
the
end of this
paper,the software
input o
nodes strategy,the nodes gains and the networks’ cooperation frequency. The soft'ware can demonstrate the process of lots of evolutionary games on several
runnin
Keywords
complex networks # experimental software # evolutionary games # LabYIEW
随着博弈论的广泛应用,博弈个体之间的关系变得 越来越复杂,博弈结果的形成过程也引起了学者们的关 注,因而诞生了网络演化博弈论。在网络演化博弈理论 中,将网络上的节点看作博弈个体,边代表博弈关系,博 弈个体随着时间演化,不断地与其邻居进行博弈并更新 其策略[1]。网络演化博弈理论为复杂网络上的交互行 为提供了强有力的解释和恰当的模型,近些年引起了学 术界广泛的关注和兴趣。在对网络演化博弈理论的学 习中,理解网络上博弈和演化的过程至关重要。目前进行网络演化博弈仿真分析,主要使用M
a
lab[2]、Repast[3]和Netlogo[4]等软件。但是能够直观展
示各方博弈策略及其演化过程的专用软件包尚不多 见,因此提供一种对网络演化博弈过程进行可视化的 专用软件已成为一种需要。
本文设计开发了基于LabYIEW的网络演化博弈 实验软件,对网络演化博弈过程中节点收益、节点策略 以及网络合作频率的变化进行可视化,从而可以帮助 实验者更好的理解和掌握网络演化博弈的理论知识。1
网络演化博弈简述
博弈论为解释自私个体间的交互行为提供了强有
收稿日期:2017-01-17
基金项目:沪江基金(C14002);上海理工大学光电信息与计算 机工程学院教师创新能力建设项目(GDCX - Y - 1212);上海市 大学生创新创业训练计划项目(SH2016030)作者简介:刘海洋(1993 -),男,硕士研究生。研究方向:复杂 网络。刘歌群(1974 -),男,博士后。研究方向:复杂网络与计 算机控制。
力的理论框架[5],从而得到了快速发展和广泛应用。 在传统博弈论的基础上,演化博弈论进行了补充和完 善,结合生物演化理论,揭示了个体间的自私行为和群 体广泛的合作行为之间的内在统一。而以复杂网络为 框架进行演化博弈称为网络演化博弈。
www. dianzikeji. arg
109
图像•编码与软件刘海洋,等\"基于LabVIEh的复杂网络演化博弈实验软件
1.1博弈论
博弈是指参加斗争或竞争的各方为了达到各自的 目标和利益选取对自己最为有利或最为合理的方 案[6],日常生活中的下棋、打牌和著名的囚徒困境
等都是博弈。一个完整的博弈应当包括以下几方面的 内容:(1)博弈的参与者,即博弈中独立决策、独立承 担后果的个人或组织,又称为局中人;(2 $博弈个体的 策略,即每个局中人可选择的全部行为;(3)博弈信 息,即博弈者所掌握的对选择策略有帮助的情报资料;(4)博弈的次序,即局中人做出策略选择的先后;(6) 博弈收益,即博弈方做出决策后的所得与所失。
在博弈过程中每个局中人在选择博弈策略时必须 考虑其他局中人的策略,与此同时每个局中人的博弈 收益还依赖于其他个体所采用的策略。博弈论就是研 究博弈中是否存在着最合理的行为方案,以及如何找 到这个合理的行为方案的数学理论和方法。博弈论对 简单博弈最直观的表述就是将博弈用收益矩阵来描 述,这种表述形式又称为矩阵表述。一个典型的矩阵 表述举例如图1所示。
机制来模拟局中人的学习和决策过程,最终目标是寻 找促进合作行为涌现的动态机制。目前,支持合作行 为产生的机制大体有:亲缘选择,直接互惠,间接互惠, 网络互惠以及群体选择°]。亲缘互惠是指具有亲缘 关系的个体之间的合作关系,例如:当地震来临时,父 母会奋不顾身的保护子女。直接互惠通常指朋友间相 互帮助,这种相互帮助会促进合作的涌现,例如重复对 手的策略就是直接互惠。间接互惠则发生在陌生人之 间,倾向合作的个体拥有较高的声誉,同时可以得到别 人的合作。网络互惠主要指描述个体联系的网络的结 构对于合作涌现具有影响。群体选择指多个群体之间 虽然是斗争的,但是作为一个整体时它们之间却是合 作的,一个形象的例子就是公司内部的各个部门之间。
1.3网络演化博弈论
以复杂网络为框架进行演化博弈研究的理论称为 网络演化博弈论。在演化博弈论中,通常假设所有个 体是相同的,相互之间均勻混合,即群体中任意两个个 体等可能地进行博弈[11]。而现实世界中,种群的个体 通常不能与所有的个体相互接触,他们之间存在复杂 且不均勻的相互关系。复杂网络理论的飞速发展,为 这种复杂且不均勻的相互关系提供了描述框架:网络 中的节点表示博弈个体,边代表博弈关系。
图1 博弈的矩阵表述
局中人在复杂网络上随着时间的演化和他的邻居 进行博弈称为网络演化博弈,通常用U “ = 1,2,…,:表 示第G个局中人;用0 ] I <1,<2,…, 1表示局中人U 米取的策略集合;5 ] (51,5,…,表示:个局中人米 取的策略在策略空间的一个策略组合,其中5 *0;用3 (5表示此策略集合下第G个局中人的收益。这样一个 演化博弈表述为051,5,…,5:;31,3!,…,3:1。
复杂网络演化博弈具有3个要素:博弈模型、策略 更新规则以及网络模型。博弈模型包含经典博弈论中 的博弈模型等,比如囚徒困境、雪堆模型和猎鹿模型 等;网络模型则包含各式复杂网络模型:随机网络或小 世界网络等。而策略更新规则的选取对于网络演化博 弈至关重要,目前主要有如下几种更新规则:模仿收益 最大的邻居策略,即个体确定性的选择收益最大的邻 居策略作为自己下一轮博弈的策略[12];按概率选择优 胜邻居的策略,即考虑收益高于自己的所有邻居,按正 比于其收益的概率选择其策略[13];配对比较个体随机 选择某个邻居进行收益比较,以某个概率转变为对方 的策略[14]。2
网络演化博弈实验软件设计
B2Bi B2局中人
图中,博弈局中人分别为U,U。局中人U可以选 择的策略有:1i,1;局中人U可以选择的策略有:4, 4!,4%。矩阵中兀素^_表示局中人&和^.对于策略
组合($的收益组合。1.2
经典博弈论和演化博弈论
经典博弈论在局中人是完全理性的情况下研究博
弈的均衡问题,而对均衡的解释为在均衡状态下没有 个体可以通过单方面改变自己的策略而增加收益。但 是经典博弈论存在一些缺陷:首先,“完全理性”观点 认为局中人总是选择使自己利益最大化的策略,在复 杂环境下,局中人很难获取全部信息,因此局中人“完 全理性”的观点是不切实际的;其次,经典博弈论虽给 出了均衡解释,但并没有给出均衡的形成过程[8]。
演化博弈论借鉴生物进化理论对经典博弈论进行 了完善。演化博弈论使用“有限理性”观点代替了经 典博弈论中的“完全理性”观点。有限理性结合适者 生存的概念,认为局中人通常是在掌握有限信息的情 况下,以优化自己的收益为目标选择策略,与此同时借 鉴生物种群的进化和稳定机制,模拟均衡的动态实现 过程。因此,演化博弈被广泛地用于研究各式各样的 合作现象[9]。
演化博弈论的关键是如何在具体情况下构造动态
为了直观演示网络演化博弈的演化过程,本文所
介绍的网络演化博弈实验软件在LabVIEW开发环境
110
www. dianzikeji. org
刘海洋,等\"基于LabVIEW的复杂网絡演化博弈实验软件图像•编码与软件
下开发。为体现软件控件的关联性,如图!所示,将实 验软件的前面板分为参数设置区、博弈演示区以及数 据显示区。
根据网络演化博弈条件,设计参数设置区包含复 杂网络演化博弈3个要素和博弈轮数。为了充分演示 复杂网络演化博弈过程,设计博弈演示区包含网络拓 扑结构以及节点策略进行。同时设计数据显示区包括 了本轮收益数组、累积收益数组以及合作频率图表,以 显示博弈过程中网络和节点统计信息的变化。
组合控件形式,集中在参数设置区。其中网络模型的
设置采用按钮的形式,点击按钮进人相应子VI进行对 应网络的设置。可设置的网络模型不仅包含了常见的 BA无标度网络、WS小世界网络和ER随机网络,还设 计了自定义网络按钮以满足实验者的特定需求。对称 博弈模型的设置则采用二维矩阵的形式。策略更新规 则的设置采用组合框的形式,包含了两个比较常见的 更新规则:模仿最优更新和随机更新规则。此外,参数 设置阶段还包含了博弈演示区节点策略的设置。节点 策略设置以布尔控件实现,灰色表示合作,黑色表示 背叛;
(2)博弈计算阶段。博弈计算阶段根据网络拓扑 结构,对有博弈关系的节点进行两两博弈收益的计算, 再通过循环嵌套完成所有博弈关系的本轮收益计算, 如图4所示。图中邻接矩阵变量为网络的邻接矩阵, 策略数组和本轮收益变量分别为19个策略和本轮收 益,按节点编号组成两个1维数组。
图2前面板以及网络拓扑结构图生成
复杂网络演化博弈实验软件以网络演化博弈相关 理论为依据,设计了以下功能性步骤:软件启动后的初 始化状态;参数设置环节;演化博弈过程中的实时动态 演示和数据更新;一次完整的演化博弈实验结束后的 状态返回。
为使软件具有更好的可读性和拓展性,演化博弈 过程分为博弈计算、策略更新以及效果显示3个子过
程。博弈计算过程进行博弈的本轮收益计算。策略更 新计算过程则根据策略更新规则进行策略的更新计 算。效果显示过程对本轮收益、总体收益和策略进行 更新。软件运行流程如图3所示。
图4博弈计算阶段程序图
如图4所示,两两博弈的博弈收益计算使用“二维 索引数组控件”实现。该控件的数组接线端连接博弈 模型数组,行和列的索引接线端都连接代表节点策略 的〇或1常量。例如:行接线端连接的节点策略为合 作,列接线端连接的节点策略为背叛,策略转化的常量 为(1,〇),对应数组第二行第一列的数,即行接线端节 点的本次博弈收益。
由于某一节点的本轮收益是与其相关的所有两两 博弈收益的累加,因此在进行新的两两博弈后,需要在 本轮收益数组中对代表该节点的本轮收益进行更新。
在LabVIEh中,使用“替换数组子集控件”实现这种对 数组元素的更新。替换数组子集控件的数组连线端连 接“本轮收益数组”,索引连线端为节点编号,子集连 线端则连接求和后的节点本轮收益。
所有连边关系上的博弈计算,通过多重循环结构 对邻接矩阵的行和列进行遍历实现。在循环过程中, 上轮循环得到的结果作为下轮循环的输人,如图4使 用“移位寄存器”的数据处理方式。移位寄存器可实 现程序语言中的静态局部变量,从而实现随着每次循 环体的执行而累加;
软件流程的几个主要环节为初始化、参数设置、博 弈计算、策略更新计算和效果显示。
(1)初始化及参数设置阶段。初始化阶段进行前 面板按钮状态和数据的初始化。参数设置相关控件以
www. dianzikeji. org
111
图像•编码与软件刘海洋,等\"基于LJVIEW的复杂网絡演化博弈实验软件
(3)策略更新计算阶段。博弈计算阶段完成后进 人策略更新阶段,策略更新阶段根据选定的规则对博 弈策略进行更新。
如图6所示,使用条件结构判断所选定的策略更 新规则,在条件结构中使用循环嵌套计算出每个节点 更新后的策略。图6中显示的是模仿最优策略更新规 则,即节点将邻居中本轮收益最高节点的策略作为自 己的策略。在更新过程中,使用移位寄存器进行循环 结构中节点策略数组的更新。
收益数组以及博弈演示区域的节点策略都在不断更 新,合作频率图表中绘制网络中节点策略的合作频率
并不断延伸。
图6策略更新计算阶段程序图
(4)效果显示阶段。该阶段将对前面板上的数据 进行更新,其中包括节点策略,节点本轮收益数组、节 点累积收益数组和网络的合作频率图表。根据策略更 新阶段计算获得的策略,对界面上的节点策略显示颜 色进行更新。合作频率经计算后以图表形式显示,图 表横坐标表示博弈的轮数,纵坐标代表合作频率。图 表形式有助于更加直观地了解网络演化博弈的统计 特性。3
软件运行实例
(d)二维格子网络
图7合作频率
在第1!轮博弈后点击结束按钮,得到合作频率
图。对4种不同的网络分别进行实验,得到4个合作 频率图如图7所示,可以发现,随着博弈轮数的增加, 合作频率最终趋于稳定。不同网络下合作频率变化不 尽相同,体现了不同复杂网络模型对于网络合作频率 的影响不同,这符合基本常识。而且稳定后的合作频 率不同,和文献[16 ]的理论结果相一致。
图7中小世界网络模型下的前6轮博弈演示区节 点策略的变化如图=所示,灰色表示节点当前策略为 “合作”,黑色表示节点当前策略为“背叛”,此图展示 了每一轮各个节点当前的策略,以及策略的变化过程。 其中灰色节点越来越多,表明网络的合作频率随着博 弈轮数的增加在增长,趋势与图7 (b$ —致,体现了所 设计软件的有效性。
为了说明软件对网络演化博弈过程的演示效果,
以文献[16]中的网络演化博弈数据为例进行演示实 验。设置节点初始策略合作和背叛各占1/2,策略更 新规则选取为模仿最优更新规则,博弈模型采用联合 生产博弈模型,收益矩阵如图9所示。分别在无标度 网络、小世界网络,随机网络和二维格子网络模型下进 行网络演化博弈实验。
1 〇 D / 0 0.6、
player 2 c (〇 12 〇 弘)
图6联合生产博弈模型
运行软件后,点击前面板网络模型区域相应的网
络模型按钮,进人各自的子VI进行网络模型参数设 置。网络模型设置完成后,将图6的数据输人博弈模 型区域的矩阵中,选择模仿最优策略更新规则,设置博 弈演示区域的节点策略初始状态。点击设置完成按 钮,博弈演示区域显示所设置的网络模型的拓扑结构, 如图1所示。设置博弈轮数为!6,点击博弈按钮开始 博弈。在博弈过程中前面板中的本轮收益数组、累积
D
player 1
C
第轮
2
第轮
3
112
www. dianzikeji. org
刘海洋,等\"基于LabVIEh的复杂网络演化博弈实验软件
博弈演示
赛示
图像•编码与软件
1 •----•-------------------------------联
第4轮 第5轮
[3] 杨中华.基于核心企业的供应链网络信息共享研究[D].
武汉:华中科技大学,2013.[4] 阮国祥,阮平南.集群网络企业间知识转移演化博弈仿真
分析[J].图书情报工作,2011,55(16):77 -81.
[5] 荣智海.复杂网络上的演化博弈与机制设计研究[D].上
海:上海交通大学,2008.[6] 杨涵新,汪秉宏.复杂网络上的演化博弈研究[J].上海理
工大学学报,2012,34(2): 166 - 171.[7] 陈维春,尚丽辉.基于奖励因子的囚徒困境博弈模型研究 [J].电子科技,2016,29(3):5 -6.
[8] 王文宾.演化博弈论研究的现状与展望[J].统计与决策,
2009(3): 158 -161.[9] 姜罗罗,汪秉宏.复杂系统中的合作演化与自组织斑图
[J].上海理工大学学报,2012,34(2): 172 - 184.[10] Nowak M A. Five rules for theevolution
Science,2016,314(5805) *1560 -1563.[11] 王先甲,全吉,刘伟兵.有限理性下的演化博弈与合作机 制研究[J].系统工程理论与实践,2011,31(S1):82 -93.[12] Nowak M A. evolutionary games and spatial chaos [ J ]. Na-
tur,2002,359 (6398): 826 -829.[13] Hauert C,Doebeli M. Spatial structure often inhibits the evo
lution of cooperation in the snowdrift game[ J]. Nature,2014, 428 (6983): 643 -646.[14] Devlin S,Treloar T. Evolution of cooperation through the het
erogeneity of random networlcs & J ]. Physical Review E Statistical Nonlinear & Soft Matter Physics,2009,79 ( 1Pt^) : 100 -115.[15 ]刘歌群,詹志国,胡琦,吕伟臻.联合生产博弈模型[J ].电
子科技,2016,29(3):1 -4.
图8 小世界网络的前5轮博弈演示区
4结束语
本文在LabVIEW开发环境下,设计了一种基于
LabVIEW
的网络演化博弈实验软件,对网络演化博弈过
程进行了可视化。软件的参数设置模块设计包含了网 络演化博弈的各个要素,方便实验者根据不同要求进行 试验,进而了解在网络演化博弈中各个参数发挥的作 用。同时,软件的显示模块对网络演化博弈过程中的各 个数据进行了展示,并动态地演示了网络演化博弈过程 中策略与合作频率的变化。实验表明,该软件有助于帮 助人们理解和学习网络演化博弈的理论知识,可在复杂 网络演化博弈的实验和教学过程中发挥作用。参考文献
& 1 ]汪小帆,李翔,陈关荣.复杂网络理论及其应用& M ].北
京:清华大学出版社,2006.[2]范如国,张应青,罗会军.考虑公平偏好的产业集群复杂
网络低碳演化博弈模型及其仿真分析&J].中国管理科 学,2015(S1):763 -770.(上接第105页)[3]李金铸,胡兴柳,张小伟.LMS算法在分布式光纤测温系
统中的应用[J].电子科技,2015,28(9):19 -22.[4 ]吕安强,李永倩,李静,等.分布式传感光纤应变和温度同
时标定方法[J].光子学报,2014(12): 110 - 114.[5] 郎向伟,张长生,强小俊.基于光纤传感技术的钢轨变形
监测可行性研究[J ].铁道建筑,2015 (3): 122 - 125.
[6] 傅一帆.分布式光纤应变测试技术工程应用试验研究
[J].四新应用,2016,34(9):56 -59.[7] 丁宇,黎中银,蔡启仲.光纤激光器功率控制系统的设计
[J].电子科技,2013,26(2):126 -132.[8 ]赵生传,时翔,陈志勇.一种智能型电缆在线监测系统的
研究与应用[J].中国电业,2012,8(24):45 -47.[9] 陈福昌,戴杰,余超群,等.光纤环校正双端探测分布式拉
曼光纤传感系统[J].光电子•激光,2016, 43(8):33 -38.[10] 宁枫,朱永,崔海军.一种提高分布式光纤测温系统空间
分辨率的线性修正算法[J].光子学报,2012,41 (4):408
-413.
[11] 余向东,金尚忠,张在宣,等.采用单工循环编码解码的分
布式光纤拉曼温度传感器[J ].光子学报,2014,43 (7): 706 -711.[12] 付婷.基于S7 -300PLC的商场恒温控制系统设计[J].
电子科技,2012,25(3):42 -47.[13] 汤玉泉,孙苗,李俊,等.温度附加损耗对分布式光纤拉曼
温度传感器测温误差影响研究[J].光电子•激光,2015, 26(5) *847 -851.[14] 王虎,李永倩,李欢,等.光纤温度传感器在电力电缆监测
中的应用[J].电力系统通信,2012(3):56 -60.[15] 何炜斌,廖维君,薛志亚.基于分布式光纤测温的电力电
缆在线监测技术研究[J].广东电力,2013,26 (5): 23 -26.
www. dianzikeji. org
113
因篇幅问题不能全部显示,请点此查看更多更全内容