虚拟社群结构特征可视化呈现的社会网络布局算法研究
2021-01-06
来源:爱问旅游网
第29卷第7期 2012年7月 计算机应用与软件 Computer Applications and Software V01.29 No.7 Ju1.2012 虚拟社群结构特征可视化呈现的社会网络布局算法研究 邱飞岳杨斌 王永固 (浙江工业大学教育科学与技术学院浙江杭州310012) 摘要 近年来,随着虚拟社区的发展,社会网络可视化软件逐渐走向普通社区成员的面前。然而现今社会网络可视化领域所采 用的布局算法普遍与社会网络分析法相脱离,无法呈现社群结构特征。因此,提出凝聚子群布局算法与核心位置布局算法,它们分 别以凝聚子群分析结果和成员整体中心度为布局依据,呈现社群子群和成员位置两种社群结构特征,并且依据实际数据给出布局 效果。 关键词 社会网络可视化布局算法 社群结构 中图分类号TP301 文献标识码A STUDY ON SOCIAL NETWoRK LAYoUT ALGoRITHMS FoR SHoWING VIRTUAL CoMMUNITY STRUCTURE FEATURES Qiu Feiyue Yang Bin Wang Yonggu (College ofEducational Science and Technology,Zhejiang University of Technology,Hangzhou 310012,Zhejiang,China) Abstract In recent years,social network visualization software gradually moved toward the front of the ordinary members of the community with the development of virtual communities.However,most of the layout algorithms used by the visualization of social networks are out of social network analysis,and cannot show community structure features.Therefore,this paper proposes Cohesive Subgroup Layout algorithm and Core Position Layout algorithm,they respectively basis on the cluster analysis and global centrality,show two community structure characteristics:subgroup and location of members,and give thedrawing effect by actual data. Keywords Social network visualization Layout algorithm Community sturcture 件,阐明社会网络可视化是社会网络分析软件发展的趋势之 0 引 言 J一 ,而现今社会网络可视化领域使用的布局算法以弹性布局 算法为主流。弹性布局又称为力导引布局算法,最早由文献 虚拟社区由瑞格尔德定义至今已有20多年历史,已经成为 [3]提出,它将所要绘制的视图看作一个节点为圆环、连结为弹 人们日常生活学习不可缺少的组成部分。越来越多的研究者投 簧的物理系统,当系统被赋予某个初始状态后,弹簧力的作用会 身到了此种虚拟环境下的社会网络关系研究中,并开发了大量 导致钢环的移动,节点间过近产生斥力,节点间过远产生拉力, 的社会化网络分析软件,用于辅助研究社会网络,如UCINET软 直到系统静止。力导引布局算法易于理解和实现,常被运用在 件等。并且近几年,社会网络可视化视图已不仅仅服务于研究 大型网络中。然而纯粹的力导引布局算法在社会网络可视化领 者,还展现在了虚拟社区普通用户的面前,如KIWI系统…、豆 域的运用存在着一个致命的缺点,那就是它仅仅从物理学角度 瓣网等等,帮助用户更充分地理解所在社群结构,更有效地进行 计算各个节点的位置,没有与社会网络分析法有效结合,使所绘 知识交互。而服务于普通用户的社会网络可视化视图除了需要 制的图形只呈现了社群的规模、密度等有限的信息,显然不能满 包涵社群规模、组成等信息外,还需要呈现更多的信息,如社会 足现今社会网络可视化领域的发展需求,社群普通用户也无法 网络结构特征信息。然而现阶段,社会网络可视化领域使用的 通过此类社群图获得更丰富的信息。 布局算法大多和社会网络分析法脱离,不能针对某种社会网络 结构特征进行显示。 1.2 oDL算法 本文依据社会网络分析法中的凝聚子群与成员整体中心度, 针对上述力引导算法的局限性,研究者们对力导引布局算 提出凝聚子群布局算法和核心位置布局算法,意在社会网络可视 法进行了一系列的改进,如文献[4]提出的ODL(outdegree lay— 化视图中呈现社群子群与成员位置两种社群结构特征信息。 out)算法。ODL算法将社会网络结构中节点出入度特征和力引 社会网络布局算法现状 收稿日期:2012—02—12。国家社会科学基金项目(10BGL095);教 育部人文社会科学研究项目(O9YJC630207);浙江省自然科学基金项目 (Y6090560);全国教育科学规划课题教育部重点项目(DCA090318)。 1.1力引导布局算法 邱飞岳,教授,主研领域:中小企业e—learning。杨斌,硕士。王永固,副 王陆教授曾系统地分析了现今所拥有的社会网络分析软 教授。 第7期 邱飞岳等:虚拟社群结构特征可视化呈现的社会网络布局算法研充 61 导布局算法相结合,以节点的出度,即成员的局部中心度为依据 核心位置这一社群结构特征,直观呈现成员在社群中的地位。 如图2所示,处于视图中心位置的成员为核心成员,拥有丰富的 将成员划分为不同层次,首先挑选出出度最大的点集运用力引 导布局算法绘制,然后逐步添加其余的点到图中,最终完成视图 的绘制。依照此算法绘制的社群图可以清晰呈现社群成员个体 社会资源,而相对远离视图中心位置的成员,在社群中拥有的资 源相对较少。 中心性的社群结构特征,可以反映成员在社会网络中具有怎样 的影响力和支配力,因而ODL算法在针对恐怖活动信息甄别的 OntoVis系统中表现活跃 。 2凝聚子群布局算法与核心位置布局算法 2.1凝聚子群布局算法 文献[6]认为:“凝聚子群是满足如下条件的一个行动者子 集合,即在此集合中的行动者之间具有相对较强的、直接的、紧 密的、经常的或积极的关系”。而分析社群的凝聚子群有助于 了解社会网络的特性,如相同子群中成员个体拥有相似的水平、 兴趣或目标 。依据赛德曼提出的运用最小度标准区分高、低 凝聚力区域,GRADAP小组提出了“m一核”,运用连结的强度作 为测量社群紧密度的标准,即社群紧密度为m时,社群中各个 成员间的联系强度都不能小于m。 凝聚子群布局算法采用现今使用最多、研究最为充分的等 级聚类法 得到凝聚子群。其核心为:不断将连结强度最高的 两位成员归做为一位新成员,直到所有成员聚合。 然而传统社会网络分析法中的柱状凝聚子群图仅仅在研究 者领域被广泛使用,虚拟社区普通用户对于此类视图仍难以理 解。凝聚子群布局算法将聚类结果作为布局依据,以连结强度 作为选项,绘制在特定连结强度之下的社群凝聚子群视图,呈现 子群的数量、规模、组成等信息。如在用户选择某一连结强度情 况下,凝聚子群布局算法将绘制如图1所示的社群凝聚子群 视图。 图1 凝聚子群布局算法绘制结果视图 2.2核心位置算法 前文中ODL算法为表现成员局部中心度,即成员的度数。 而在社会网络分析法中表现成员中心性的数据指标还有一种, 为整体中心度。局部中心度侧重于表现成员控制力,而整体中 心度侧重表现成员在社群中所处的地位,核心位置布局算法以 成员的整体中心度为依据。整体中心度,即该成员与其他所有 成员的最短距离和,计算公式为:∑ f(e) _9 J。其值越低表明 该成员与所有其他成员联系越便捷,也就越接近核心位置。研 究者表明处于核心位置的成员相比社群中的其他成员表现得更 活跃,更具有声望和权利,在进行信息交互时拥有更多的选择, 更有可能能够受到他人高效的帮助和支持 。 核心位置布局算法依据成员的整体中心度排序,抓住社群 成员b 成员e 图2核心位置布局算法绘制结果视图 3凝聚子群布局算法布局过程 3.1凝聚子群分析 凝聚子群分析依照前文所述.运用等级聚类法得到聚类结 果。如图3所示,参照等级聚类法原理设计了凝聚子群分析算 法,算法核心思想为:反复在无向 : 接矩阵中选取强度最大的连 结,判断拥有连结的两位成员状态,若一位成员在已有子群中, 则将另一位成员加入到该子群,并更新邻接矩阵(其他成员与 该子群中成员的连结取较小连结保留);若两位成员都不属于 已有子群,则新建一子群并更新邻接矩阵;若两位成员分别属于 两个已有子群,则两个子群合并,更新邻接矩阵。 图3凝聚子群的分析算法 上述算法输出为凝聚数组,一个三重对象数组,具体结构如 图4所示。凝聚数组CohesionAn"包含一到多个eohesiongroup 对象,每一个eohesiongroup对象表示不同连接强度vlaue下的凝 聚子群,其SubGroup属性为包含一到多个Group对象的对象数 组。每一个Group对象表示一个子群,为由多个成员member对 象组成的对象数组。依据此凝聚:故组,可以清晰地存储当前连 接强度value下凝聚子群信息,如子群的数量即SubGroup. 1ength,每一个子群中拥有的成员等等。 3.2视图绘制 凝聚子群视图主要由三种图形元素组成:子群、成员节点和 62 计算机应用与软件 2012丘 开始 输入邻接矩阵减员数组 创建已绘成员数组,绘制核心成 员,并加人已绘成员数组 图4凝聚数组结构图 连接,分别由SubGroup、Member和Line三个Sprite类的子类绘 出一位已绘成员,绘制与其 接连结成员,并将这些成员 制(本文布局算法均通过Flex技术实现),由绘图Draw类调用 布局Layout类的各种方法得到节点坐标,然后绘制视图。 绘制过程主要有三个步骤:第一步,绘制子群;第二步,绘制 成员;第三步,绘制连结。其中布局核心为子群中心点坐标的确 定,其坐标计算公式如下所述: =COS(2,tr/∑n×i)×r+stagex,Y =sin(2 /∑n×i)×r+stagey,其中∑11,为子群数量,r为子群布 局半径,在舞台范围内随机产生,每一个子群的r都不相同。 stagex与stagey为舞台的中心点( ,Y)坐标。 4核心位置算法布局过程 核心位置布局过程共两步。第一步,整体中心度计算,依据 无向邻接矩阵计算所有成员整体中心度,得到处于社群核心位 置的成员,即整体中心度最小的成员;第二步,视图绘制,依据成 员离核心位置越近坐标离视图中心越近的原则,层层布局、绘 制,得到核心位置视图。 4.1整体中心度计算 依据社会网络分析法中整体中心度概念,因为需要计算成 员与社群其他所有成员的最短路径和,所以Dijkstra算法将是 有效的解决方案。参照计算机网络中的动态路由表,为每一个 成员创建一张成员距离表,用于记录该成员与社群中其他成员 的距离,依据无向邻接矩阵更新每张成员距离表,最后成员整体 中心度即为其成员距离表中数据之和。 4.2视图绘制 核心位置视图主要有两种图形元素组成:成员节点和连接, 其类图与凝聚子群视图的类图相似,而其布局核心为成员节点 坐标的确定。 如图5所示,绘制过程分三步: 第一步,绘制核心成员,即整体中心度最低的成员。确定核 心成员是单人还是多人,若单人就直接绘制在舞台的中心点上; 若多人,则其(X,Y)坐标公式为 =COS(2盯/∑n×i)×r+stagex 与Y=sin(2w/∑n×i)×r+stagey,并记录每一个成员节点的绘 制角度 ,即2 ∑ ×i。 第二步,绘制与已绘制成员距离为1的成员。若只有一人, 则延续已绘制成员的绘制角度,其( ,Y)坐标为 =COS(0)×r+ memberx与Y=sin( )×r+member?/,其中memberx与membery为 与已绘成员( ,Y)坐标,而 为已绘成员的绘制角度;若有多人, 则在已绘制成员的外围分布,其 、Y坐标为: =COS( 一叮T/2+ /∑n×i)+memberx,Y:sin( —ir/2+盯/∑n×i)×r+mem— bery,其中∑ 为与该已绘成员直接相连的成员数和。 第三步,绘制连结,依据无向邻接矩阵依次绘制成员节点间 的连结。 加入已绘成员数缎 5视图效果 5.1小数据集下效果 图6与图7分别是运用凝聚子群布局算法和核心位置布局 算法绘制而成的社会网络可视化视图,其数据来源于浙江工业 大学教科学院2010级14名教育技术学专业研究生网络教育资 源开发课程,14名成员在虚拟社区中组成一个虚拟社群,开展 在线协作学习。 ~ 、 ●l 一 一■ 一 .薹 ●女她 图6 14位成员社群凝聚子群视图 图7 14位成员社群中心度视图 图6为运用凝聚子群布局算法绘制而成的凝聚子群视图, 该图清晰地显示在强度为1时,该社群共拥有5个子群,另外3 位成员为孤立成员,没有加入任何子群。其中“专属爱的号 码”、“shangruiy”“银鱼炖蛋”三人所组成的子群规模最大,并与 另外两个子群保持着密切联系。通过该图,教师能清晰地了解 (下转第136页) l36 计算机应用与软件 2012丘 [2]Jenkins S,Kirk S R Software Architecture Graphs as Complex Net— works:A Novel Partitioning Scheme to Measure Stability and evolution l Jj.Information Sciences,2007,177(12):2587—2601. [3]He K,Peng R,Liu J,et a1.Design Methodology of Networked Software Evolution Growth Based on Software Patterns[J].Journal of Systems Science and Complexity,2006,19(2):157—181 [4]Gamma.Design Pattern:The Basis of Reusable Object.Oriented Soft ware[M].1994. [5]Gamma E,Helm R,Johnson R,et a1.Design Patterns:Elements of Re. usable Object-Oriented Software[M].Addison-Wesley,MA,1994. [6]Fowler M,Beck K,Brant J,et a1.Refactoring:Improving the Design of Existing Code[M].Ad.dison・Wesley,MA,1999. [7]Chidamber S R,Kemerer C F.A Metircs Suite for Object—Oriented De. sign[J].IEEE Transactions on Software Engineering,1994,20(6): 476—493. [8]Ma Y_r,tte K Q,Liu J.Network Motifs in Object—Oriented Software Systems[J]Dynamics of Continuous,Discrete and Impulsive Systems (Series B:Applications and Algorithms)Special Issue off Software En- gineering and Complex Networks,2006,l4(S6):166—172. [9]Henderson—Sellers B.Object—Oriented Metircs:Measures of Complexity [M].Prentice—Hall R,Upper Saddle Revier,RJ,1996. [10]Subrammanyam R,Krishnan M S.Empiircal Analysis of CK Metircs for Object—Oriented Design Complexity:Implications for Software defects [J].IEEE Transactions on Software Engineering,2003,29(4):297 3l0. [1 1]He K Q.Software Network[M].Science Publishing,2008. (上接第62页) 社群的分簇情况,判断社群的凝聚力。 图7为运用核心位置布局算法绘制而成的核心位置视图。 该视图显示了“狄某只”与“专属爱的号码”整体中心度相同,同 为最低25,居于虚拟社群的核心,属于核心成员。“丑儿嫒”、 “银鱼炖蛋”、“云南包谷”等成员次之,分布于“狄某只”与“专 属爱的号码”周围,其余成员分布于外围。图中节点间连线的 粗细与成员互动强度相关,连结强度越强,图中节点连线越粗。 通过该图,成员能直观地发现处于社群核心、边缘等位置的成 员,采取相关协调策略促进社群互动向均匀化发展。 5.2大数据集下效果 图8与图9分别是由浙江工业大学2009届计算机科学与 技术2个班级84位成员在班级论坛中的数据绘制而成的中心 度视图与强度为4下的凝聚子群视图。发现当数据集增大时, 由于凝聚子群的特性(子群中成员需要与其他每一位成员都保 持特定强度下的连结),使得在社群凝聚力较为松散时,大部分 成员无法归结于某一子群中而不法绘制在凝聚子群视图中,效 果不甚理想,而中心度视图依然保持良好效果。 ● ● ∞ m .j4 啦 ● 蹿h哪 图8 84位成员社群凝聚子群视图 图9 84位成员社群中心度视图 6 结语 目前社会网络可视化领域正处于高速发展阶段,越来越多 的社会网络可视化视图走向虚拟社区用户生活中。凝聚子群布 局算法和核心位置布局算法与社会网络分析法紧密结合,以凝 聚子群分析结果和成员整体中心度为布局依据,从而使所绘制 的视图中除了呈现社群规模、组成等基本信息外,还直接明了地 呈现社群子群、成员位置两种社群结构特征信息。成员通过观 察视图,能够对社群结构拥有一个定性认识,并促进对某些具体 数据指标的定量认识,最终达到在定性定量两种角度上全面了 解社群,提高信息交互效率。 参考文献 Rita Cadima,Carlos Ferreira.Promoting social network awareness:A social network monitoring system[J].Computer and Education,2010 (54):1233—1240. [2] 王陆.典型的社会网络分析软件工具及分析方法[J].中国电化教 育,2009(4):95—100. [3] Eades P.A heuristic for graph drawing[J].congressusNumerantium, 1984(42):149~161. [4] Chan D S M,Chua K S,Leckie C,et a1.Visualization of power—law network topologies[C]//Proc.of the 1 l th IEEE Int’1 Conf.on Net— works.Sydney:Bioxham&Chambers,2003:69—74. [5] Shen Z Q,Ma K L,Eliassi-Rad T.Visual analysis of large heteroge— neous s0cial networks bv semantic and structural abstraction『J].IEEE Trans.on Visualization and Computer Graphics,2006,12(6):1427 1439. Wasserman,S,Faust K.Social Network Analysis:Methods and Ap— plication[M].Cambridge:Cambridge University Press,1994. Tan.Social Networks in Online Learning Environments[D].Lansing: Michigan State University,2006. 钟伟金,李佳.共词分析法研究(三)一共词聚类分析法的原理与 特点[J].情报杂志,2008(7):118—120. 刘军.社会网络分析导论[M].北京:社会科学文献出版社,2004. 1barra H.Personal Networks of Women and Minorities in Management: A Conceptual Framework[J].Academy of Management Review,1993, 18(1):56~87.