快速上手Gephi:以《倚天屠龙记》人物关系网络为例
快速上手Gephi:以《倚天屠龙记》人物关系网络为例
本文将介绍如何使用Gephi软件进行社会网络分析,以《倚天屠龙记》人物关系网络为例,详细展示数据准备、导入、布局、统计、外观设置、过滤和预览等关键步骤。
Gephi简介
Gephi是一款专为网络分析设计的数据可视化处理软件,其设计理念类似于"Photoshop for graphs",致力于提供简洁方便的工具栏和菜单栏,是社会网络可视化中最便捷的工具之一。本次演示使用的是gephi 0.92版本。
数据准备
本文采用《倚天屠龙记》人物的共现关系矩阵数据,构建无向单图。数据结构如下:如果两个名字在同一段落出现,则在矩阵中对应的值为1,否则为空值。这种结构能够有效汇聚相互联系的名字形成网络。
导入数据
进入Gephi后,选择"文件"->"导入电子表格"。Gephi支持三种类型的Excel数据导入:
- 边数据+节点表格:类似于NetworkX生成图的原理,需要导入边数据和节点数据,包括Source和Target的点以及边的权重。
- 矩阵数据:由两个节点对应的属性值组成的矩阵,相当于Source、Target加上一个属性的数据结构。本次演示使用的就是矩阵类型的数据。
导入时需要指定分隔符和数据类型,有时还需要手动调整字符集编码。
布局
布局是可视化中最关键的部分,Gephi内置了七种布局方法,最常用的是Force Atlas、YIfan Hu和OpenOrd。初次布局采用OpenOrd方法,得到如下结果:
统计
统计功能用于计算图中每个节点的算法结果,包括度、模块化等指标。运行所有算法后,可以得到详细的统计结果。
外观
外观功能决定了可视化效果的美观程度。可以通过调整节点和边的颜色、大小、标签颜色和尺寸来优化视觉效果。例如,可以根据度的结果调整节点大小,根据模块化结果为节点分类涂色。
布局(第二次)
为了更清晰地显示重点信息,需要再次进行布局调整。本次采用Force Atlas布局方法,并增大吸引强度参数,使社区探测结果相同的节点集中在一起。
概览
为了便于观察,需要为每个节点显示标签。需要注意的是,如果要显示中文标签,必须选择中文字体。从图中可以看出:
- 少林寺的和尚都是橙色一类
- 朱元璋一伙都是绿色一类
- 丐帮基本是黑色一类
这些分类都是通过模块化算法自动识别的。
过滤
如果只想关注主要角色的人物关系,可以使用过滤功能。在拓扑中选择度范围,设置合适的参数,可以过滤出与很多人有关系的关键角色。
布局(第三次)
为了使过滤后的结果更美观,需要再次调整布局。通过调整吸引强度参数,使网络分布更加合理,便于查看人物关系和标签。
预览
预览功能提供了更全面的调整选项,可以详细设置节点、标签和边的显示效果。最后,可以将优化后的图形保存为PNG或JPG文件。
小结
本文详细介绍了Gephi软件的基本使用方法,包括数据导入、布局、统计、外观设置、过滤和预览等关键步骤。虽然教程较为枯燥,但通过实际操作可以掌握社会网络分析的基本技能。建议读者结合刘勇老师的《网络数据可视化与分析利器:Gephi 中文教程》进一步学习,以提升数据分析和设计能力。
参考资料:
- 官方网站:https://gephi.org/
- 刘勇,杜一.网络数据可视化与分析利器:Gephi 中文教程(全彩)[M]. 北京:电子工业出版社.2017