【Gephi项目实战-带数据集】利用gephi绘制微博肖战超话120位用户关系图,并计算整体网络指标与节点指标

数据集在评论区,B站演示视频在评论区!

简介

最近2天需要用到gephi做社会网络分析,于是从0开始接触gephi并摸索出了gephi的基本使用指南。下面将结合真实的节点文件与边文件,利用gephi绘制社会网络并计算相关测量指标。整个过程会详细讲解:1.数据格式2.如何导入数据3.如何调整外观4.布局选取5.节点与网络测量指标的计算

(一)数据格式

本项目使用的数据来源于微博肖战超话120位用户,经过整理后分为节点文件和边文件。

1.1节点文件

节点文件以excel格式存储,包括7个字段。其中id字段必须要有,且id字段和下面要介绍的边文件中的source与target字段对应。id字段即120个用户的名称,边文件中的source与target字段全部取自id字段,并且source与target中的名字必须属于id字段中的名称,要求一一对应。

 label字段用于在gephi绘制的网络中作为每个节点的标签展示,如下图展示的就是每个节点的label。其他字段则是该节点的属性,后续可以作为节点颜色和大小的依据,也可以用不到。

1.2 边文件

边文件以excel格式存储,包括source、target和weight三个字段。我要绘制的网络是有向图,所以source与target对应的值是不一样的,如果是无向图则值可以互相交换。weight字段则可以影响边标签的颜色和大小。

(二)如何导入数据

2.1 导入节点文件

 第一步,打开gephi,点击文件,点击打开

第二步,选择节点.xlsx文件并点击打开(注意此时不要在外部打开该文件,否则gephi里打开会有错误) 

第三步,点击下一步和完成

 第四步,我这里选择图的类型是有向的,默认是混合的。然后既然先打开的是节点文件,则选择新的工作区,可是看到导入了120个节点

 第五步,点击确定就可以看到导入的120个节点

2.2 导入边文件

 第一步,打开边文件(同样不要在外部打开)

第二步,点击下一步和完成

第三步,图的类型选择混合的。并选择添加到现在的工作区。因为边文件里面有平行边(一个节点有2条及以上的边指向另一个节点,可能是数据处理时除了点问题,没问题的话直接选择有向的图类型即可,这里还是选择混合的;添加到现在的工作区是因为之前导入了节点文件,所以这里直接把边加到节点上,也就是添加到现在的工作区)

第四步,点击确定,则初步的网络就构造完成了

 (三)如何调整外观

首先看看此时的工作界面,有人可能会发现文件导入后不是数据资料点击空白,就是没显示图之类的问题,这里我们先点击窗口,把4个都勾选上,后面要用。

点击外观,我们可以发现能够分别设置节点和边的外观。节点可以设置4个,分别是节点颜色、节点大小、节点标签颜色和节点标签大小。设置依据可以是统一的,也可以根据属性设置,即分割。

分割有不同的依据,我们这里节点的颜色根据节点的category(类别)属性设置3个,节点的大小则根据节点的度设置,设置好要记得点击应用

其他外观设置大家自行摸索,大差不差。

(四)布局选取

这里就是提供了几个基础的布局算法,每个算法得到的布局不一样,一般使用Fruchterman Reingold算法,大家可以都尝试一下。另外还有插件提供更多的算法,请自行查询插件下载方式。

(五)节点与网络测量指标的计算

最后一个是关于社交网络节点测量指标与整体网络指标的计算。gephi提供了统计工具(上面以及打开了该窗口)

5.1 节点测量指标

节点的测量指标包括度、入度、出度;点度中心度(degree centrality)、中介中心度(betweeness centrality)、接近中心度(closeness centrality)。其中点度中心度就是度。每个指标的含义这里就不解释了,请大家自行查询。

gephi中可以计算每个节点的上述指标,点击运行下面几个指标:

然后打开数据资料就可以得到每个节点的指标值了

5.2 整体网络测量指标

整体网络测量指标我这里列举几个常用的:群体点度中心势、群体中介中心势、群体接近中心势。可以发现就是与节点的指标对应,只不过一个叫“度”,一个叫“势”。因此在gephi中是不能直接计算这3个指标的,有对应的公式根据节点的指标值来计算,具体请看这篇文章:

https://www.cnblogs.com/baiyunwanglai/p/13228813.html

我们可以先导出节点的指标数据,然后在excel中根据公式进行计算:
 

在输出表格后,可能会存在中文乱码的情况,没关系我们只保留需要的字段即可:

大家看完公式就知道这个表格里的网络测量指标怎么算的了 

总结

文章围绕做项目的过程介绍gephi的使用,所以可能漏掉部分功能,但我认为主要功能都涵盖进去了。更详细的介绍,也可以看我评论区的B站讲解视频,会演示如何操作,应该更清楚一些

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/669190.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

简单介绍Spring Security 的认证机制和授权机制

Spring Security 认证机制 Spring Security 的认证机制是一个用于确认用户身份的过程,它是基于Spring框架提供的一套全面的安全和身份验证特性。认证机制允许应用程序确认用户是否为他们所声明的用户,通常通过用户名和密码或其他凭证来完成。Spring Sec…

数据库学习笔记2024/2/5

2. SQL 全称 Structured Query Language,结构化查询语言。操作关系型数据库的编程语言,定义了 一套操作关系型数据库统一标准 2.1 SQL通用语法 在学习具体的SQL语句之前,先来了解一下SQL语言的通用语法。 1). SQL语句可以单行或多行书写&…

扩展鸿蒙ArkUI日期组件

鸿蒙ArkUI日期组件使用的是DatePickerDialog.show基础上扩展的表单式输入组件,方便在输入日期方式快速使用及复用。 /*** 日期*/ Component export default struct DiygwDate{//绑定的值Link Watch(onValue) value:string;// 隐藏值State valueField: string valu…

(5)【Python/机器学习/深度学习】Machine-Learning模型与算法应用—12种聚类算法说明与归纳

目录 一、12种聚类(无监督学习)算法说明和区分比较 聚类算法的类型(一) ​编辑导入函数库 加载数据集 ​编辑 (1)K-Means --Centroid models (2)Mini-Batch K-Means -- Centroid models (3)AffinityPropagation (Hierarchical) -- Connectivity models (4)Mean Shift…

DBNet详解及训练ICDAR2015数据集

论文地址:https://arxiv.org/pdf/1911.08947.pdf 开源代码pytorch版本:GitHub - WenmuZhou/DBNet.pytorch: A pytorch re-implementation of Real-time Scene Text Detection with Differentiable Binarization 前言 在这篇论文之前,文字检…

vue2之父子组件BUG

父组件&#xff1a;&#xff08;如果这样写&#xff09; <count-down:start-time"changeStartTime":end-time"changeEndTime"/>则changeStartTime就算写在计算属性里&#xff0c;也可能子组件不会在自动随着父组件的数据更新重新给子组件传值&#x…

微信小程序的图片色彩分析,窃取网络图片的主色调

1、安装 Mini App Color Thief 包 包括下载包&#xff0c;简单使用都有&#xff0c;之前写了&#xff0c;这里就不写了 网址&#xff1a;微信小程序的图片色彩分析&#xff0c;窃取主色调&#xff0c;调色板-CSDN博客 2、 问题和解决方案 问题&#xff1a;由于我们的窃取图片的…

基于Langchain-Chatchat + chatGLM3 轻松在本地部署一个知识库

前面三篇分别讲解了如何在本地环境部署大模型&#xff0c;那么今天简单的通过 Langchain-Chatchat 和 chatGLM3结合在本地环境搭建一套属于自己的大模型知识库。 往期llm系列文章 基于MacBook Pro M1芯片运行chatglm2-6b大模型如何在本地部署chatGLM3基于ChatGLM.cpp实现低成…

论文阅读-通过云特征增强的深度学习预测云工作负载转折点

论文名称&#xff1a;Cloud Workload Turning Points Prediction via Cloud Feature-Enhanced Deep Learning 摘要 云工作负载转折点要么是代表工作负载压力的局部峰值点&#xff0c;要么是代表资源浪费的局部谷值点。预测这些关键点对于向系统管理者发出警告、采取预防措施以…

企业动态 | UFAPKU“金融科技”沙龙走进同创永益——前沿技术在金融科技领域的应用

金融科技作为金融发展的驱动力量&#xff0c;对金融行业有着深远的影响。金融行业通过技术创新和数字化转型&#xff0c;极大地提高了金融服务和产品的效率和便捷性。1月21日&#xff0c;UFAPKU“金融科技”第二期沙龙在北大校友企业同创永益北京总部举办&#xff0c;数十位来自…

python增量同步文件夹中的文件

要增量同步文件夹中的文件&#xff0c;可以使用Python的shutil模块。以下是一个示例代码&#xff0c;它可以将源文件夹中的新增文件复制到目标文件夹中&#xff0c;并保留文件的时间戳和访问权限。 import os import shutil import time# 源文件夹和目标文件夹的路径 src_dir …

请问CTF是什么?请介绍一下关于隐水印的知识特点技术原理应用领域技术挑战

目录 请问CTF是什么&#xff1f; 请介绍一下关于隐水印的知识 特点 技术原理 应用领域 技术挑战 请问CTF是什么&#xff1f; CTF&#xff08;Capture The Flag&#xff0c;夺旗比赛&#xff09;是一种信息安全竞赛&#xff0c;常见于计算机安全领域。这种比赛模拟各种信…

fastjson 导致的OOM

fastjson 导致的OOM 示例代码 public static void main(String[] args) throws Exception {try {List<Integer> list JSONObject.parseArray("[2023,2024", Integer.class);}catch (Exception e){System.err.println("error");}System.out.println…

一文搞懂 springboot 如何融合数据源

1、简介 springboot 支持关系型数据库的相关组件进行配置&#xff0c;包括数据源、连接池、事务管理器等的自动配置。降低了数据库使用的难度&#xff0c;除了 mysql 还支持 Derby、H2等嵌入式数据库的自动配置&#xff0c;MongoDB、Redis、elasticsearch等常用的 NoSQL 的数据…

BGP邻居故障检测

第一种情况:如果AR2和AR4采用直连建立邻居,则排查步骤如下: 1)在AR2和AR4上使用ping x.x.x.x命令检查AR2和AR4用于建立EBGP邻居关系的直连地址连通性是否正常。如果不能ping通。则需要使用二分法从网络层向下层逐层进行排查,首先检查接口地址及路由的可达性,修改完成后,如…

Codeforces Round 914 (Div. 2)(D1/D2)--ST表

Codeforces Round 914 (Div. 2)(D1/D2)–ST表 D1. Set To Max (Easy Version) 题意&#xff1a; 给出长度为n的数组a和b&#xff0c;可以对a进行任意次数操作&#xff0c;操作方式为选择任意区间将区间内值全部变成该区间的最大值&#xff0c; 是否有可能使得数组a等于数组b…

WEB3:互联网发展的新时代

随着科技的飞速发展&#xff0c;互联网已从最初的信息交流平台发展为涵盖了工作、生活、娱乐、教育等众多领域的复杂系统。我们将其称之为“WEB3”&#xff0c;这个名称是对互联网新时代的高度概括&#xff0c;标志着我们已经迈入了WEB3时代。 在WEB3时代&#xff0c;互联网将…

MySQL 函数触发隐式转换应对策略

文章目录 前言1. 环境介绍2. MySQL 5.72.1 执行计划2.2 虚拟列优化2.3 原理解析 3. MySQL 8.03.1 执行计划3.2 函数索引优化3.3 原理解析 前言 MySQL 中&#xff0c;当 SQL 索引字段使用了函数的话&#xff0c;会出现隐式转换的问题&#xff0c;导致索引失效&#xff0c;从而导…

C# CAD界面-自定义窗体(三)

运行环境 vs2022 c# cad2016 调试成功 一、引用 二、开发代码进行详细的说明 初始化与获取AutoCAD核心对象&#xff1a; Database db HostApplicationServices.WorkingDatabase;&#xff1a;这行代码获取当前工作中的AutoCAD数据库对象。在AutoCAD中&#xff0c;所有图形数…

《短链接--阿丹》--技术选型与架构分析

整个短链接专栏会持续更新。有兴趣的可以关注一下我的这个专栏。 《短链接--搭建解析》--立项+需求分析文档-CSDN博客 阿丹: 其实整套项目中的重点,根据上面的简单需求分析来看,整体的项目难题有两点。 1、快速的批量生成短链,并找到对应的存储。 并且要保持唯一性质。…