作为复杂网络领域中重要的课题之一,社团检测有助于揭示网络中存在的功能性模块或群集,旨在于仅利用网络中蕴含的来识别模块,并可能进而识别它们的层次组织。社团检测在各个领域具有重要的应用,可以帮助深入理解复杂系统潜在的模式和规律。
罗盘复杂网络计算平台官方网站:www.scicompass.com
在罗盘复杂网络计算平台中,提供了多种社团检测算法,方便用户进行相关分析。在罗盘复杂网络计算平台中,构建社团检测任务主要包括以下三个关键步骤:
1. 数据集选择
在官方组件库中或按照格式模板选择需要计算的数据集。例如,在下文的数据集选择中,我们从官方组件库中选择了Zachary's-Karate-Club数据集作为计算数据集。值得注意的是,选择数据集时要关注数据集是否存在可以作为社团标识的节点属性,例如在Zachary's-Karate-Club中节点属性club可以作为社团的标识。
2. 社团检测算法选择
选择期望计算的社团检测算法,并进行相应的配置和应用。在下面的例子中,选择了Label Propagation Algorithm (LPA)、Agglomerative Clustering、Info Map作为计算的社团检测算法。
3. 评价指标评估
选择适当的评价指标来评估链路预测算法的结果。在下面的例子中,我们选择了Variation of Information (VI)、Rand Index (RI)、Normalized Mutual Information (NMI)评价指标来评估模型的性能。
以下是如何在罗盘复杂网络计算平台上构建链路预测基本流程的详细步骤:
1. 进入计算平台首页
(1)访问平台:访问罗盘复杂网络计算平台的官方网站(www.scicompass.com)。
(2)用户登录:在首页右上角点击“登录”按钮,输入用户名和密码。如果没有账户,点击“注册”并按照提示创建一个新账户。
2. 创建计算项目
(1) 创建项目:登录后,在首页点击“计算平台”按钮,并点击加号创建项目。
(2) 填写信息:填写项目名称输入项目的名称相关领域内容完成项目的创建。
3. 添加计算任务
(1) 进入项目:在项目列表中找到刚创建的项目并点击进入。
(2) 添加计算:进入画布后会自动创建计算画布,但也可以通过加号添加额外的计算任务。
4. 数据集选择
(1) 数据集选择:在左侧的官方组件库中,可以在数据集模块中选择平台预置的数据集。
(2) 查看数据集:选择相关数据拖入面板后,可以在面板右侧对数据进行初步的数据统计指标查看,并可以通过查看详情进入数据集详情页面查看数据集的节点属性名称。
5. 配置社团检测流程
(1) 社团检测算法选择:在算法列表中选择合适的链路预测算法,如Label Propagation Algorithm (LPA)、Agglomerative Clustering、Info Map或其它算法连接至数据集的输出。
(2) 社团检测算法配置:在选择好社团检测算法后,需要对社团检测算法的配置中说明用于指定图中节点的属性名称,表示在进行社团检测时使用哪个节点属性作为节点的标识。在Zachary's-Karate-Club中节点属性club可以作为社团的标识。
6. 评价指标评估
(1) 评价指标选择:在罗盘复杂网络平台中,目前提供了包括Variation of Information (VI)、Rand Index (RI)、Normalized Mutual Information (NMI)等多种社团检测经典评价指标,可以根据需要选择它们并将其连接至具体算法的输出。
7. 运行计算
(1) 启动计算:配置完成后,点击“开始计算”按钮启动计算。
(2) 进度监控:平台会显示计算任务的进度条进行进度监控,可以实时查看任务执行状态。
(3) 等待计算:根据数据规模和算法复杂度的不同,计算时间可能会有所变化。您可以选择关闭页面稍后再查看结果,或者保持页面开启等待完成。
8. 查看结果
(1) 查看结果:运算完成后,您可以在下方查看产生的计算结果。点击相关步骤的链接即可将算法的运算结果下载到本地。
在查看计算结果时,结果的命名以流程中的连边命名, A—B表示在由A指向B的过程中产生的结果。
值得注意的是,运算过程中生成的对象会被打包成pkl文件,其它可转换的格式则为csv文件。上图中文件具体解释如下:
1. Zachary's-Karate-Club.pkl
这个文件表示基于Zachary's-Karate-Club数据集构建的网络对象,保存为.pkl格式。
2. Zachary's-Karate-Club——InfoMap.csv
这个文件中包含了对Zachary's-Karate-Club数据集使用InfoMap算法后得到的结果。
3. Zachary's-Karate-Club——Label Propagation Algorithm, LPA.csv
这个文件中包含了对Zachary's-Karate-Club数据集使用Label Propagation Algorithm (LPA)后得到的结果。
4. Zachary's-Karate-Club——Agglomerative Clustering.csv
这个文件中包含了对Zachary's-Karate-Club数据集使用Agglomerative Clustering算法后得到的结果。
5. InfoMap——Normalized Mutual Information, NMI.csv
这个文件中包含了使用InfoMap算法计算得到的Normalized Mutual Information (NMI)结果。
6. Label Propagation Algorithm, LPA——Rand Index, RI.csv
这个文件中包含了使用Label Propagation Algorithm (LPA)算法计算得到的Rand Index (RI)结果。
7. Agglomerative Clustering——Variation of Information, VI.csv
这个文件中包含了使用Agglomerative Clustering算法计算得到的Variation of Information (VI)结果。