ABSTRACT
准确的IP地理定位对于位置感知的应用程序是必不可少的。虽然基于以路由器为中心(router-centric )的IP图的最新进展被认为是前沿的,但一个挑战仍然存在:稀疏IP图的流行(14.24%,少于10个节点,9.73%孤立)限制了图的学习。为了缓解这个问题,我们将目标主机(target host)指定为中心节点,并聚合多个最后跳路由器(multiple last-hop routers)来构建以目标为中心的IP图,而不是像以前的工作那样仅仅依赖于具有最小的最后跳延迟的路由器。在三个真实数据集上的实验表明,与现有的基线相比,我们的方法显著提高了地理位置的精度。
Introduction
许多独立于客户端的IP地理定位方法已经被提出来估计地理位置。这些方法并不依赖于用户愿意共享他们的位置数据,而是使用替代技术来确定位置,而不需要直接从客户机中输入。最近,这一领域的前沿进展涉及到使用以路由器为中心的IP图的图神经网络(GNNs),以其利用丰富的周围信息的非凡能力而闻名(Wang等人2022;Tai等人2023)。然而,尽管实现了地理定位的准确性,但以路由器为中心的IP地理定位面临着一个挑战:稀疏IP图的流行限制了图学习的有效性。通过对数据集的分析,有14.24%的目标拥有少于10个邻居,其中9.73%是完全孤立的。
(Wang等人2022)Wang, Z.; Zhou, F.; Zeng, W.; Trajcevski, G.; Chunjing, X.; Yong, W.; and Kai, C. 2022. Connecting the Hosts: Street-Level IP Geolocation with Graph Neural Networks. In SIGKDD.
(Tai等人2023)Tai, W.; Chen, B.; Zhou, F.; Zhong, T.; Trajcevski, G.; Wang, Y.; and Chen, K. 2023. TrustGeo: Uncertainty-Aware Dynamic Graph Learning for Trustworthy IP Geolocation. In SIGKDD.
在这项工作中,我们提出了一个简单但有效的图富集方法(graph enrichment method)来解决上述挑战。具体来说,我们将目标主机指定为中心节点,并聚合多个最后跳路由器来构建以目标为中心的(target-centric,TC)IP图,而不是像之前的工作那样仅仅依赖于最后跳延迟最小的路由器。这种直接的修改大大将隔离节点(isolated nodes)的比例从9.73%降低到4.46%,将稀疏度(sparsity ratio)比从14.24%降低到8.64%