Stanford Large Network Dataset Collection 斯坦福大学大型网络数据集
官方网站:https://snap.stanford.edu/data/
the University of Florida Sparse Matrix Collection 佛罗里达大学稀疏矩阵集合
官方网站:https://sparse.tamu.edu/
1、com-Orkut(OK):是Orkut社交网络的无向图
官方网站:https://snap.stanford.edu/data/com-Orkut.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-orkut.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 3072441 |
Edges 边 | 117185083 |
平均聚类系数 | 0.1666 |
三角形数量 | 627584181 |
社区数量 | 8455253 |
平均社区规模 | 34.86 |
每个节点的社区成员资格 | 95.9 |
2、com-LiveJournal:LiveJournal 社交网络和真实社区
官方网站:https://snap.stanford.edu/data/com-LiveJournal.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-lj.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 3997962 |
Edges 边 | 34681189 |
平均聚类系数 | 0.2843 |
三角形数量 | 177820130 |
社区数量 | 311782 |
平均社区规模 | 40.06 |
每个节点的社区成员资格 | 3.09 |
3、com-Friendster:Friendster 是一个在线游戏网络
官方网站:https://snap.stanford.edu/data/com-Friendster.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-friendster.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 65608366 |
Edges 边 | 1806067135 |
平均聚类系数 | 0.1623 |
三角形数量 | 4173724142 |
社区数量 | 1449666 |
平均社区规模 | 26.72 |
每个节点的社区成员资格 | 0.32 |
4、com-Youtube:YouTube 是一个包含社交网络的视频共享网站
官方网站:https://snap.stanford.edu/data/com-Youtube.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-youtube.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 1134890 |
Edges 边 | 2987624 |
平均聚类系数 | 0.0808 |
三角形数量 | 3056386 |
社区数量 | 8385 |
平均社区规模 | 13.5 |
每个节点的社区成员资格 | 0.1 |
5、com-DBLP:DBLP 计算机科学参考书目提供了计算机科学研究论文的完整列表
官方网站:https://snap.stanford.edu/data/com-DBLP.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-dblp.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 317080 |
Edges 边 | 1049866 |
平均聚类系数 | 0.6324 |
三角形数量 | 2224385 |
社区数量 | 2547 |
平均社区规模 | 429.79 |
每个节点的社区成员资格 | 2.56 |
6、com-Amazon:亚马逊产品共同购买网络和真实社区
官方网站:https://snap.stanford.edu/data/com-Amazon.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/com-amazon.ungraph.txt.gz
Source (citation) 来源(引用):J. Yang and J. Leskovec. Defining and Evaluating Network Communities based on Ground-truth. ICDM, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 334863 |
Edges 边 | 925872 |
平均聚类系数 | 0.3967 |
三角形数量 | 667129 |
社区数量 | 49732 |
平均社区规模 | 99.86 |
每个节点的社区成员资格 | 14.83 |
7、wiki-Talk:维基百科谈话网络
官方网站:https://snap.stanford.edu/data/wiki-Talk.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/Wiki-Talk.txt.gz
Source (citation) 来源(引用):J. Leskovec, D. Huttenlocher, J. Kleinberg. Predicting Positive and Negative Links in Online Social Networks. WWW 2010.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 2394385 |
Edges 边 | 5021410 |
平均聚类系数 | 0.0526 |
三角形数量 | 9203519 |
8、ego-Facebook:社交圈:脸书
官方网站:https://snap.stanford.edu/data/ego-Facebook.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/facebook.tar.gz
Source (citation) 来源(引用):J. McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 4039 |
Edges 边 | 88234 |
平均聚类系数 | 0.6055 |
三角形数量 | 1612010 |
9、ego-Twitter:社交圈:推特
官方网站:https://snap.stanford.edu/data/ego-Twitter.html
下载链接:http://snap.stanford.edu/data/bigdata/communities/twitter.tar.gz
Source (citation) 来源(引用):J. McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks. NIPS, 2012.
介绍:
数据集统计(属性) | 值 |
---|---|
Nodes 节点 | 81306 |
Edges 边 | 1768149 |
平均聚类系数 | 0.5653 |
三角形数量 | 13082506 |