先看一例旧闻:西部“最强大脑”落户雁塔——30亿亿次超算能力助力创新之城建设
其中提到一期算力为 300PFLOPS FP16(每秒30亿亿次半精度浮点计算),项目总投资约为19亿元。
这个算力是什么概念呢?
我们以深度学习训练中经常使用的一款主流显卡 NVIDIA V100 来做估算,从 NVIDIA V100S Datasheet 中可以查到 V100 搭配 SXM2 插槽的半精度浮点算力为 125 TFLOPS
那么 300PFLOPS FP16 相当于 300*1000/125=2400 块 V100 GPU
而一台 NVIDIA DGX-2 服务器上装配了 16 块 V100, 那么上述算力相当于 2400/16=150台 DGX-2 节点
我们可以查到一台 DGX-2 的售价大约是 $399,000 [ 3 ] ^{[3]} [3], 假如人工智能中心全部采用英伟达 DGX-2 服务器的话,那么服务器成本这一块大约为 399000*150*7.1=424,935,000(4.2亿元人民币)
该项目总投资为 19 亿元,上述算力服务器成本占比大约为 22%.
注 1:未来人工智能中心实际采购的是华为的昇腾服务器,欢迎知情大佬分享售价信息
注 2:上述分析其实只是算力成本中很小的一块,实际中还有还有机房的供能、制冷、网络、软件等成本
参考文献:
[1] NVIDIA V100S Datasheet
[2] SXM
[3] Nvidia DGX
[4] 西部“最强大脑”落户雁塔——30亿亿次超算能力助力创新之城建设
[5] 雁塔未来人工智能计算中心