作者 | 贾凯强、伍杏玲
出品 | CSDN云计算(ID:CSDNcloud)
10 月 19 日,2021 年云栖大会正式拉开帷幕。达摩院院长、阿里云智能事业部总裁张建锋表示,如今一个以云为核心的新型计算体系结构正在形成,该体系从三个层次演进:首先在基础设施层,云向下定义硬件,自研芯片、服务器、操作系统等底层技术,建设云为核心的硬件体系;其次,核心软件基于云来重构,开源社区成为创新中心,并催生低代码等新的开发方式,让云更易用;最后在应用层,未来随着 5G 网络发展,计算和数据加速向云上迁移,催生云电脑、元宇宙、自动驾驶等新物种。
为进一步加强这个新型计算体系的构筑,会上阿里云重磅发布全新云芯片倚天 710、“磐久”自研服务器,开源玄铁RISC-V 系列处理器等技术和产品,下面我们先睹为快。
又出新!阿里第一颗云芯片倚天 710,性能超业界标杆 20%
过去的一个世纪里,数字科技快速发展,ICT 与 IT 两条科技路径都有了很大的改变。而在如今的互联网环境下,大型企业都可能拥有超过百万级别的服务器产品,诸多用户都在呼唤新的服务器架构诞生。而互联网架构的本质是分布式计算,随着互联网技术的发展,在系统规模日益庞大后,云的价值还在于把规模化的服务变为商品,赋能其他企业与公司。
云计算本来是IT的部分,而如今IT变成了云的一部分,云网端融合会推动新的计算机体系结构的诞生。张建锋在演讲中表示:“基于阿里云“一云多芯”和“做深基础”的商业策略,我们发布倚天710,希望满足客户多样性的计算需求,这款芯片不出售,主要是阿里云自用。我们将继续与英特尔、英伟达、AMD、ARM 等合作伙伴保持密切合作,为客户提供更多选择。”
据悉,最新推出的倚天 710 芯片采用业界最先进的5nm 工艺,单芯片容纳高达 600 亿晶体管;在芯片架构上,基于最新的 ARMv9 架构,内含 128 核CPU,主频最高达到 3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的 DDR5、PCIE5.0 等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。
为解决云计算高并发条件下的带宽瓶颈,倚天710 针对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。在标准测试集SPECint2017上,倚天 710 的分数达到 440,成为业界性能最强的ARM服务器芯片,超出超过业界标杆 20%,能效比提升 50% 以上。
云端也是是高性能服务器芯片最大的应用场景。倚天 710 针对云场景的高并发、高性能和高能效需求而设计,将领先的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。目前,阿里云已全面兼容 x86、ARM、RISC-V 等主流芯片架构,自研倚天 710 进一步丰富了阿里云的底层技术架构,并与飞天操作系统协同,为云上用户提供高性价比的云服务。
同时,阿里云正式推出面向云原生时代的“磐久”自研服务器系列,首款搭载自研芯片倚天 710的磐久高性能计算系列也同时亮相。磐久服务器系列采用灵活模块化设计,可实现计算存储分离,包括高性能计算系列、大容量存储系列、高性能存储系列。而且,“磐久”自研服务器系列拥有风冷、液冷不同散热模式和归一化的主板,整机柜的设计让交付效率提升 50%,更符合下一代云原生系统架构,可在大规模事务、在线交易及云原生应用场景中发挥重要作用。
针对云原生时代容器化、微服务、持续交付等特点,磐久系列采用软硬件融合方式实现极致性能,结合自研的MOC、FIC、AliFPGA、神盾卡等,满足云原生的创新开发对性能和稳定性的机制要求。在计算方面,虚拟化和 OVS 转发性能业界领先;存储方面,可实现百万级IOPS和存储延迟的大幅降低;安全方面,支持芯片级的硬件加密。据悉,该款服务器将在今年部署,为阿里云自用。
一直以来,中国芯片长期依赖于进口,仅 2020 年芯片进口额就达到 2.4 万亿元,尽管中国企业正在快马加鞭努力补齐芯片设计的短板,但在高性能 CPU市场几乎没有太多建树。平头哥5nm高性能CPU倚天710发布,意味着中国企业在高端服务器芯片领域开始逐步扭转高性能芯片长期落后于人的局面。而随着“倚天”和“磐久”的面世,阿里云完善了全栈云基础设施的最后一环,实现从芯片、部件到整机的技术及架构创新和自研。
阿里造芯之路:从专用芯片到通用芯片,死磕自研芯
回顾造芯之路,阿里布局已久:
2017 年 10 月,阿里成立达摩院,研究方向涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术,还承载了必须要比阿里巴巴活得更长的愿景。
2018 年云栖大会上,达摩院芯片研发团队与中天微团队合并成立平头哥半导体公司,投身芯片自研,同时致力提高中国的芯片竞争力。
所谓“社会‘平头哥’,人狠话不多”,平头哥成立的三年时间里,接连发布几款重磅芯片产品:从 RISC-V 玄铁处理器,到 AI 芯片含光800,再到今天的通用服务器芯片倚天 710,平头哥三年完成“三级跳”。
2019 年 7 月,平头哥发布当时业界最强性能RISC-V处理器玄铁910,让芯片设计的门槛进一步降低;目前玄铁 CPU 累计出货 25 亿,成为国内应用规模最大的国产 CPU,在全球 RISC-V 处理器里首屈一指。
在 2019 年云栖大会上,平头哥发布阿里首颗 AI 芯片含光800,这款针对场景深度定制的芯片,为当时全球性能最强的 AI 芯片,性能打破了 AI 芯片记录,性能及能效比全球第一。目前含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。
为构筑“自研芯”,平头哥脚步不停,“死磕”上通用 CPU ,重磅发布上述的通用 CPU 芯片倚天,成为半导体行业新里程碑,深化端云一体芯片生态。
值得一提的是,阿里致力为各行业提供普惠算力,帮助企业和开发者共建“云端一体”的AIoT生态:在今天的大会上,平头哥重磅开源玄铁 RISC-V 系列处理器,包括玄铁 E902、E906、C906、C910 等 4 款量产处理器 IP,以及基于玄铁的多操作系统的全栈软件及工具。
据了解,这是系列处理器与基础软件的全球首次全栈开源,将推动 RISC-V 架构走向成熟,帮助RISC-V软硬件技术加速融合发展,推动全球 RISC-V生态发展。
玄铁RISC-V系列处理器源代码传送门:https://occ.t-head.cn
全面推进新计算体系
在云基础设施之上,云原生技术取代了传统IT软件,张建锋认为,大型软件向系统软件转变,应用软件让企业自己开发。也就是说,企业应用软件会由业务部门来开发而非IT部门。尤其是随着低代码软件的发展,这让任何业务人员,都可以搭建自己的应用,加快创新速度。
张剑锋表示,就阿里巴巴自身而言,其已经落地了全球最大规模的云原生实践。阿里巴巴业务100%跑在公共云上,并且实现应用100%云原生化。当然,基于钉钉的低代码开发是一种新的开源模式,钉钉上的低代码开发应用8个月增长了86万。这种开发模式的变革让让开发者从企业专业的IT人员逐步走向个人,开发成本不到原来的十分之一。
随着5G等通信技术发展,计算和数据将会进一步向云上迁移,从而催生更多云上新物种。举例而言,云、网、端的深度融合,就已经催生出云电脑、元宇宙、自动驾驶等新物种。在此次云栖大会的展位就是一个很好的体现,阿里巴巴发布的“无影”解决方案让现场的展商几乎都不需要使用电脑主机。使用名片大小的无影解决方案,就可以适配所有屏幕,连接阿里云形成一台超级电脑。在企业场景中,云和5G的发展会重新定义办公形态,工程师们也可以使用无影进行编程,当数据都在云端存储时,整体系统的安全性得以提升,避免核心代码泄露,同时还不用购置高配硬件,可以使用无限算力,处理各种复杂计算需求。
今年9月1日,《数据安全法》正式实施。张建锋表示:“《数据安全法》有利于云计算的健康可持续发展,促进社会对云产业的信任。未来,阿里云将继续加大安全投入,持续践行保护客户数据安全的第一原则。”
多年来,阿里云不断强化数据安全能力,以神龙4.0架构下的神龙安全芯片为基础,提供硬件层面的可信根和数据加密能力,并从硬件层面向上打造了CPU、Hypervisor、OS、VM、容器、应用的层层芯片级安全加密可信的云上环境,以此来保障客户的应用和数据安全。
目阿里云超过40款产品支持全链路加密,同时适用产品均支持自选密钥,是国内实现该功能最多的云服务商,也是国内首个通过专有云商用密码应用安全性评估,政务云国密能力验证的云厂商,真正实现只有用户才能看到并使用自己的数据,同时把加密算法的密钥控制权交给用户,让用户对数据的调用和读取具备完全的控制权。
在最后,张剑锋还对此次的演讲总结了三条结论,第一,ICT 和 IT 发展至今,原本云是IT的一部分,如今IT则成为了云的一部分;第二,云计算和云原生发展加速,未来的云计算将会更加的高效、环保、节能;第三,云、网、端协同发展后,必然会诞生新的计算机体系结构。而这一切,都会推动数字新生态的诞生。