编辑 | 宋慧
出品 | CSDN云计算
头图 | 付费下载于 IC photo
11月17日,全球开源的云原生数据编排软件开发商Alluxio宣布完成5000万美元C轮融资,该轮融资由新投资方高瓴创投领投,战略投资方和原股东a16z, Seven Seas Partners,火山石投资跟投。Alluxio已新设中国区总部,将大力开拓国内市场业务。
同时Alluxio今天也发布了数据编排平台2.7版本,通过并行数据加载、数据预处理和训练工作流,可将机器学习(ML)训练的I/O效率提高5倍,降低成本。新版本还提供更强性能分析,更好地支持Apache Hudi和Iceberg等开放表格格式,对数据湖的访问更易于扩展,实现Presto和Spark的分析提速。
最新版本2.7,增强混合/多云的人工智能机器学习负载支持
Alluxio 使数据团队能够将计算与存储分离,同时让数据更接近计算,用于跨云、跨集群和跨区域的分析和人工智能/机器学习工作负载。Alluxio 的智能数据分层和缓存为客户提供更好的性能和更强的可靠性。
对于新版本的特性和亮点,采访中,Alluxio创始人兼首席执行官李浩源对CSDN表示,2.7版本增强了对大规模数据应用和AI机器学习工作负载的支持,以及从容器化Kubernetes层面提高系统的易用性。
“Alluxio 2.7版本进一步巩固了Alluxio在云上人工智能(AI)、机器学习和深度学习方面的重要地位,”Alluxio创始人兼首席执行官李浩源提到。“随着数据集的增长以及CPU和GPU计算能力的增强,机器学习和深度学习已成为AI主流技术。这些技术的兴起推动了AI的发展,但也凸显了数据和存储系统访问中存在的一些挑战。”
“我们在1000个节点的集群中部署了Alluxio,用来加速我们游戏AI平台上模型训练的数据预处理。事实证明Alluxio稳定、可扩展且易于管理。”腾讯大数据平台研发负责人陈鹏表示。随着越来越多的大数据和AI应用容器化,Alluxio正在成为更多大型企业和机构的选择,作为加速数据分析和模型训练的中间层。
“拥有大规模分析和AI/ML计算框架的数据团队面临着越来越大的压力,需要让日益增长的数据源更易于访问,同时确保性能的稳定,这需要同时考虑数据本地性、网络I/O和成本问题,”ESG分析师 Mike Leone表示。“企业和机构希望选用更实惠和可扩展的存储,如云对象存储,同时避免昂贵的应用程序修改或处理新的性能问题。Alluxio通过抽象存储细节并使数据更接近计算侧来应对这些挑战,尤其是在混合云和多云环境中。”
顶级配置团队,开源商业取得快速发展
虽然成名于开源社区(Alluxio前身为Tachyon,后更名为Alluxio,遵循Apache2.0开源许可),不过Alluxio商业公司核心团队在工程研究和商业上都有丰富积累。
Alluxio创始人,董事长兼CEO李浩源本科毕业于北京大学计算机系,UC Berkeley AMPLab 博士,在伯克利大学攻读博士期间,师从分布式系统和网络领域泰斗Ion Stoica教授和Scott Shenker教授。李浩源博士在读期间,发布了Alluxio(前身Tachyon)的技术原型,获得硅谷和中国风投机构投资,创立Alluxio公司并致力于推广技术商业化。他在SOSP/NSDI等国际顶级会议发表论文10余篇,Google Scholar 引用量3000+,并担任Alluxio开源社区主席和Apache Spark成立委员会委员。本科时李浩源代表北京大学获得大学生国际编程比赛(ACM ICPC)全球第11名。
Alluxio公司的创始成员,开源社区副总裁范斌,本科毕业于中科大,博士毕业于卡内基梅隆大学计算机系,CSDN早前也对范博士做过专访(2016年CSDN专访范斌,谈开源三年后的Alluxio)。博士期间范斌博士在分布式系统算法和系统实现等方向发表多篇包括SIGCOMM、SOSP、NSDI等顶级国际会议论文以及多篇专利。加入Alluxio前, 范斌在Google从事下一代大规模分布式存储系统的研究与开发,曾获得谷歌年度技术奖。
全球销售和市场部高级副总裁John Mracek在加入Alluxio前,曾担任初创公司Imanis Data和NetSeer的首席执行官。此外也曾在eBay、雅虎等知名企业担任副总裁和总经理的职位。John拥有麻省理工学院计算机科学与工程学士学位。
除了创始团队的技术与商业积累,Alluxio近年在商业化也取得了快速进展。2021年初Alluxio宣布2021财年营收比2020财年增长3.5倍,创历史新高,并实现正现金流,客户数量翻一番,其中70%为财富500强公司,最大单集群规模达到3000+节点。据Alluxio介绍,目前全球十大互联网公司中已有包括Facebook、Airbnb、Uber、阿里巴巴、腾讯和字节跳动在内的八家企业部署了Alluxio,还有更多大型企业在生产中运行 Alluxio。也因此,在刚刚完成上一轮融资仅半年时间,Alluxio再次进入新一轮融资,以及新版本的发布迭代。
力拓中国市场,科技、金融、电信、基因制药等重点行业
Alluxio 表示将大力拓展国内市场业务,将北京设立为中国区总部,并成立本地化的研发团队,以快速响应并满足众多国内企业的个性化需求。凭借这笔超额认购的 C 轮融资资金,Alluxio将继续加大产品研发力量,在全球扩大目标市场规模和研发运营覆盖范围,推动公司业务快速增长。
对于重点应用行业,李浩源提到仍将重点投入在科技(含互联网)、金融、电信、基因制药等对数据应用有大规模数据基础和重度使用场景的行业。另外,李浩源看到,其他各行业均在社区中应用Alluxio并向前发展,例如能源等领域。
“为了保持竞争力,各行业的头部公司都在进行数字化转型。越来越多的企业架构已转向混合云和多云环境。虽然这种转变带来了更大的灵活性和敏捷性,但也意味着必须将计算与存储分离,这就对企业跨框架、跨云和跨存储系统的数据管理和编排提出了新的挑战,” 李浩源表示,“这笔融资将帮助公司进一步推动业务增长,助力全球扩张计划,进而帮助更多企业解决时下面临的最复杂的数据挑战。”