世博展览馆内人们的热情,与世博中心内参与论坛的人们,心情似乎并不成正比。
展馆内人们看到的大模型加速落地是表象,也是结果;而论坛里的企业家和人工智能学者们则更关注大模型的未来发展方向和商业化进程,以及AI安全问题等等。仿佛关于AI的一切,热情、焦虑与冷静同在。
作者|思杭
出品|产业家
梅雨季的上海,在今年的世界人工智能大会期间,开启了异常的高温状态。然而,对于两年持续挂在WAIC主题词榜首的“大模型”而言,展馆内游客的热情,与论坛内专家学者们的焦虑,形成了鲜明对比。可谓是,“外行人看热闹,内行人看门道。”
那么,这个既叫人兴奋,又令人焦虑的大模型,如今究竟走到哪一步了?
不同于去年大模型的“重在参与”,今年的重头戏聚焦在更实际的应用、更颠覆性的技术和更普惠的模型。从百度、阿里、腾讯、京东、商汤,到智谱、面壁、百川、Minimax,再到三大运营商,大家从参数谈到技术,从多模态谈到端云协同,从价格谈到应用落地,各家在大模型的方向上似乎愈加清晰,也愈加务实。
“其实我们内部对大模型技术、产品和应用都挺冷静的”,“大模型价格战一定不是长久之计”,“今年明显感觉到了企业自身希望通过大模型来解决内部业务上的一些问题”,上述言论均来自于本次WAIC大会上云厂商和大模型企业的高层发言。
而透过本次WAIC大会,一个对于产业界更清晰的信号则是,虽然技术依旧青涩,焦虑也依然存在,也有更多AI安全问题亟待解决,但一个个在产业侧落地的AI应用的确在真实地发生。
以下为产业家在WAI C大会的现场实录:
一、云厂商谈大模型:护城河已初现雏形
阿里云的“通义灵码”、蚂蚁集团 的“支付宝智能助理”、商汤Vimi可控人物视频生成大模型,以及智谱的基座大模型GLM-4,以上被评为“WAIC 2024八大镇馆之宝”的四款产品,也许是看见当下大模型发展的最佳窗口。总体来看,它们代表着能对标国际领先模型的前沿技术,与渗透进日常生活的应用落地。
然而,从B端的角度来看,上述产品却仅呈现出了冰山一角,一个全景的AI产业视图则是由云厂商、大模型企业和三大运营商的不同产品和模型共同构成。而对此,这些企业在大模型的布局可以说是术业有专攻。如果说2023是大模型“重在参与”的一年,那么2024可谓是“锋芒毕露”的一年,如今看来,其各自的护城河已初现雏形。
透过本次世界人工智能大会,关于大模型,可以主要分为六大类别,分别是大模型、小模型、垂直行业模型、多模态模型、开源模型和部署在端侧的AI PC。
首先,毋庸置疑的是,几大云厂商始终牢牢占领着大模型的主阵地。无论是从过去拼参数的时候,“一家更比一家强”;还是到后来基于大模型重构自身底座,颠覆企业开发模式,从PaaS到MaaS;抑或是基于自身垂直行业know-how,如今积累数十万家客户;甚至是随着用户规模提升,越来越普惠的价格;这些都是云厂商在大模型这个主战场上的强有力证明。
而在今年的WAIC上,如果说从企业各自的展位占地面积来看,华为、阿里、百度、腾讯这四大云厂商也的确是整个展馆中占地面积最大的四大厂商(排名不分先后)。
2024WAIC大会展位图
然而,如果从各家强调的重点来看,则会发现即使都是云厂商,在大模型的发力也各有不同。比如在本次WAIC大会的分论坛现场,阿里云在开场时便公布了一份成绩单,即通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。
实际上,在两年前的世界人工智能大会上,阿里云就公布了其通义模型开源的理念。到去年8月,通义就加入到开源行列。而目前,阿里云所开源的Qwen2也持续受到开源社区的好评。
其中,HuggingFace联合创始人兼CEO Clem发文表示:“Qwen2是王者,中国在全球开源大模型领域处于领导地位。”
另外,提到大模型领域的开源,在本届WAIC大会的分论坛现场,腾讯首次宣布开源全球最大甲骨文多模态数据集,该数据集包含一万片甲骨的拓片、摹本等等,助力于推动甲骨文研究加速数字化和智能化。实际上,在大模型狂飙了两年的今天,愈加成熟的技术和愈加繁荣的生态,则都可以说是对大模型价值的认可。
而在这个人文价值大于商业价值的“甲骨文多模态数据集”的背后,它所考验的同时也是腾讯云在AI底层技术的积淀,尤其是在音视频算法技术方面。对于腾讯而言,多模态模型可以称得上是在本届WAIC大会区别于其他大模型的一大亮点。
为什么腾讯可以在多模态方面居于领先地位?实际上,在过去一年时间里,腾讯已经将其自身沉淀的音视频底层技术,在AI的加持下,输送给腾讯内部的多个产品,其中最为代表的便是大模型时代下技术不断实现突破的腾讯会议。
而除了上述提到的从开源生态到多模态模型的发展,围绕本届WAIC大会的一个更为重要的主题词便是“新质生产力”。站在产业的角度去解读,则意味着,以大模型为抓手,在产业侧实现加速落地,并成为真实助力各行各业的“新质生产力”。而这也是本次 WAIC大会上百度智能云在分论坛的一大焦点。
从教育、人事,到企业服务、文娱、医疗等等领域,百度智能云如今基于5大行业、20多个场景有了更多标准化的解决方案。而在这些标准化的解决方案背后,也正是其在无数个客户身上沉淀下来的行业know-how。对此,百度智能云在现场披露了一份数据,即截至目前,百度智能云千帆客户数已经超过15万家。
此外,在现场一个更为重磅的消息则是文心大模型的再次降价。其中,文心模型系列的ERNIE 4.0 Turbo面向企业客户全面开放,输入输出价格分别低至0.03元/千Tokens、0.06元/千Tokens。
另外,提到应用落地,在国内众多大模型中,一个绕不开的存在便是华为的盘古大模型。从气象大模型到矿山大模型,再到华为在政务、铁路、金融、制造、汽车等等领域所积累的垂直行业大模型,可以说在业界都是很难撼动的存在。
可以说,现如今,在云厂商内部,已经有越来越多的企业加入到打造垂直行业模型的队伍当 中。与此同 时,它也预示着,大模型在千行百业的加速落地。
二、AI企业谈大模型:从C到B,再从B到C
对于走在AI最前沿的世界人工智能大 会而言,频繁更换的主题词,同样也意味着每年都有新面孔。而在大模型成为焦点的今年,新面孔则是聚焦大模型赛道上的AI企业。这些企业在过去一年不仅是备受资本关注,更是成为云厂商的“武器库”,因此,它们也有另一个名字“明星AI公司”。
然而,与云厂商不同,大模型企业有其自己特定的基因。而这也注定了,它们与云厂商有着两条完全不同的路线。
在WAIC大会现场,我们观察到,以智谱、面壁、百川和MiniMax为首的大模型企业,各自的发力重点可以说都各有千秋。比如,被评选为“镇馆之宝”智谱AI基座大模型GLM-4,同时也号是“中国版的OpenAI”。
另外,面壁智能则是作为大模型企业中主打端侧模型的一个存在,在本届WAIC大会的阿里云分论坛上,其宣布了最新模型“小小钢炮”,即MiniCPM-S,这是继上一款MiniCPM“小钢炮”的再缩小版,参数仅有1.2B,但性能却更强。对此,面壁智能还专门提出了“面壁定律”,即通过更高的知识密度,实现更高效的模型。
而另外两家AI公司,Minimax和百川智能,则分别展示了自家的多模态大模型,和涵盖开源和闭源的大模型全家桶。总体来看,相比于云厂商提供的大模型,大模型企业的模型参数并不大,但效能甚至不输于国际顶级AI公司OpenAI。
与此同时,随着大模型逐渐走向落地,关注点也从参数变成了更具实际意义的端侧。
对此,在WAIC展馆现场,产业家观察到,不仅仅是专注于端侧模型的大模型企业,一些云厂商和数字化服务商也都聚焦在AI PC的应用落地上,比如星环科技在展馆所展示为财经、法律等领域打造的AI PC,以及阿里云为教育行业打造的无影云AI助手,另外,联想也在发布了数十款AI PC,其中联想AI PC中的“天禧”个人大模型是基于阿里通义千问等通用大模型打造的。
然而,在这些侧重点各有不同的背后,一个问题是,为什么大模型企业的方向是端侧,是AI PC,是小模型?
如果从企业自身基因出发,首先大模型企业成立时间并不长,但由于其创始团队都来自于在人工智能领域最前沿的学者、专家和互联网企业高层等等,这同时也意味着其大模型的效能可以更强,技术本身也并不输于云厂商的大模型。
然而,由于大模型企业不同于云厂商有过去云计算时代和互联网时代,服务tob企业的行业know-how等经验,这也注定了大模型企业的命运,即一边与云厂商联手,一边想办法“弯道超车”找到自身的创新点。
实际上,在B端的应用落地,大模型公司也有其自身优势。比如以端侧模型为发力点的面壁智能,近期就为深圳市中级人民法院打造了国内首个司法审判垂直大模型;再比如,在WAIC现场,智谱AI也提供了包括公共事务、消费、文旅、医疗等多个行业场景的典型案例。
那么,大模型企业未来的想象力又在何处?
可以说,如今的大模型已经从AIGC类的C端应用,发展到B端为行业打造的垂直大模型,并提供解决方案,而未来,对于大模型企业而言,其想象力则恰在如何通过B端积累的行业know-how,打造C端AI应用,从而真正繁荣大模型生态。而这也正是大模型企业在这条赛道上能够实现弯道超车的机会之一。
有人说,目前大模型都是自嗨,因为还没有“Killer App”出现,大家都在等一个能真正点燃国内大模型的killer app。对此,无论是大模型企业,还是云厂商都在提通过开源缩短差距,或者通过降价来繁荣大模型生态。然而,大模型企业与云厂商虽然立场不同,策略也不同,但却殊途同归,目的都是共同国内大模型的生态。
距离世博展览馆不远的茶馆,在一个轻松惬意的环境下,面壁智能CEO李大海对媒体诉说了其做端侧大模型的心路历程,在这过程中,他提到了“数据飞轮”,即通过服务B端客户沉淀下来的数据,从而不断进行产品迭代。而这也正是大模型企业从C到B,再从B到C的想象力。
三、加速落地背后,焦虑依旧
从国央企+AI,到工业、银行、医疗等等领域+AI,在今年的WAIC大会期间,“AI +应用”展区也成为了一道新的风景线。
来逛展的人从数字化服务商到寻求AI解决方案的企业,听到最多的问题就是,“什么是RAG?”,“如果用大模型能不能解决我们企业的问题?”,似乎人们都可以从中寻找到自己想要的答案。
然而,世博展览馆内人们的热情,与世博中心内参与论坛的人们,心情似乎并不成正比。
在大模型加速落地的如今,也不乏有焦虑的情绪存在。可以说,展馆内人们看到的大模型加速落地是表象,也是结果;而论坛里的企业家和人工智能学者们则更关注大模型的未来发展方向和商业化进程,以及AI安全问题等等。
实际上,谈及大模型的发展,不少企业家和学者都对大模型价格战呈现出担忧的心情。其中,京东探索研究院院长何晓东博士在谈及大模型发展现状时,提到了对于大模型价格战的看法,“大模型价格战短期来讲确实会繁荣生态,但长期来讲一定不是长久之计,现在的价格可能连电费都不一定付得起”。
而从5月份以来,云厂商对于大模型的降价就从未停息。这其中,也不断有声音传出,比如云厂商对大模型的降价究竟是因为用户规模提升带来的技术普惠,还是在大模型时代“换汤不换药”的传统打法。
至今为止,关于这一话题都仍有争议,目前主要有两大派别,一方是坚信云厂商的降价的确是用户规模达到一定程度了,对此,从上述百度智能云和阿里云的客户数即可窥探一二;但另一方则认为如今缺、缺算力、能耗高等等这些问题都并未解决,价格战绝不是长久之计。
这两种说法的背后,所代表的是不同立场。
于云厂商而言,短期内由于用户规模上涨也许能够承担成本,也确实会达到繁荣生态的作用;而于规模并不太大的AI大模型企业而言,则需要通过小参数模型来获取自身优势,从这一角度看,降价则并不是最佳方案。
在本届WAIC大会期间,有超20位人工智能专家学者到访WAIC,而在各大论坛的圆桌环节,专家们从大模型的落地现状谈到未来趋势,从数字人谈到具身智能,从AI安全到基础学科的重要性,仿佛一切围绕着AI的话题都散发着焦虑。
而论坛以外,有电梯间里外国学者对API for Science的热情讨论,有滴滴司机对自动驾驶可能带来失业的担忧,也有企业和服务商对大模型的冷静,又仿佛关于AI的一切,热情、焦虑与冷静同在。