直击2024 WAIC现场:关于大模型,热情、焦虑与冷静同在

世博展览馆内人们的热情,与世博中心内参与论坛的人们,心情似乎并不成正比。

展馆内人们看到的大模型加速落地是表象,也是结果;而论坛里的企业家和人工智能学者们则更关注大模型的未来发展方向和商业化进程,以及AI安全问题等等。仿佛关于AI的一切,热情、焦虑与冷静同在。

作者|思杭

出品|产业家

梅雨季的上海,在今年的世界人工智能大会期间,开启了异常的高温状态。然而,对于两年持续挂在WAIC主题词榜首的“大模型”而言,展馆内游客的热情,与论坛内专家学者们的焦虑,形成了鲜明对比。可谓是,“外行人看热闹,内行人看门道。” 

那么,这个既叫人兴奋,又令人焦虑的大模型,如今究竟走到哪一步了? 

不同于去年大模型的“重在参与”,今年的重头戏聚焦在更实际的应用、更颠覆性的技术和更普惠的模型。从百度、阿里、腾讯、京东、商汤,到智谱、面壁、百川、Minimax,再到三大运营商,大家从参数谈到技术,从多模态谈到端云协同,从价格谈到应用落地,各家在大模型的方向上似乎愈加清晰,也愈加务实。 

“其实我们内部对大模型技术、产品和应用都挺冷静的”,“大模型价格战一定不是长久之计”,“今年明显感觉到了企业自身希望通过大模型来解决内部业务上的一些问题”,上述言论均来自于本次WAIC大会上云厂商和大模型企业的高层发言。 

而透过本次WAIC大会,一个对于产业界更清晰的信号则是,虽然技术依旧青涩,焦虑也依然存在,也有更多AI安全问题亟待解决,但一个个在产业侧落地的AI应用的确在真实地发生。 

以下为产业家在WAI C大会的现场实录: 

一、云厂商谈大模型:护城河已初现雏形

阿里云的“通义灵码”、蚂蚁集团 的“支付宝智能助理”、商汤Vimi可控人物视频生成大模型,以及智谱的基座大模型GLM-4,以上被评为“WAIC 2024八大镇馆之宝”的四款产品,也许是看见当下大模型发展的最佳窗口。总体来看,它们代表着能对标国际领先模型的前沿技术,与渗透进日常生活的应用落地。 

然而,从B端的角度来看,上述产品却仅呈现出了冰山一角,一个全景的AI产业视图则是由云厂商、大模型企业和三大运营商的不同产品和模型共同构成。而对此,这些企业在大模型的布局可以说是术业有专攻。如果说2023是大模型“重在参与”的一年,那么2024可谓是“锋芒毕露”的一年,如今看来,其各自的护城河已初现雏形。 

透过本次世界人工智能大会,关于大模型,可以主要分为六大类别,分别是大模型、小模型、垂直行业模型、多模态模型、开源模型和部署在端侧的AI PC。 

首先,毋庸置疑的是,几大云厂商始终牢牢占领着大模型的主阵地。无论是从过去拼参数的时候,“一家更比一家强”;还是到后来基于大模型重构自身底座,颠覆企业开发模式,从PaaS到MaaS;抑或是基于自身垂直行业know-how,如今积累数十万家客户;甚至是随着用户规模提升,越来越普惠的价格;这些都是云厂商在大模型这个主战场上的强有力证明。 

而在今年的WAIC上,如果说从企业各自的展位占地面积来看,华为、阿里、百度、腾讯这四大云厂商也的确是整个展馆中占地面积最大的四大厂商(排名不分先后)。 

2024WAIC大会展位图 

然而,如果从各家强调的重点来看,则会发现即使都是云厂商,在大模型的发力也各有不同。比如在本次WAIC大会的分论坛现场,阿里云在开场时便公布了一份成绩单,即通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。 

实际上,在两年前的世界人工智能大会上,阿里云就公布了其通义模型开源的理念。到去年8月,通义就加入到开源行列。而目前,阿里云所开源的Qwen2也持续受到开源社区的好评。 

其中,HuggingFace联合创始人兼CEO Clem发文表示:“Qwen2是王者,中国在全球开源大模型领域处于领导地位。” 

另外,提到大模型领域的开源,在本届WAIC大会的分论坛现场,腾讯首次宣布开源全球最大甲骨文多模态数据集,该数据集包含一万片甲骨的拓片、摹本等等,助力于推动甲骨文研究加速数字化和智能化。实际上,在大模型狂飙了两年的今天,愈加成熟的技术和愈加繁荣的生态,则都可以说是对大模型价值的认可。 

而在这个人文价值大于商业价值的“甲骨文多模态数据集”的背后,它所考验的同时也是腾讯云在AI底层技术的积淀,尤其是在音视频算法技术方面。对于腾讯而言,多模态模型可以称得上是在本届WAIC大会区别于其他大模型的一大亮点。 

为什么腾讯可以在多模态方面居于领先地位?实际上,在过去一年时间里,腾讯已经将其自身沉淀的音视频底层技术,在AI的加持下,输送给腾讯内部的多个产品,其中最为代表的便是大模型时代下技术不断实现突破的腾讯会议。 

而除了上述提到的从开源生态到多模态模型的发展,围绕本届WAIC大会的一个更为重要的主题词便是“新质生产力”。站在产业的角度去解读,则意味着,以大模型为抓手,在产业侧实现加速落地,并成为真实助力各行各业的“新质生产力”。而这也是本次 WAIC大会上百度智能云在分论坛的一大焦点。 

从教育、人事,到企业服务、文娱、医疗等等领域,百度智能云如今基于5大行业、20多个场景有了更多标准化的解决方案。而在这些标准化的解决方案背后,也正是其在无数个客户身上沉淀下来的行业know-how。对此,百度智能云在现场披露了一份数据,即截至目前,百度智能云千帆客户数已经超过15万家。 

此外,在现场一个更为重磅的消息则是文心大模型的再次降价。其中,文心模型系列的ERNIE 4.0 Turbo面向企业客户全面开放,输入输出价格分别低至0.03元/千Tokens、0.06元/千Tokens。 

另外,提到应用落地,在国内众多大模型中,一个绕不开的存在便是华为的盘古大模型。从气象大模型到矿山大模型,再到华为在政务、铁路、金融、制造、汽车等等领域所积累的垂直行业大模型,可以说在业界都是很难撼动的存在。 

可以说,现如今,在云厂商内部,已经有越来越多的企业加入到打造垂直行业模型的队伍当 中。与此同 时,它也预示着,大模型在千行百业的加速落地。 

二、AI企业谈大模型:从C到B,再从B到C

对于走在AI最前沿的世界人工智能大 会而言,频繁更换的主题词,同样也意味着每年都有新面孔。而在大模型成为焦点的今年,新面孔则是聚焦大模型赛道上的AI企业。这些企业在过去一年不仅是备受资本关注,更是成为云厂商的“武器库”,因此,它们也有另一个名字“明星AI公司”。 

然而,与云厂商不同,大模型企业有其自己特定的基因。而这也注定了,它们与云厂商有着两条完全不同的路线。 

在WAIC大会现场,我们观察到,以智谱、面壁、百川和MiniMax为首的大模型企业,各自的发力重点可以说都各有千秋。比如,被评选为“镇馆之宝”智谱AI基座大模型GLM-4,同时也号是“中国版的OpenAI”。 

另外,面壁智能则是作为大模型企业中主打端侧模型的一个存在,在本届WAIC大会的阿里云分论坛上,其宣布了最新模型“小小钢炮”,即MiniCPM-S,这是继上一款MiniCPM“小钢炮”的再缩小版,参数仅有1.2B,但性能却更强。对此,面壁智能还专门提出了“面壁定律”,即通过更高的知识密度,实现更高效的模型。 

而另外两家AI公司,Minimax和百川智能,则分别展示了自家的多模态大模型,和涵盖开源和闭源的大模型全家桶。总体来看,相比于云厂商提供的大模型,大模型企业的模型参数并不大,但效能甚至不输于国际顶级AI公司OpenAI。 

与此同时,随着大模型逐渐走向落地,关注点也从参数变成了更具实际意义的端侧。 

对此,在WAIC展馆现场,产业家观察到,不仅仅是专注于端侧模型的大模型企业,一些云厂商和数字化服务商也都聚焦在AI PC的应用落地上,比如星环科技在展馆所展示为财经、法律等领域打造的AI PC,以及阿里云为教育行业打造的无影云AI助手,另外,联想也在发布了数十款AI PC,其中联想AI PC中的“天禧”个人大模型是基于阿里通义千问等通用大模型打造的。 

然而,在这些侧重点各有不同的背后,一个问题是,为什么大模型企业的方向是端侧,是AI PC,是小模型? 

如果从企业自身基因出发,首先大模型企业成立时间并不长,但由于其创始团队都来自于在人工智能领域最前沿的学者、专家和互联网企业高层等等,这同时也意味着其大模型的效能可以更强,技术本身也并不输于云厂商的大模型。 

然而,由于大模型企业不同于云厂商有过去云计算时代和互联网时代,服务tob企业的行业know-how等经验,这也注定了大模型企业的命运,即一边与云厂商联手,一边想办法“弯道超车”找到自身的创新点。 

实际上,在B端的应用落地,大模型公司也有其自身优势。比如以端侧模型为发力点的面壁智能,近期就为深圳市中级人民法院打造了国内首个司法审判垂直大模型;再比如,在WAIC现场,智谱AI也提供了包括公共事务、消费、文旅、医疗等多个行业场景的典型案例。 

那么,大模型企业未来的想象力又在何处? 

可以说,如今的大模型已经从AIGC类的C端应用,发展到B端为行业打造的垂直大模型,并提供解决方案,而未来,对于大模型企业而言,其想象力则恰在如何通过B端积累的行业know-how,打造C端AI应用,从而真正繁荣大模型生态。而这也正是大模型企业在这条赛道上能够实现弯道超车的机会之一。 

有人说,目前大模型都是自嗨,因为还没有“Killer App”出现,大家都在等一个能真正点燃国内大模型的killer app。对此,无论是大模型企业,还是云厂商都在提通过开源缩短差距,或者通过降价来繁荣大模型生态。然而,大模型企业与云厂商虽然立场不同,策略也不同,但却殊途同归,目的都是共同国内大模型的生态。 

距离世博展览馆不远的茶馆,在一个轻松惬意的环境下,面壁智能CEO李大海对媒体诉说了其做端侧大模型的心路历程,在这过程中,他提到了“数据飞轮”,即通过服务B端客户沉淀下来的数据,从而不断进行产品迭代。而这也正是大模型企业从C到B,再从B到C的想象力。 

三、加速落地背后,焦虑依旧

从国央企+AI,到工业、银行、医疗等等领域+AI,在今年的WAIC大会期间,“AI +应用”展区也成为了一道新的风景线。 

来逛展的人从数字化服务商到寻求AI解决方案的企业,听到最多的问题就是,“什么是RAG?”,“如果用大模型能不能解决我们企业的问题?”,似乎人们都可以从中寻找到自己想要的答案。 

然而,世博展览馆内人们的热情,与世博中心内参与论坛的人们,心情似乎并不成正比。 

在大模型加速落地的如今,也不乏有焦虑的情绪存在。可以说,展馆内人们看到的大模型加速落地是表象,也是结果;而论坛里的企业家和人工智能学者们则更关注大模型的未来发展方向和商业化进程,以及AI安全问题等等。 

实际上,谈及大模型的发展,不少企业家和学者都对大模型价格战呈现出担忧的心情。其中,京东探索研究院院长何晓东博士在谈及大模型发展现状时,提到了对于大模型价格战的看法,“大模型价格战短期来讲确实会繁荣生态,但长期来讲一定不是长久之计,现在的价格可能连电费都不一定付得起”。 

而从5月份以来,云厂商对于大模型的降价就从未停息。这其中,也不断有声音传出,比如云厂商对大模型的降价究竟是因为用户规模提升带来的技术普惠,还是在大模型时代“换汤不换药”的传统打法。 

至今为止,关于这一话题都仍有争议,目前主要有两大派别,一方是坚信云厂商的降价的确是用户规模达到一定程度了,对此,从上述百度智能云和阿里云的客户数即可窥探一二;但另一方则认为如今缺、缺算力、能耗高等等这些问题都并未解决,价格战绝不是长久之计。 

这两种说法的背后,所代表的是不同立场。 

于云厂商而言,短期内由于用户规模上涨也许能够承担成本,也确实会达到繁荣生态的作用;而于规模并不太大的AI大模型企业而言,则需要通过小参数模型来获取自身优势,从这一角度看,降价则并不是最佳方案。 

在本届WAIC大会期间,有超20位人工智能专家学者到访WAIC,而在各大论坛的圆桌环节,专家们从大模型的落地现状谈到未来趋势,从数字人谈到具身智能,从AI安全到基础学科的重要性,仿佛一切围绕着AI的话题都散发着焦虑。 

而论坛以外,有电梯间里外国学者对API for Science的热情讨论,有滴滴司机对自动驾驶可能带来失业的担忧,也有企业和服务商对大模型的冷静,又仿佛关于AI的一切,热情、焦虑与冷静同在。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/867822.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机的错误计算(二十三)

摘要 计算机的错误计算(二十二)阐明:对于结果应该为 0的算式,即使增加计算精度,也得不出0. 针对 ,本节给出一种解决方案。 计算机的错误计算(十九)展示了计算机对 的错误计算&…

【0基础学爬虫】爬虫框架之 feapder 的使用

前言 大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0…

Python遥感开发之时序数据的线性插值

Python遥感开发之时序数据的线性插值 0 历史博客1 实现思路2 代码实现3 效果展示 前言:在遇到空间数据的时候,尤其是哨兵、Landsat或者MODIS数据会出现局部值的空缺,为了解决这些值的空缺,通常采用插值的方法,本博客使…

Python编程学习笔记(1)--- 变量和简单数据类型

1、变量 在学习编程语言之前,所接触的第一个程序,绝大多数都是: print("Hello world!") 接下来尝试使用一个变量。在代码中的开头添加一行代码,并对第二行代码进行修改,如下: message "…

中国星坤X1224系列线对板连接器:小巧稳定,助力物联网终端高效运行

在物联网、电器和消防等领域,终端设备的安全稳定运行至关重要。为了满足这些领域对连接器高可靠性、小巧轻便和耐高温的需求,X1224系列线对板连接器应运而生。这款连接器以其独特的设计和卓越的性能,成为了终端设备中不可或缺的一部分。 一、…

Ubantu22.04 通过FlatPak安装微信

Ubuntu22.04 下使用Flatpak稳定安装微信! 国际惯例,废话不多说,先上效果图。为啥使用Flatpak,因为Wechat官方只在FlatPak发布了最新的版本。之前使用了Wine以及Dock安装Wechat,效果都不是很理想,bug很多。所以使用了FlatPak。 Fl…

免费的鼠标连点器电脑版教程!官方正版!专业鼠标连点器用户分享教程!2024最新

电脑技术的不断发展,许多用户在日常工作和娱乐中,需要用到各种辅助工具来提升效率或简化操作,而电脑办公中,鼠标连点器作为一种能够模拟鼠标点击的软件,受到了广大用户的青睐。本文将为大家介绍一款官方正版的免费鼠标…

一.2.(3)放大电路的图解分析方法和微变等效电路分析方法;

放大电路的主要分析方法:图解法、微变等效电路法 这里以共射放大电路为例 (1) 图解法: 1.静态分析 首先确定静态工作点Q,然后根据电路的特点,做出直流负载线,进而画出交流负载线,最后,画出各极电流电压的波形。求出最大不失真输出电压。 估算IBQ,然后根据数据手册里…

09.QT控件:按钮类控件

1. QPushButton 在QT中使⽤ QPushButton 表⽰⼀个按钮。QPushButton 继承⾃ QAbstractButton,这个类是⼀个抽象类,是其他按钮的⽗类。 (1)QAbstractButton 中,和 QPushButton 相关性较⼤的属性: &#xf…

STM32-Unix时间戳和BKP备份寄存器以及RTC实时时钟

本内容基于江协科技STM32视频学习之后整理而得。 文章目录 1. Unix时间戳1.1 Unix时间戳简介1.2 UTC/GMT1.3 时间戳转换 2. BKP备份寄存器2.1 BKP简介2.2 BKP基本结构2.3 BKP库函数 3. RTC实时时钟3.1 RTC简介3.2 RTC框图3.3 RTC基本结构3.4 硬件电路3.5 RTC操作注意事项3.6 R…

vue事件处理v-on或@

事件处理v-on或 我们可以使用v-on指令(简写)来监听DOM事件,并在事件触发时执行对应的Javascript。用法:v-on:click"methodName"或click"hander" 事件处理器的值可以是: 内敛事件处理器&#xff1…

Golang | Leetcode Golang题解之第213题打家劫舍II

题目: 题解: func _rob(nums []int) int {first, second : nums[0], max(nums[0], nums[1])for _, v : range nums[2:] {first, second second, max(firstv, second)}return second }func rob(nums []int) int {n : len(nums)if n 1 {return nums[0]}…

SSRF靶场通关合集

目录 前言 SSRF总结 1.pikachu 1.1SSRF(curl) 1.1.1http协议 1.1.2 file协议查看本地文件 1.1.3 dict协议扫描内网主机开放端口 1.2 SSRF(file_get_content) 1.2.1 file读取本地文件 1.2.2 php://filter/读php源代码 2.DoraBox靶场 前言 最近…

恢复出厂设置手机变成砖

上周,许多Google Pixel 6(6、6a、6 Pro)手机用户在恢复出厂设置后都面临着设备冻结的问题。 用户说他们在下载过程中遇到了丢失 tune2fs 文件的错误 。 这会导致屏幕显示以下消息:“Android 系统无法启动。您的数据可能会被损坏…

Linux服务器使用总结-不定时更新

# 查看升级日志 cat /var/log/dpkg.log |grep nvidia|grep libnvidia-common

如何在多个服务器上安装WordPress分布式部署

许多网络主机现在保证其服务的正常运行时间为 99.9%,但这仍然每年最多有 8.7 小时的停机时间。 许多公司不能够承担这种风险。例如。在超级碗比赛中失败的体育新闻网站可能会失去忠实的追随者。 我们通过设置维护高可用性 WordPress分布式部署配置来帮助 WordPres…

unity3d:Shader知识点,矩阵,函数,坐标转换,Tags,半透明,阴影,深度,亮度,优化

基本结构 Shader "MyShaderName" {Properties {// 属性}SubShader {// 针对显卡A的SubShaderPass {// 设置渲染状态和标签Tags { "LightMode""ForwardBase" }// 开始Cg代码片段CGPROGRAM// 该代码片段的编译指令,例如:#p…

【笔记】在window上连接虚拟机中的redis

愚昧啊 困扰了我近两天的问题居然是因为是java代码写错地方了 在虚拟机中进入redis.conf文件 vim redis.conf /bind --斜杠搜索关键词 将值设置为 bind 0.0.0.0 保存 退出:wq 回到java中 添加redis依赖 刷新maven 就是在这一步出问题……………………………………自己在蓝…

LeetCode 189.轮转数组 三段逆置 C写法

LeetCode 189.轮转数组 C写法 三段逆置 思路: 三段逆置方法:先逆置前n-k个 再逆置后k个 最后整体逆置 由示例1得,需要先逆置1,2,3,4 再逆置5,6,7,最后前n-k个与后k个逆置 代码 void reverse(int*num, int left, int right) //逆置函数 { while(left …

react-类组件1

类组件&#xff1a; import { Component } from "react";class App extends Component {constructor() {super();this.state {message: "xxxxx",};}render() {return (<div><div>{this.state.message}</div></div>);} }export d…