百度的新想象力在哪?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。 

作者|皮爷 

出品|产业家 

沿着首钢园北区向西北步行10分钟,就能看到一个高约90米的大跳台,在工业园钢铁痕迹的印衬下,雪白的坡道在给人质感的同时,也更多了几分厚重——这里是刚刚过去的冬季奥运会自由滑板大跳台和单人滑板大跳台项目的举办地,伫立在首钢园的它也是当今全世界唯一一个永久保留的滑雪大跳台。

今天,这里是百度的主场。

关于百度,在过去的一年里很难有人忽视掉这家老牌中国互联网企业。不论是在大模型浪潮里代表中国的“率先出战”,还是其大模型产品在技术参数和落地上的一个个动作,再或者是百度在自身各个产品线上的AI重构,每一个事件和节点都在成为着中国大模型舞台上的核心事件之一。

这些成绩在展示着中国AI企业的特殊加速度背后,也更在让外界重新认识和理解百度——在All in AI多年后,有一身“极客”气质的百度终于站在了自己的专属舞台上。

不过如今,和它一起出现再次出现在“百度世界大会”舞台上的,不仅是大模型本身,还有百度各个“换上新装”的一众明星产品:百度文库、百度文档、百度网盘等等……

现在的百度,是一个怎样的百度?又或者说,伴随着AI大模型浪潮蜂拥而来的,除了文心大模型,百度在发生的改变还有什么?

理解中国大模型,百度是一个窗口。这个窗口的特殊性不仅在于变化本身,而是在于百度本身就是那个窗口。

一、大模型潮水里的百度时刻

“我们是全球科技大厂里最先发布大模型的公司。”在今年的3月16日,始终身穿一身白衬衫出现在公众面前的李彦宏向外界发布了百度文心大模型。

而在7个月过后的今天,这个被率先发布的互联网大厂大模型有了新的成绩单——文心大模型4.0版本正式发布。客观来看,这是目前国内唯一一个可以对标GPT-4的大模型产品。

这意味着什么?

过去几个月的时间里,大模型浪潮蜂拥而来。根据中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》数据显示,目前国内大模型数量超过200家,其中参数量级超过10亿的模型数接近80个。

这些模型不仅是基础模型,更多的则是产业模型,比如面向金融、教育、工业、农业等不同的产业方向,它们都在成为着大模型的价值自证地和新机会市场。

但在其中,百度文心大模型仍然是尤为特殊的一个。

能力本身是大模型绕不开的必考卷。从时间线来看,在百度推出文心一言模型后的2个月后,百度正式宣布文心大模型正式从 3.0 升级到3.5,文心大模型 3.5 的模型效果累计提升超过 50%,训练速度提升了 2 倍,推理速度提升了 30 倍。

这个升级在IDC发布的《AI大模型技术能力评估报告,2023》中有足够清晰的例证。即百度文心大模型3.5在12项相关指标测试中,拿下了7个满分,包括综合评分、算法模型、行业覆盖等均取得了第一名。

而如今的4.0版本尽管被社会层面的验证仍然在路上。但根据官网数据显示,文心大模型4.0,相比3.5版本,逻辑和记忆能力有显著的提升,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。此外,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。

此外,能力之外,场景更是当下大模型被检验的核心指标。在面向产业端的市场中,百度智能云发布了千帆平台,为企业提供“大模型超级工厂”服务。而这个方案的数据是,从今年3月份以来,它已经服务了超过17000家客户,在超过400个场景中实现了落地。

而在这些之外,百度的更特殊之处在于对自身的重新重塑,在在这次大会上重磅亮相的百度文库、百度文档、百度网盘等产品背后,对应的是百度自身对于AI的深度应用和理解,即基于文心大模型,百度真正肉眼可见的进入AI-native时代。

实际上,在过去的几个月时间里,人们对于大模型的讨论始终不绝于耳。从最开始单纯追求参数,到后来的重视场景,再到如今的AI原生应用,对应的一方面是人们对于大模型技术愈发趋向理性和冷静的观察,另一方面也更是大模型本身在实际发展不同阶段的不同核心命题——从技术到场景到AI应用。

而伴随着这些不同的命题,对应的是舞台中央不断轮换的企业,比如技术至上的极客公司,比如有专有产业数据的产业模型企业,再比如具备产品开发能力的产品模型创业者等等。但在舞台中央,在不同的阶段,百度却始终都在聚光灯下。

不论是芯片算力、还是场景落地,再或者是生态开放和AI原生应用等等,在每一个大模型的棱面上,百度始终会是那个率先出击的企业,最终也恰构成了这次百度世界大会给外界展示出的大模型“多面体”。

或者可以说,百度在成为引领者、亲历者的同时,也更在成为一面中国大模型企业出击的“时刻”标签。

二、谁在推动AI奇点?

2019年,在小说《三体》出版后,刘慈欣还写了一篇名为《技术奇点》的文章,在文章中他写到,“什么是技术奇点?是技术的进步可能由量变产生突然的质变,在极短的时间里彻底改变人类世界的状态。”

而这个词,在如今的大模型时代更是被再次提及。即在大模型时代里,什么才是真正的奇点?又或者说,什么才是真正的推动大模型普惠的最直接路径?

如果说从技术到场景,对应的是大模型缓慢前行的过程。那么,在此之外一个更为直接的答案则是应用,更具体来说,则是基于大模型技术的应用。

“应用的最关键价值在于,它能让技术变得可见、可用和可感。”一位观察大模型的投资人告诉产业家,“它能强化大模型的普惠效应。”

这也正是百度的思考。以这次大会为例,百度内部诸多应用都在成为AI驱动的应用,比如百度文库,其升级为“一站式智能文档平台”,接下来其将不仅具备之前的信息查阅功能,更具备"PPT智能生成、文档智能生成、智能编辑、智能辅助阅读"等核心AI能力。

再比如百度网盘,其主打的网盘智能助理“云一朵”是国内首个网盘智能助理,用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。同样还有百度地图,基于文心大模型进行重构的百度地图V19,将上线全新“AI向导”,它将具备多轮自然语言交互能力,更接近“真人交流”体验。

可以理解为,百度正在将固有的产品界面基于大模型进行重新解构,这种解构不再是之前的产品功能优化,而是基于新的交互方式和强大的中文知识图谱做支撑,进行更为彻底的从交互到产品功能的重构。

实际上,这也恰是当下大模型强化技术标签的最强社会信号。

即伴随着大模型的技术推进,越来越多的共识是这项技术将会率先在产业侧落地,其基于大模型本身对数据的重新训练和表达可以转化为更先进的生产力,帮助企业实现更快速的数字化转型。

这种思考诚然如此,但在这之外,更关键的点在于对于C端人群语法凸显的一个问题是——“大模型是什么?”。在单纯的一问一答之外,大模型的更多元表达会是什么?

这个问题知易行难。对于中国互联网市场的一众产品而言,需要被重新架设的不仅是固有的产品思维,也更是在其上需要被重点强化的领域知识图谱和数据,以及足够强大的能支撑C端人群的算力底层。

可以理解为,百度的这些应用重构,恰是这个难题的答案。即作为兼备明星产品和坚实模型能力的互联网企业,百度是为数不多的可以将两者进行加法的科技厂商,这些最中文语义最强的知识图谱被拆解成具体的模块,经过特殊的微调和强化,和不同的产品形态进行特殊的加法,或乘法。

不过,从某种层面来看,这些应用也恰构成着百度或者说大模型企业在当下数字化时代的特殊飞轮,即通过应用可以对大模型进行更广和更深的数据训练和加持,基于现象级落地实现大模型自身的优化升级。

这是百度锚定的奇点,也更是一个大模型进化的必然奇点。

三、中国大模型拼图里,重新理解百度

实际上,在一众的节点之中,百度正在成为一个不同的百度。如果说百度之前的标签是搜索、是营销,那么如今百度更核心的标签恰是AI大模型。

这种变化足够鲜明。从整个产品矩阵来看,不论是百度最核心的搜索,还是百度文库、百度网盘、百度地图、百度营销,乃至其他板块的小度科技、度小满金融等等,都已然基于大模型构建出自己的新形态。

恰如李彦宏在会上所说,

就当下而言,在整个中国大模型的版图里,百度更可以看作是一个足够清晰的AI样板间。基于文心大模型,这家企业的产品、商业模式都在发生肉眼可见的变化,这些变化也恰在给市场和用户提供一种特殊的大模型普惠的使用方式——大模型被具象为更加专用的产品场景,帮助人们更好地解构数据和获取知识。

而在这种变化背后,对应的是如今百度文心大模型4.0更为强大的理解和逻辑能力,以及底层充分的算力支撑。

这些构成的是如今的新百度。在这个新的百度身上,看到的是新智能化的产品矩阵,新被拓宽的商业空间天花板和新的愈发广阔的新想象力。

当然,也更有对技术的始终专注和坚持。根据财报数据显示,百度核心研发费用占百度核心收入比例已连续7个季度超过20%,而这些研发的数字在如今的大模型时代,恰在从质变走到量变,转化成一个个百度重新出发的原点。

实际上,百度的变化也更在被市场所看见。在刚刚过去的9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等被评为全球AI领袖。《时代》给李彦宏的评语是,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。

更客观的表达是,在当下的AI时代,百度多年的默默坚持正在被转化为加速出发的动力。在这一轮的大模型潮水里,“百度时刻”在加速到来,属于百度的中央舞台也正在缓缓驶来。

仍记得一组数据——8 月 31 日,文心一言率先向全社会全面开放,从0 点至 24 点,文心一言共计回复网友超 3342 万个问题。

或许,多年之后再看这个时间点,它是许多人在大模型时代推开的第一扇大门,也更是新百度的推开的第一扇窗。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/111706.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cannot use object of type __PHP_Incomplete_Class as array

场景:将项目复制 出来一份后,修改控制器,打开后就报错 解决:将runtime 清除后就正常了

TikTok Shop新结算政策:卖家选择权加强,电商市场蓄势待发

据悉,从2023年11月1日开始,TikTok Shop将根据卖家的店铺表现来应用3种不同类型的结算期,其中,标准结算期:资金交收期为8个日历日;快速结算期:资金交收期为3个日历日;延长结算期&…

企业数字化转型时,会遇到的5大挑战

企业数字化转型时,会遇到的5大挑战添加链接描述 数字化转型已然是当今商业战略的一大基石,根据Gartner的《2023年度董事会调查》显示,有89%的企业将数字业务视为其增长的核心。但该研究的另一项统计数据也显示:在这些企业中&…

KingBase库模式表空间和客户端认证(kylin)

库、模式、表空间 数据库 数据库基集簇与数据库实例 KES集簇是由单个KES实例管理的数据库的集合KES集簇中的库使用相同的全局配置文件和监听端口、共享相关的进程和内存结构同一数据库集簇中的进程、相关的内存结构统称为实例 数据库 数据库是一个长期存储在计算机内的、有…

AI猫咪穿搭也太萌了!用AI写出好故事的22条诀窍;吴恩达AI新课预告;2024年十大战略技术趋势 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🔥 可口可乐与好利来跨界联名,推出与AI共创的新品巧克力 继「酱香拿铁」后又有一款跨界合作让人眼前一亮——可口可乐与好利来…

通用音乐播放器蜂鸣器AX301开发板verilog,视频/代码

名称:通用音乐播放器代码,蜂鸣器播放音乐 软件:Quartus 语言:Verilog 代码说明:本代码为音乐播放器通用代码,只需修改管脚即可适配其他开发板 代码功能: 设计一个音乐播放器,使用…

解决一则诡异的javascript函数不执行的问题

有个vue 音乐播放器项目,由于之前腾讯的搜索接口没法用了,于是改成了别家的搜索接口。 但是由于返回数据结构不一样,代码重构的工作量还是挺大的:包括数据请求,数据处理,dom渲染,处理逻辑都进行…

Elasticsearch:什么是余弦相似度?

余弦相似度是数据科学、文本分析和机器学习领域的基本概念。 如果你想知道什么是余弦相似度或者它如何在现实世界的应用程序中使用,那么你来对地方了。 本指南旨在让你深入了解相似性是什么、其数学基础、优点及其在不同领域的各种应用。读完本指南后,你…

PHP 变量

变量 变量的声明、使用、释放 变量定义 形式 $ 变量名;严格区分大小写 $name; $Name; $NAME //三个变量不是同一个变量字母、数字、下划线组成,不能以数字开头,不能包含其他字符(空白字符、特殊字符) 驼峰式命名法、下划线式命名法 $first_name; $fi…

在 Visual Studio Code (VS Code) 中设置

在 Visual Studio Code (VS Code) 中设置代理服务器的详细教程如下: 打开 Visual Studio Code。 在顶部菜单栏中,点击 "File"(文件) > "Preferences"(首选项) > "Settings…

IP协议(上)

目录 一、初步认识IP协议 二、认识IP地址 三、协议报头格式 1.报头和有效载荷分离 2.20字节的固定数据 四、网段划分 1.一个小例子 2.认识IP地址的划分 3.数据的传输过程 4.特殊的IP地址 5.通信运营商 (1)通信运营商的作用 (2&a…

如何利用考培系统进行个性化学习和评估

考培系统作为一种现代化的学习和评估工具,可以为学生提供个性化的学习和评估服务。它利用先进的技术和算法,根据学生的学习情况和需求,为其量身定制学习计划,并提供相应的评估反馈。 1. 个性化学习 考培系统通过分析学生的学习情…

javaEE - 2(11000字详解多线程)

一:多线程带来的的风险-线程安全 线程安全的概念:如果多线程环境下代码运行的结果是符合我们预期的,即在单线程环境应该的结果,则说这个程序是线程安全的。 当多个线程同时访问共享资源时,就会产生线程安全的风险&am…

【AIGC核心技术剖析】扩大富有表现力的人体姿势和形状估计SMPLer-X模型

富有表现力的人体姿势和形状估计 (EHPS) 将身体、手和面部运动捕捉与众多应用结合起来。尽管取得了令人鼓舞的进展,但当前最先进的方法仍然在很大程度上依赖于有限的训练数据集。在这项工作中,我们研究了将 EHPS 扩展到第一个通用基础模型(称为 SMPLer-X),以 ViT-Huge 作为…

【译】快速开始 Compose 跨平台项目

原文: Compose Multiplatform application 作者:JetBrains 注意 Compose Multiplatform 中的 iOS 部分目前处于 Alpha 状态。以后可能会有不兼容的更改,届时也许需要手动进行迁移。 你可以使用这个模板来开发同时支持桌面、安卓和 iOS 的跨平…

GitHub验证的2FA

一、 起因: GitHub需要双重身份验证 (2FA) 是登录网站或应用时使用的额外保护层。启用 2FA 时,必须使用您的用户名和密码登录,并提供另一种只有您知道或可以访问的身份验证形式。 二、解决: 2.1 这里使用chrome的身份验证插件进…

在emacs中,设置latex的主文档

文档: chapter1.tex chapter2.tex main.tex 在chapter1.tex中,先按下 ctrlc ctrln,再按下ctrlc ctrla,在下方的提示框中输入主文档。

支付宝小程序介入人脸识别(金融级--前端部分)

在这里只做前端部分说明: 详情参考文档:如何通过集成支付宝小程序唤起实人认证服务_实人认证-阿里云帮助中心 操作步骤 调用 API 发起认证。 发起认证服务。 调用 startBizService 接口请求认证。 function startAPVerify(options, callback) {my.call(startBizService, {n…

AWS S3加密

Hello大家好。 在本课时我们将讨论S3加密相关的内容。 S3加密相关是认证考试的一个重要的主题考点,您需要了解亚马逊S3的几种不同类型的加密方式。| 首先是静态数据的加密,静态数据加密是指数据存储在亚马逊S3 数据中心的磁盘上时&#xff0…

stable diffusion和midjourney哪个好

midjourney和stable diffusion哪个好?midjourney和stable diffusion的区别?那么今天就从这2款软件入手,来探索一下他们的功能的各项区别吧,让你选择更适合你的一款ai软件。 截至目前,我们目睹了生成式人工智能工具的在…