AI时代,百度的三大主义

图片

现实主义、长期主义、理想主义


定焦One(dingjiaoone)原创

作者 | 苏琦 郑浩钧

编辑 | 魏佳

“人工智能很像是一次新的工业革命,这意味着它不会三五年就结束,也不会一两年就出现‘超级应用’,它更像是三五十年对于整个社会一次彻底的重构。”

11月12日下午,李彦宏与硅星人创始人骆轶航,以及甲子光年创始人张一甲进行了一场“AI圆桌对谈”,再一次表达了他对AI的信仰,同时阐释了百度在AI上的战略和思考。

这场对谈也是对当天“百度2024世界大会”的延续。世界大会上,李彦宏发布了文心iRAG、无代码工具“秒哒”、自由画布等核心技术和产品,宣告“AI应用的群星闪耀时刻已然到来”。

李彦宏在对谈中表示,将此次百度世界大会的主题定为“应用来了”,是出于“有用”这一价值观。他表示,模型本身不产生直接价值,只有在模型之上开发各种应用,在各种场景找到所谓的PMF(产品市场契合),才能真正产生价值。“如果说2023年大家还在卷模型,让模型能力逐步地达到可用地步的话,那未来所谓的‘可用’,就是真的有东西用,应用的‘用’。”

自百度成立以来,李彦宏一直在AI领域进行前瞻研究和清醒布局。这样的坚守需要定力,也有厚积薄发的力量,不仅能带着百度朝前走,也能给行业带来理性的声音。

李彦宏的布道之路还在继续,他在圆桌访谈中表露心声:“在这条路上,需要长期主义、理想主义和现实主义的结合。”

这三大主义,也在李彦宏多年的AI探索中得到体现。

图片

现实主义:

解决幻觉难题,降低使用门槛

一年前,李彦宏曾呼吁,“大模型本身不仅不产生任何价值,还造成了对公司资源、社会资源的巨大浪费。” 

如果不做通用大模型,创业者应该做什么?当时李彦宏给出的答案是:AI原生应用,“我们需要的不是100个所谓的大模型,而是100万量级的AI原生应用。”

时间过去快两年,超级应用却迟迟没来,原因一方面是部分应用的技术有硬伤,例如文生图幻觉严重,中看不中用;另一方面是应用开发门槛太高,不够智能。在2024百度世界大会上,李彦宏带来两个杀手锏:iRAG(检索增强的文生图技术)和秒哒,解决了上述两大现实存在的技术难题,宣告“AI应用的群星闪耀时刻已然到来”。

图片

百度之所以选择做iRAG,是从现实的用户需求出发进行的倒推。李彦宏在访谈中提到,应用需要大模型能力,而大模型想要具备实用价值就需要有效控制幻觉生成,所以团队开始研究iRAG技术,并开发在ToB场景的应用。

同时,多模态要想进入真正实用阶段,也得有准确性和可控性,应用空间才能打开,这同样离不开iRAG。

iRAG技术作为大模型的一项基础技术,在影视作品、漫画作品、海报制作等几乎所有的创作场景,都能有广泛的应用空间,且可以大幅降低创作成本、提高创作效率。

李彦宏在对谈中举例,比如以前汽车的实拍宣传海报动辄需要十几万元,如果运用iRAG,不仅创作的成本接近于0,还能在保持车该有的形态的前提下,放飞人们的想象,创作出真正有创造力的故事情节,宣传也会更吸引人。

无代码工具“秒哒”的发布也让人兴奋。现在硅谷很重视辅助代码生成,美国很缺工程师,所以现在很多技术和工具都是用来提升这些工程师的效率。

但是百度的思路是,除了能让金字塔塔尖的人更加有效率优势,还想做出一款工具让金字塔中间层和底层的人,都拥有金字塔塔尖这些人的能力。

随着基础模型和智能体的能力逐步提升,百度把这些能力综合在一起,发布“秒哒”,让一行代码都看不懂的人具备程序员的能力。“当几亿、十几亿人都具备这种能力的时候,它对于创造力的爆发,是辅助代码生成工具无法比拟的。”李彦宏表示。

上述两大技术是李彦宏AI现实主义的体现,但这条“实用之路”也是一个逐步发展的过程,不会一蹴而就。“但它是非常有希望的赛道,一个人今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,激发更多人的创造性。”李彦宏在对谈中称。

图片

长期主义:

10年投千亿,应用终爆发

很多人提到巨头做AI和创新,最大的负担是legacy(遗产),但是李彦宏在访谈中直言,百度真正的legacy就是“相信AI”,“一旦你把这个东西当成legacy,很多东西就都很好解释,我就是在做我多年前一直想做的事。无论是深度学习、机器学习还是产品积累,一切都源自百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”

在大学时期就学习AI相关课程的他,很早就意识到AI是解决搜索引擎问题的核心技术,所以过去10年间百度投入1700亿研发和布局AI。他不仅自己信仰AI,还鼓励公司和社会关注AI,2012年,距离OpenAI成立还有3年,他就发布全员信鼓励全百度产品经理了解AI技术。2013年,他在百度年会上宣布成立深度学习研究院并担任院长。

李彦宏曾在2021年的《致股东信》中写道,“过去10年,我们打基础、建生态,在人工智能大潮奔涌而来的今天,百度成为了领先的AI生态型公司。”

正因为搭好了基础,如今才有了数以千万计的智能体和数十万的产业应用在百度的AI生态中涌现。

百度是少见的将智能体作为最重要战略方向的公司。根据用户的不同需求,李彦宏将智能体分为四类,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。

百度之所以将智能体看得如此重要,不仅因为其开发门槛低、天花板足够高,还看到了智能体与搜索结合,能拓展搜索的边界。

图片

换句话说,百度不仅提供基础大模型和应用开发工具,还提供分发渠道,在百度里搜相应的词,搜出来的结果有可能就是一个智能体。目前,百度新搜索已经成为了智能体分发最大入口,日均分发已超1000万。

李彦宏在访谈中解释,当百度的AI生态里拥有大量智能体的时候,能够将人的需求和智能体进行高效匹配和连接的渠道,还是搜索。同时,人与智能体需要多轮交互,甚至需要调用工具解决问题,这两者的结合拓展了搜索的边界,能打开更多新的可能性。



随着应用开发门槛的降低、智能体的增加,百度文心大模型的调用量也在迅速增长。据百度官方透露,目前文心大模型的日均调用量已超过15亿,较一年前首次披露的5000万次,增长近30倍。

李彦宏在访谈中分享了自己的观察,文心大模型最近两个月调用量的陡升背后是开发者群体的觉醒,他们逐步意识到可以用模型做出应用,这样的需求足够旺盛。

除了智能体,一些像百胜中国、智能招聘这样的公司,也因为和百度的合作,在它们具体的业务场景里,能够更加高效、更加低成本、更加快速的获得实实在在的收益。

百度构建智能产业生态的主要依托是百度智能云。目前在百度智能云的千帆大模型平台上,已经累计精调了3.3万个大模型,开发出了77万个企业级应用,百度智能云已经拥有中国最大的大模型产业落地规模,60%的央国企以及大量的民营企业,都在联合百度智能云进行AI创新。

目前,百度已经发布基于大模型的100大产业应用,涵盖制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。

图片

理想主义:

从AI拓荒者成为领跑者

虽然此次百度世界大会发布的更多是人人可用的产品,李彦宏的演讲也没有谈很大的命题,但是他身上仍表现出了“理想主义者”的影子。

一方面,百度把很多研发资源投在了“理想主义者”看重的东西上面,李彦宏在访谈中提到,“我们不断地在这方面加大投入、付出努力,没说并不代表没有做”。另一方面,李彦宏过去24年的AI信仰和沉淀,本身就是一种“清醒的理想主义”。

这个清醒体现在面对困境不迷茫,在2020年上海世界人工智能大会上,面对行业的低迷,李彦宏表示当下人工智能所处的阶段,是一个容易产生迷茫甚至悲观的阶段,这是大多数颠覆性技术在加速普及之前的必经阶段。“百度也曾从这样的低谷期爬出来过,所以我相信熬过寒冬就能成为新的英雄。”

这个清醒还体现在,市场冷清时率先布局、耐心坚守;市场热闹时消除噪音,看到潮水真正的流向。

相比于很多其他公司,在2022年11月OpenAI发布ChatGPT后才匆忙进入大模型领域,百度的文心大模型1.0版本早在2019年3月就发布。而当国内生成式大模型的浪潮来袭,李彦宏又呼吁不要卷大模型,应该专注实际场景,重视应用。这样的表态,在当时的环境下需要极大的勇气,事后证明,这其实就是全球主流的AI方向。

图片

2022年底创立的Perplexity.ai,创建了一种高效直接的搜索体验,百度也在去年3月发布文心一言App。到今年,各类以大模型为基础的国产智能助手遍地开花,再一次验证了李彦宏的猜想。

最前沿的技术浪潮是等不来的,浪潮到来前的每一步也都不会白走。这种对AI始终如一的信仰和清醒,给了百度更大的信心和回报。李彦宏带领的百度已经成为一个拥有广泛用户基础的AI生态型公司:在深度学习、对话式人工智能操作系统、自动驾驶等前沿领域均已深度布局。

过去三十年,中国的电脑行业和手机行业飞速发展,但遗憾的是,在这两个行业中,还没有出现中国操作系统巨头,李彦宏更大的理想,或许是让百度成为AI时代“操作系统”的最后胜利者。“我们的主要精力放在做工具、做基础平台,让大家更容易的在这上面开发应用。”

对于百度来说,搭建基础设施,在把自身优势放到最大的同时带动更多人一同开发创造,这是比取得某个单项赛道的胜利更有想象力、更有价值的事情。

2021年李彦宏在《致股东信》中曾写道,“每当百度徘徊在十字路口,我都会问自己,什么才能够让人真正制胜未来?”他给自己的答案是两方面:一是你信仰什么,二是你有多大的决心。

过去24年,李彦宏和百度对AI的信仰没有一丝改变,唯一改变的是,他们正在离自己的信仰越来越近。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/61265.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于YOLOv11的火焰实时检测系统(python+pyside6界面+系统源码+可训练的数据集+也完成的训练模型)

100多种【基于YOLOv8/v10/v11的目标检测系统】目录(pythonpyside6界面系统源码可训练的数据集也完成的训练模型 摘要: 本文提出了一种基于YOLOv11算法的火灾检测系统,利用1852张图片(1647张训练集,205张验证集&#…

算法——两两交换链表中的节点(leetcode24)

这是一道对于链表节点进行操作的题目非常考验对于链表操作的基本功; 解法: 本题的解法结合下图来进一步解释 创建一个虚拟节点指向头结点以便使代码逻辑看起来更为简便且操作节点容易,定义cur是为了方便找到cur之后的两个节点进行交换操作定义pre和aft是为了保存执…

【提效工具开发】管理Python脚本执行系统实现页面展示

Python脚本执行:工具管理Python脚本执行系统 背景 在现代的软件开发和测试过程中,自动化工具和脚本的管理变得至关重要。为了更高效地管理工具、关联文件、提取执行参数并支持动态执行Python代码,我们设计并实现了一套基于Django框架的工具…

鸿蒙开发:ForEach中为什么键值生成函数很重要

前言 在列表组件使用的时候,如List、Grid、WaterFlow等,循环渲染时都会使用到ForEach或者LazyForEach,当然了,也有单独使用的场景,如下,一个很简单的列表组件使用,这种使用方式,在官…

Figma插件指南:12款提升设计生产力的插件

在当今的设计领域,Figma已经成为许多UI设计师和团队的首选原型和数字设计软件。随着Figma的不断更新和插件库的扩展,这些工具极大地提升了设计工作的效率。本文将介绍12款实用的Figma插件,帮助你在UI设计中更加高效。 即时AI 即时AI利用先进…

揭秘云计算 | 5、关于云计算效率的讨论

一、 公有云效率更高? 解:公有云具有更高的效率。首先我们需要知道效率到底指的是什么。这是个亟须澄清的概念。在这里效率是指云数据中心(我们将在后文中介绍其定义)中的IT设备资源利用率,其中最具有代表性的指标就是…

Flutter:AnimatedPadding动态修改padding

// 默认top为10&#xff0c;点击后修改为100&#xff0c;此时方块会向下移动 padding: EdgeInsets.fromLTRB(left, top, right, bottom),class _MyHomePageState extends State<MyHomePage> {bool flag true;overrideWidget build(BuildContext context) {return Scaffo…

【c++丨STL】stack和queue的使用及模拟实现

&#x1f31f;&#x1f31f;作者主页&#xff1a;ephemerals__ &#x1f31f;&#x1f31f;所属专栏&#xff1a;C、STL 目录 前言 一、什么是容器适配器 二、stack的使用及模拟实现 1. stack的使用 empty size top push和pop swap 2. stack的模拟实现 三、queue的…

JavaEE初学07

JavaEE初学07 MybatisORMMybatis一对一结果映射一对多结果映射 Mybatis动态sqlif标签trim标签where标签set标签foreach标签补充 在这里插入图片描述右击运行即可 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/c71d44d027374a399d5d537ce96f00e1.png) Mybatis Myba…

《Spring Cloud 微服务架构探秘》

一、Spring Cloud 微服务架构概述 Spring Cloud 是基于 Spring Boot 构建的微服务开发框架&#xff0c;它充分利用了 Spring Boot 的便利性&#xff0c;极大地简化了分布式系统基础设施的开发。 Spring Cloud 具有诸多显著特点。首先&#xff0c;它提供了丰富的组件&#xff0…

【AIGC】破解ChatGPT!如何使用高价值提示词Prompt提升响应质量

文章目录 为什么高价值提示词如此重要&#xff1f;&#x1f50d;1.1 提升响应的相关性和准确性1.2 节省时间与资源1.3 增强用户体验 了解ChatGPT的工作原理&#x1f9e0;2.1 语言模型的训练过程2.2 上下文理解与生成2.3 限制与挑战 高价值提示词的核心要素✍️3.1 清晰明确的指…

D74【 python 接口自动化学习】- python 基础之HTTP

day74 http基础定义 学习日期&#xff1a;20241120 学习目标&#xff1a;http定义及实战 -- http基础介绍 学习笔记&#xff1a; HTTP定义 HTTP 是一个协议&#xff08;服务器传输超文本到浏览器的传送协议&#xff09;&#xff0c;是基于 TCP/IP 通信协议来传递数据&…

2025 -生物信息学- GEO - 神经网络分析-ANN

GEO - 神经网络分析-ANN 01. 准备文件 id GSM3587381_con GSM3587382_con GSM3587383_con GSM3587384_con GSM3587385_con GSM3587386_con GSM3587387_con GSM3587388_con GSM3587389_con GSM3587390_con GSM3587391_con GSM3587392_con GSM3587393_con GSM3587394_con GSM358…

uniapp页面样式和布局和nvue教程详解

uniapp页面样式和布局和nvue教程 尺寸单位 uni-app 支持的通用 css 单位包括 px、rpx px 即屏幕像素。rpx 即响应式px&#xff0c;一种根据屏幕宽度自适应的动态单位。以750宽的屏幕为基准&#xff0c;750rpx恰好为屏幕宽度。屏幕变宽&#xff0c;rpx 实际显示效果会等比放大…

5G Non-Public Network(三)Public Network Integrated NPN

这篇我们来看下PNI-NPN,之前都没有提到NPN引入的背景,这里就简单看下。 NPN引入的背景如上,就不细说了,贴在这里,确实很简单的看了下。紧接着就来看下规范上的内容。 相比于SNPN,PNI-NPN是PLMN提供的NPN,内容也要少很多,下面的内容参考38.300,38.331 ,38.304,23.50…

⾃动化运维利器Ansible-基础

Ansible基础 一、工作原理二、快速入门2.1 测试所有资产的网络连通性2.2 发布文件到被管理节点(资产) 三、资产(被管理节点)3.1 静态资产3.1.1 自定义资产3.1.2 自定义资产的使用3.1.3 资产选择器 四、Ansible Ad-Hoc 命令4.1 模块类型4.1.1 command & shell 模块4.1.2 cop…

一文了解Android中的AudioFlinger

AudioFlinger 是 Android 音频框架中的一个核心组件&#xff0c;负责管理音频流的混合和输出。它是 Android 音频系统服务的一部分&#xff0c;作为音频框架和硬件之间的桥梁&#xff0c;接收应用程序的音频请求、进行混音处理&#xff0c;并最终通过音频硬件输出声音。 下面我…

基于YOLOv8深度学习的智慧交通事故评级检测系统研究与实现(PyQt5界面+数据集+训练代码)

本文研究并实现了一种基于YOLOv8深度学习模型的智慧交通事故评级检测系统&#xff0c;旨在解决传统交通事故检测过程中效率低、误报率高等问题。该系统通过深度学习技术的应用&#xff0c;结合交通事故图像的分析&#xff0c;能够实现对事故的精准识别和评级&#xff0c;进而为…

使用MaxKB搭建知识库问答系统并接入个人网站(halo)

首发地址&#xff08;欢迎大家访问&#xff09;&#xff1a;使用MaxKB搭建知识库问答系统并接入个人网站 前言 从OpenAI推出ChatGPT到现在&#xff0c;大模型已经渗透到各行各业&#xff0c;大模型也逐渐趋于平民化&#xff1b;从最开始对其理解、生成、强大的知识积累的惊叹&…

Android15之解决:Dex checksum does not match for dex:framework.jar问题(二百三十九)

简介&#xff1a; CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布&#xff1a;《Android系统多媒体进阶实战》&#x1f680; 优质专栏&#xff1a; Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a; 多媒体系统工程师系列【…