你认识AI开发者吗?
在工作中,我们会采访形形色色的AI开发者。他们来自不同的地方,说着不同的口音。年纪小的还没上小学,年纪大的在退休之后又找到了新的兴趣与梦想。他们有人心怀温暖,用AI技术帮助听障人士恢复听力;有人心系桑梓,用AI能力防沙固沙,誓要把家乡的沙漠变成绿洲;有人能力卓群,一个人就是一间AI工厂,完成的AI创新不计其数。
如果问,这些不同行业,不同学科,不同年龄的AI开发者们有什么共同之处?我能想到的似乎有两点。
一个是他们的眼里都有光亮,愿意用创新的思维去看待这个世界,尝试用想象力去发现和解决问题。
另一个是他们的手里都有共同的工具——文心加飞桨,已经成为无数AI开发者探索梦想的基石。
对于这些开发者来说,每年有两次盛大的“节日”。那就是WAVE SUMMIT深度学习开发者大会。WAVE SUMMIT见证着飞桨和文心的成长,同时也陪伴了无数AI开发者的追梦之旅。
每年两届的WAVE SUMMIT,恰好在刚刚迎来了五年十届的节点,也到了值得回顾、总结和再出发的时候。12月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在第十届WAVE SUMMIT深度学习开发者大会上发表了《文心加飞桨,翩然赴星河》主题演讲。期间,王海峰分享了飞桨和文心的最新发展成果,公布了文心一言用户规模已经超过一亿,同时也回顾了WAVE SUMMIT一路走来的思考与感受。
五年走来,一场花开。深度学习技术在中国大地上从嫩芽变成了雨林,AI开发者手中有了坚实的技术工具,面向千行百业的AI生态已经成型,通用人工智能的曙光已经显现。
五年时间,正好适合回顾这一切的改变是如何发生的。面向未来,文心加飞桨的组合又将带来什么?
百度与万千AI开发者,将继续赴这场AI技术的星河之约。
五年十届
共赴AI的星辰大海
过去五年,是中国深度学习技术发展速度最快,AI开发者规模增长最快的时期。五年当中,无数开发者加入AI的寻梦之旅,万千企业开启了智能化的征程,大量院校与科研机构开始用AI探索科学的奥秘。
回顾深度学习技术在中国的发展脉络,会发现WAVE SUMMIT是贯穿过去五年一条非常重要的发展线索。在这个舞台上,每次都能分享到最具深度与前瞻性的AI技术洞察,每次都能迎来巨量的深度学习开发平台与AI大模型技术更新。
WAVE SUMMIT走过了五年十届。在这五年时间里,我们对AI技术的认识与洞察逐步加深,年年迭代。产学各界的共识不断凝聚,面向未来的发展路径不断清晰。
在2019年的首届WAVE SUMMIT,王海峰提出“深度学习框架是智能时代的操作系统”,“深度学习推动人工智能进入工业大生产阶段”。这样的判断为智能化带来了新的视野,“AI工业大生产”也成为接下来AI技术发展的核心。
接下来,王海峰在2020年提出了“打造AI新型基础设施,云智一体加速产业智能化”,AI大生产平台升级为云智一体的新型基础设施,为产业智能化奠定了坚实基础;2021年,提出AI技术呈现“融合创新”和“降低门槛”的特点;2022年,确定了“深度学习平台加大模型,贯通AI全产业链,夯实产业智能化基座”。时间来到2023年,王海峰明确提出了“大语言模型为通用人工智能带来曙光”。
这些洞察和预判逐步推进,层层衔接,在不断获得产学各界认证的同时,推动接下来AI技术的持续发展。更重要的是,这些预判一次次点亮了AI开发者眼中的星光。
而文心加飞桨的体系建设,则让AI开发者可以将星光带入现实。WAVE SUMMIT的另一重价值,在于将百度对AI技术的预判,转化为真实的技术突破、工具升级、生态建设,组成了蔚为大观的深度学习基础设施。其中,文心与飞桨已经成长为整个AI产业的两大支柱。
目前阶段,飞桨已经完成了包括核心框架、基础模型库、开发套件、工具组件等能力的全面建设,还有助力开发者成长的星河社区。飞桨具有动静统一的深度学习框架、端到端自适应大规模分布式训练、云边端全场景高性能推理等核心领先技术。
在飞桨生态方面,2019年飞桨开发者规模为150万。截至2023年12月底,飞桨已凝聚1070万开发者,服务23.5万家企事业单位,基于飞桨创建了86万个模型。突破千万的开发者,证明了AI技术迎来了发展最快,凝聚力最强的时代。
在备受关注的大模型领域,百度在2019年开始预训练大模型研发,推出了文心大模型1.0。经过多年积累,今年3月百度率先发布了知识增强大语言模型文心一言。10月,文心一言的基础模型升级到4.0,理解、生成、逻辑和记忆四大AI基础能力全面提升。文心大模型4.0仅仅在过去两个月整体效果又提升了32%。
王海峰现场披露,文心一言用户规模已突破1亿。自8月31日获准开放对公众提供服务以来,文心一言的用户提问量一路攀升,获得了越来越充沛的用户信任。一亿用户的规模证明,下一个超级流量入口俨然已经成型。
王海峰表示:“五载十届,我们与所有开发者一起,踔厉奋发,笃行不怠。愿继续与所有开发者携手并肩,在飞桨和文心的支持下,共赴通用人工智能的星辰大海”。
WAVE SUMMIT走过的五年,似乎让我们对AI技术一切认知都发生了变化。无数开发者、企业、科研工作者,以及来自千行百业的人们,共同走过了一段激动人心的AI旅程。
而更加让人激动的旅途,永远在未来,在更远处。
花开大模型
文心生态进取突破
AI大模型,是2023年全球AI行业,乃至整个科技行业的第一关键词。AI开发者,以及更多有志于AI机遇的准开发者们,目前最关注的就是能否有效利用大模型技术,能否加入一个完善的大模型生态,能否将大模型与自身所在行业、领域进行结合?
回顾这一年,伴随着文心一言的横空出世,文心大模型频频带给我们惊喜。在本届WAVE SUMMIT当中,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布了文心一言和飞桨星河社区的最新进展与升级动作。
从产业进程中看,文心大模型已经取得了惊人的成绩。从对外开放到今天,文心一言用户已经遍布全国各地,累计完成了37亿字的文本创作,文本创作量相当于十部《永乐大典》、500套《鲁迅全集》、10000本《三体》。在代码生成方面,文心一言累计输出了三亿行代码,涵盖所有主流编程语言。
可以看到,不同领域,不同特点的用户需求都在文心一言当中得到了极大地满足。在学习方面,文心一言为中小学学生提供了一系列帮助,比如提升学习能力,进行口语训练,拓展课外知识。大学生则广泛利用文心一言进行知识查询,信息搜集,专业能力提升。
在专业应用方面,文心一言已经累计帮助用户处理专业合同多达4亿次,在租房合同审查等触手可及的场景提供重要帮助。在旅行场景中,文心一言已经累计制定了五百万次的旅行计划。
在悲欢交集的生活中,文心一言为用户发出了1083万次的关怀、鼓励,提供了240万次的建议和支持。当然,这些努力也得到了回馈,文心一言已经收获了超过2000万次的赞赏和感谢。
过去一年里,文心一言的基础模型文心大模型,发布了3.5和4.0两个大版本。为了能够带给客户更深层的帮助,文心大模型还研发了智能体技术。接下来,文心一言的智能体模式,将在专业版中开启测试。
伴随文心大模型的技术进步与产业发展,开发者对文心大模型的需求也愈发强烈。目前,星河社区已经有超过4000个基于文心一言开发的应用,覆盖了各个行业与领域。面向未来,文心大模型的生态建设与开放,将成为最为重要的工作。
作为中国最大的AI开发者社区,飞桨星河社区全面升级,为广大开发者提供丰富的异构算力和通用组件,飞桨产业级模型库和全流程开发工具链,实现低成本开发AI应用。在飞桨和文心大模型的共同驱动下,星河社区具备了“AI原生应用创新全要素”,为开发者提供开发、体验、推广、交流、学习一体化服务。
最新发布的大模型工具中心,集合了百度人工智能多年来的建设成果,包括飞桨产业级模型库、百度大脑AI能力、文心一言工具等,同时支持生态工具接入,赋能开发者高效开发AI原生应用。
现场,吴甜使用大模型工具中心的“多工具智能编排”开发模式,演示了如何在零代码情况下开发具备图文识别、问答、翻译、播报等多模态全功能的“旅行助手”应用。
为了让文心大模型更聪明,更智慧,WAVE SUMMIT上还首次公布了文心导师计划。首批有10位来自不同领域的顶尖专家和学者将成为文心导师,他们的专业知识与深度思考,将让文心一言在专业领域提升自身能力,强化专业造诣,为用户提供更具有思想深度与广度的支持。此外,文心大模型还与《辞海》深度合作,将《辞海》庞大的数据融入文心基座大模型。
飞桨和文心大模型的生态之花,已经绽开在AI时代的土壤中。融入这个生态,建设这个生态,将成为AI开发者打开未来之门的钥匙。
根植开发者
AI开发能力全面升级
开发者是文心加飞桨的根,需要把更好的开发体验,更低的开发门槛,更充沛的开发工具交到开发者手中。面对这项工作,WAVE SUMMIT始终坚持将更好的开发能力、开发工具交付到开发者手中。根植开发者,帮助开发者,信赖开发者,是WAVE SUMMIT不变的底色。
在这一届WAVE SUMMIT当中,百度AI技术生态总经理马艳军发布了飞桨开源框架2.6版本和大模型重构的开发工具链。
飞桨全新版本实现了开发体验大幅提升。通过自适应图构建机制,实现了动转静训练成功率达到100%,同时,实现了高扩展性IR,支撑大模型极致性能优化;支持动静统一自动并行编程,混合并行训练代码开发大幅简化。
在AI开发者最为关注的大模型开发层面,飞桨带来了大模型套件全流程优化。对大模型预训练、精调,压缩、推理、部署全流程关键技术进行了升级。同时,硬件适配方案升级,结合文心大模型的适配,更好地支持硬件厂商进行灵活定制、软硬协同深度优化。
在推动AI原生应用开发方面,WAVE SUMMIT展示了大模型加持的开发工具链。其中,智能编码伙伴Comate AutoWork,可以实现开发者输入需求,AutoWork即可智能规划完成从需求到编码上线全流程,极大降低综合开发成本。飞桨低代码开发工具PaddleX在飞桨开发套件能力基础上,充分结合文心大模型,实现了AI应用开发效果和效率大幅提升。
除此之外,面向广大开发者对大语言模型的开发需求,文心一言也推出了面向生态的开发机制。这次升级中,文心一言带来了配套开发工具升级、优化注入自动化流程、支撑开发者深度效果调优、助力应用推广四大举措,将典型应用开发时间缩短40%以上,端到端效果提升30%以上。
至此,文心一言已经提供了面向生态的一整套开发机制,开发者可以通过API和SDK使用文心大模型的基础能力,并支持插件开发、多工具智能编排开发,提供低代码和零代码开发界面,全面赋能开发者进行AI原生应用开发。
结束语
翩然赴星河
在大模型生态不断取得突破,AI开发能力不断升级的加持下,AI可以成为每个人生活与工作中的工具,成为我们共同的机遇、能力与梦想。
为了让更多人奔赴这场关于AI的星河之约,WAVE SUMMIT现场百度联合启动国内首个《大模型产业人才标准与能力评价》,新一轮飞桨人工智能教育创新中心落成授牌。飞桨文心生态将为更多人打开AI大门,让人人都可以成为AI开发者。
可以确定地说,五年来,AI开发者的一切都在改变。
他们掌握了核心技术,可以用飞桨加文心去探索未知,解锁更多生活与事业中的可能。
他们拥有了充沛的开发工具,AI开发的门槛不断降低,助力不断丰富,每个人都可以成为AI开发者的梦想在一步步变为现实。
他们建设了凝聚力极高的生态,在飞桨与文心的生态体系中,开发者彼此帮助,与平台形成良性互动,各个生态角色充分支持,AI生态变成了生机勃勃的雨林。
最重要的是,他们有了实现梦想的通道,并且相信文心加飞桨的通道会一直开启,不断迭代,奔涌向前。
五年来,WAVE SUMMIT从一个舞台,一次交流,变成了一个节日,一种信赖,一场“翩然赴星河”。
“翩然赴星河”,是百度的邀请,是AI开发者的诺言,也是AI时代最为盛大的一场浪漫。