什么才是好用的大模型?

随着大模型在千行百业的逐步落地,中国基础大模型正直面来自用户端的诸多拷问。

近日,随着OpenAI宣布禁止中国用户使用其API,更多的国产大模型都在提供替代方案和优惠措施,来吸引和支持开发者进行用户迁移。

这既是一次挑战,也是一次全新的机会。

一方面,在技术差距面前,只有更强的基础大模型才更有机会从这次变局中赢得先机;另一方面,更多的用户反馈将为大模型提供更多的“养分”,促进大模型的持续迭代。

这意味着,大模型的头部效应将越来越明显。越领先的模型将吸引越多用户和资源,进一步巩固其市场地位。

作为中国最早涉猎大语言模型的公司,百度一方面在推出“搬家服务”,吸引用户迁移至百度千帆大模型平台。另一方面,百度也在迭代自身的基础大模型,直面这场愈演愈烈的市场竞争。

6月28日,百度文心大模型再次完成了最新的进化升级。在WAVE SUMMIT深度学习开发者大会2024上,百度正式发布大模型的新升级版本——文心大模型4.0 Turbo。

百度发布文心大模型4.0 Turbo

同时,百度也正式公开文心一言最新数据。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰透露**:**“目前,文心一言累计用户规模已达3亿,日调用次数也达到了5亿。”

亿级的的大模型产品背后,百度正在推动大模型技术通用性和能力全面性的持续进步。

毫无疑问,在这个转折点进行全面升级,无疑为百度文心大模型在当下的大模型竞争局势添了一份更有分量的筹码。

1.好用的大模型

对于用户而言,在选择用哪个大模型这道题面前,最大的考量因子就是“好用”。

效果和速度是基础大模型比拼的两大要素。

一方面,大模型需要具备高准确性和可靠性,不仅在自然语言理解、生成、逻辑推理等基础能力上表现优秀,还需要能够处理多样化的任务并提供高质量的输出,展示在特定领域的专业知识。另一方面,模型响应时间要快,能够在短时间内处理大量请求,保证用户体验的流畅性。

新亮相的文心大模型4.0 Turbo就是在朝着这一方向精进。

自2010年起开始全面布局人工智能以来,百度在2019年3月推出文心大模型1.0;去年10月发布文心大模型4.0。文心大模型一直在持续快速进化。

而速度和效果正是文心大模型新升级的方向。“新的大模型,速度更快,效果更好”,王海峰在演讲中提到。

在现场,从文心大模型4.0Turbo和文心大模型4.0对比演示结果效果来看,新版本大模型回复速度更快,且内容更富有逻辑、细节更翔实。

文心大模型4.0 Turbo和文心大模型4.0对比演示

文心大模型4.0 Turbo如此强力的背后,离不开更好的训练以及推理支持,同时,也得益于百度在大模型的数据、算法、过程化能力的积累。

为了让大模型能力更强,百度进行了有监督的精细调整和基于人类反馈的强化学习,并改进了提示词工程,融合了知识增强、检索增强和对话增强等特色技术。

面对OpenAI“停服”中国市场,百度不仅提供“搬家”服务,还直接开放可用了。

目前文心大模型4.0 Turbo版已经可以直接在网页端进行体验,文心一言App也会在各个应用商店陆续上线,开发者也可以在百度智能云的千帆平台上调用API接口。

对于像以文心为代表的国产大模型来说,加速技术研发、场景创新是未来不断迭代的方向,进而满足不同行业、不同领域的需求。而“好用”无疑是核心的命题。更强大的文心大模型4.0 Turbo在此时亮相,势必为百度赢来更多机会。

2.三亿用户,AI和人的互动在各个角落悄然发生

今天,大模型市场的热点正在从基础大模型排位赛延伸到围绕AI原生应用的竞赛中。

数据显示,现今,全球市场各类AI项目应接不暇,仅在2023年,GitHub AI项目总数就急剧增长了59.3%。大语言模型交互、智能体、代码生成无疑是三个热门细分方向。

AI和人的互动,无疑将会深刻影响大模型发展方向。

作为大模型竞赛中的翘楚,文心大模型数据表现亮眼。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜透露,从全面向社会开放之后,文心一言的用户规模持续处于一个快速的增长状态。

“目前,文心一言的**用户规模已经达到了3亿。**过去半年,文心大模型用户日均提问量增加78%,提问平均长度提升89%。”

文心一言用户规模数据和应用场景

**AI和人的互动在各个角落悄然发生着。**文心大模型为用户提供的帮助从简单需求延伸到更多元、复杂的任务。与此同时,文心大模型还支持了大量的应用创新。

在实际生活中,有人和文心一言一起进行小说创作,也有人和文心一言一起冲刺高考,让AI给自己设计各学科的考卷……

截至目前,文心大模型已经生成了70亿行代码,创作了5.9亿篇文章,制作了5000万份PPT,书写了100万篇专业研报。在学习场景中,文心大模型已经帮助用户解答了1.7亿个问题,其中包括2000多万道数学题。数字人主播与用户的互动时长超过了1400万小时。在工作场景中,文心大模型已辅助了1.3亿人次。

这些数据背后意味着文心大模型在大量、多元、复杂的用户交互中,在准确性、实用性和用户体验上不断自我进化。

除了个人用户使用外,大模型的触角已经从广泛的内容创作领域伸展到各行各业。

目前,基于文心一言的应用场景已经过万。比如,在距离人工智能更远的农业上,大模型也有了新的“涉足”。百度发布了中国工程院朱有勇院士及团队与百度共同打造的首个农业智能体——“农民院士智能体”。

它学习了朱有勇院士的研究成果以及相关的农业知识,可以随时随地为农民解答生产生活中的问题。目前,这个智能体可以在文心一言App、百度App、网页端和小度的设备上使用。

百度发布“农民院士智能体”

除了文本生成能力,大模型的代码生成能力对于企业和开发者也是一项重要的功能。

对于开发者而言,能提高开发效率、降低入门门槛、支持多语言编程、自动化重复任务等,提升了编程的便捷性和效率。对于企业而言,可以借助这项能力生成特定领域的定制化代码解决方案,满足特定业务需求,提高生产力。

“Comate”智能代码助手是百度在2023年推出的代码生成应用,可以实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者效率。开发者可以通过插件等形式,在主流开发软件中使用。

这次大会,“Comate”代码助手官宣全新的中文名——“文心快码”,同时还宣布其在企业全流程的赋能,以及知识增强、企业级安全方面进行了全新的迭代。

拥有新能力的“文心快码”不仅能够全面深入地分析整个代码库,还可以通过整合公认权威的公共与私有领域知识,创造全新的代码。同时,在安全性方面,用户只需简单一键即可采纳或修复,就能够自动检测编码过程中的安全漏洞,并智能提出修复建议。

Comate智能代码助手官宣全新的中文名:“文心快码”

对于企业用户而言,一方面,“文心快码”可以加快开发速度。由于文心快码通过汇集技术专家的经验和研发知识,形成了一个强大的超级助手,能够在开发过程中提供精准及时的帮助。这使得工程师在单位时间内的代码提交数量提升了35%,从而加快了开发速度,缩短了项目完成时间。

另一方面,文心快码还可以加快业务的迭代速度。由于其智能化能力覆盖了整个研发流程,从需求澄清到开发、测试和发布,每个环节都实现了提效。特别是在安全方面,它能够在需求阶段就提醒产品经理注意安全规范,在开发阶段生成更安全的代码,并在测试环节自动检测和修复漏洞,从而加快业务的迭代速度。

除了技术方面的进步,**文心快码的行业积累和经验也是一大竞争力。**文心快码能够帮助企业快速落地新研发工具。例如,喜马拉雅在一个季度内全面落地文心快码,代码采样率达到了44%。这种快速复制和落地实践,使得企业能够迅速采纳文心快码,实现研发提效。

可见,AI和人的互动不仅发生在每日的学习生活中,还发生在广袤的产业大地上,每一个角落都悄然发生着变化。

3.底层技术再向前

更强大的大模型背后来源于底层技术的不断迭代更新。

一直以来,百度在芯片、框架、模型和应用上都有全栈布局,而飞桨深度学习平台和文心的联合优化为文心大模型的持续进化提供了更强大的动力。为了支撑大模型更进一步迭代,飞桨发布核心框架3.0,专为大模型设计**。**目前,开发者可以在社区里使用最新版本。

飞桨框架3.0技术架构采用分层设计,划分为适配层、算子层、调度层、表示层,以及顶层的开发接口。和2.0一样,3.0版本在开发接口上保持了完全的兼容性,消除了开发者对于代码需要重写的顾虑。用户可以无缝过渡到3.0版本,并充分利用其新增的强大功能。

百度发布新升级的飞桨框架3.0

作为给文心大模型提供更好的训练以及推理支持的底层技术平台,飞桨围绕以下四个方面进行全方位能力构建,用以更好应对大模型技术发展趋势,以及异构多核处理器的普及:

  • 飞桨框架3.0强化了大模型在训练和推理过程中的集成体验,从而使模型训练和推理部署的过程更加流畅高效;

  • 平台的自动化能力再向前走了一步,尤其在动静统一自动并行和编译器自动化方面。飞桨框架3.0不仅允许开发者在进行大规模模型训练时,框架能够自动处理并行计算的复杂性,还通过编译自动化简化了开发和调优过程,使得性能优化更加高效;

  • 为了确保大模型能够在多种硬件上高效运行,包括CPU、GPU、FPGA等,飞桨3.0进一步增强了对不同硬件平台的适配能力。硬件厂商只需适配基础算子,大幅减少了开发工作量。

  • 同时,飞桨的适配层进行了大量软硬件协同优化工作,包括高效算子的流水编排和硬件代码的编译等,从而实现更好的性能优化。

其中,训练和推理的一体化设计对于大模型的发展至关重要。

一方面,它不仅提升了开发和部署的效率,确保了模型在不同阶段的一致性,还优化了成本并加快了迭代速度。另一方面,这种设计简化了开发流程,降低了技术门槛,使得模型的端到端优化成为可能,在提高运行效率和性能的同时,改善了用户体验,为特定应用场景提供了灵活性。

这也是飞桨框架3.0的一大亮点。新升级的飞桨框架3.0允许动态图自动转换成静态图进行性能调优,使得训练、压缩和推理过程无缝衔接。在大模型训练过程中(尤其是人类反馈强化学习训练中),可以调用高性能推理算子。同时,通过复用分布式训练策略,量化过程的效率提升了3倍,显著提高了整体流程的效率。

飞桨的进阶,是百度技术向前的一大步,也是中国大模型创新的关键一步。

如今,通用大模型之间的能力竞赛如火如荼,飞桨的全面升级,不仅给百度在大模型战略布局上提供了更坚实的技术基础,也成为进一步支撑中国大模型建设走向应用的关键力量。

4.大模型生态效应圈

大模型不是少数人的游戏,而是一片需要各行各业的力量都参与构建的生态雨林。这一过程中,不论是企业还是研究机构,亦或是开发者,都需要依靠生态的力量进行资源共享、应用落地、多样化场景,才有可能让高成本、高难度的大模型技术降低成本、惠及千行百业。

大型科技公司是这场“大模型生态雨林”共创牌局中的关键参与者,一方面,他们有先进的硬件设施和强大的云计算平台,为大模型训练和推理提供必需的基础设施;另一方面,他们有更丰富的资源和工具平台,能提供更多应用场景落地经验和全面的工具支持。

就像这次,百度不仅在大模型技术和应用方面进行了最新升级,同时也在持续推进大模型生态建设,逐渐形成大模型生态效应圈

去年,百度发起了文心大模型星河共创计划,将大模型资源和产业生态资源进行互动与链接。经过一年的发展,目前百度已与众多合作伙伴、开发者一起,共创了55万AI应用1000个以上大模型工具,覆盖生活、图像、思维和管理等多个工具领域。此外,百度与上海辞书、维普等机构合作,共创了超过1000B的高质量稀缺数据,激活了各行各业中的数据资源。

如今,大模型正在试图走向更深、更远的产业带,与医疗、金融、教育、制造等行业碰撞更多的火花。

除此之外,文心大模型生态也正在和软件、硬件等各类生态伙伴合作,通过平台建设,为用户提供更丰富的大模型使用方法,联合打造一系列新的AI应用。

比如,国内首个体育大模型就是百度与上海体育大学在体育科技方面开展的共研共创应用,包括辅助设备数据运用、互联设备空间计算、运动员动作技巧与战术分析、以及数字化媒体传播等。

上海体育大学“长江学者”特聘教授、美国国家体育科学院院士刘宇透露,目前,上体体育大模型与相关联合科研团队正在服务游泳、田径、体操、蹦床、攀岩等多支国家队备战巴黎奥运会。

各行各业正在以开放的姿态拥抱大模型。制造领域,大模型正在探索智能制造、预测性维护和供应链优化等方面的应用,提高生产效率和管理水平;教育行业,大模型特在为个性化学习、智能辅导和教育资源优化提供支持,推动教育公平和质量提升;金融机构通过大模型优化风险管理、提升客户服务并进行智能投顾,实现了更为精准的市场分析和客户需求匹配。

现如今,随着这些现实中正在发生的落地实践,百度大模型生态圈正在日益扩大。飞桨文心生态也在持续壮大,目前累计拥有1465万名开发者,支持了37万家企业,并创建了95万个模型。

此刻,沐浴在通用人工智能的曙光之下,像百度一样的大模型积极拥抱者正在携手探索AI未来的无限可能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/872882.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多多OJ评测系统 前端项目环境初始化 安装Vue脚手架 引入Arco Design组件

目录 确定环境 命令行输入 装一下脚手架 监测一下是否安装成功 创建一个项目 选择一系列的配置后 我们打开webStorm 配置脚手架后我们先运行 我们这边能获取到网址 其实我们脚手架已经帮我们做到了 接下来要引入相关的组件 选择用npm进行安装 我们建议的是完整引入…

UDP客户端、服务端及简易聊天室实现 —— Java

UDP 协议(用户数据包协议) UDP 是无连接通信协议,即在数据传输时,数据的发送端和接收端不建立逻辑连接,简单来说,当客户端向接收端发送数据时,客户端不会确认接收端是否存在,就会发出…

windows镜像下载网站

一个专注于提供精校、完整、极致的Windows系统下载服务的仓储站,网站托管于Github。 网站:https://hellowindows.cn/ 下载方式:ED2k,BT,百度网盘 MSDN - 山己几子木,提供Windows 11、Windows 10等不同版本…

单例模式Singleton

设计模式 23种设计模式 Singleton 所谓类的单例设计模式,就是采取一定的方法保证在整个的软件系统中,对某个类只能存在一个对象实例,并且该类只提供一个取得其对象实例的方法。 饿汉式 public class BankTest {public static void main(…

Qt模型/视图架构——委托(delegate)

一、为什么需要委托 模型(model)用来数据存储,视图(view)用来展示数据。因此,模型/视图架构是一种将数据存储和界面展示分离的编程方法。具体如下图所示: 由图可知,模型向视图提供数…

3D问界—MAYA制作铁丝栅栏(透明贴图法)

当然,如果想通过建立模型法来实现铁丝栅栏的效果,也不是不行,可以找一下栅栏建模教程。本篇文章主要是记录一下如何使用透明贴图来实现创建铁丝栅栏,主要应用于场景建模,比如游戏场景、建筑场景等大环境,不…

PGCCC|【PostgreSQL】PG考证对工作上有什么好处# PG证书

认证 PostgreSQL 考证(PostgreSQL Certification)在工作上有以下几个好处: 增强专业能力:通过考证,可以系统地学习和掌握 PostgreSQL 数据库的知识和技能,提高自己的专业水平。 提升职业竞争力&#xff1…

CentOS 7 初始化环境配置详细

推荐使用xshell远程连接,如链接不上 请查看 CentOS 7 网络配置 修改主机名 hostname hostnamectl set-hostname xxx bash 关闭 SElinux 重启之后生效 配置yum源(阿里) 先备份CentOS-Base.repo,然后再下载 mv /etc/yum.repos…

android R ext4 image打包脚本介绍

一、Android R打包指令使用介绍 (1)mkuserimg_mke2fs #./mkuserimg_mke2fs --help usage: mkuserimg_mke2fs [-h] [--android_sparse] [--journal_size JOURNAL_SIZE][--timestamp TIMESTAMP] [--fs_config FS_CONFIG][--product_out PRODUCT_OUT][--b…

小程序图片下载保存方法,图片源文件保存!

引言 现在很多时候我们在观看到小程序中的图片的时候,想保存图片的原文件格式的话,很多小程序是禁止保存的,即使是让保存的话,很多小程序也会限制不让保存原文件,只让保存一些分辨率很低的,非常模糊的图片…

QT-RTSP相机监控视频流

QT-RTSP相机监控视频流 一、演示效果二、关键程序三、下载链接 一、演示效果 二、关键程序 #include "mainwindow.h"#include <QDebug>MainWindow::MainWindow(QWidget *parent) : QMainWindow(parent), m_settings("outSmart", "LiveWatcher&…

CentOS 7 安装MySQL 5.7.30

CentOS 7 安装MySQL卸载&#xff08;离线安装&#xff09; 安装配置MySQL之前先查询是否存在&#xff0c;如存在先卸载再安装 rpm -qa|grep -i mysql rpm -qa|grep -i mariadb rpm -e --nodeps mariadb-libs-5.5.68-1.el7.x86_64如下命令找到直接 rm -rf 删除&#xff08;删除…

MySQL增量备份

增备1 做增量备份前&#xff0c;是需要进行一次完成备份的 1、做数据修改 创建一个add1.t1 t1 包含&#xff1a;id,name 加2条数据 id | name | ---------- | 1 | add1 | | 2 | add2 | ----------操作如下&#xff1a; MySQL root(none):(none)> show databases; -…

Linux openEuler_24.03部署MySQL_8.4.0 LTS安装实测验证安装以及测试连接全过程实操手册

Linux openEuler_24.03部署MySQL_8.4.0 LTS安装实测验证安装以及测试连接全过程实操手册 前言: 什么是 MySQL? MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于Oracle 公司。MySQL 是一种关系型数据库管理系统,关系型数据库将数据保存在不同的表中,…

C++ 入门基础:开启编程之旅

文章目录 引言一、C的第⼀个程序二、命名空间1、namespace2、namespace的定义 三、C输入 与 输出四、缺省参数五、函数重载六、引用1、引用的概念和定义2、引用的特性3、指针和引用的关系七、inline八、nullptr 引言 C 是一种高效、灵活且功能强大的编程语言&#xff0c;广泛应…

C1W4.Assignment.Naive Machine Translation and LSH

理论课&#xff1a;C1W4.Machine Translation and Document Search 文章目录 1. The word embeddings data for English and French words1.1The dataThe subset of dataLoad two dictionaries 1.2 Generate embedding and transform matricesExercise 1: Translating English…

张量分解(5)——Tucker分解

&#x1f345; 写在前面 &#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;这里是hyk写算法了吗&#xff0c;一枚致力于学习算法和人工智能领域的小菜鸟。 &#x1f50e;个人主页&#xff1a;主页链接&#xff08;欢迎各位大佬光临指导&#xff09; ⭐️近…

如何防范场外个股期权的交易风险?

场外个股期权交易&#xff0c;作为金融衍生品市场的重要组成部分&#xff0c;为投资者提供了更为灵活和多样化的投资策略。然而&#xff0c;其高杠杆、高风险特性也使得投资者在追求高收益的同时&#xff0c;面临着较大的交易风险。为了有效防范这些风险&#xff0c;投资者需要…

Kafka Producer发送消息流程之Sender发送线程和在途请求缓存区

文章目录 1. Sender发送数据1. 发送数据的详细过程&#xff1a;2. 关键参数配置 2. 在途请求缓存区 1. Sender发送数据 Sender线程负责将已经在RecordAccumulator中准备好的消息批次发送到Kafka集群。虽然消息在RecordAccumulator中是按照分区组织的&#xff0c;但Sender线程在…

【VScode】安装【ESP-IDF】插件及相关工具链

一、ESP-IDF简介 二、VScode安装ESP-IDF插件 三、安装ESP-IDF、ESP-IDF-Tools以及相关工具链 四、测试例程&编译烧录 一、ESP-IDF简介 二、VScode安装ESP-IDF插件 【VScode】安装配置、插件及远程SSH连接 【VSCode】自定义配置 打开VScode&#xff0c;在插件管理搜索esp…