中国信通院王蕴韬:从“好用”到“高效”,AIGC需要被再次颠覆

当下AIGC又有了怎样的颠覆式技术?处于一个怎样的发展阶段?产业应用如何?以及存在哪些风险?针对这些问题,我们与中国信通院云计算与大数据研究所副总工程师王蕴韬进行了一次深度对话,从他哪里找到了这些问题的答案。

2022年11月30日,ChatGPT正式面向全球发布,AIGC浪潮由此席卷而来。

实际上,AIGC技术由来已久。

1957年,Lejaren Hiller和Leonard Isaacson通过将计算机程序中的控制变量改为音符,用计算机创作了音乐作品《Illiac Suite》。

2014年,美国《洛杉矶时报》记者Ken Schwencke通过编写的算法程序,仅用3分钟就完成了当时洛杉矶发生的一场4.4级地震的新闻报道。

那么,当下AIGC又有了怎样的颠覆式技术?处于一个怎样的发展阶段?产业应用如何?以及存在哪些风险?

针对这些问题,我们与中国信通院云计算与大数据研究所副总工程师王蕴韬进行了一次深度对话,从他哪里找到了这些问题的答案。

大模型,再次唤醒AIGC

“和传统基于深度学习技术的AIGC相比,以GPT为代表的生成式大模型在去年年底的出现,直接将AIGC内容质量和好用程度提升到了一个新高度,AIGC这把火由此也再次被点燃。”这是王蕴韬看到的行业变化。

大模型的出现,对各个行业都带来了不可忽视的影响,AIGC产业也不例外。

这其中AIGC的“C”,不仅仅是指OpenAI的ChatGPT带火的“chatbot”中的文本内容,还包括诸如图片、视频、代码等内容形式。

尤其过往十年人工智能技术的快速发展,让人工智能技术在诸如图像/视频修复、低代码等领域有了一定的应用,大模型的到来才能进一步对这些产业形成一次颠覆。

关于这次对于人工智能的技术颠覆,王蕴韬将其中的直观感受总结为“可用”到“好用”。

对此,他进一步指出:

因为人工智能技术路线一直是在仿人类的神经元功能演进的,在这之中,我们经历了“低仿”到“高仿”的发展阶段。

此前基于深度学习的人工智能,是通过CNN、RNN网络,先是做一个线性变换,再经过一个激活函数,从而实现“低仿”人类神经元的算法模型。

现在再度火起来的AIGC背后的根技术是Transformer,有点类似编码器和解码器,通过将编码和解码放在一起,从而同时吸收更长的字符串(token)来做相关的任务处理。

从深度学习到现在的大模型,我们用的依然是广义上的深度神经网络,只不过这个深度神经网络基本单元发生了变化。

大模型的出现,改变了构成AIGC的基本单元,让AIGC从“可用”跨越到了“好用”阶段。

AIGC造“血”,行业内容涌现

2023年是大模型的战场,在这个战场上,悄悄进行了两场军备竞赛。

第一场是关于通用大模型,包括国外的微软、谷歌、亚马逊,以及国内的BAT等科技巨头,都加入到了这场竞赛中。

他们通过引入规模庞大的公开数据集、通过预训练,形成了通用大语言模型。

王蕴韬称,这个通用大语言模型,实现了大模型从0到1的构建,但实际上是“0.5版大模型”。

之后在行业大模型的竞赛中,真正适合深入到应用阶段的大模型才开始出现。

关于后者,王蕴韬称,大家主要是基于“0.5版大模型”在微调,通过不断灌输行业知识,增加与人类专家的交互,从而将“0.5版大模型”调试得更加好用。

经此“历练”,AIGC最终有机会进一步深入到各个行业,为各行各业造“血”。

“所有行业都需要生产内容,实际上,如今的AIGC已经在金融、电商、影视、传媒等领域开始被规模应用。”

以影视和传媒领域为例,这一领域各类机构和企业的核心竞争力就是提供内容,这些机构如果能够通过AIGC低成本高质量生产内容,必然会形成一次产业颠覆。因此,我们能够看到,现在影视行业已经在用AIGC进行后期制作,例如AI换脸就是已经被大家熟知的热门应用。

再如在电商领域,其中的直播带货、客服咨询等环节所需要内容服务都是AIGC最擅长的,而AIGC在电商内容生成上已经达到了非常理想的效果,尤其是人类很难实现的诸如直播带货中的24小时不间断货品推荐,已经在通过AIGC来实现。

据王蕴韬的观察,“实际上,在教育、工业、医疗、法律、农业、设计、软件,软件编写上,AIGC也确实已经遍地开花。”

大模型评估标准难题

AIGC及其背后大模型的到来带来的另一个难题是,如何建立起一套全新的评判标准。

在此之前,AI模型和算法经过几十年的发展,已经形成了一套成熟的评判标准,不过王蕴韬告诉我们,这套标准并不适用于现在的AIGC和大模型。

此前学术界会先搭建一个评测数据集,通过将这个数据集放到不同模型中并对比输出结果,以及与相对原有数据集的差异,从而判断AI模型的能力,诸如斯坦福等高校都是这方面权威评测机构。

然而,“这样的评测方法仅适用于原来判别式的AI模型,无法对现在生成式AI有一个很好的评测效果。”

从目前来看,国内对于大模型和AIGC一些场景应用的评测及标准,尚且处于探讨和研究阶段,据王蕴韬透露,“信通院专门针对大模型和AIGC的评测评估标准做了不少探索性工作,但目前这些标准主要还是围绕功能性指标,包括一个AIGC应用全生命周期实现哪些功能,这一块我们已经梳理出来了。”

但是针对AIGC背后大模型的性能有怎样的突破,这仍是一个行业难题。

“大模型每次生成的东西都会有明显的差异,如何判断每次输出都不一样的开放性输出和预想的输出的契合度有多少,这是目前评测最难实现的点。”

王蕴韬表示,“目前我们只能通过主观评价指标才能确定大模型究竟在性能上有多少提升,而针对相似度评估,整个产业界依旧非常欠缺。”

除此以外,王蕴韬还特别指出,如何让大模型可管、可控,安全地工作,同样是现在亟需解决的一个问题。

尤其是对于实时性、安全可控有高要求的行业和场景,现在尚且难以很好地应用AI大模型,“因为你完全无法预料大模型会输出怎样的结果。”

实际上,早在2021年,大模型刚刚兴起时,产学研各界就已经注意到了人工智能的安全可信,“我们当时做出过一个判断:人工智能已经进入到产业发展和治理重要度相同的新阶段。”

“原来大家都只是盯着产业发展,只踩油门,不踩刹车,现在来看,因为它在赋能垂直行业过程中会产生很多伦理相关的问题,确实已经进入到了一个新阶段。”

正因如此,在大模型进入对地域性、安全性较高的行业时,也出现了私有大模型这样独特的应用,尤其在数据安全越来越被重视的当下,私有大模型也成了通用大模型、行业大模型之外,一个更具时代特色的大模型。

现在全球对于到底什么样的AI是合乎科技伦理的、是可信的已经基本达成一定的共识,但是现在需要将这些宏观的、抽象的要求转化为企业真正在开发产品时落实的一个准则。

AIGC需要被再次颠覆

大模型带来的技术颠覆,为人工智能技术创新带来了新的范式,但第一波赚到钱的,依然是“卖铲子的人”。

王蕴韬表示,“通过堆算力的方式‘堆出来’的大模型效果已经很不错,但从商业角度来看,训练成本和推理成本之高,消耗电量和算力之大是难以想象的。因而,现阶段大模型解决的问题带来的效益远比它的成本投入要低。”

王蕴韬认为,针对大模型的商业化,接下来还需要供需方朝着两个方向发力:

第一,从供给侧来看,现在的大模型还有进一步压缩成本、提高性价比的空间。

大家已经意识到了以Transformer为代表的根技术还存在很大的问题,例如每增加一个token,它需要的算力是呈指数级增长的,对于由此带来的成本,同样如此。因此,从供给侧来看,目前仍然有很大的提升空间。

第二,从使用侧来看,现在AIGC做得最好的往往是企业自身数字化转型程度很高的,提升自身数字化程度也就成了企业高效应用AIGC的一个必然前提。

如果想要在更广泛的领域去应用AIGC技术,我们就需要这些领域在自己的数字化方面有更好的基础建设,这个基础的提升同样需要大量的资金、人力和时间的投入,先拥有更高数字化建设基础的企业和行业,也将先受益于AIGC技术红利。

而谈到当下大模型的技术路径,王蕴韬也特别指出,现在已经有高校和机构意识到了商业化的问题,开始思考区别于Transformer的新的技术路线。

他指出,“从‘好用’到‘高效’,AIGC在未来也许会再经历一次或多次技术范式的颠覆。” 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/169163.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路 buck-boost相关知识

BUCK-BOOST 文章目录 BUCK-BOOST前言一、DC-DC工作模式电容电感特性伏秒积平衡原理 二、BUCK电路三、BOOST电路四、BUCK-BOOST电路总结 前言 最近需要用到buck-boost相关的电路知识,于是便写下这篇文章复习一下。 一、DC-DC 在学习buck-boost电路之前我们先来看一…

邮件泄密案例分析

近日,一起令人震惊的事件在美军方内部引发了广泛关注。据报道,美军方意外将数百万封包含敏感信息的邮件发至非洲国家马里。这些邮件涉及的内容十分广泛,包括军事行动计划、人员部署、战术策略等,甚至还有部分涉及国家安全和战略决…

前缀和——238. 除自身以外数组的乘积

文章目录 🍷1. 题目🍸2. 算法原理🍥解法一:暴力求解🍥解法二:前缀和(积) 🍹3. 代码实现 🍷1. 题目 题目链接:238. 除自身以外数组的乘积 - 力扣&a…

代码随想录算法训练营第五十八天|739. 每日温度、496. 下一个更大元素 I

第十章 单调栈part01 739. 每日温度 给定一个整数数组 temperatures ,表示每天的温度,返回一个数组 answer ,其中 answer[i] 是指对于第 i 天,下一个更高温度出现在几天后。如果气温在这之后都不会升高,请在该位置用…

小程序项目:springboot+vue基本微信小程序的学生健康管理系统

项目介绍 随着信息技术和网络技术的飞速发展,人类已进入全新信息化时代,传统管理技术已无法高效,便捷地管理信息。为了迎合时代需求,优化管理效率,各种各样的管理系统应运而生,各行各业相继进入信息管理时…

武汉教育E卡通学生证照片尺寸要求及证件照集中采集方法

”武汉教育E卡通“电子学生证旨在数字化中小学生身份,提供通用的教育卡,实现身份认证的电子化、权威化和集成化。校内一卡通系统包括刷卡考勤、电子班牌、图书借阅等,全面记录学生在校业务。同时,采集社会通行、实践活动等数据&am…

Redis大key与热Key

什么是 bigkey? 简单来说,如果一个 key 对应的 value 所占用的内存比较大,那这个 key 就可以看作是 bigkey。具体多大才算大呢?有一个不是特别精确的参考标准: bigkey 是怎么产生的?有什么危害?…

Redis数据备份和还原

Redis SAVE 命令用于创建当前数据库的备份文件,文件名默认为dump.rdb。备份数据库数据可以增强对数据的保护,提升数据的安全性。当数据不小心丢失或者被删除时,我们就可以通过相应的操作进行数据恢复。本节介绍 Redis 的数据备份和数据还原操…

MySQL表的操作『增删改查』

✨个人主页: 北 海 🎉所属专栏: MySQL 学习 🎃操作环境: CentOS 7.6 阿里云远程服务器 🎁软件版本: MySQL 5.7.44 文章目录 1.创建表1.1.创建时指定属性 2.查看表2.1.查看表结构2.2.查看建表信息…

【SpringCloud】为什么选择微服务?

一般的平台会遇到的问题: 服务配置复杂。基础服务多,服务的资源配置复杂,传统方式管理服务复杂 服务之间调用复杂。检索服务、用户中心服务等,服务之间的调用复杂,依赖多 服务监控难度大。服务比较多,…

MYSQL基础知识之【数据类型】

文章目录 前言标题一数值类型日期和时间类型字符串类型后言 前言 hello world欢迎来到前端的新世界 😜当前文章系列专栏:Mysql 🐱‍👓博主在前端领域还有很多知识和技术需要掌握,正在不断努力填补技术短板。(如果出现错…

CSS:浏览器设置placeholder样式 / 微信小程序设置placeholder样式

一、web 设置placeholder 设置浏览器的placeholder样式 ::-webkit-input-placeholder { /* WebKit browsers */color: #999; } :-moz-placeholder { /* Mozilla Firefox 4 to 18 */color: #999; } ::-moz-placeholder { /* Mozilla Firefox 19 */color: #999; } :-ms-input-p…

「最优化基础知识2」一维搜索,以及python代码

最优化基础知识(2) 无约束优化问题,一维搜索 一、一维搜索 一维搜索的意思是在一个方向上找到最小点。 用数学语言描述,X*Xk tPk,从Xk沿着Pk方向行走t到达最小点X*。 1、收敛速度: 线性收敛&#xff1…

基于厨师算法优化概率神经网络PNN的分类预测 - 附代码

基于厨师算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于厨师算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于厨师优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神经网络的光滑…

redis持久化:RDB:和AOF

目录 RDB 持久化 1、修改配置文件:redis.conf 2、RDB模式自动触发保存快照 3、RDB模式手动触发保存快照 4、RDB的优缺点 AOF持久化 1、AOF持久化工作流程 2、修改配置文件开启AOF 3、AOF优缺点 4、AOF的重写机制原理 RDBAOF混合模式 redis持久化有两种方…

《尚品甄选》:后台系统——结合redis实现用户登录

文章目录 一、统一结果实体类二、统一异常处理三、登录功能实现四、CORS解决跨域五、图片验证码六、登录校验功能实现6.1 拦截器开发6.2 拦截器注册 七、ThreadLocal 要求: 用户输入正确的用户名、密码以及验证码,点击登录可以跳转到后台界面。未登录的用…

基于人工兔算法优化概率神经网络PNN的分类预测 - 附代码

基于人工兔算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于人工兔算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于人工兔优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神经网络…

P10 C++类和结构体的区别

目录 01 前言 02 struct 与 class格式上的区别 03 struct 与 class 使用上的区别 04 常用的代码风格 01 前言 今天这期我们主要解决一个问题,就是 C 中的类和结构体有什么区别。 本期我们有两个术语,结构体 struct,它是 structure 的缩写…

深度学习之基于Tensorflow银行卡号码识别系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介银行卡号码识别的步骤TensorFlow的优势 二、功能三、系统四. 总结 一项目简介 # 深度学习基于TensorFlow的银行卡号码识别介绍 深度学习在图像识别领域取得…

【JVM】一篇通关JVM垃圾回收

目录 1. 如何判断对象可以回收1-1. 引用计数法1-2. 可达性分析算法1-3. 四种引用强引用软引用弱引用虚引用终结器引用 2. 垃圾回收算法3. 分代垃圾回收4. 垃圾回收器5. 垃圾回收调优 1. 如何判断对象可以回收 1-1. 引用计数法 引用计数法 只要一个对象被其他变量所引用&…