多模态AI崛起,2022年人工智能5大发展趋势

3c01ecca1018eba8732a552d8591dacb.png

来源:CSDNnews

转自:中国机器人网

前言

国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点出 2022 年值得人们期待的五个人工智能发展趋势。

随着深度学习的开放,人工智能在几年中快速发展,尖端技术慢慢向普及应用到各行各业。以下是国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点的 2022 年值得人们期待的五个人工智能发展趋势。

趋势 1:大型语言模型(LLMs),定义交互式人工智能的下一个浪潮

    cb3fe8f94627000261f4e4aa2551e79d.png   

人工智能的语言模型是基于自然语言处理技术和算法创建的。比如在某一句话说一半的时候,这个模型会根据以往记录的实例,来推断出这句话后面的几个字。总的来说就是总结文本信息,甚至从纯文本中创建视觉图表。

大型语言模型(LLMs)是在包含巨大数据量的大规模数据集上训练的。像是 Google 的 BERT 和 OpenAI 的 GPT-2 和 GPT-3 就是 LLMs 很好的例子。据了解,GPT-3 中约有 1750 亿个参数,在 570 千兆字节的文本上进行训练。这些模型生成的东西可以从简单的文章到复杂的金融模型。现如今,包括 OpenAI、Hugging Face、Cohere、AI21 Labs 以及 AI12 在内的人工智能初创公司,正在通过训练具有数十亿参数的模型来推动 LLMs 的发展。

韩国一家叫做 Naver 的公司宣布,它已经建立了最全面的基于人工智能的语言模型之—— HyperCLOVA,一个类似于 GPT-3 的韩语模型。与上述模型不同的是,华为的 PanGu-Alpha 以及百度的 Ernie 3.0 Titan 则是在由电子书、百科全书和社交媒体组成的海量中文数据集上进行训练的。

在 2022 年,我们将看到大型语言模型成为下一代交互式人工智能工具的基础模型。

趋势 2:多模态人工智能的崛起

    1bcce8ecf241976761323c0e7ec9ff96.png   

" 模态 "(Modality)是德国理学家赫尔姆霍茨提出的一种生物学概念,即生物凭借感知器官与经验来接收信息的通道,如人类有视觉、听觉、触觉、味觉和嗅觉模态。多模态是指将多种感官进行融合,而多模态交互是指人通过声音、肢体语言、信息载体(文字、图片、音频、视频)、环境等多个通道与计算机进行交流,充分模拟人与人之间的交互方式。

传统的深度学习算法专注于从一个单一的数据源训练其模型。例如,计算机视觉模型是在一组图像上训练的,NLP 模型是在文本内容上训练的,语音处理则涉及声学模型的创建、唤醒词检测和噪音消除。这种类型的机器学习与单模态人工智能有关,其结果都被映射到一个单一的数据类型来源。而多模态人工智能是计算机视觉和交互式人工智能智能模型的最终融合,为计算器提供更接近于人类感知的场景。

多模态人工智能的最新例子是 OpenAI 的 DALL-E,该模型使用艺术家萨尔瓦多 - 达利和皮克斯的瓦力的谐音来命名。它可以从文本描述中生成对应图像。例如,当文本描述为 " 一个甜甜圈形状的时钟 " 被发送到该模型时,它就可以生成以下图像。

a302c723838c907161fb85d10a456e5e.png

图片来源 TheNewStark

谷歌的多任务统一模型(MUM)是多模态人工智能的另一个例子。它承诺通过从 75 种不同语言中挖掘出的上下文信息对用户搜索结果进行优先排序,从而提高用户的搜索体验。MUM 使用 T5 文本到文本框架,比 BERT 中流行的基于变换器的自然语言处理模型要强大 1000 倍。

英伟达的 GauGAN2 模型则将根据简单的文本输入生成照片般逼真的图像。它在一个单一的模型中结合了分割映射、内画和文本到图像的生成,使其成为一个强大的多模态工具,可以用文字和图画的混合来创造逼真的艺术。

在不远的未来我们就可以见到计算机视觉、语言以及语音模型的融合,这使得人工智能更丰富,更自然逼真。

趋势 3:简化和精简 MLOps

    c67217cd150eca39c946708bd04a1793.png   

机器学习操作(MLOps),是一个将机器学习投入到工业生产中的实践,是机器学习和 DevOPs 在软件领域交叉的产物,所以它在许多方面与 2012 年的 DevOps 相似。在 2012 年 DevOps 上线的时候,许多企业就意识到了它的价值,但是他们在实施 DevOps 的时候很困难,工具链非常复杂,生态系统也不够完善。而 MLOps 相比来说更加复杂,它的软件包包括安装、配置训练、推理基础设施、配置特征存储、配置模型注册表、监控模型的衰减以及检测模型漂移等所有的相关内容。其庞大的软件包也导致 MLOps 的部署比 DevOps 还困难。

MLOps 是被纳入基于云计算的 ML 平台的概念之一,平台包括如亚马逊网络服务的 Amazon SageMaker, Azure ML,   以及谷歌的 Vertex AI。然而,它所拥有的这些能力却不能用于混合和边缘计算这两个环境。因此,监测边缘计算的环境模型被证明是企业要面临的一个重大挑战。在处理计算机视觉系统和交互式人工智能系统时,创建一个为其服务的监测边缘计算的模型就变得更加具有挑战性。

随着 Kubeflow 和 MLflow 等开源项目的逐渐成熟,MLOps 其实已经很容易就能获取到。在未来几年我们或许可以看到一个精简和简化的 MLOps 方法横跨云领域和边缘计算环境。

趋势 4:AI 驱动的开发者生产力

    0382c382bd7b4667cd9ed0ad68ce27cf.png   

在未来,人工智能几乎会影响到 IT 行业的每个方面,包括编程和开发。在过去的几年里,我们已经看到了诸如亚马逊代码大师这样的工具,该产品会在开发者编程时,为其提供智能建议,以提高代码质量,并识别出应用程序中最重要的代码行。就在最近,Github Copilot 作为一个 " 人工智能配对程序员 " 首次亮相,协助开发人员编写高效的代码。而 Salesforce 的研究团队也推出了 CodeT5,这是一个开源项目,将帮助 Apex 开发人员进行由人工智能驱动的编码。Tabnine,即以前的 Codata,将智能代码完全带到了主流开发环境。Ponicode 也是一个 AI 驱动的工具,可以提供函数创建、可视化和运行单元测试的快捷方式。

d5a4aa6d99b285c798d1cab0a4f31ebc.png

图片来源 TheNewStark

大型语言模型(LLMs)的兴起和开源代码更广泛的可用性,使 IDE 供应商能够再其基础上建立智能代码生成和分析系统。

展望未来,人们期望看到能够从内联注释中生成高质量和紧凑代码的工具。它们甚至能够从一种语言编写的代码翻译成另一种语言,通过将传统代码转换为现代语言来实现应用程序的现代化。

趋势 5:云平台新的垂直化人工智能解决方案

    4e079802a13a778b487f81c6bcc69272.png   

世界领先的人工智能供应商,包括亚马逊、谷歌和微软,都正专注于将研究和开发工作商业化。他们通过旗下的云平台提供托管服务,并建立硬件设备,配备人工智能加速器和针对特定场景的预训练模型。

亚马逊连接和谷歌联络中心 AI 是垂直整合的典型例子。两者都利用机器学习能力来执行智能路由,由机器人驱动的客服对话,以及对联络中心代理商的自动协助。AWS Panorama 可以连接到现有的 IP 摄像机,以此来执行基于计算机视觉的推理。客户可以在其云平台训练新的模型,并将它们部署在全景设备的边缘。Azure Percept 采用了类似的方法,在边缘提供计算机视觉模型和交互式人工智能。微软基于 Azure 上现有的物联网、人工智能和边缘计算服务建立了 Percept。

最后,亚马逊 Lookout for Equipment 和谷歌 Cloud Visual Inspection AI 等服务,利用基于云的人工智能平台,对设备进行预测性维护和产品的异常检测。这些服务是专为零售和制造业定制的。

在 2022 年,我们将看到人工智能平台和云供应商利用前沿研究技术和现有的管理服务,提供针对特定的例子和场景的解决方案。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

0c42223567f76bc8371c6b2c0442771b.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482668.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenStack组件——Keystone身份认证

1.keystone介绍 keystone 是OpenStack的组件之一,用于为OpenStack家族中的其它组件成员提供统一的认证服务,包括身份验证、令牌的发放和校验、服务列表、用户权限的定义等等。云环境中所有的服务之间的授权和认证都需要经过 keystone. 因此 keystone 是云…

1_RabbitMQ初入门入门Hello消费者+生产者

文章目录1_RabbitMQ初入门1.RabbitMQ的介绍1.工作原理&发送/接收消息的流程2. 为什么要使用消息队列?3.使用了消息队列有什么缺点?2.安装RabbitMQ3.入门程序Hello_消费者&生产者_1.导入依赖2.生产者1.设置连接信息2.获取connection(连…

《Nature》:衰老后的核糖体发生了哪些致病变化

来源:生物通研究发现,产生蛋白质的细胞装配线会随着年龄的增长而停滞,从而引发雪球效应,增加错误折叠蛋白质的产量。在人类中,成堆的错误折叠蛋白质会导致与年龄相关的阿尔茨海默病和帕金森病。衰老会损害核糖体有效合…

[转载]eXeScope 6.50本地溢出分析

作 者: humourkyo时 间: 2009-03-30,21:03链 接: http://bbs.pediy.com/showthread.php?t84975无聊逛了下http://www.milw0rm.com 看最近有什么ODAY没,顺便挑一个分析下玩玩。于是就看到了这个http://www.milw0rm.com/exploits/8270是eXeScope 6.50 Local Buffer O…

饶毅:中国脑计划是我见过的最差科学经费管理,中国猴计划应该缓行

左:饶毅 右:蒲慕明来源:饶议科学 作者:饶毅原标题:中国猴计划应该缓行在我国上上下下左左右右普遍对支持科学研究有广泛共识,在我国具备一定支持科学研究的经济条件的情况下,科技部正在推动最大…

2_RabbitMQ工作模式_Work queues_Publish/Subscribe_Routing_Topics_HeaderRpc

文章目录2_RabbitMQ工作模式1.Work queues2.Publish/Subscribe1.工作模式2.代码1.生产者1.指定消息队列相关消息2.建立连接&绑定队列3.发送消息完整代码:2.消费者1.指定消息队列相关消息2.建立连接&绑定队列3.实现消费方法&监听消息完整代码3.小结3.Rou…

1000亿美元!英特尔要在美国建世界最大芯片厂,美520 亿美元芯片法案接近敲定...

来源:新智元编辑:桃子 拉燕 时光1000亿美元芯片计划,要重振英特尔往日雄风!路透称,英特尔将投资200亿美元建设2家芯片制造工厂,并计划最终投资多达1000亿美元。新工厂的建设将于今年晚些时候开始&#xff0…

Vue 组件间通信六种方式

前言 组件是 vue.js最强大的功能之一,而组件实例的作用域是相互独立的,这就意味着不同组件之间的数据无法相互引用。一般来说,组件可以有以下几种关系: 如上图所示,A 和 B、B 和 C、B 和 D 都是父子关系,C …

vue-day01-vue模板语法

文章目录Vue 是什么?使用Vue将helloworld 渲染到页面上指令v-cloakv-textv-htmlv-pre**v-once**双向数据绑定v-modelmvvmv-onv-on事件函数中传入参数事件修饰符按键修饰符自定义按键修饰符别名小案例-简单计算器v-bind绑定对象绑定class绑定对象和绑定数组 的区别绑…

IEEE Spectrum调查:AI 的 6 种最坏情况

来源:AI科技评论编译:辛西娅审核:维克多对于人类社会,人工智能(AI)带来的最大威胁是什么?好莱坞科幻电影的“想象”提供了答案:它逐渐进化,获得人类思考能力,…

212页PPT详解MEMS微传感器的工作原理(深入全面!)

来源:传感器专家网本文是关于MEMS微传感器的工作原理最全面的内容,分为两部分,共计212页PPT内容。主要讲解了MEMS微传感器的概念、分类,基本敏感原理介绍,MEMS微传感器实例、MEMS微执行器分类、基本致动方式介绍、微执…

Lucene-01 全文检索基本介绍

文章目录课程计划什么是全文检索数据分类结构化数据搜索非结构化数据查询方法如何实现全文检索全文检索的应用场景Lucene实现全文检索的流程索引和搜索流程图创建索引获得原始文档创建文档对象分析文档创建索引查询索引用户查询接口创建查询执行查询渲染结果全文检索技术Lucene…

为何生命进化的方向是衰老,而不是永生?

来源:科学的乐园永生似乎是全世界各种文化里都在追求的一种状态,为此古代的人们发展出了宗教,用来寄托死亡带来的遗憾。而人类也在想尽一切办法抑制衰老,各种护肤品、保养品相继问世。当然人类在这条追求永生的道路上也吃了很多苦…

vue-day02-vue常用特性

文章目录Vue常用特性表单基本操作表单修饰符自定义指令Vue.directive 注册全局指令Vue.directive 注册全局指令 带参数自定义指令局部指令计算属性 computed侦听器 watch过滤器过滤器中传递参数生命周期常用的 钩子函数数组变异方法替换数组动态数组响应式数据图书列表案例1、 …

2022年,哪些科技趋势将持续改变世界?这里有一份来自百度研究院的预测

来源:数学中国编辑部弹指之间,2021 年已经远去。这一年,新冠疫情全球经济和社会生活带来诸多挑战,同时,科学技术的力量得以持续显现。技术进步与产业发展的速度进一步加快,数字技术、智能技术为人们的生活带…

CSS每日学习笔记(1)

7.30.2019 1.CSS 文本属性 属性 描述 color 设置文本颜色 direction 设置文本方向。 line-height 设置行高。 letter-spacing 设置字符间距。 text-align 对齐元素中的文本。 text-decoration 向文本添加修饰。 text-indent 缩进元素中文本的首行。 text-shado…

vue-day03-vue组件化开发

文章目录组件组件注册全局注册组件基础用组件注意事项局部注册Vue 调试工具Vue组件之间传值父组件向子组件传值子组件向父组件传值兄弟之间的传递组件插槽匿名插槽具名插槽作用域插槽购物车案例1. 实现组件化布局2、实现 标题和结算功能组件3. 实现列表组件删除功能4. 实现组件…

智源发布《人工智能的认知神经基础白皮书》,一览“AI×脑科学”前沿

图. 智源研究院《人工智能的认知神经基础白皮书》(2021年)来源:智源研究院智源研究院发布 2021 年度《人工智能的认知神经基础白皮书》,兼具专业性与科普性,是人工智能学者探寻“AI脑科学”交叉学科研发创新的导览之作…

VR视觉健康标准在穗发布 专家:VR使用不要超过45分钟

来源:VR每日必看近期,“元宇宙”新兴概念备受关注,虚拟现实(下称“VR”)技术也被国内外媒体评为“第四次工业革命的钥匙之一”。但是,有不少人对VR眼镜等设备感到担忧:使用它会损害视力吗&#…

vue-day04-vue前端交互

文章目录接口调用方式异步promise基于Promise发送Ajax请求Promise 基本API实例方法.then().catch().finally()静态方法.all().race()fetch概览fetch请求参数(图片记录)fetch API 中的 HTTP 请求fetchAPI 中 响应格式axiosaxios基础用法axios的响应结果ax…