14-18 2024 年影响企业 GenAI 的关键技术趋势

现在,大多数 .com 公司已于 2023 年更名为 .ai,那么价值万亿美元的问题是:接下来会发生什么?哪些关键障碍、工具、技术和方法将重塑格局

企业 AI 的不同之处在于,它专注于可衡量、可管理的输出,企业可以控制这些输出并将其品牌与之联系起来。今年将以技术工具为主,使 GenAI 克服挑战,成为一种可靠的工具,而不仅仅是潜力。

数据科学家在预测自己领域的未来方面确实很糟糕(双关语!)。因此,请以 95% 的置信区间来看待这些预测 :)

图片由 Dall-E 生成

1. 资本支出周期的转变

现在,没有一家企业没有投资 GenAI。今年某个时候,这些投资将开始产生回报。新技术的资本支出 (capex) 产品周期通常遵循 18 个月的周期:18 个月投资,18 个月寻找市场,然后决定是进一步发展以达到顶峰还是投资其他地方。

构建 GenAI PoC 很容易,但将其投入生产却极具挑战性,因为存在幻觉、治理、缺乏评估标准和架构混乱等问题。

到 2024 年秋季,我们将看到公司试图为去年春季开始嵌入 AI 的所有产品找到产品与市场的契合度。这意味着有些公司会错失良机,而精益求精的人才会脱颖而出。这意味着那些没有找到产品与市场契合度的公司将面临有关投资和团队的艰难决策。

这是否意味着 GenAI 泡沫将要破裂?远非如此。然而,我们将看到企业进行整合,不仅关注 PoC 项目,还将关注今年秋季末投入生产的项目。而那些没有达到要求的企业要么拿出资金,要么撤资。

2.推理优化

到目前为止,大多数 GenAI PoC 最容易被忽视的领域是运行这些基于 LLM 的大型推理的成本。它看起来可能单价很小,但对于一家拥有几百万次推理调用的中型公司来说,成本很快就会累积起来。

报道芯片市场的新闻通讯 SemiAnalysis 在 2 月份估计,OpenAI 处理 GPT-3.5 提示花费了 0.0036 美元。按照这个速度,如果谷歌使用 GPT-3.5 来回答其搜索引擎每秒收到的约 32 万个查询,其营业收入将从每年 555 亿美元降至 195 亿美元。2 月份,谷歌表示,节省处理成本是其将 Bard 聊天机器人建立在其 LaMDA 大型语言模型的相对较小版本上的原因。

今年的重点将是开发推理优化方法。该领域将通过考虑各种因素来平衡成本效益,以提供推理服务,例如准确性、ROI 预测、底层本地部署与云基础架构与 SaaS 模型、LLM 的大小,以及它应该是 RAG 还是微调或自定义调整模型。

这是一个复杂的问题,人工智能领导层需要提前考虑,以免在将 GenAI 投入生产后遭遇账单冲击。请关注正在为加速计算开发的新框架,这些框架可以更快地运行模型或降低计算要求。

3. 再见“提示词优化”(欢迎回来 微调)

提示词调整是一种很好的建立基线的技术,但还不足以构建生产级解决方案。提示词调整是一种零样本学习方法,它不会调整张量的值。这意味着它不会学习任何特定于您的企业数据集的内容。毕竟,如果您的聊天机器人听起来和其他人一样,为什么有人会更喜欢你而不是他们呢?是什么让您的 GenAI 与众不同?

虽然提示词调整可以快速体现价值而无需训练任何模型,但它也存在固有的局限性。最终,你会得到一个推理成本过高且过于通用的解决方案。微调可以解决这个问题。

对于任何想要使用 GenAI 为客户增加价值的公司来说,它都需要带来其数据的独特性。而实现这一目标的方法要么是 RAG(Retriever Augmented Generation),要么是微调。RAG 与微调之间的争论是错误的,因为它取决于用例和您拥有的数据类型。

对于生成式问答来说,RAG 是更好的选择,而 Fine-Tuning 则适合其他问题,例如 text2sql。

虽然 Prompt Tuning 会作为一种方法继续存在,但它只是 GenAI 流程中的一个步骤,而不是流程本身的结束。对于任何拥有大量数据的企业来说,使用 LLM 嵌入作为基础模型,然后在此基础上构建自定义或微调模型更有意义,这种模型更轻量、更便宜、更好。

留意为“ AI中间件”创建的新空间,该空间具有更高的抽象框架,可以轻松微调模型(如SuperKnowa)。

4. SLM,MLM和VSLM的兴起   

你不需要用大炮来杀死蚊子!

继续之前的主题,如果您知道如何针对您的数据调整或训练较小的模型,您可以获得更好、更便宜的模型。这将引发人们对 SLM(小型语言模型)和 MLM(中型语言模型)的新兴趣,这些模型通常具有少于 7B 的参数,并且可以轻松安装在单个 GPU 上。

使用较大的模型进行实验不仅成本高昂,而且速度也很慢。在 20B LLM 上运行实验需要很长时间。另一个关键驱动因素是 GPU 短缺,这种情况将持续到 2024 年。

我预计,我们将看到甚至极小的语言模型(参数少于 10 亿)的兴起,这些模型可以安装在边缘设备上,将 GenAI 嵌入硬件中,并快速进行自定义训练,而无需 GPU。目前已有用于各种 NLP 任务的可嵌入NLP 库,这些库内部使用 2 亿到 3 亿个参数模型。

5. 多 - 多 - 多

多模型、多模式和多云 — 这些是您今年会多次听到的术语。为任何企业协调这些众多选项都会产生一系列新问题。今年,AI 领导者需要解决一些挑战:

  • 企业希望在其架构中支持多少个不同的 LLM?(请记住,由于 GPU 短缺,仅加载和推断 34B 参数的 LLM 就需要 6 个 GPU)。我们是想支持所有模型,还是选择更多较小的模型,或者几个中型模型,或者一个大模型和一个小模型?
  • 在单一云上运行既有风险又昂贵,那么我们如何管理跨多个云与本地 LLM 的工作负载?通常,本地模型部署从长远来看可以节省大量资金,并且可以更好地控制治理和产出。
  • 多模式——将文本与图像、视频和音频相结合将是一个值得关注的主题。这些多模式模型的部署仍然是一个需要工具开发的领域。

6. 阿基里斯·希尔——“人工智能治理”

如果说 GenAI 有一个领域让高管们夜不能寐,那就是 AI 治理。他们不知道他们的聊天机器人应用程序何时会散播错误信息,他们将不得不支付罚款(如加拿大航空案),或者何时会说出仇恨内容并被下架(如谷歌),或者如何遵守欧盟法律等新法规。

所有公司都想知道的答案是,一旦投入生产,它会做什么。尚未解决的问题是“如何衡量”它。没有简单的指标或解决方案来衡量幻觉,尤其是当涉及到没有普遍基本事实的特定领域数据(如政策)时。另一个挑战是合规性工具,就像审计目的一样。让黑匣子变得开放和可预测是一个挑战,它阻碍了许多公司将他们的 GenAI PoC 推向生产。

预计在私人和公共空间中都会有大量关于这个问题的讨论。希望美国国会能通过一些法律,并让行业采用一套可接受的通用标准(类似于制药药物试验的标准)。当然,这其中很多都是一厢情愿的想法,在此之前,像WatsonX.Governance这样的工具将是必不可少的。

7. 绝地归来(又名数据科学家)

去年,看起来成为一名人工智能工程师就是从事人工智能的全部需要(一些误导性的新报告声称,成为一名人工智能工程师可以为你提供 90 万美元的薪水,不含工资可以达到 40 万美元)。

今年最后一个但可能很难实现的变化是,人们认识到仍然非常需要数据科学家来推动 GenAI 从潜力到效力。

首先,两者有什么区别?传统的 ML 需要训练模型,数据科学家会利用他们的统计和算法专业知识来使模型适合您的用例。有了 LLM,您已经有一个预先训练好的模型,所以人们认为您不再需要这样做了。无论你需要什么,都可以用 Prompt Tuning 来完成,这是一种智能英语写作。因此,AI 工程师的数量激增,他们不太关注科学部分,而更专注于 ML-Ops 工程,以在应用程序内部配置、集成和部署 GenAI。

事实证明,现实情况要复杂一些,尤其是对于企业 GenAI 而言。以 RAG 应用程序为例。为几十个文档构建 RAG 很容易,但当文档数量达到几百万时,您需要了解检索器和重新排序算法(如 KNN、编码器、BM-25)深度的技能。对于另一个用例(如 text2sql),您需要微调模型的技能(即 PEFT、Beam Search 等)。此外,所有 GenAI 应用程序都需要评估模型的技能,并提出适合该数据集和用例的正确统计指标(如 NDCG、Fleiss-Kappa)。所有这些都意味着统计和 ML 算法的核心技能仍然非常重要,仅仅把这些框框放在一起是不够的。

因此,数据科学家将以绝地武士的身份回归,让 GenAI 焕发活力。核心统计技能将成为您快速提供高精度 GenAI 解决方案的关键因素。

期待意外

人工智能的魅力在于它的不可预测性(这不是缺陷,而是一种特性,因为一切都建立在概率之上)。包括 Sam Altman 在内的所有人都未能预测到当前的 GenAI 浪潮。我们第一次看到这一点是在 2012 年视觉模型的高潮和对自动驾驶汽车的炒作中。现在,LLM又迎来了一次繁荣。

所有企业都应该预料到,他们自己的计划可能会因为一些表现优于预期的新模型(如 Llama3 或 GPT5)或一些完全不同、出乎意料的东西而被打乱。新的模型、方法、数据集或服务器可能会扰乱局面。无论好坏,GenAI 中总是会出现意想不到的情况。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/40179.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker容器基础:Docker的安装与基本使用

Docker容器基础:Docker的安装与基本使用 前言 Docker是一种开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。本文将介绍Docker的安装…

前端Web开发HTML5+CSS3+移动web视频教程 Day4 CSS 第2天

P44 - P 四个知识点: 复合选择器 CSS特性 背景属性 显示模式 复合选择器 复合选择器仍然是选择器,只要是选择器,作用就是找标签。复合选择器就是把基础选择器进行组合使用。组合了之后就可以在大量的标签里面更快更精准地找标签了。找…

redis实现简单分布式锁

1.redisTemplate实现简单分布式锁 AutowiredRedisTemplate redisTemplate;/*** redis分布式锁演示案例,此处使用redisTemplate* param stockId 此处以扣减库存为例子,stockId代表要扣减库存的商品id,库存数据是提前存在redis的,并和数据库进…

Qt中线程的使用

目录 1 .QThread重要信号和函数 1.1 常用共用成员函数 1.2信号和槽函数 1.3静态函数 1.4 任务处理函数 2.关于QThread的依附问题: 3.关于connect连接 4.QThread的使用 5.线程池QThreadPool 5.1. 线程池的原理 5.2.QRunable类 5.3. QThreadPoo…

Java8新特性常见用法

Java8新特性 示例类Stream API 使用示例forEach:遍历Stream:创建流map:转换元素filter:过滤元素collect(收集元素) 和 Collectors(分组、连接)sorted 和 comparing(搭配排序)toMap:转换Map元素collectingAndThen:过滤掉相同数据toUpperCase:转大写distinct:去重c…

安装维修制氮设备的注意指南

制氮设备在许多工业领域都发挥着重要作用,无论是确保生产过程中的氮气供应,还是维持设备的稳定运行,正确的安装和维修都是关键。以下是一些重要的注意事项,帮助您顺利完成制氮设备的安装与维修工作。 一、安装注意事项 (一)选址与…

独孤思维:你自己都不相信的副业,怎么能赚钱

要明白,你做副业的目的是什么? 如果你打心眼里,看不上这个项目,或者心不甘情不愿的被动推进项目的实操。 那么我建议你直接放弃。 不要不情愿地去做。 不要当成任务去完成。 如果抱着这份心态去做副业。 你的副业&#xff0…

VUE自定义新增、复制、删除dom元素

功能需求,能灵活新增或删除一个dom元素,在此dom元素中还存在能灵活新增、删除的dom元素。实现后功能图如下: 点击新增策略,能新增整个策略dom 实现思路:定义一个数量和一个数组,然后使用循环遍历展示内容&a…

一种特殊的二叉树 哈夫曼树(Huffman Tree)

哈夫曼树(Huffman Tree)是一种特殊的二叉树,它在信息编码领域有着广泛的应用,特别是在数据压缩技术中。下面我将通过图文结合的方式,详细介绍哈夫曼树的概念、构建方法以及应用场景。 哈夫曼树的概念 哈夫曼树是一种特殊的二叉树,由David Huffman于1952年提出。它主要用…

将iStoreOS部署到VMware ESXi变成路由器

正文共:888 字 19 图,预估阅读时间:1 分钟 前面把iStoreOS部署到了VMware workstation上(将iStoreOS部署到VMware Workstation)。如果想把iStoreOS直接部署到ESXi上,你会发现转换镜像不能直接生成OVF或者OV…

React Navigation 和 Expo Router

React Navigation 是 React Native 社区最常用的导航库,其具有高度可定制性且性能良好的特性。它提供了一系列导航器(如堆栈导航器、标签导航器、抽屉导航器等),可以满足绝大多数的页面导航需求。 Expo Router 是 Expo 官方最新发…

css+js实现导航栏色块跟随滑动+点击后增加样式

这篇文章,我给大家分享一个导航菜单的效果。用cssJS实现,效果如图: 本例实现效果:当鼠标移动到其他菜单项时,会有个背景色块跟随鼠标横向平滑移动。当鼠标点击后,被点击的菜单名称文字字体会加粗。 现在&…

《数字图像处理与机器视觉》案例四 基于分水岭算法的粘连物体的分割与计数

一、引言 分水岭算法(Watershed Algorithm),是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影…

SpringBoot 集成Swagger在线接口文档 接口注解

介绍 Swagger接口文档是一种自动生成、描述、调用和可视化的RESTful风格Web服务接口文档的工具。它通过一系列的规范和自动化工具&#xff0c;极大地简化了后端开发人员与前端开发人员之间的协作。 依赖 <!--swagger--> <dependency><groupId>io.springfo…

怎么办理固体废物处理处置工程乙级资质

1. 准备工作 企业法人资格&#xff1a;确保企业具有独立法人资格。 注册资本&#xff1a;注册资本不少于100万元人民币。 社会信誉&#xff1a;企业需具有良好社会信誉。 人员配置&#xff1a; 至少配备14名专业技术人员&#xff0c;其中注册人员10名&#xff0c;非注册人…

「媒体邀约」天津媒体资源?媒体邀约宣传报道

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 媒体宣传加速季&#xff0c;100万补贴享不停&#xff0c;一手媒体资源&#xff0c;全国100城线下落地执行。详情请联系胡老师。 天津拥有丰富的媒体资源&#xff0c;利用这些资源进行有效…

保护你的JavaScript项目:使用Yarn进行依赖审计

保护你的JavaScript项目&#xff1a;使用Yarn进行依赖审计 在当今快速发展的软件开发领域&#xff0c;依赖管理是项目成功的关键。Yarn&#xff0c;作为一个高效且可靠的JavaScript依赖管理工具&#xff0c;提供了强大的依赖审计功能来帮助开发者识别和修复安全漏洞。本文将详…

ICMP协议详解及尝试用ping和tracert捕抓ICMP报文

一、ICMP协议 1.1、定义 ICMP&#xff08;Internet Control Message Protocol&#xff0c;互联网控制消息协议&#xff09;是一个支持IP层数据完整性的协议&#xff0c;主要用于在IP主机、路由器之间传递控制消息。这些控制消息用于报告IP数据报在传输过程中的错误&#xff0c…

大气热力学(1)——理想气体

本篇文章源自我在 2021 年暑假自学大气物理相关知识时手写的笔记&#xff0c;现转化为电子版本以作存档。相较于手写笔记&#xff0c;电子版的部分内容有补充和修改。笔记内容大部分为公式的推导过程。 文章目录 1.0 本文所用符号一览1.1 理想气体的状态方程1.2 理想气体的压强…

学会拥抱Python六剑客,提高编程效率

在Python语言中&#xff0c;有六个强大的工具&#xff0c;它们被称为"Python六剑客"。而Python六剑客指的是Python中常用的六种功能强大且灵活的工具&#xff0c;它们分别是“切片&#xff08;Slicing&#xff09;&#xff0c;推导列表&#xff08;List Comprehensio…