创新指南|解构企业AI价值如何实现 – 从5个关键策略着手

这篇文章探讨了谁将从生成式人工智能(Generative AI)市场中创造价值。作者分析了生成式AI技术栈,包括计算基础设施、数据、基础模型、微调模型和应用程序,找出了有利可图的领域。基于Transformer架构的大型语言模型(LLM)如GPT-4成为这一领域的基础模型。微调这些通用模型以适应特定任务和行业的需求也带来了商机。此外,基于LLM构建应用程序和编辑工具等产品是另一价值实现途径。总的来说,掌握这些关键要素的企业和新进参与者都有机会在生成式AI市场获利。

在 ChatGPT 公开发布后的几个月里,风险投资公司向生成式人工智能初创公司投入了大量资金,企业也加大了对该技术的投入,希望实现工作流程的自动化。这种兴奋是值得的。早期研究表明,生成式人工智能可以显著提高生产率1。这些提高有些来自于增强人力,有些来自于替代人力。

但问题是,谁将从这一爆炸性市场中获取价值,获取价值的决定因素又是什么?为了回答这些问题,我们分析了生成式人工智能堆栈–大致可分为计算基础设施、数据、基础模型、微调模型和应用–以确定差异化的成熟点。虽然文本、图像、音频和视频都有生成式人工智能模型,但我们在讨论中始终使用文本(大型语言模型或 LLM)作为说明背景。

1.解构生成式AI的技术实现

自从 ChatGPT 向公众推出以来,投资激增。风险投资公司正在向生成式人工智能初创公司注入资金,而公司则增加在该技术上的支出以简化其运营。人们对这项技术的热情是有道理的,因为初步研究表明生成式人工智能有潜力大大提高生产力。这些生产率的提高可能源于人力投入的增加和替代。

挥之不去的疑问围绕着谁将抓住这个快速扩张的市场带来的机会以及哪些因素有助于获取这种价值。为了深入研究这些查询,我们深入研究了生成式人工智能堆栈领域,其中包括计算基础设施、数据、基础模型、微调模型和应用程序。我们的目标是找出有潜力脱颖而出的领域。尽管存在适合文本、图像、音频和视频等各种领域的生成式人工智能模型,但我们仍将文本(特别是大型语言模型,即 LLM)作为我们讨论的中心主题。

专业的计算基础设施 – 构成了生成式人工智能技术的基础。该基础设施由高性能 GPU 驱动,用于训练和执行机器学习模型。希望开发新的生成式人工智能模型或服务的公司可以选择投资 GPU 和相关硬件,为本地 LLM 培训和执行建立必要的基础设施。然而,这种方法可能会带来经济负担且不切实际,因为可以通过 Amazon Web Services (AWS)、Google Cloud 和 Microsoft Azure 等领先的云服务提供商轻松访问等效的基础设施。

专有数据 – 生成式人工智能模型的力量来自广泛的互联网规模数据。以 OpenAI 的 GPT-3 背后的训练数据为例,它是 Common Crawl、开放网络存储库以及来自维基百科、在线文学作品和各种其他来源的数据的混合体。 Common Crawl 等数据集的合并表明在模型开发过程中需要吸收来自《纽约时报》和 Reddit 等不同网络来源的数据。此外,基础模型利用从网络爬行活动、合作伙伴关系或雪花市场等平台的数据采购中提取的特定领域信息。尽管模型的训练过程是透明的,但开发人员经常隐瞒有关其数据源来源的复杂细节。尽管如此,研究人员还是利用了即时注入攻击等策略来发现一系列数据源,这些数据源为这些人工智能模型的训练提供了动力。

基础模型 – 是在大量数据集上训练的神经网络,没有针对特定领域或任务(例如生成法律文档或提供技术产品信息)进行特定优化,在人工智能领域发挥着至关重要的作用。这些模型,例如 OpenAI 的 GPT-4 和 Google 的 Gemini,都基于 Vaswani 等人在 2017 年发表的一篇开创性论文中介绍的 Transformer 架构。虽然创建新的基础模型有潜力进入生成人工智能领域,但需要大量数据、计算能力和专业知识等重大障碍限制了高质量大型基础模型的开发。基础语言模型的著名例子包括闭源模型,例如 Meta 的 Llama-2 和阿拉伯联合酋长国技术创新研究所的 Falcon 40B,以及开源替代方案。

RAGs和模型微调 – 基础模型以其在各种语言任务中的多功能性和强大性能而闻名;然而,他们可能并不总是在特定的环境或任务中表现出色。为了提高特定于上下文的任务的性能,可能需要合并特定于域的数据。当将大型语言模型 (LLM) 用于特定目的时,例如帮助用户解决产品的技术问题,有两种可能的方法可供考虑。第一种方法涉及创建一个服务,该服务检索与用户查询相关的相关信息片段,并将该信息附加到提供给基础模型的提示中。例如,在帮助用户解决问题的场景中,这种方法需要开发代码,从产品手册中提取相关细节,与用户的问题紧密结合,并指导法学硕士根据提取的信息生成响应。这种方法通常称为检索增强生成(RAG)。虽然基础模型对其可容纳的提示长度有限制,但它们通常可以处理最多大约 100,000 个单词的提示。与这种方法相关的费用包括基础模型的 API 成本,该成本根据输入提示的大小和 LLM 生成的输出而增加。因此,从产品手册中获取的信息输入到 LLM 中的信息越多,实施成本就越高。

微调模型代表了一种替代策略,但初始计算费用更高。该方法不是简单地向模型提供产品手册中的上下文信息,而是通过利用特定领域的数据来增强基本模型的神经网络。此过程使 ChatGPT 能够处理指令并与用户进行对话。微调过程包括使用针对特定领域定制的数据集重新训练现有的基础模型,例如 Llama 或 GPT-4。

RAG 方法虽然由于模型需要冗长的提示而可能导致较高的 API 成本,但比微调更容易执行。此外,它还消除了在新数据集上重新训练神经网络所需的费用。这意味着 RAG 方法需要较低的设置成本,但在每次用户提出查询时将数据传输到基本模型时会增加可变费用。相反,微调方法虽然最初成本较高,但有望产生优异的结果,并且一旦完成,可以在将来使用,而无需像 RAG 那样为每个问题提供上下文。拥有技术敏锐度的企业可能会发现扩展生成式人工智能工具层的价值,促进微调和 RAG 等选项,无论是用于内部产品开发还是作为向其他企业提供的服务。

LLM 应用. 该结构的最上层包括可以在基础模型或改进模型上构建的应用程序,以满足特定需求。各种初创公司开发了用于生成法律文档 (Evisort)、压缩书籍和电影脚本 (Jumpcut) 或解决技术查询 (Alltius) 的应用程序。这些应用程序遵循典型软件即服务产品的定价模型(按月收费),其额外成本主要与基础模型的云托管和 API 费用相关。

最近,来自科技巨头和各级投资者的大量投资涌入。引入了许多新的基础模型,以及使用独特的数据集进行微调的特定任务模型,以获得竞争优势。此外,许多初创企业正在积极创建基于不同基础模型或定制模型的应用程序。

2.云计算的经验教训

哪些企业能从这些投资中获得最大价值?在过去的几个月里,已经有数十种基础模型面世,其中许多都能提供与更流行的基础模型相媲美的性能。不过,我们认为,基础模型市场很可能会在少数几家公司之间进行整合,就像云服务的大部分市场份额(和价值)被亚马逊、谷歌和微软等公司所占据一样。

大多数云基础设施初创企业失败(或被更大的竞争对手收购)有三个原因,这些原因也适用于生成式人工智能。首先是创建、维持和改进高质量技术基础设施所需的成本和能力。由于训练这些模型所需的数据和计算资源成本非常高昂,这就进一步加剧了 LLM 的情况。这其中就包括 GPU 的成本,而 GPU 的供应量相对于需求量来说是很低的。根据外部估算,仅谷歌 5400 亿参数 PaLM 模型最终训练运行的计算成本就在 900 万到 2300 万美元之间(总训练成本可能是这一数字的数倍)。同样,Meta 在 2023 年和 2024 年对 GPU 的投资估计也将超过 90 亿美元。此外,建立基础模型需要获取海量数据,以及大量的实验和专业知识,所有这些都可能非常昂贵。

其次是需求方的网络效应。随着围绕这些基础设施的生态系统不断壮大,新市场进入者面临的障碍也会随之增加。以 PromptBase 为例,这是一个为 LLM 提供提示信息的在线市场。这里提供最多的提示是 ChatGPT 和流行的图像生成器 Dall-E、Midjourney 和 Stable Diffusion。从技术角度看,新的 LLM 可能很有吸引力,但如果用户有大量在 ChatGPT 中运行良好的提示,而新的 LLM 却没有经过验证的提示,那么他们很可能会坚持使用 ChatGPT。虽然不同 LLM 的底层架构相似,但它们都经过了大量设计,在一种 LLM 上行之有效的提示策略在其他 LLM 上可能并不适用。同时,用户数量是源源不断的礼物: ChatGPT 凭借其庞大的用户群吸引了开发人员在其基础上开发插件。此外,LLM 的使用数据还能形成反馈回路,使模型不断改进。一般来说,最受欢迎的 LLM 会比较小的 LLM 改进得更快,因为它们有更多的用户数据可供使用,而这些改进会带来更多的用户。

第三个因素是规模经济。资源池和需求聚合带来的供应方优势将使拥有庞大客户群的本地语言托管服务的每次查询成本低于初创本地语言托管服务。这些优势包括能够从 GPU 供应商和云服务提供商那里谈判到更优惠的价格。

基于上述原因,尽管新的基础模型会定期发布,但我们预计基础模型市场将围绕几个主要参与者进行整合。

3.构建还是租用?

希望打入生成式人工智能服务市场的公司必须决定是在 GPT-4 等第三方基础模型之上构建应用,还是构建和托管自己的 LLM(要么在开源替代模型之上构建,要么从头开始训练)。在第三方模型上构建应用程序可能会带来安全风险,例如可能会暴露专有数据。使用可信的云计算和 LLM 提供商可以部分降低这种风险,因为它们可以保证客户数据的机密性,不会用于训练和改进其模型。

另一种方法是利用开源 LLM,如 Llama 2 和 Falcon 40B,而不依赖 OpenAI 等第三方提供商。开源模型的吸引力在于,它们为公司提供了对模型完整而透明的访问权限,通常成本更低,而且可以托管在私有云上。不过,开源模型目前在代码生成和数学推理等复杂任务方面的性能落后于 GPT-4。此外,托管此类模型需要内部技术技能和知识,而使用第三方托管的 LLM 则非常简单,只需注册一项服务并使用提供商的应用程序接口即可访问其功能。云提供商已开始越来越多地托管开源模型,并通过 API 提供访问权限,以解决这一问题。

由于文章篇幅有限,原文链接,请点击:

创新指南|解构企业AI价值如何实现 - 从5个关键策略着手

 延展文章:

1. A创新指南 | 如何利用人工智能技术实现企业营销效率提升10倍(上)

2. 入门指南|营销中人工智能生成内容的主要类型 [新数据、示例和技巧]

3. 创新指南|如何将人工智能应用于未来的创新管理——并不断付诸实践

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/781121.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

总结UDP协议各类知识点

前言 本篇博客博主将详细地介绍UDP有关知识点,坐好板凳发车啦~ 一.UDP特点 1.无连接 UDP传输的过程类似于发短信,知道对端的IP和端口号就直接进行传输,不需要建立连接; 2.不可靠传输 没有任何的安全机制,发送端发…

【AI】命令行调用大模型

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 【AI】命令行调用大模型引入正文初始化项目撰写脚本全局安装 成果展示 【AI】命令…

探索高效开发大屏可视化项目模板:es-big-screen

一、引言 在数据驱动的时代,大屏可视化已经成为了展示数据和信息的重要手段。本文将介绍一个基于 Vue 3、Echarts、高德地图和 Pinia 开发的大屏可视化项目模板——es-big-screen,它提供了丰富的功能,包括大屏适配、图表组件(Ech…

【Leetcode】top 100 贪心算法

基础知识补充 贪心算法:在对问题求解时,总是做到局部最优; 但局部最优并不总能获得整体最优解,但通常能获得近似最优解 题目 121 买卖股票的最佳时机 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股…

《Effective C++》《构造/析构/赋值运算——7、为多态基类声明virtual析构函数》

文章目录 1、term7:Declare destructors virtual in polymorphic base classes2、总结3、相关面试题3.1 析构函数在什么情况下声明为虚函数 4、参考 1、term7:Declare destructors virtual in polymorphic base classes 带有多态性质的基类应该声明一个virtual析构函数&#x…

突破编程_C++_STL教程( find 算法)

1 std::find 算法的概念与用途 std::find 是 C 标准库 <algorithm> 中的一个非常有用的算法。这个算法用于在一个范围内查找指定的元素&#xff0c;并返回该元素的迭代器。如果元素不存在于该范围内&#xff0c;则返回范围的尾迭代器。 std::find 的基本概念是遍历一个…

49 el-input 的 模型 视图 双向同步

前言 这里来看一下 el-input 这边的 数据 和 视图的双向绑定 最开始 我以为 这部分的处理应该是 vue 这边实现的, 但是跟踪调试了一下 发现这部分的处理是业务这边 自己实现的 这部分 还是有一些 值得记录的东西, 从这里 要去理解的而是 vue 这边从宏观的框架上面来说 帮我们…

前端网页之间传递参数

在多页面应用中&#xff0c;我们可能面临着前端页面之间传递参数的情况&#xff0c;在一个页面获取到一些参数信息后&#xff0c;到另一个页面去进行后续处理&#xff0c;需要将前一个页面得到的一些参数带到第二个页面。当参数较少时&#xff0c;可以在跳转第二个页面时通过se…

前端-深入探讨网络面试题

第一关 请求-文件、数据、连接 文件类的请求&#xff1a;加载HTMl、CSS 数据&#xff1a; ajax请求&#xff08;基于HTTP&#xff0c;HTTP基于TCP&#xff09;&#xff0c;如何建立连接的&#xff08;三次握手&#xff0c;为什么不是两次或者四次&#xff09;&#xff0c;sock…

《QT实用小工具·四》屏幕拾色器

1、概述 源码放在文章末尾 该项目实现了屏幕拾色器的功能&#xff0c;可以根据鼠标指定的位置识别当前位置的颜色 项目功能包含&#xff1a; 鼠标按下实时采集鼠标处的颜色。 实时显示颜色值。 支持16进制格式和rgb格式。 实时显示预览颜色。 根据背景色自动计算合适的前景色…

AIGC重塑金融:AI大模型驱动的金融变革与实践

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​&#x1f4ab;个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-tVrfBkGvUD0Qi13F {font-family:"trebuchet ms",verdana,arial,sans-serif;font-siz…

学习java第二十七天

Spring框架作为IOC容器的落地实现,提供了一个灵活的"插座",其他组件只需要简单的"插上"即可享受Spring提供的基础设施支持- ,并且结合Spring一起使用。 Spring的核心在于它的IOC容器设计,我们可以通过Spring应用程序上下文生命周期和Spring Bean的生命周期…

基于SpringBoot的“游戏分享网站”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“游戏分享网站”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringBoot 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统总体结构图 网站首页界面图 用户注册界面图 …

为什么用了索引,搜索速度还是很慢

索引列选择不当 1.假设有一个包含性别信息的表&#xff0c;其中有1000条记录&#xff0c;其中男性占 99%、女性占 1%。如果在性别列上创建索引&#xff0c;由于选择性太低&#xff0c;大部分查询都会涉及到表中的绝大多数行&#xff0c;这时候数据库优化器可能会认为全表扫描比…

[SpringCloud] Feign Client 的创建 (二) (五)

文章目录 1.自动配置FeignAutoConfiguration2.生成 Feign Client2.1 从Feign Client子容器获取组件2.2 Feign Client子容器的创建2.3 构建Feign Client实例 1.自动配置FeignAutoConfiguration spring-cloud-starter-openfeign 包含了 spring-cloud-openfeign-core FeignAutoCo…

HarmonyOS实战开发-如何实现一个支持加减乘除混合运算的计算器。

介绍 本篇Codelab基于基础组件、容器组件&#xff0c;实现一个支持加减乘除混合运算的计算器。 说明&#xff1a; 由于数字都是双精度浮点数&#xff0c;在计算机中是二进制存储数据的&#xff0c;因此小数和非安全整数&#xff08;超过整数的安全范围[-Math.pow(2, 53)&#…

【详解】运算放大器工作原理及其在信号处理中的核心作用

什么是运算放大器 运算放大器&#xff08;简称“运放”&#xff09;是一种放大倍数非常高的电路单元。在实际电路中&#xff0c;它常常与反馈网络一起组成一定的功能模块。它是一种带有特殊耦合电路和反馈的放大器。输出信号可以是输入信号的加法、减法、微分和积分等数学运算…

vue3+ts项目 | axios 的测试 | 测试接口

在 App.vue 中&#xff0c;测试接口 // 测试接口import request from /utils/request;import { onMounted } from vue;onMounted(() > {request.get(/hosp/hospital/1/10).then((res) > {console.log("APP组件展示获取的数据",res);})}) 在request.ts中&…

link 样式表是否会阻塞页面内容的展示?取决于浏览器,edge 和 chrome 会,但 firefox 不会。

经过实测&#xff1a; 在 head 中 link 一个 1M 大小的样式表。设置网络下载时间大概为 10 秒。 edge 和 chrome 只有在下载完样式表后&#xff0c;页面上才会出现内容。而 firefox 可以直接先显示内容&#xff0c;然后等待样式表下载完成后再应用样式。 DOMContentLoaded 事…

Vue指令之v-for

跟其他语言中的for一样&#xff0c;是用来渲染多个类似实例的。 语法为v-for"(item, index) in 可迭代对象"&#xff0c;一般就用于遍历数组。这里的语法跟Python中的for循环enumerate也有点相似之处&#xff0c;但要注意item在前&#xff0c;index在后&#xff0c;…