生成式人工智能重置:从初期热潮到战略扩展

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

“是时候对生成式人工智能(生成 AI)进行重置了。随着企业意识到捕捉生成 AI 的巨大潜在价值比预期更困难,2023 年的最初热情和一阵忙碌的活动正在让位于重新思考和重新校准。

2024 年即将成为生成 AI 证明其价值的一年,企业应牢记在数字和 AI 转型中学到的艰难教训:竞争优势来自于建立组织和技术能力,以广泛创新、部署和改进大规模解决方案——实际上,是为了分布式的数字和 AI 创新重新构建业务。

让我们简要看看这对一家太平洋地区的电信公司意味着什么。该公司聘请了一位首席数据和 AI 官,任务是“使组织能够通过数据和 AI 创造价值。”首席数据和 AI 官与业务部门合作,制定了战略愿景并实施了用例的路线图。经过对企业内部领域(即客户旅程或功能)和用例机会的扫描,领导层优先选择了家庭服务/维护领域作为试点,并作为更大一系列举措的一部分进行扩展。他们特别针对开发生成 AI 工具,以帮助调度员和服务操作员更好地预测服务家庭时所需的呼叫类型和零件。

领导层设立了具有共享目标和激励措施的跨职能产品团队来构建生成 AI 工具。作为提升整个企业更好地使用数据和生成 AI 工具技能的一部分,他们还设立了一个数据和 AI 学院,调度员和服务操作员作为培训的一部分报名参加。为了为生成 AI 提供技术和数据基础设施,首席数据和 AI 官还选择了一个大型语言模型(LLM)和能够满足该领域需求并服务于企业其他部分的云提供商。首席数据和 AI 官还监督了数据架构的实施,以便快速且负责任地提供构建生成 AI 工具所需的干净可靠的数据(包括服务历史和库存数据库)。打破生成 AI 机会的关键是公司需要以下列方式重新构建工作方式。

找出生成 AI 助理可以为您提供真正竞争优势的地方


围绕生成 AI 的广泛兴奋及其相对易用性导致了组织内一阵实验热潮。然而,这些举措中的大多数不会产生竞争优势。例如,一家银行购买了数万份 GitHub Copilot 许可证,但由于对如何使用该技术没有清晰的认识,进展缓慢。我们经常看到的另一个无重点的努力是公司试图将生成 AI 纳入其客户服务能力。对于大多数公司而言,客户服务是一种商品能力,而不是核心业务的一部分。尽管生成 AI 可能在此类情况下有助于提高生产力,但它不会创造竞争优势。

要创造竞争优势,公司应首先理解成为“接受者”(使用可用工具,通常通过 API 和订阅服务)、“塑造者”(将可用模型与专有数据集成)和“制造者”(构建 LLM)的区别。目前,对于大多数公司而言,制造者方法成本太高,因此企业的最佳选择是在提高生产力的同时实施接受者模式,并构建塑造者应用以获得竞争优势。

生成 AI 近期价值的很大一部分与其帮助人们更好地完成当前工作的能力密切相关。通过这种方式,生成 AI 工具充当助理,与员工并肩工作,例如创建一个开发人员可以调整的初始代码块,或者起草一个新零件的采购申请单,供现场维护人员审核和提交。这意味着公司应专注于助理技术在其优先计划中可以产生最大影响的地方。

一些工业公司,例如,已经确定维护是其业务的关键领域。审查维护报告并与一线工人共度时光可以帮助确定生成 AI 助理在哪些方面可以产生重大影响,例如快速及早识别设备故障问题。生成 AI 助理还可以更快地识别卡车故障的根本原因并推荐解决方案,并作为最佳实践或标准操作程序的持续来源。

挑战在于如何通过提高生产力来创造收入。例如,在客户服务中心,公司可以停止招聘新代理,并通过自然流失实现潜在的实际财务收益。因此,定义如何通过提高生产力来创造收入的计划对于捕捉价值至关重要。

提高现有人才的技能,但要明确生成 AI 特定技能的需求


目前,大多数公司对所需的技术生成 AI 技能有一个大致的了解,例如模型微调、向量数据库管理、提示工程和上下文工程。在许多情况下,这些是可以通过培训现有员工来发展的技能。那些具备现有 AI 和机器学习(ML)能力的公司有很大的优势。例如,数据工程师可以学习多模态处理和向量数据库管理,ML 操作(MLops)工程师可以扩展其技能到 LLMops(LLM 操作),数据科学家可以发展提示工程、偏见检测和微调技能。

学习过程需要两到三个月才能达到一个相当的熟练水平,因为学习不同 LLM 能做什么和不能做什么以及如何最好地使用它们的复杂性。编码人员需要获得构建软件、测试和验证答案的经验。例如,一家金融服务公司花了三个月时间培训其最好的数据科学家达到高水平的熟练度。尽管课程和文档是可用的——许多 LLM 提供商为开发人员提供训练营——我们发现,通过学徒制、大规模培训人员以便培训他人以及建立从业者社区是最有效的能力建设方式。通过在团队之间轮换专家进行培训,定期安排会议分享学习成果,并举办每两周一次的文档审查会议,这些做法在建立从业者社区方面取得了成功。

成功的生成 AI 技能不仅仅是编码熟练度。我们在开发自己生成 AI 平台 Lilli 的过程中发现,最好的生成 AI 技术人才具备设计技能,能够发现需要解决的问题,具备上下文理解能力,确保生成最相关和高质量的答案,具备与知识专家合作的能力(测试和验证答案并制定适当的策划方法),具备强大的取证技能,能够找出故障原因(问题是数据、用户意图的解释、元数据的质量还是其他原因),具备预见能力,能够构思和规划可能的结果并将正确类型的跟踪纳入代码。纯粹的编码人员如果没有这些技能,可能不会是团队中有用的成员。

尽管目前的技能提升主要基于“在职学习”方法,但我们看到市场迅速出现了过去一年学到这些技能的人。技能增长迅速。GitHub 报告称,开发人员正在“大量”参与生成 AI 项目,2023 年在其平台上创建了 65,000 个公共生成 AI 项目,比前一年增长了近 250%。如果您的公司刚刚开始生成 AI 之旅,您可以考虑雇佣两到三名为其公司构建生成 AI 塑造产品的高级工程师。这可以大大加快您的进展。

组建集中团队以建立标准,实现责任扩展


为了确保业务的各个部分都能扩展生成 AI 能力,集中技能是一个自然的第一步。该集中团队的关键重点将是制定并实施支持扩展的协议和标准,确保团队能够访问模型,同时将风险降至最低并控制成本。团队的工作可以包括,例如,采购模型并规定访问方式,制定数据准备标准,建立已批准的提示库,分配资源。

对于开发生成 AI 解决方案的团队,其团队组成将类似于 AI 团队,但会有具有生成 AI 经验的数据工程师和数据科学家,并且风险管理、合规和法律职能的贡献者更多。通常的做法是从不同专业领域分配资源到小组,这种理念不会改变,但生成 AI 密集型小组的技能组成会有所不同。

设置技术架构以扩展


构建生成 AI 模型通常相对简单,但要使其在大规模上全面运行则完全不同。我们见过工程师在一周内构建一个基本的聊天机器人,但发布一个稳定、准确且合规的版本以扩展可能需要四个月时间。这就是为什么我们的经验表明,实际的模型成本可能不到解决方案总成本的 10% 到 15%。

构建扩展不意味着构建新技术架构。但这确实意味着关注一些核心决策,以简化和加快流程,而不会造成巨大开支。以下三项决策尤为重要:

关注重用技术。重用代码可以使生成 AI 用例的开发速度提高 30% 到 50%。一个好的方法是简单地创建一个已批准工具、代码和组件的来源。例如,一家金融服务公司创建了一个生产级工具库,经过安全和法律团队的批准,并在库中提供给团队使用。更重要的是花时间识别和构建在最优先用例中常见的能力。例如,同一家金融服务公司确定了三个组件,可以重用于 100 多个已识别的用例。通过首先构建这些组件,他们能够为所有已识别的用例生成大量代码库——实际上给每个应用程序一个很大的起步。

将架构重点放在使生成 AI 模型与内部系统之间的高效连接上。为了使生成 AI 模型在塑造者原型中有效工作,它们需要访问企业的数据和应用程序。集成和编排框架的进步显著减少了进行这些连接所需的工作量。但关键是要明确这些集成是什么以及如何实现它们,以确保这些模型高效工作,避免复杂性造成的技术债务(公司在解决现有技术问题时支付的时间和资源“税”)。首席信息官和首席技术官可以为其组织定义参考架构和集成标准。关键要素应包括一个模型中心,包含经过训练和批准的模型,可以按需提供;标准 API,充当连接生成 AI 模型与应用程序或数据的桥梁;以及上下文管理和缓存,通过提供来自企业数据源的相关信息加速处理。

建立测试和质量保证能力。我们在构建 Lilli 的过程中,优先考虑了测试而不是开发。我们的团队不仅开发了每个开发阶段的测试协议,还协调了整个团队,例如,明确谁具体需要对每个阶段的过程进行签字。这虽然减慢了最初的开发速度,但通过减少错误和修复错误所需的时间,加快了整体交付速度和质量。

确保数据质量并关注非结构化数据以支持模型


企业能否从生成 AI 模型中生成和扩展价值将取决于其利用自身数据的能力。与技术一样,现有数据架构的针对性升级是为了最大化生成 AI 的未来战略收益:

针对性地提高数据质量和数据增强工作。虽然数据质量一直是一个重要问题,但生成 AI 模型可以使用的数据的规模和范围——特别是非结构化数据——使这个问题变得更加重要。因此,关键是要正确处理数据基础,从明确决策权到定义明确的数据流程,再到建立模型可以访问的数据分类。做得好的公司将其数据质量和增强工作与特定的 AI/生成 AI 应用和用例联系起来——您不需要将这种数据基础扩展到企业的每个角落。这可能意味着,例如,开发一个新的数据存储库,包含所有设备规格和报告的问题,以更好地支持维护助理应用。

了解非结构化数据中锁定的价值。大多数组织传统上专注于结构化数据(可以组织成表格的值,例如价格和特性)。但 LLM 的真正价值来自其处理非结构化数据的能力(例如,PowerPoint 幻灯片、视频和文本)。公司可以绘制哪些非结构化数据源最有价值,并建立元数据标记标准,以便模型可以处理数据,团队可以找到所需的内容(标记尤其重要,有助于公司在必要时从模型中删除数据)。在考虑数据机会时要有创造性。一些公司,例如,在高级员工退休时采访他们,并将捕获的机构知识输入 LLM,以帮助改善其助理性能。

优化以降低大规模成本。企业在数据上的花费与他们优化数据基础设施和基础成本后的花费之间往往有十倍的差距。这一问题通常源于公司在未优化数据方法的情况下扩展概念验证。通常有两项成本突出。一是存储成本,公司将数 TB 的数据上传到云端并希望这些数据 24/7 可用。实际上,公司通常只需要 10% 的数据具有这种可用性水平,而在 24 或 48 小时内访问其余数据是更便宜的选择。另一个成本与需要调用数千个处理器运行的模型计算相关。这尤其适用于公司构建自己的模型(制造者原型),但也适用于使用预训练模型并使用自己的数据和用例运行它们(塑造者原型)。公司可以仔细研究如何在云平台上优化计算成本——例如,将一些模型排队在处理器未使用时运行(例如,当美国人睡觉,Netflix 等计算服务消费减少时)是一种更便宜的选择。

建立信任和可重用性以驱动采用和扩展


由于许多人对生成 AI 有担忧,解释这些工具如何工作比大多数解决方案的要求更高。使用这些工具的人想知道它们如何工作,而不仅仅是它们做什么。因此,投资额外的时间和金钱以通过确保模型准确性和简化检查答案来建立信任非常重要。

例如,一家保险公司创建了一个生成 AI 工具来帮助管理索赔。作为该工具的一部分,它列出了所有已实施的保护措施,并为每个答案提供了指向相关政策文件句子或页面的链接。该公司还使用 LLM 生成了许多相同问题的不同变体,以确保答案的一致性。这些步骤在帮助最终用户建立对工具的信任方面至关重要。

培训使用生成 AI 工具的维护团队的一部分应该是帮助他们了解模型的局限性以及如何最好地获得正确答案。这包括教导工人以更广泛的问题开始然后逐步缩小范围以快速获得最佳答案。这为模型提供了更多的上下文,也有助于消除可能自认为已经知道答案的人的偏见。让模型界面看起来和感觉与现有工具相同也有助于用户在引入新应用程序时不感到压力。

要实现扩展,企业需要停止构建难以用于其他类似用例的单一解决方案。例如,一家全球能源和材料公司将可重用性作为所有生成 AI 模型的关键要求,并在早期迭代中发现其组件的 50% 到 60% 可以重用。这意味着要为开发生成 AI 资产(例如提示和上下文)设置标准,以便其他用例可以轻松重用。

尽管许多与生成 AI 相关的风险问题是已经在讨论中的进化——例如数据隐私、安全、偏见风险、工作替代和知识产权保护——生成 AI 极大地扩展了风险范围。报告 AI 采用的公司中只有 21% 表示他们已经制定了管理员工使用生成 AI 技术的政策。

同样,应该建立一套测试 AI/生成 AI 解决方案的测试,以证明数据隐私、消除偏见和知识产权保护得到了尊重。一些组织实际上建议发布附带性能特征文档的模型。记录您的决策和理由在与监管机构的对话中特别有帮助。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/25890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PyTorch学习8:多分类问题

文章目录 前言一、说明二、示例1.步骤2.示例代码 总结 前言 介绍如何利用PyTorch中Softmax 分类器实现多分类问题。 一、说明 1.多分类问题的输出是一个分布,满足和为1. 2.Softmax 分类器 3.损失函数:交叉熵损失 torch.nn.CrossEntropyLoss() 二、…

虚拟化 之一 详解 jailhouse 架构及原理、软硬件要求、源码文件、基本组件

Jailhouse 是一个基于 Linux 实现的针对创建工业级应用程序的小型 Hypervisor,是由西门子公司的 Jan Kiszka 于 2013 年开发的,并得到了官方 Linux 内核的支持,在开源社区中获得了知名度和吸引力。 Jailhouse Jailhouse 是一种轻量级的虚拟化…

微软如何打造数字零售力航母系列科普13 - Prime Focus Technologies在NAB 2024上推出CLEAR®对话人工智能联合试点

Prime Focus Technologies在NAB 2024上推出CLEAR对话人工智能联合试点 彻底改变您与内容的互动方式,从内容的创建到分发 洛杉矶,2024年4月9日/PRNewswire/-媒体和娱乐(M&E)行业人工智能技术解决方案的先驱Prime Focus Techn…

人工智能在医学领域的应用及技术实现

欢迎来到 Papicatch的博客 目录 🍉引言 🍉 医学影像分析 🍈技术实现 🍍数据准备 🍍模型构建 🍍模型训练 🍍模型评估 🍍应用部署 🍈示例代码 🍉 基因…

操作系统真象还原:内存管理系统

第8章-内存管理系统 这是一个网站有所有小节的代码实现,同时也包含了Bochs等文件 8.1 Makefile简介 8.1.1 Makefile是什么 8.1.2 makefile基本语法 make 给咱们提供了方法,可以在命令之前加个字符’@’,这样就不会输出命令本身…

微信小程序使用 “云函数“ 获取 “openid“

文章目录 1.前期准备2.具体操作步骤 1.前期准备 必须使用云开发已经配置好云开发 2.具体操作步骤 1.进入小程序开发工具→在云函数目录上右键→选中新建云函数 创建结束,自动上传(必须确认已经上传才生效) 2.进入对应页面的js文件&#…

QT 信号和槽 信号关联到信号示例 信号除了可以绑定槽以外,信号还可以绑定信号

信号除了可以关联到槽函数,还可以关联到类型匹配的信号,实现信号的接力触发。上个示例中因为 clicked 信号没有参数,而 SendMsg 信号有参数,所以不方便直接关联。本小节示范一个信号到信号的关联,将按钮的 clicked 信号…

【优化过往代码】关于vue自定义事件的运用

【优化过往代码】关于vue自定义事件的运用 需求说明过往代码优化思路优化后代码(Vue2)遇到问题记录 Vue2官方自定义指令说明文档 Vue3官方自定义指令说明文档 需求说明 进入某些页面需要加载一些外部资源,并在资源加载完后进行一些处理&…

【栈】2751. 机器人碰撞

本文涉及知识点 栈 LeetCode2751. 机器人碰撞 现有 n 个机器人,编号从 1 开始,每个机器人包含在路线上的位置、健康度和移动方向。 给你下标从 0 开始的两个整数数组 positions、healths 和一个字符串 directions(directions[i] 为 ‘L’ …

MySQL-数据处理函数

026-distinct去重 select job from emp;加个 distinct 就行了 select distinct job from emp;注意:这个去重只是将显示的结果去重,原表数据不会被更改。 select 永远不会改变原数据 select distinct deptno, job from emp order by deptno asc;027-数…

步态控制之足旋转点(Foot Rotation Indicator, FRI)

足旋转点(Foot Rotation Indicator, FRI) 足旋转点是人形机器人步态规划中的一个关键概念,用于描述步态过程中机器人脚部的旋转和稳定性。FRI 可以帮助确定机器人在行走时是否稳定,以及如何调整步态以保持稳定。下面详细介绍FRI的原理,并举例说明其应用。 足旋转点(FRI…

R语言统计分析——图形的简单示例

参考资料:R语言实战【第2版】 1、示例一 # 绑定数据框mtcars attach(mtcars)# 打开一个图形窗口并生成一个散点图plot(wt,mpg)# 添加一条最优拟合曲线abline(lm(mpg~wt))# 添加标题title("Regression of MPG on weight") # 解除数据框绑定 detach(mtcar…

ES8.13 _bulk报错Malformed content, found extra data after parsing: START_OBJECT解决

在使用elaticsearch8.13.0使用批量创建索引时,根据谷粒中说的es7.9方法去批量操作请求: http://127.0.0.1:9200/shop/_doc/_bulk 注意1:设置header为Content-Type:application/x-ndjson,否则请求报错: {"error": &qu…

机器学习笔记:focal loss

1 介绍 Focal Loss 是一种在类别不平衡的情况下改善模型性能的损失函数最初在 2017 年的论文《Focal Loss for Dense Object Detection》中提出这种损失函数主要用于解决在有挑战性的对象检测任务中,易分类的负样本占据主导地位的问题,从而导致模型难以…

【recast-navigation-js】使用three.js辅助绘制Agent寻路路径

目录 说在前面setAgentTarget绘制寻路路径结果问题其他 说在前面 操作系统:windows 11浏览器:edge版本 124.0.2478.97recast-navigation-js版本:0.29.0golang版本:1.21.5上一篇:【recast-navigation-js】使用three.js辅…

linux:centos7升级libstdc++版本到3.4.26

下载,解压 wget http://www.vuln.cn/wp-content/uploads/2019/08/libstdc.so_.6.0.26.zip unzip libstdc.so_.6.0.26.zip 复制到【/usr/lib64】: cp libstdc.so.6.0.26 /usr/lib64创建软链接 cd /usr/lib64 sln libstdc.so.6.0.26 libstdc.so.6查看一…

Python | Leetcode Python题解之第144题二叉树的前序遍历

题目: 题解: class Solution:def preorderTraversal(self, root: TreeNode) -> List[int]:res list()if not root:return resp1 rootwhile p1:p2 p1.leftif p2:while p2.right and p2.right ! p1:p2 p2.rightif not p2.right:res.append(p1.val)…

机器学习笔记 - LoRA:大型语言模型的低秩适应

一、简述 1、模型微调 随着大型语言模型 (LLM) 的规模增加到数千亿,对这些模型进行微调成为一项挑战。传统上,要微调模型,我们需要更新所有模型参数。这也称为完全微调 (FFT) 。下图详细概述了此方法的工作原理。 完全微调FFT 的计算成本和资源需求很大,因为更新每…

Vmess协议是什么意思? VLESS与VMess有什么区别?

VMess 是一个基于 TCP 的加密传输协议,所有数据使用 TCP 传输,是由 V2Ray 原创并使用于 V2Ray 的加密传输协议,它分为入站和出站两部分,其作用是帮助客户端跟服务器之间建立通信。在 V2Ray 上客户端与服务器的通信主要是通过 VMes…

【InternLM实战营第二期笔记】06:Lagent AgentLego 智能体应用搭建

文章目录 讲解为什么要有智能体什么是 Agent智能体的组成智能体框架AutoGPTReWooReAct Lagent & Agent LegoAgentLego 实操Lagent Web Demo自定义工具 AgentLego:组装智能体“乐高”直接使用作为智能体,WebUI文生图测试 Agent 工具能力微调 讲解 为…