利用大型语言模型提升数字产品创新:提示,微调,检索增强生成和代理的应用

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

随着像Gemini、GPT或Claude这样的大型语言模型(LLMs)的新版本不断推出,相关头条新闻铺天盖地而来。与此同时,许多其他公司也在探索如何利用这些模型来创新、增加价值并降低成本。对于这些快速的进展,很容易感到不知所措,我自己也经常有这种感觉!在这篇博客文章中,我将整理一些最重要的概念及其对产品和公司的潜在价值,帮助你跟上这些发展。

关于如何将LLMs和其他生成性AI模型整合到产品或流程中,有一些常见的趋势性概念,包括:提示(prompting)、微调(fine-tuning)、检索增强生成(retrieval augmented generation,简称RAG)以及代理(agents)。我相信你可能已经听说过这些概念中的几个或全部,但有时它们之间的差异可能不太清楚,最重要的是,我们仍然不知道它们能为我们的公司或产品带来哪些潜力。

使用大型语言模型(LLM)通过提示


提示是为大型语言模型(LLM)构建指令的过程,以从中获取期望的生成结果。

目前,许多人已经熟悉了提示的使用:在 OpenAI 网站上使用 ChatGPT 就是一个很好的例子。作为用户,我们向 ChatGPT 输入一个具体的问题,比如“为我写一首关于大型语言模型如何改变数字产品的说唱歌曲”。OpenAI 将这个输入构造成一个提示,并将其输入到 GPT-x 模型中以生成响应。这种构造使 OpenAI 能够管理响应:如何设定语调,拒绝回答需要最新信息的问题,如果被问到如何制造核武器则警告其危险,或者将所有先前的对话串联起来,使响应考虑所有信息,而不仅仅是用户的最后一个输入。

那么,提示如何增强我们的“发布新商品”用例呢?通过将大型语言模型的 API 调用集成到我们的功能中,我们可以根据特定的用户输入构造提示。例如,我们可以要求用户仅输入新商品的标题,并构造一个提示来生成填充描述和发布类别的适当内容。如果所提示的模型是多模态的(接受多种类型的输入数据,如文本、图片、声音等),构造的提示可以包括产品的图片,从而允许更准确的描述和分类。我们需要对提示进行调整(提示工程),以获得准确且有用的结果。关于提示工程的更多信息,可以在这里找到一个不错的资源。

通过微调使用大型语言模型


虽然改进提示可以带来更好的结果,但可能会有一个点需要进一步细化。这时,微调可能是一个不错的选择,因为它允许我们根据我们市场的环境调整模型,通过向其提供数据(例如,我们平台上发布的所有产品信息的历史)。这样,我们可以使其生成的文本更符合平台内的语言风格和沟通规范。

微调是采用预训练模型并通过特定数据集或任务进一步精细化的过程,以便更好地适应专业的环境或领域。

微调一个大型语言模型并不像提示那样直截了当,它需要数据科学团队的专业知识来实施微调并在生产中部署微调后的模型,以及从环境中提供精心策划的数据。由于模型需要在内部部署,成本也可能有所不同(并可能增加),与查询 API 相关的成本相比。

微调可以通过应用更新初始模型所有权重的方法来完成。然而,也有更具成

本效益的方法,例如参数有效的微调(如 LoRA 或 QLoRA)。要进一步了解微调,deeplearning.ai 的课程“Generative AI with Large Language Models”是一个很好的实践资源。一旦部署了微调后的模型,工作流程与之前看到的提示模式相似。唯一的区别:我们现在运行的是微调后的模型,而不是基础模型。


通过微调,我们为用户带来了附加价值,因为生成的描述和类别可能会更准确和有价值,需要较少的手动编辑。由于微调后的模型已经看过市场数据,甚至可能会建议一个合理的商品价格。在这种情况下,平衡微调的好处与增加的成本和解决方案复杂性是很重要的。

检索增强生成


无论是提示还是微调,都会遇到模型截止知识的局限性,因为它的知识仅限于其训练或微调时点的可用数据。这被视为大型语言模型的一个巨大限制,让用户对其实用性感到疑惑,如果它们无法实时访问信息,或者无法获取市场上当前可用的产品详情。检索增强生成(RAG)解决了这一限制。检索增强生成(RAG)是一种检索相关信息以丰富提示的技术。

在实际操作中,想象在我们的示例中,用户输入“哈利波特第一册,几乎全新”。根据这个输入,我们的系统将采取以下步骤:
获取最相关的结果。这一步可以通过语义搜索完成,或者通过市场实施的任何排序逻辑。假设这些结果是哈利波特第一册的其他例子和该系列的其他书籍的一些例子。
通过使用从检索到的相关结果中获得的所有信息来丰富预定义的模板,构建提示。


通过这种丰富的提示,大型语言模型现在能够生成更有价值的描述,这可能包括从类似产品中获得的哈利波特书的特定特征。由于它还可以访问类似物品的定价数据,模型甚至可能能够建议新商品的适当价格。已经证明 RAG 可以减轻大型语言模型的幻觉风险(参考资料)。要深入了解如何实施 RAG,推荐的短期课程是 deeplearning.ai 的“Building and Evaluating Advanced RAG Applications”。

代理


到目前为止,我们已经看到了提示、微调和 RAG 如何促进并提高广告发布过程的质量。然而,仍然存在两个小的局限性:

缺乏价格可解释性:模型自动生成价格,对结果提供的见解或控制很少
手动过程:用户仍需输入、确认并手动通过各个步骤。
代理是基于大型语言模型的过程,可以主动做出决策、访问工具和执行操作。

有了代理,我们可以为系统引入额外的自主性层,使其能够计划、访问工具并执行操作。这意味着为系统配备计算价格的能力。与仅依赖模型生成的过程不同,代理可以访问可运

行的环境或计算器,根据合理的逻辑计算建议的价格(例如,类似物品的所有价格的平均值)。此外,我们可以进一步自动化发布过程,通过让代理直接访问发布 API。有关代理策略的更多信息,我建议查看 The Batch 的这些帖子。

总结
在这篇博客文章中,我们已经了解了当今创新的时尚 AI 概念:提示、微调、RAG 和代理。我们探讨了每个概念的含义,探索了它们之间的关系和差异,优点和缺点,同时专注于它们的变革潜力。

提示是通过 AI 生成的建议为用户带来价值的最直接方式。微调更进一步,定制模型以更好地适应公司或产品的环境,并提供更准确的结果。RAG 打破了知识截止的障碍,使系统能够实时访问信息以丰富生成的建议。最后,代理引入了新的自动化和任务执行水平。

了解这些功能是否提高了用户满意度、减少了用户痛点(如摩擦、混乱)并影响了产品指标,是通过创新真正带来价值的关键。UX 调查可以提供有关用户如何感知新功能的定性反馈。用户是否发现广告创建过程更直观?他们是否觉得建议相关?此外,通过 a/b 测试和检查特定的产品指标可以帮助量化这种影响。用户发布新商品需要多少时间?有多少用户开始发布过程并完成它?有多少用户编辑了系统放置的建议?AI 生成的内容的质量或转化率是否优于其他内容?

通过分析和监控这种影响,我们可以验证我们的 AI 产品的有效性,并确定进一步优化和创新的领域。请记住,我们只涵盖了这些解决方案的机会,而未涉及相关风险:幻觉、安全问题、偏见、不一致……在实施 GenAI 解决方案时,了解这些风险是重要的

这只是公司和数字产品可以利用 GenAI 的开始。希望这篇文章对于了解当前这项技术的使用及其相关用例的想法有所帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/5592.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

「笔试刷题」:字母收集

一、题目 描述 有一个 𝑛∗𝑚 的矩形方阵,每个格子上面写了一个小写字母。 小红站在矩形的左上角,她每次可以向右或者向下走,走到某个格子上就可以收集这个格子的字母。 小红非常喜欢 "love" 这四个字母。…

FFmpeg开发笔记(二十三)使用OBS Studio开启RTMP直播推流

OBS是一个开源的直播录制软件,英文全称叫做Open Broadcaster Software,广泛用于视频录制、实时直播等领域。OBS不但开源,而且跨平台,兼容Windows、Mac OS、Linux等操作系统。 OBS的官网是https://obsproject.com/,录制…

【报错处理】ib_write_bw执行遇到Couldn‘t listen to port 18515原因与解决办法?

要点 要点: ib默认使用18515端口 相关命令: netstat -tuln | grep 18515 ib_write_bw --help |grep port# server ib_write_bw --ib-devmlx5_1 --port88990 # client ib_write_bw --ib-devmlx5_0 1.1.1.1 --port88990现象: 根因&#xff…

为什么公共事业机构会偏爱 TiDB :TiDB 数据库在某省妇幼健康管理系统的应用

本文介绍了某省妇幼健康管理系统的建设和数据库架构优化的过程。原有的数据库架构使用了 StarRocks 作为分析层,但随着业务的发展,这套架构暴露出诸多痛点,不再适应妇幼业务的需求。为解决这些问题,该系统选择了将原有架构中的 St…

OBSERVER(观察者)-- 对象行为模式

意图: 定义对象间地一种一对多地依赖关系,当一个对象地状态发生改变时,所有对于依赖于它的对象都得到通知并被自动更新。 别名: 依赖(Dependents), 发布-订阅(Publish-Subsribe) 动机: 将一个系统分割成一系列相互协…

使用Python及R语言绘制简易数据分析报告

Pytohn实现 在python中有很多包可以实现绘制数据分析报告的功能,推荐两个较为方便的包:pandas-profiling 和 sweetviz 。 使用 pandas-profiling 包(功能全面) 这个包的个别依赖包与机器学习的 sklearn 包的依赖包存在版本冲突&a…

【C++中的模板】

和你有关,观后无感................................................................................................................. 目录 前言 一、【模板的引入和介绍】 1、泛型编程 2、【模板的介绍】 二、【 函数模板】 2.1【模函数板的介绍】 1.…

修改word文件的创作者方法有哪些?如何修改文档的作者 这两个方法你一定要知道

在数字化时代,文件创作者的信息往往嵌入在文件的元数据中,这些元数据包括创作者的姓名、创建日期以及其他相关信息。然而,有时候我们可能需要修改这些创作者信息,出于隐私保护、版权调整或者其他实际需求。那么,有没有…

【开源设计】京东慢SQL组件:sql-analysis

京东慢SQL组件:sql-analysis 一、背景二、源码简析三、总结 地址:https://github.com/jd-opensource/sql-analysis 一、背景 开发中,无疑会遇到慢SQL问题,而常见的处理思路都是等上线,然后由监控报警之后再去定位对应…

vue 前端读取Excel文件并解析

前端读取Excel文件并解析 前端如何解释Excel呢 平时项目中对于Excel的导入解析是很常见的功能,一般都是放在后端执行;但是也有特殊的情况,偶尔也有要求说前端执行解析,判空,校验等,最后组装成后端接口想要的…

【大数据】利用 Apache Ranger 管理 Amazon EMR 中的数据权限

利用 Apache Ranger 管理 Amazon EMR 中的数据权限 1.需求背景简介2.系统方案架构图3.主要服务和组件简介3.1 Amazon EMR3.2 Simple Active Directory3.3 Apache Ranger 4.部署步骤4.1 部署 Simple AD 服务4.2 部署 Apache Ranger4.3 部署 Amazon EMR4.4 在 Amazon EMR 的主节点…

【数据结构】二叉树(带图详解)

文章目录 1.树的概念1.2 树的结构孩子表示法孩子兄弟表示法 1.3 相关概念 2.二叉树的概念及结构2.1 二叉树的概念2.2 数据结构中的二叉树-五种形态2.3 特殊的二叉树2.4 二叉树的存储结构顺序存储链式存储 2.5 二叉树的性质 3. 堆3.1 堆的定义3.2 堆的实现堆的结构堆的插入向上调…

java技术栈快速复习02_前端基础知识总结

前端基础 经典三件套: html(盒子)css(样式)JavaScript(js:让盒子动起来) html & css HTML全称:Hyper Text Markup Language(超文本标记语言),不是编程语…

不科学上网使用Hugging Face的Transformers库

参考 Program Synthesis with CodeGen — ROCm Blogs (amd.com) HF-Mirror - Huggingface 镜像站 https://huggingface.co/docs/transformers/v4.40.1/zh/installation#%E7%A6%BB%E7%BA%BF%E6%A8%A1%E5%BC%8F 准备 apt show rocm-libs -a pip install transformers python …

计算机网络—数据链路层

一、数据链路层的基本概念 结点:主机、路由器 链路:网络中两个结点之间的物理通道,链路的传输介质主要有双绞线、光纤和微波。分为有线链路、无线链路 数据链路:网络中两个结点之间的逻辑通道,把实现控制数据协议的…

ABAP 查找第二代增强

文章目录 ABAP 查找第二代增强第一种方法-根据包去查找第二种方法-通过MODX_FUNCTION_ACTIVE_CHECK重要的表MODSAP表TFDIR表TFTIT表 ABAP 查找第二代增强 第一种方法-根据包去查找 第二种方法-通过MODX_FUNCTION_ACTIVE_CHECK 第二代增强(基于函数模块的增强&…

git如何将多个commit合并成一个?

我们使用git进行版本控制,在本地开发完某个功能时,需要提交commit,然后push至开发分支。简单的功能还好,几个commit可能就好了。但是如果功能比较复杂,commit多达十几甚至几十个时,commit管理就会很冗长。比…

【IC设计】CRC(循环冗余校验)

目录 理论解读CRC应用CRC算法参数解读常见CRC参数模型 设计实战校招编程题分类串行输入、并行计算、串行输出**串行计算、串行输出(线性移位寄存器)LSFR线性移位寄存器(并转串)(并行计算)模二除 总结——串行、并行计算的本质参考…

成功解决STM32-No ST-LINK detected问题!

本文目录 一、原因二、解决方法一:有复位按键方法二:没有复位按键 一、原因 在之前一直都用的好好的,突然出现这个问题,原因只有两个: 接线松了,或者杜邦线损坏,换新的线试一下。上一次下载到…

【AI赋能演示力】:纯新人食用指南!ChatPPT万字实测报告

引言 随着科技的日新月异,人工智能已经深入到我们工作生活的方方面面,尤其是在提高效率与创新设计方面发挥着越来越重要的作用。 追溯至2023年3月,一款名为ChatPPT的人工智能驱动的PPT设计工具震撼登场并开启公测,标志着办公智能…