如何打造垂直LLM的护城河

B2B人工智能初创企业的一个伟大策略是打造“垂直人工智能”产品:成为特定行业的人工智能助手,比如律师、金融服务、医生。 听起来很简单:你可以利用LLM的超能力,并将其应用于宠物行业的特定数据和用例。 这就是我们在Explain所做的事情:Explain是公共部门(基础设施、公用事业、房地产、建筑等)专业人士的人工智能助手,帮助他们在超级无聊的公开招标中挖掘关键信息,总结 正式报告或撰写建筑许可证草稿。

但问题在于:如果你和每个人都获得相同的LLM,你如何建立护城河,即可防御的竞争优势? 你如何才能不依赖你的 LLM 提供商并确保创造的价值归你所有? 根据我们的经验,我们找到了三种有效的方法。

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 

1、无聊的工作流程自动化胜过聪明的洞察力生成

标准 B2B 策略:如果你嵌入用户的流程和工作流程中,你就锁定了他们。这对于AI产品仍然适用,对我们来说,这意味着专注于流程自动化而不是洞察生成。

我们团队的座右铭是“无聊的阅读和写作是机器的事”:我们有时会担心人工智能霸主即将崛起,但截至目前,大多数人工智能仍然是自动执行人类很容易完成的无聊、重复性任务 一次,但不可能做数千次。 LLM所做的主要是扩大自动化的范围。 我们的一位客户希望跟踪其行业中每次公开招标的获胜者和失败者; 对于每个招标,地方当局都会发布一份小报告,客户团队必须提取 3 条信息; 但每年有 100,000 份招标报告,信息以半结构化格式编写,必须以另一种格式输入客户的 CRM 中。 非常无聊,可以通过人工智能实现自动化,而且在工作流程中非常重要!

对我们来说,这些用例比复杂的评分、趋势分析或出色的数据可视化效果更好,后者虽然很耀眼,但并不持久。

2、你需要一些自己的数据(LangChain还不够)

LLM让我们所有人都兴奋不已,但如果没有你自己的一些数据,LLM就没有意义。 它可以是你公开获取并构建到数据库中的数据(新闻、官方文件、法律、财务报告),也可以是你的用户的数据(他们的内部备忘录档案或之前对公开招标的回复),但你需要对包含用户相关信息的数据的特权访问。 这就是为什么,在Explain,我们的第一步是建立我们独特的公共文档数据库,我们抓取了数以万计的网站,然后进行清理、分类和结构化。 然后是LLM。

要将 LLM 应用于你的数据,可能会使用某些版本的 LangChain 软件包,它允许你通过将数据作为提示的一部分提供给 LLM 来处理自己的数据,而不是简单地与 GPT 对话并让它处理你自己的数据。 根据其参数的权重回答。 因此,你的技术栈将如下所示:根据你的数据库,你将提取数据的相关部分(检索阶段); 然后,你将在提示中将这些部分提供给LLM并表述任务(提示工程阶段)。 最近许多基于 LLM 的工具都使用这种类型的体系结构(例如本文中描述的):新的 Bing 或工具允许你在浏览器、pdf 或操作系统中使用 LLM。

这是一个非常强大的技术栈,它避免了 LLM 因自己的设备而陷入的许多幻觉和错误。 它也非常灵活,在我们的团队中它已经成为许多传统 NLP 任务(情感分析、实体识别、摘要等)的默认响应。 顺便说一句:如果你当前的 NLP 堆栈是围绕许多专门的、非 LLM 的算法构建的,那么你就背负了 NLP 债务,并且可能不再具有竞争优势。

但这里的关键点是,虽然超级功能来自LLM组件,但护城河来自数据库组件。 所以如果你没有先建立一个独特的数据库,LangChain 是不够的。

3、微调 LLM 胜过提示工程以实现可扩展性

前两个护城河都不是来自LLM本身。 这个可以。

前面描述的检索 + LLM 架构的一个限制是它存在不可扩展的风险。 当然,编写精心设计的提示并调用 GPT-4 API 确实有效,但成本可能非常高:使用 GPT-4,我们花费了 3 美元来建立一个地区最有利于风电的 50 位地方官员名单 。 我们不可能把它交给用户。

根据Explain 首席技术官 Guillaume Barrois 进行的研究,适合我们的技术栈如下。

  • 我们没有使用最新、最昂贵的 LLM (GPT-4),而是使用更小的模型(到目前为止,我们使用了 Hugging Face 库中的开源模型)。 成本降低 10 至 100 倍。
  • 然后,为了提高性能,我们根据我们的文档对其用例进行微调:我们向其提供有关新基础设施项目的民选官员声明的训练集或一页官方决策的 3 行摘要。
  • 神奇之处在于:用于微调的训练集非常大(高达 100 000 个样本),但我们不是手动构建训练集:我们使用 GPT-4 代替。 当前LLM的一项不为人知的成就是,他们在许多中低复杂度的任务上实现了人类水平的表现:正如一位大学水平的老师向我报告的那样,GPT-4 在总结方面比 80% 的人更好。 本科生。 因此,对于此类任务,你可以使用 GPT-4 来构建训练集,而不是人工标记器,然后将其提供给开源 LLM 进行微调。 你可以构建最先进的自动化技术栈,专门用于微调任何LLM。
  • 因此,你最终会得到一个更便宜、更小、更快的 LLM,它可以满足你 75% 的任务,而上一代旗舰 LLM 则只需要 1% 的资源。

斯坦福Alpaca论文中很好地描述了这一策略,根据我们的测试,它似乎适合我们。 工具不断涌现,可以帮助你更轻松地完成工作。 当然,它可能不适用于高复杂性或高方差的任务,但我们相信这是 B2B 用例的最佳选择,在这些用例中,用户倾向于在大量实例中重复有限数量的任务。

我们还相信,这种策略比根据数据从头开始培训自己的LLM的“硬核”路线具有更好的性价比,例如彭博社最近报道的那样。 我不清楚这项工作的哪一部分是关于效率与研发展示他们的LLM技能,但我们把钱花在微调路线上。 来自谷歌内部的泄密事件也证实了这一点。

这个微调栈与成本优化无关:它提供了完全不同的用户体验,因为它允许你为所有核心任务释放 LLM 的力量,并大大加快推理性能。 这种优势是有道理的,因为它基于你的数据和你对用例的了解。

该技术栈将限制你对某个特定 LLM 提供商的依赖:栈的核心是微调组件,它可以插入许多不同的通用 LLM 上。

在Explain,我们非常相信SaaS 公司的垂直人工智能战略。 我们使用产品驱动和技术驱动的策略来建立强大的进入壁垒:充分了解你的客户并融入他们的工作流程; 投资拥有一个独特的数据库; 构建一个可扩展的 LLM 栈,针对你的数据和用例进行微调。


原文链接:垂直LLM的护城河 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/169038.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode—94.二叉树的中序遍历【简单】

2023每日刷题(四十) Leetcode—94.二叉树的中序遍历 C语言实现代码 /*** Definition for a binary tree node.* struct TreeNode {* int val;* struct TreeNode *left;* struct TreeNode *right;* };*/ /*** Note: The returned array mus…

【matlab版本的ggplot2】

gramm (complete data visualization toolbox, ggplot2/R-like) 来源:Morel, Pierre. “Gramm: Grammar of Graphics Plotting in Matlab.” The Journal of Open Source Software, vol. 3, no. 23, The Open Journal, Mar. 2018, p. 568, doi:10.21105/joss.00568…

【开源】基于JAVA的森林火灾预警系统

项目编号: S 019 ,文末获取源码。 \color{red}{项目编号:S019,文末获取源码。} 项目编号:S019,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 数据中心模块2.2 系统基础模块2.3 烟…

【Linux】匿名管道与命名管道,进程池的简易实现

文章目录 前言一、匿名管道1.管道原理2.管道的四种情况3.管道的特点 二、命名管道1. 特点2.创建命名管道1.在命令行上2.在程序中 3.一个程序执行打开管道并不会真正打卡 三、进程池简易实现1.makefile2.Task.hpp3.ProcessPool.cpp 前言 一、匿名管道 #include <unistd.h&g…

vivado产生报告阅读分析22

“ Advanced ”选项卡 “ Advanced ” &#xff08; 高级 &#xff09; 选项卡如下图所示。 在“ Advanced ”选项卡中提供了以下字段 &#xff1a; • “ Report ” &#xff08; 报告 &#xff09;&#xff1a; 选中“ Advanced ”选项卡中的“ Cells to Analyze ” &…

Vatee万腾的科技探险:vatee数字化力量的前瞻征途

在Vatee万腾的科技探险中&#xff0c;我们领略到了一场数字化力量的前瞻征途&#xff0c;这是一次引领未来的创新之旅。Vatee万腾以其独特的科技理念和数字化力量&#xff0c;开启了一次引领行业的前瞻性征途&#xff0c;为数字化未来描绘出了崭新的篇章。 Vatee万腾的数字化力…

推荐6款本周 yyds 的开源项目

&#x1f525;&#x1f525;&#x1f525;本周GitHub项目圈选: 主要包含 链接管理、视频总结、有道音色情感合成、中文文本格式校正、GPT爬虫、深度学习推理 等热点项目。 1、Dub 一个开源的链接管理工具&#xff0c;可自定义域名将繁杂的长链接生成短链接&#xff0c;便于保…

无人机电力巡检系统运行流程全解读

随着电力行业体系不断完善&#xff0c;保障电网运营的安全成为至关重要的任务。传统的人工巡检方式在面对电力设备广泛分布和复杂工况时显得效率低下&#xff0c;为了解决这一难题&#xff0c;无人机电力巡检系统应运而生&#xff0c;以智能化的运行流程&#xff0c;为电网安全…

Linux的基本指令(3)

16.cal指令 cal命令可以用来显示公历&#xff08;阳历&#xff09;日历。公历是现在国际通用的历法&#xff0c;又称格列历&#xff0c;通称阳历。“阳历”又名“太阳历”&#xff0c;系以地球绕行太阳一周为一年&#xff0c;为西方各国所通用&#xff0c;故又名“西历”。 命…

京东家用电器商品电子说明书在哪里能找到怎么查看产品电子说明书?草柴返利APP如何查询领取京东优惠券拿京东购物返利?

京东商品电子说明书是一种便捷、高效的说明工具&#xff0c;为消费者了解和使用商品提供了重要帮助。京东商品电子说明书是一种以电子文档、图文、视频的形式提供的商品使用说明书。它通常由商家上传至京东平台&#xff0c;以供消费者在购买商品后下载查看。与传统的纸质说明书…

Google hacking语法

Google hacking语法 文章目录 Google hacking语法site:inurl:intitle:filetypecacheintext注意 site: 搜索子域 跟域名site:www.baidu.com 定位 跟语言 site: jp inurl: 用于在特定url链接中搜索网站信息 inurl:login intitle: 使用intitle:指令返回页面标题中包含关键…

jvm优化之:OOM(out of memory)内存溢出

内存溢出 注意内存溢出不是内存泄漏&#xff01;&#xff01;这里主要是介绍如何用jdk自带的jmap工具导出进程堆空间快照。内存溢出&#xff1a; Out Of Memory&#xff0c;是指申请的堆内存空间不够用了&#xff0c;比如&#xff1a;你申请了10M空间&#xff0c;但是你要放12M…

github国内访问小解(windows)

git 下载安装 使用 github 前必须确保电脑上已经安装了 Git&#xff0c;可以从 Git 官方网站去下载。 官方的网站在国内访问会比较慢&#xff0c;这里可以选择国内镜像&#xff1a;https://registry.npmmirror.com/binary.html?pathgit-for-windows/ github 之旅 确认电脑已…

【华为网络-配置-021】- MSTP 多实例配置及安全保护等

要求&#xff1a; 1、vlan 10 从红色链路转发。 2、vlan 20 从黄色链路转发。 一、基础配置 [SW1]vlan batch 10 20 [SW1]interface GigabitEthernet 0/0/1 [SW1-GigabitEthernet0/0/1]port link-type trunk [SW1-GigabitEthernet0/0/1]port trunk allow-pass vlan all [SW…

小程序姓名:ssm+vue基本微信小程序的个人健康管理系统

项目介绍 首先,论文一开始便是清楚的论述了小程序的研究内容。其次,剖析系统需求分析,弄明白“做什么”,分析包括业务分析和业务流程的分析以及用例分析,更进一步明确系统的需求。然后在明白了小程序的需求基础上需要进一步地设计系统,主要包罗软件架构模式、整体功能模块、数…

LeetCode OJ循环队列(C语言)

1.题目的初步分析 我们分析上述题目的时候会发现题目非常的长&#xff0c;不好整理思路&#xff0c;我这里可以大致的将本题的几个核心点说出来&#xff1a; 1.队列的思路 循环队列说来说去不还是队列嘛&#xff0c;那么队列的基本操作增删查改、以及队列的基本结构肯定都是不能…

十大排序之堆排序(详解)

文章目录 &#x1f412;个人主页&#x1f3c5;算法思维框架&#x1f4d6;前言&#xff1a; &#x1f380;堆排序 时间复杂度O(n*logn)&#x1f387;1. 算法步骤思想&#x1f387;2、动画演示&#x1f387;3.代码实现 &#x1f412;个人主页 &#x1f3c5;算法思维框架 &#x1…

[黑马程序员SpringBoot2]——开发实用篇3

目录&#xff1a; jetcache远程缓存方案jetcache本地缓存方案jetcache方法缓存j2cache基本操作springboot整合quartz​​​​​​​springboot整合task发送简单邮件发送多部件邮件消息简介购物订单案例-发送短信ActiveMQ安装springboot整合ActiveMQRabbitMQ安装springboot整合…

【鬼鬼鬼iiARPG开发记录】

鬼鬼鬼ARPG开发记录 一、创建项目1、创建3D(URP)项目2、导入新的输入系统&#xff08;input system&#xff09;3、勾选Enter Play Mode Options 二、导入资源1、创建若干文件夹 一、创建项目 1、创建3D(URP)项目 2、导入新的输入系统&#xff08;input system&#xff09; …

分布式数据恢复-hbase+hive分布式存储误删除如何恢复数据?

hbasehive分布式存储数据恢复环境&#xff1a; 16台某品牌R730XD服务器节点&#xff0c;每台物理服务器节点上有数台虚拟机&#xff0c;虚拟机上配置的分布式&#xff0c;上层部署hbase数据库hive数据仓库。 hbasehive分布式存储故障&初检&#xff1a; 数据库文件被误删除…