企业如何正确地利用LLM大模型?

大型语言模型 (LLM) 不值得信任。就是这样。

考虑到它们先进的 AI 能力以及当今强大的基础模型的普遍知识,这似乎是一件令人惊讶的事情。然而,问题的关键在于 LLM 无法解释其输出。你不能信任 LLM 的结果,不是因为它不准确,而是因为它令人费解。没有办法审核答案或检查其工作。

这类似于接受一个人的话,却没有能力验证他们的主张;这对于关键的业务决策来说是行不通的。健康的关系建立在信任的基础上。企业与其 ML 模型的关系也不例外。那么你如何克服你的信任问题呢?

你可能听过这样一句话:“信任,但要核实”。这句古老的谚语是否预示着LLM的到来?虽然你不能完全信任大型语言模型,但这并不意味着你应该完全放弃它们。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

1、是否有可能超越 LLM 响应猜测?

LLM 在统计概率领域运行,没有确定性边界。它们生成解决方案而不引用任何预定义的数据库或“真相来源”。因此,不可能交叉检查 LLM 输出或要求他们证明他们的答案。这就像试图检查一个人的大脑内容一样——你做不到。

用于生成每个 LLM 响应的配方成分无法追踪或解构;配方本质上是一个黑匣子。但这并不是绝望的理由。

LLM 响应上下文中固有的不信任并不意味着组织应该放弃它们。 LLM 就像你听说的那样强大;你只需要正确使用它们。

如果使用得当,它们可以作为自主智能代理的组成部分,用于回答企业问题。诀窍是使用 LLM 将自然语言问题重新定义为结构化查询。当针对受管理和可审计的数据源执行这些查询时,它们会产生准确的答案——最重要的是,可证明的准确答案。

在这个场景中,用户的回答是透明且可审计的,而不是隐藏在黑匣子里。答案满足了用户的需求,但背后一切都是可追溯和可验证的。就像老师要求学生“展示你的作品”一样,答案和答案的路径都是完全可见的。

2、真实用例:人力资源数据代理

假设你是公司的人力运营经理。你无法询问 ChatGPT,“哪些员工受我们的薪资范围政策约束?”

ChatGPT 不知道如何回答这个问题;它不知道你有多少员工,你的薪资范围政策是什么,以及它应该考虑哪些其他参数。这些信息在你组织的数据存储中是分散的;其中一些是私密的,ChatGPT 无法获取。

当然,你可以努力在数据库上训练 ChatGPT;向其提供有关你的薪资范围政策以及员工名册等的信息。但是,你无法验证它的响应是否准确;它们只是最佳猜测。

现在,重新构建你的方法。使用像上面这样的自主代理架构来重新构建你的查询过程。

你问代理,“哪些员工受我们的薪资范围政策约束?”代理可以在知识图谱中查找你的策略,并了解策略的定义方式。

假设此示例为“必须每年审查工资高于其工资范围最高工资 95% 的每个员工”。它可以利用这些知识将问题重新定义为“哪些员工的工资高于其工资范围最高工资的 95%?” 这个问题可以转化为结构化查询。

代理可以运行该查询并得到答案 - 它对问题的答案包含完整而全面的上下文路径以“显示工作”并得出事实的、有数据支持的响应。你(最终用户可以)可以验证它是否查找了正确的策略、正确解释了它并运行了正确的查询。

3、克服 LLM 信任问题

自主代理方法将 AI 问答的强大功能与强大的可解释性和可审计性结合在一起。因此,公司可以依靠这些智能代理进行决策,并确保他们的 AI 驱动的见解是受规则控制且值得信赖的。

尽管 LLM 在管理大量数据和复杂查询方面具有显著优势,但必须严格管理其使用,以确保透明度、可验证性和信任度。归根结底,不仅仅是 LLM,自主代理加上知识图谱和强大的治理框架,才能成为企业可靠的 AI 解决方案。

4、最后的想法

LLM 既不是你可以完全信任的魔盒,也不是混乱的潘多拉魔盒。通过正确的方法和严格的治理,可以有效地利用它们。

通过将自然语言问题重新定义为结构化查询,我们可以确保 AI 驱动的企业解决方案的准确性、可解释性和治理。这不是要丢弃盒子,而是要学习如何明智地补充它。


原文链接:企业利用LLM的正确方法 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/16205.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无畏并发: Rust Mutex的基本使用

并发是很多编程语言避不开的一块主要内容,主打一个无畏并发的Rust自然也面临这样的挑战。Rust中的Mutex提供了强大的同步原语,确保共享数据的线程安全,这篇文章中,我们会探讨Mutex的使用,从基础的用法到一些高阶内容。…

2024电工杯B题平衡膳食食谱的优化设计及评价原创论文分享

大家好,从昨天肝到现在,终于完成了2024电工杯数学建模B题的完整论文啦。 实在精力有限,具体的讲解大家可以去讲解视频: 给大家看一下目录吧: 目录 摘 要: 10 一、问题重述 14 二.问题分析 …

Python学习---基于HTTP的服务端基础框架搭建案例

整体功能: 1 创建框架构建相关的文件夹 2 创建app,模块文件 3 在 app模块文件中创建application函数(用于处理请求) 4 将request_handler()中的处理逻辑交由app模块的application函数完成 5 app模块的 application函数返回响应报文 6 在application 文件夹中创建一个…

淘工厂订单导出自动化工具

目录 下载安装与运行 主要目的 其他工具的弊端 本工具的优势 视频演示 下载新版后的注意事项 支持的导出项 什么叫一单多拍 常见问题 如何实现快捷登录 导出卡住时如何操作 如何精确导出 下载安装与运行 下载、安装与运行 语雀 主要目的 导出订单信息&#xf…

知识分享:隔多久查询一次网贷大数据信用报告比较好?

随着互联网金融的快速发展,越来越多的人开始接触和使用网络贷款。而在这个过程中,网贷大数据信用报告成为了评估借款人信用状况的重要依据。那么,隔多久查询一次网贷大数据信用报告比较好呢?接下来随小易大数据平台小编去看看吧。 首先&…

某钢铁企业数字化转型规划案例(114页PPT)

案例介绍: 该钢铁企业的数字化转型案例表明,数字化转型是钢铁企业应对市场竞争、提高生产效率、降低成本、优化资源配置和降低能耗排放的重要手段。通过引入先进的技术和管理理念,加强员工培训和人才引进,企业可以成功实现数字化…

欢乐钓鱼大师游戏攻略:自动钓鱼技巧!

《欢乐钓鱼大师》是一款极具趣味性和挑战性的钓鱼模拟游戏,为玩家提供了一个体验钓鱼乐趣的虚拟世界。从湖泊到河流,再到广袤的海洋,游戏中的各种钓场让人流连忘返。无论是新手钓友,还是经验丰富的老钓手,都可以在游戏…

k8s集群中pod的容器资源限制和三种探针

一、资源限制 总结: requests表示创建pod时预留的资源,limits表示pod能够使用资源的最大值。requests值可以被超,limits值不能超过,如果是内存使用超过limits会触发oom然后杀掉进程,如果是cpu超过limits会压缩cpu的使用…

20.SkyWalking

一.简介 SkyWalking用于应用性能监控、分布式链路跟踪、诊断: 参考连接如下: https://github.com/apache/skywalking https://skywalking.apache.org/docs/ 二.示例 通过官网连接进入下载页面:https://archive.apache.org/dist/skywalkin…

揭秘章子怡成功之路:她是如何征服世界的?

章子怡的演艺生涯可谓是一部传奇❗❗❗ 从一个普通工人家庭的女孩,到如今的国际巨星 她的每一步都充满了努力和汗水 她的舞蹈基础为她日后的演艺事业奠定了坚实的基础 而她对戏剧和电影的热爱更是让她在演艺道路上不断前行 从《我的父亲母亲》到《卧虎藏龙》&…

代码随想录|Day55|动态规划 part15|● 392.判断子序列 ● 115.不同的子序列

392.判断子序列 class Solution: def isSubsequence(self, s: str, t: str) -> bool: dp [[0] * (len(t) 1) for _ in range(len(s) 1)] for i in range(1, len(s) 1): for j in range(1, len(t) 1): if s[i - 1] t[j - 1]: dp[i][j] dp[i - 1][j - 1] 1 else: dp[i…

【UE5.1 角色练习】06-角色发射火球-part2

目录 效果 步骤 一、火球生命周期 二、添加可被伤害的NPC 三、添加冲量 在上一篇(【UE5.1 角色练习】06-角色发射火球-part1)基础上继续实现角色发射火球相关功能 效果 步骤 一、火球生命周期 为了防止火球没有命中任何物体而一直移动下去&#…

【全开源】赛事报名系统源码(Fastadmin+ThinkPHP和Uniapp)

基于FastadminThinkPHP和Uniapp开发的赛事报名系统,包含个人报名和团队报名、成绩查询、成绩证书等。 构建高效便捷的赛事参与平台 一、引言:赛事报名系统的重要性 在举办各类赛事时,一个高效便捷的报名系统对于组织者和参与者来说都至关重…

WebService的wsdl详解

webservice服务的wsdl内容详解,以及如何根据其内容编写调用代码 wsdl示例 展示一个webservice的wsdl,及调用这个接口的Axis客户端 wsdl This XML file does not appear to have any style information associated with it. The document tree is shown…

编译aosp刷入pixel 真机得问题记录

编译aosp要做什么(ubuntu下编译问题相对少) 需要vmware并且已经安装了ubuntu镜像系统 直接切换到root 避免后期避免麻烦 参考地址 https://mp.weixin.qq.com/s/yJp3ijIxykiMmNVYr2V1nQ apt install git //安装git sudo apt install git//给git设置用户…

mysql事务 事务并发问题 隔离级别 以及原理

mysql事务 简介:事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。 事务四大特性 原子性(Atomici…

.哈希表.

哈希 哈希表:将大而复杂的数据映射到紧凑的区间内。分为:①存储结构 (离散化是特殊的哈希,之前讲的离散化是严格保序的 映射到区间上是连续递增的) 哈希不保序,这里讲的是一般的哈希 弊端:若…

Linux(四)

Linux(四) shell脚本shell脚本开发过程创建创建.sh文件编写.sh文件添加执行的权限 chmod 777 1.sh运行 shell中注释shell中变量用户自定义变量 (尽量大写)位置参数即命令行参数预定义变量环境变量 shell中程序和语句说明性语句功能性语句echo 输出read 键…

网上打印试卷的步骤是什么

对于学生和家长来说,打印试卷是日常学习中的一项重要需求。那么,如何在网上方便地打印试卷呢?下面,就让我来为您介绍琢贝云打印的试卷打印步骤。 一、选择琢贝云打印的原因 支持多种文件格式打印,包括图片、PPT、PDF、…

每日百万交易的支付系统,如何设置JVM堆内存大小?

每日百万交易的支付系统,如何设置JVM堆内存大小? 1、支付背景的引入2、支付的核心业务流程3、每日百万交易支付系统的压力在哪里?4、支付系统每秒钟需要处理多少笔支付单5、每个支付订单处理需要耗时多久6、每个支付订单大概需要多大的内存空间7、每秒发起的支付请求对内存的…