华为大咖说丨如何通过反馈机制来不断优化大模型应用?

本文分享自时习知

作者:袁泉(华为AI数据工程专家)全文约3015字,阅读约需8分钟


大模型应用正式投入使用后,存在一个较为普遍的情况:在利用“大模型提升业务运营效率”的过程中,业务部门和IT团队在初期通常都充满热情,对成果的期待也很高。一旦冷启动完成,应用如期上线,则皆大欢喜,庆祝新特性上线,宣传造势。

在组织和热情的惯性下,大模型应用效果通常有一定的爬坡,这是“前程发力的快周期”。但随后,就会逐渐或快速面临准确率、满意度双双下滑的局面,有些从此就跌入低谷,再也没起来;而有些则是震荡式的,一直妄图阶段性冲高,结果却不尽如意,很难维持在上线初期的那个水平,这是“后程乏力的慢周期”。有点像中国的股市,快起快落,牛短熊长。

面对这样情况下的大模型应用,该如何进行优化呢?今天,我想和大家聊聊“反馈热循环”机制这件事。(反馈热循环是一种持续的循环过程,不断地提供内容,获取AI的反馈,根据反馈调整和优化内容,并再次进行反馈。这样的循环往复,为AI提供持续且高质量的数据和知识。)


01 什么是反馈?

 谈到反馈,我们先明白其定义。中文对反馈的解读是,在对信息的有效接收和正确理解的基础上,及时予以回应并形成良性循环。而反馈的英文解读则是,Feedback = Feeding(数据) + Understanding(信息) + Backing(执行) 

最近我在读《反馈,化解不确定性的数字认知论》,其中有那么一段话讲得挺好。“反馈本身没有意义,以不同的方式更高效地转化和利用反馈中隐藏的信息,才使反馈有了意义。


02 业界有哪些不错的反馈循环设计思路?

2.1 Midjourney: 反馈不够,设计来凑。

在没有任何利益的驱动下,是没有人愿意反馈的,这显然是违背人性的。因此Midjourney通过生成图片下面的Favourite(代表喜欢和收藏),这种相对巧妙的设计,让用户在与应用进行交互的过程中,不知不觉地把反馈的事情给干了。

 

2.2 从GPT3.5到GPT4, 根据环境反馈迭代改进的智能循环体,是产品断代式演进的关键。

相较于GPT3.5,GPT4的整体表现是现象级的。在短短几个月的时间,实现了模型能力的大幅提升。在面向全世界上亿用户的尝鲜式公测,GPT4设计智能循环体(code model代码模型、feedback model反馈模型、repair model修复模型),以根据环境反馈不断迭代改进模型能力,起到了不小的作用。英伟达科学家Jim Fan直呼:“Critique is all you need。”

2.3 互联网企业与传统企业,在反馈机制上各有优劣。

整体来说,互联网企业和传统企业在AI反馈应用上各有优劣。

互联网企业应用,由于庞大的用户群体和天然的利益驱动,在如何快速搜集反馈数据上优势明显,同时在面对反馈的效果(推荐、检索、生成方案)上,用户的包容性更强些;但在反馈信息如何更好地闭环,传统企业应用面向的用户群范围相对固定,流程相对清晰和责任主体比较明确,更容易聚焦TOP问题,同时用户对反馈效果是否符合预期,相对更苛责。


03 目前,各领域应用+AI在反馈机制上存在什么问题?

 结合各领域应用+AI的调研结果,无论是在“智能搜索问题”场景还是在“方案生成推荐”场景,各领域在反馈内容应该分成哪些类,如何分类,反馈的信息是否足够完整上,都在摸着石头过河。

有细分到【业务问题】【应用问题】【平台问题】的,也有笼统的【好】【不好】【没有帮助】等。

总的来说,各领域应用+AI在对反馈数据分哪几类,分到哪个粒度,按照什么层级来分等,缺少方法和统一的标准。反馈信息不完整,不足以支撑下一步的问题理解


04 AI反馈的几种模式及特点

初步调研完各领域AI应用当前的场景和所采取的反馈机制后,我就在想,有没有可能在业务(含流程)、应用、数据等反馈上找到共性,从而提炼出几类模式。然后基于几类模式来做好解决方案设计。这样领域应用可以照方抓药,找到适合自己的模式和方法;同时围绕几个典型场景,吃透几类模式,进而沉淀平台公共能力,以便后续更好地被复用。

经过提炼,个人认为以为3类模式,基本上可以覆盖企业的绝大部分场景。

“标注”即反馈,或者称之为“上报”即反馈。这里指的是领域通过运营人员、AI数据工程专家在进行例行的问题分析和标注(通常按周/月,方式一般为线下EXCEL或者应用自身构建的运营分析模块),基于分析后的结果,需要将相关信息(如优化后的AI数据集、意图判断、问题&正确的回答)传递给AI数字产线,从而进入下一轮的迭代。以某产品为例,有众多的用户在使用其AI搜索推荐等功能,我们可以让AI标注工程师对用户的问答结果&问题等分类,再把相关信息上报给AI数字产线进行下一轮优化,这种"标注"即反馈。

这种反馈模式下,Feeding(数据)和Understanding(信息)都是业务offline处理好了,对于平台来说,关键在于做好对接和Backing(执行)。

“作业”即反馈。AI基于业务活动中的上下文信息(如单据),结合历史的知识经验等input,生成其推荐的方案output。业务人员在操作过程中结合实际情况以及自身知识储备,所采取的完全采纳,部分采纳、弃用、补充等策略,在系统提交后流入到下一作业环节。以“方案生成与推荐”的招聘场景为例,HR输入各种招聘需求,AI推送相关岗位给候选人,基于候选人【刷一刷】、【浏览】、【简历筛选意见】、【直接投递】等动作,给予结果反馈。

这种反馈模式下,Feeding(数据)的挑战是如何在应用侧做好数据定义,Understanding(信息)的关键在于应用的交互设计。

“行为”即反馈。这一类应用的特点是业务受众面较广,没有特别强的领域属性,偏集团公共类。该类AI应用通常需要业务给出明确的信息作为输入,且业务的提问通常不容易收敛,长尾效应明显。这种反馈模式下,关键在于如何基于用户的行为分析其意图,以及判断实际达成情况,最大的挑战在于用户行为的感知和分析。

以“企业通用搜索”为例,用户的连续相似问行为:xxx产品经理是谁?-->xxx产品经理-->xxx产品经理负责人-->谁负责xxx-->xxx谁负责,用户对AI反馈结果的复制、粘贴、转发行为;用户的转人工坐席或提交问题单等行为,都是对于结果是否满意的一种隐性反馈……
 

以上各个反馈模式的特点,下图已整理好。

 05 从建好一个“应用 + AI ”的视角,看AI反馈结果的几条循环路径

 反馈的最终结果,是导向改进。好的方面,要继续发扬光大;不好的方面,要有找到对应责任主体来制定相应的改进策略,不断循环形成飞轮。

从如何建好一个“应用+AI”的视角出发,AI反馈结果可以按照以下4条路径,由不同的组织负责优化,也有可能一个问题需要同时从4个方面进行优化才能达到想要的效果。


06 不同AI反馈模式下的反馈MRC(机器阅读理解)模板设计

既然定义了几类反馈模式,那必然是要有对应的反馈模板的。当前AI反馈存在的问题中,“信息不完整”“语言不统一”具备一定的典型代表,那么就需要有模板来指导和校验反馈的信息是否足够清晰、完整。下图是基于两个典型场景所提炼的反馈模板,仅供参考。(关于MRC的相关信息,可见上期《华为大咖说》——华为大咖说丨什么是大模型“MRC”?一文讲明白~


07 反馈热循环的解决方案设计 

将AI反馈循环所需要的业务能力,分成3大段。

第1段是Feeding(有效接收),即反馈信号能被正确到的能力,具体如数据采集有哪几种模式,如何降噪,如何获取环境信息等;第2段是Understanding(正确理解),即已被接收的反馈信息如何被正确理解,具体如Understanding分析中哪些是定性分析,哪些是定界分析,哪些是定位分析等;第3段是Backing(优化、循环),即如何行动和验证改进的持续有效性,具体如补充缺失知识、做好分片、结果评测等。

根据以上3大段的AI反馈循环所需要的业务能力结合对应的组织、流程,即可设计一份反馈热循环的解决方案

关于“应用+AI”反馈热循环的思考,今天我就分享到这里,欢迎小伙伴在评论区互动交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/58163.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

K8S如何基于Istio重新实现微服务

K8S如何基于Istio重新实现微服务 认识 Istio前言Istio 的理念Istio 的架构数据平面控制平面服务与 Istio 的关系 Istio 实践环境准备安装 Helm安装Istio 使用 Istio 代理运行应用情感分析应用的架构使用 Istio 代理运行应用Sidecar 注入Ingress 网关网关资源VirtualService 资源…

动态规划 —— 路径问题-不同路径

1. 不同路径 题目链接: 62. 不同路径 - 力扣(LeetCode)https://leetcode.cn/problems/unique-paths/description/ 2. 算法原理 1. 状态表示:以莫一个位置为结尾 dp[i]表示:以[i,j]位置为结尾时&#xff0…

本地Docker部署开源WAF雷池并实现异地远程登录管理界面

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

[四轴飞行器] 航模常见术语

航模常见术语 1.X模式和模式 从结构形式上四轴飞行器可分为十字模式和X模式。十字模式如下图左所示,X模式如下图右所示。对于姿态测量和控制来说,两种结构差别不大。如果考虑安装航拍摄 像机,为了视线不被挡住,通常采用X模式。 …

mysql原理、部署mysql主从+读写分离、监控mysql主从脚本

mysql:工作原理 从库生成两个线程,一个I/O线程,一个SQL线程; i/o线程去请求主库 的binlog,并将得到的binlog日志写到relay log(中继日志) 文件中; 主库会生成一个 log dump 线程&…

2024最新保姆级Python下载安装教程

今天给大家带来Python下载安装教程! 👉大礼包🎁:python安装包/pycharm教程免费分享(安全链接,放心点击)👈 一、下载装 Python 1、进入Python官网首页,下载最新的Pytho…

outlook创建新账户时报错2603、2604的解决办法

全新的戴尔笔记本电脑,自带的Win11家庭版,安装ms office 2021也顺利完成。 但是奇怪的是,只有其中一台笔记本电脑,OUTLOOK无法添加新账户。 但是这个账号在WEB端登录正常,由于是新入职的员工,根据以往经验&…

transformer的新手疑问

Transformer模型的原理主要基于自注意力机制(Self-Attention)和编码器-解码器结构。它的设计不依赖传统的循环神经网络(RNN)或卷积神经网络(CNN),而是通过并行的方式处理序列数据,极…

雷池社区版OPEN API使用教程

OPEN API使用教程 新版本接口支持API Token鉴权 接口文档官方没有提供,有需要可以自行爬取,爬了几个,其实也很方便 使用条件 需要使用默认的 admin 用户登录才可见此功能版本需要 > 6.6.0 使用方法 1.在系统管理创建API TOKEN 2.发…

REST APIs与微服务:关键差异

在构建基于微服务的应用程序时RESYful API和微服务这两个术语经常相伴出现。然而,它们指的是截然不同的东西。 了解 RESTful API 和微服务之间差异的最简单方式是这样: 微服务:它们是构成更大规模基于微服务的应用程序的单个服务和功能&…

《金融数据安全分级指南JR/T 0197-2020》解读与想法

#1024程序员节|征文# 一、文件框架与核心思考 1、定级目标再审视 自《金融数据安全 数据安全分级指南JR/T 0197-2020》(以下简称“指南”)发布以来,金融数据安全领域已历经四年的发展与变革。该指南作为金融标准中首个以“金融数…

Docker 基础入门

Docker 基础入门 前言 在云计算和微服务架构日益盛行的今天,软件开发与部署的效率和灵活性成为了企业竞争力的关键因素之一。Docker,作为一种开源的容器化平台,凭借其轻量级、可移植性和易于管理的特性,迅速成为现代软件开发和运…

[云] 大数据分析栈(Big Data Analytics Stack)+ Apache Hadoop分布式文件系统(HDFS)+Apache Spark

任务概述 本次作业旨在帮助你理解大数据分析栈(Big Data Analytics Stack)的工作原理,并通过实际操作加深认识。你将搭建Apache Hadoop分布式文件系统(HDFS)作为底层文件系统,并将Apache Spark作为执行引擎…

Linux第二讲:Linux权限理解

Linux第二讲:Linux权限理解 1.shell命令以及运行原理2.Linux权限2.1什么是权限2.2认识人 -- 用户、普通用户、root用户,以及用户之间的切换2.3文件属性2.4文件权限知识点补充2.4.1知识点一2.4.2知识点二2.4.3知识点三2.4.4知识点四 3.角色的修改4.关于权…

Puppeteer 与浏览器版本兼容性:自动化测试的最佳实践

Puppeteer 支持的浏览器版本映射:从 v20.0.0 到 v23.6.0 自 Puppeteer v20.0.0 起,这个强大的自动化库开始支持与 Chrome 浏览器的无头模式和有头模式共享相同代码路径,为自动化测试带来了更多便利。从 v23.0.0 开始,Puppeteer 进…

可私有化部署的集装箱箱号自动识别技术,提供API 接口

启智集装箱箱号自动识别技术特点: 集装箱箱号自动识别技术为通过手机、相机等拍摄集装箱号码后进行视频处理或图像的去燥、纠偏、二值化等分析后进行字符的识别,箱号识别具有以下特点: 1)快速:自动实时识别&#xff0c…

行为设计模式 -责任链模式- JAVA

责任链设计模式 一 .简介二. 案例2.1 抽象处理者(Handler)角色2.2 具体处理者(ConcreteHandler)角色2.3 测试 三. 结论3.1 优缺点3.2 示例3.3 要点 前言 这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接下来还会持续更新。 作者:神…

智能优化算法-狐狸优化算法(FOX)(附源码)

目录 1.内容介绍 2.部分代码 3.实验结果 4.内容获取 1.内容介绍 狐狸优化算法 (Fox Optimization Algorithm, FOX) 是一种基于群体智能的元启发式优化算法,它模拟了狐狸的捕食行为、社会互动和环境适应能力,用于解决复杂的优化问题。 FOX的工作机制主要…

MR20一体式远程IO模块:引领工业自动化的创新之选

在快速发展的工业自动化领域,高效、可靠且易于维护的IO模块成为了众多企业的首选。其中,MR20系列一体式远程IO模块凭借其卓越的性能和人性化的设计,在众多IO模块中脱颖而出,成为工业自动化领域的璀璨明星。 小巧体积,高…

【CSS3】css开篇基础(4)

1.❤️❤️前言~🥳🎉🎉🎉 Hello, Hello~ 亲爱的朋友们👋👋,这里是E绵绵呀✍️✍️。 如果你喜欢这篇文章,请别吝啬你的点赞❤️❤️和收藏📖📖。如果你对我的…