Re69：读论文 LaMDA: Language Models for Dialog Applications

Re69：读论文 LaMDA: Language Models for Dialog Applications

bicheng/2025/4/12 19:07:39/文章来源:https://blog.csdn.net/PolarisRisingWar/article/details/137967369

诸神缄默不语-个人CSDN博文目录
诸神缄默不语的论文阅读笔记和分类

论文名称：LaMDA: Language Models for Dialog Applications
ArXiv网址：https://arxiv.org/abs/2201.08239

本文介绍谷歌提出的对话大模型LaMDA，主要关注对各项指标（包括对话质量、安全性等）的优化。
因为我自己不是做对话的，所以很多对话子领域特有的内容我就不写了。

在研究中发现扩大模型能提高对话质量，但不能提高安全性和factual grounding（大概就是找出理论依据、减少幻觉这种任务），本文通过在标注数据上微调和引入外部知识源来解决这两个问题。
对话质量：sensibleness, specificity, and interestingness
安全性：不提供有害建议和偏见等。用有标数据构建分类器。（从网络搜集外部知识可能会降低安全性，本文用的是已知资料；微调能增强安全性）
引入外部知识源提高factual grounding：信息检索，翻译器，计算器等。指标：Informativeness（携带外部信息的比例），Citation accuracy（引用正确超链接的比例）

LaMDA方法对对话质量和安全性指标都能实现提升：
在这里插入图片描述

application-specific helpfulness (i.e., useful and correct responses)
role consistency (i.e., agent utterances match agent role) 指标：Helpfulness and Role consistency

预训练时的数据集Infiniset包括对话数据（众包打分）和通用语料，全是英语。

微调第一步：FT quality-safety

通用微调格式：<context> <sentinel> <response>（损失函数只计算response）
示例：What’s up? RESPONSE not much.

针对特定指标的格式：<context> <sentinel> <response> <attribute-name> <rating>（损失函数只计算rating）
示例：What’s up? RESPONSE not much. SENSIBLE 1

指标权重：3 * P(sensible) + P(specific) + P(interesting)

LaMDA的模型架构是Transformer decoder。

在这里插入图片描述
解码时采用sample-and-rank策略：抽样，根据对数似然和长度选择得分最高的座位输出。

The toolset (TS)

微调第二步：FT groundedness (LaMDA)

context + base
context + base + query + snippet

调用外部API，如信息检索系统

在这里插入图片描述
↑ 图中黄色为模型输入，红色为模型输出（以TS为标志，是否要检索），绿色为检索系统输出

微调数据：
在这里插入图片描述

不同尺寸模型的微调效果：（PT就是没有经过微调的版本，只经过了语言模型预训练）
在这里插入图片描述

指标结果：
在这里插入图片描述

微调子机制效果（模型分析）：
在这里插入图片描述

LaMDA在领域任务上的效果的实验，场景是：
在这里插入图片描述
用几轮role-specific dialogs开头来引导LaMDA模型进入角色：

公平、安全、耗能和碳足迹问题之类的，我以后需要参考了再看吧。略。

其他应该考虑的指标：
礼貌程度
appropriateness
人格化
不同应用对指标有着不同的需求

附录还有很详细的安全问题定义与分类、标注人员的信息和标注方法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/5050.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

智慧能源数据监控平台

智慧能源数据监控平台

随着科技的飞速发展，能源管理已逐渐从传统的粗放型向精细化、智能化转变。在这个转型过程中，HiWoo Cloud平台的智慧能源数据监控平台以其独特的技术优势和创新理念，正引领着能源管理的新潮流。一、智慧能源数据监控平台的概念智慧能源数据…

阅读更多...

经典文献阅读之--SurroundOcc(自动驾驶的环视三维占据栅格预测)

经典文献阅读之--SurroundOcc(自动驾驶的环视三维占据栅格预测)

0. 简介环视BEV已经是很多场景中需要的功能，也是视觉代替激光雷达的有效解决方案，而《SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving》一吻则代表了这个领域的SOTA算法，文中通过多帧点云构建了稠密占据栅格数据…

阅读更多...

微信小程序for循环示例（JavaScript）

微信小程序for循环示例（JavaScript）

微信小程序for循环示例（JavaScript） 在微信小程序开发中，我们最常用的循环方式就是for和foreach，接下来我就浅浅的将自己的写的一小段示例代码分享给大家。首先是for循环，也是咱们最常用的方式，具体示例…

阅读更多...

python爬虫插件XPath的安装

python爬虫插件XPath的安装

概要 XPath Helper是一款专用于chrome内核浏览器的实用型爬虫网页解析工具。XPath可以轻松快捷地找到目标信息对应的Xpath节点，获取xpath规则，并提取目标信息，并进行校对测试；可对查询出的xpath进行编辑，正确编辑的结…

阅读更多...

微信开发api、微信视频号开发

微信开发api、微信视频号开发

接口地址： http://api.videostui.com/finder/v2/api/login/checkLogin 接口说明获取到登录二维码后需每间隔5s调用本接口来判断是否登录成功新设备登录平台，次日凌晨会掉线一次，重新登录时需调用获取二维码且传appId取码，登录成…

阅读更多...

课程34：Windows Docker部署.Net Core项目

课程34：Windows Docker部署.Net Core项目

这里写目录标题 🚀前言一、安装Docker Desktop1.1 官网下载Docker1.2 安装Docker1.2.1 选择配置，默认都勾选1.2.2 安装中1.2.3 安装成功1.2.4 启动1.2.5 启动成功二、.Net Core 项目发布与部署2.1 修改Dockerfile文件2.2 Web项目发布2.3 修改配置2.3.1 修改dockerfile<

阅读更多...

android studio拍照功能问题解决

android studio拍照功能问题解决

1.点击拍照功能直接闪退 2.拍照后不能选择确认键，无法保存上述是在android studio做项目中经常会使用到模拟器或真机的拍照功能时主要遇到的两个问题。解决方法： 1.直接闪退问题： if(Build.VERSION.SDK_INT>Build.VERSION_CODES.N)…

阅读更多...

关于使用SpringSecurity框架发起JSON请求，但因登陆失效导致响应403的问题。

关于使用SpringSecurity框架发起JSON请求，但因登陆失效导致响应403的问题。

这里记录一个生产中遇到的一个问题。现有环境是基于SpringBoot 2.6.8，然后是前后台一体化的项目。安全框架使用的是内置版本的SpringSecurity。在实际使用过程中遇到一个问题。就是当用户登陆失效后，前端操作JSON请求获取列表数据，但…

阅读更多...

323_C++_QT_使用QProcess执行cmd解压tar.gz等等其他压缩包文件到指定目录，不需要外部库，QT自带API的就行

323_C++_QT_使用QProcess执行cmd解压tar.gz等等其他压缩包文件到指定目录，不需要外部库，QT自带API的就行

// decompressPath : 解压到此目录 // fileName ：解压的tar.gz文件名executeCommand(decompressPath , QString::fromStdString(fileName));// 开始解压 void executeCommand

阅读更多...

visual studio code安装Clicknium

visual studio code安装Clicknium

visual studio code下载安装 Download Visual Studio Code - Mac, Linux, Windows 安装python extend，需要把科学上网关了 clicknium 获取插件名 clicknium 录制教程 https://blog.51cto.com/u_16213624/7007362 实战教程： Python 自动化神器 Click…

阅读更多...

上海亚商投顾：沪指创年内新高房地产板块掀涨停潮

上海亚商投顾：沪指创年内新高房地产板块掀涨停潮

上海亚商投顾前言：无惧大盘涨跌，解密龙虎榜资金，跟踪一线游资和机构资金动向，识别短期热点和强势个股。一.市场情绪三大指数昨日继续反弹，沪指盘中涨超1%，重返3100点上方，深成指涨超2%&#…

阅读更多...

如何确定当前项目是采用 Vite 还是 Vue CLI 项目

如何确定当前项目是采用 Vite 还是 Vue CLI 项目

查看项目的配置文件和依赖对于 Vite 项目： 检查项目根目录下是否有一个名为 vite.config.js 或 vite.config.ts 的文件。这是 Vite 项目的配置文件。在 package.json 文件中，查看 dependencies 和 devDependencies 部分是否包含 vite 和 vitejs/plug…

阅读更多...

初探 JUC 并发编程：Java 并发包中并发 List 源码剖析

初探 JUC 并发编程：Java 并发包中并发 List 源码剖析

最近在阅读《Java 并发编程之美》这本书，感觉学到了很多东西；所以我决定将从事书中学到的思想和一些经典的案例整理成博客的形式与大家分享和交流，如果对大家有帮助别忘了留下点赞和关注捏。第五部分：Java 并发包中并发 List 源…

阅读更多...

性能监控之prometheus+grafana搭建

性能监控之prometheus+grafana搭建

前言 Prometheus和Grafana是两个流行的开源工具，用于监控和可视化系统和应用程序的性能指标。它们通常一起使用，提供了强大的监控和数据可视化功能。 Prometheus Prometheus是一种开源的系统监控和警报工具包。它最初由SoundCloud开发，并于…

阅读更多...

【亲测有效】Element UI 自定义 Notification 通知样式不生效，设置this.$notify样式不生效问题

【亲测有效】Element UI 自定义 Notification 通知样式不生效，设置this.$notify样式不生效问题

不生效的源代码 <style lang"scss" scoped> ::v-deep .el-notification__group {margin-left: 130px; } </style><style lang"scss" scoped> .el-notification__group {margin-left: 130px; } </style>以上两种代码均不生效解决…

阅读更多...

Android log tag标签如am_pss意义

Android log tag标签如am_pss意义

Android log tag标签如am_pss意义 Android输出日志中不同的标签代表不同的意义，比如 am_pss，则代表内存回收（整理）。定义在源代码文件 ： https://android.googlesource.com/platform/frameworks/base//master/servic…

阅读更多...

匠心精神与创新力量：构筑网络安全的新防线

匠心精神与创新力量：构筑网络安全的新防线

一、匠心精神在网络安全中的重要性匠心精神代表着对工作的专注和对质量的极致追求。在网络安全领域，这意味着对每一个安全漏洞的深入挖掘，对每一项安全技术的精心打磨。亿林网络李璐昆的提名，正是对其在网络安全领域匠心精神的认可。二、…

阅读更多...

A/B测试

A/B测试

在当今数字化时代，数据驱动的决策已经成为企业取得成功的关键。而在众多数据驱动的策略中，A/B测试无疑是一种强大且实用的工具。本文将深入探讨A/B测试的概念、原理、应用案例以及其重要性，旨在帮助读者更好地理解并应用这一方法。一、A/B测…

阅读更多...

PCL 模版对齐

PCL 模版对齐

文章目录一、简介二、实现代码三、实现效果参考资料一、简介在 PCL 中，模板对齐（template alignment）通常指的是将一个点云与另一个点云进行配准（registration）的过程。PCL为我们提供了多种方法来实现点云的配准，其中包括特征匹配、迭代最近点（ICP）算法等。具体过程如…

阅读更多...

Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 4000+字图文分析文档销售价格库存分析+完整python代码

Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 4000+字图文分析文档销售价格库存分析+完整python代码

资源地址：Python数据分析大作业 4000字图文分析文档销售分析完整python代码完整代码分析同时销售量后1000的sku品类占比中（不畅销产品）如上，精品类产品占比第一，达到66.7%，其次是香化类产品&#x…

阅读更多...

最新文章