什么是rouge metric

什么是rouge metric

news/2025/4/19 3:28:32/文章来源:https://blog.csdn.net/qq_46805255/article/details/136279713

采用分类任务的指标评估生成任务的问题

举个例子，在一个seq2seq模型中，黄金标签是“police killed the gunman”，模型输出是"the gunman police killed"，两句话的意思是有差别的，但是从unigram的角度，它们都包含了"The", "police", "killed", "gunman"，是完全相同的。

以常用的分类指标precision, recall, f1为例。precision = TP/(TP+FP), recall = TP/(TP+FN)。

在上面情境中，模型预测出"the" "gunman" "killed" "police"四个unigram，还都预测对了，因为它们在黄金标签“police killed the gunman”中也出现了，因此TP=4, 因为没有预测错误的unigram，FP=0，precision =1。

同理，对recall而言，TP=4，因为黄金标签中的4个unigram，全都被模型预测出来了，没有漏网之鱼，因此FN=0，即没有那些本来为阳性，却预测为阴性的unigram。因此recall为1.

因此F1 = TP/(TP+FN)=1，从分类的角度看，模型的预测是非常成功的。

但是我们一眼就看出，模型生成的结果改变了黄金标签的意思。这时候怎么去衡量模型生成结果的质量呢。

rouge-1

首先介绍rouge-1，这个1指的就是连续的一个单词。上图中绿色的是机器生成的，黄色的是人类给的标注，从单个连续单词的角度，一共有六个匹配的单词，按照图中给出的公式计算，即可算出rouge-1。

rouge-2

通过把模型生成的句子和人类给出的标注分拆成bi-gram的形式，与计算rouge-1类似，寻找匹配的bi-gram个数，带入公式，即可计算出rouge-2。

rouge-L

对于rouge-L，它不比较两句话中有多少个L-gram是相互匹配的，而是用两句话的最长公共子序列来计算。图中两句话的最长公共子序列长度为6，代入图中的ROUGE-L公式，即可计算出precision和recall。

如何调包计算rouge

可以调用load_metric包来计算rouge

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/701557.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

数字化浪潮下的企业变革：深度解析ERP的崭新篇章

数字化浪潮下的企业变革：深度解析ERP的崭新篇章

引言： 随着科技的飞速发展，企业正迎来前所未有的数字化浪潮。在这个数字时代，企业资源规划（ERP）被认为是企业应对挑战、实现创新的重要工具。本文将深入研究ERP的发展历程，聚焦不同行业和场景下的创新应用…

阅读更多...

Atomic-flag-tutorial

Atomic-flag-tutorial

本文介绍 <atomic> 头文件中最简单的原子类型: atomic_flag。atomic_flag 一种简单的原子布尔类型，只支持两种操作，test_and_set 和 clear。 std::atomic_flag 详解 std::atomic_flag 构造函数 std::atomic_flag 构造函数如下： ato…

阅读更多...

ROS2 学习笔记13：创建 ROS2 包

ROS2 学习笔记13：创建 ROS2 包

ROS2 学习笔记13：创建 ROS2 包 Background 背景1 什么是ROS2 包2 ROS2包的组成3 工作空间的包 Prerequisites 前提Tasks 任务1 Create a package2 Build a package3 Source the setup file4 Use the package5 Examine package contents6 Customize package.xml Summ…

阅读更多...

虚拟化原理

虚拟化原理

1 概念： ①通俗理解： 虚拟化是在硬件和操作系统之间的实践 ②通过对计算机的服务层级的理解，理解虚拟化概念抽离层级之间的依赖关系（服务器虚拟化） 2 虚拟化分类 ①按架构分类 ◆寄居架构：装在操作系统上…

阅读更多...

pytest.param作为pytest.mark.parametrize的参数进行调用

pytest.param作为pytest.mark.parametrize的参数进行调用

pytest.param：在 pytest.mark.parametrize 中可以作为一个指定的参数进行调用获取数据库（网页端）数据，通过pytest.param包装成数据包用于pytest.mark.parametrize 中实现数据驱动调用。 import os import pytest import json fr…

阅读更多...

OSCP靶场--Nickel

OSCP靶场--Nickel

OSCP靶场–Nickel 考点(1.POST方法请求信息 2.ftp，ssh密码复用 3.pdf文件密码爆破) 1.nmap扫描 ┌──(root㉿kali)-[~/Desktop] └─# nmap 192.168.237.99 -sV -sC -p- --min-rate 5000 Starting Nmap 7.92 ( https://nmap.org ) at 2024-02-22 04:06 EST Nm…

阅读更多...

5.1 Ajax数据爬取之初介绍

5.1 Ajax数据爬取之初介绍

目录 1. Ajax 数据介绍 2. Ajax 分析 2.1 Ajax 例子 2.2 Ajax 分析方法 （1）在网页页面右键，检查 （2）找到network，ctrl R刷新 （3）找 Ajax 数据包 （4）…

阅读更多...

【前后端的那些事】文件上传组件封装

【前后端的那些事】文件上传组件封装

文章目录效果前端代码后端代码组件封装效果前端代码 /views/file/file.vue <template><el-row><el-uploadv-model:file-list"fileList"class"upload-demo"multiple:auto-upload"false":on-preview"handlePreview"…

阅读更多...

Javascript[ECMAScript] ES6、ES7、ES8、ES9、ES10、ES11、ES12、ES13、ES14[2023]新特性

Javascript[ECMAScript] ES6、ES7、ES8、ES9、ES10、ES11、ES12、ES13、ES14[2023]新特性

# 前言鉴于找不到ES6-ES14 的新特性集合，所以有了这篇文章，后续会持续更新每年的新特性 # 背景 ## JS1.1（1997） [第一版基于Netscape Navigator 3.0中实现的JAVASCRIPT 1.1](https://web.archive.org/web/19970614042441/http:/…

阅读更多...

数据结构之：跳表

数据结构之：跳表

跳表（Skip List）是一种概率性数据结构，它通过在普通有序链表的基础上增加多级索引层来实现快速的查找、插入和删除操作。跳表的效率可以与平衡树相媲美，其操作的时间复杂度也是O(log n)，但跳表的结构更简单&#xff0c…

阅读更多...

Swiper.js：不识这个轮播图js库，说明你的前端还未入门

Swiper.js：不识这个轮播图js库，说明你的前端还未入门

hello，我是贝格前端工场，本期给大家带来轮播图的s库：Swiper.js，用这个类库处理轮播图、幻灯片、画廊那是得心应手，非常的easy，欢迎老铁们点赞关注，如有前端定制开发需求可以私信我们。一、Swip…

阅读更多...

网络编程、UDP、TCP

网络编程、UDP、TCP

计算机网络就是将地理位置不同的具有独立功能的多台计算及外部设备，通过通信线路连接起来，在网络操作系统、网络管理软件以及网络通信协议的管理和协调下，实现资源共享和信息传递的计算机系统目的传播交流信息、数据交换、通信如何做…

阅读更多...

TensorRT及CUDA自学笔记003 CUDA编程模型、CUDA线程模型及其管理、CUDA内存模型及其管理

TensorRT及CUDA自学笔记003 CUDA编程模型、CUDA线程模型及其管理、CUDA内存模型及其管理

TensorRT及CUDA自学笔记003 CUDA编程模型、CUDA线程模型及其管理、CUDA内存模型及其管理各位大佬，这是我的自学笔记，如有错误请指正，也欢迎在评论区学习交流，谢谢！ CUDA编程模型我们使用CUDA_C语言进行CUDA编程&am…

阅读更多...

【Vue3】‘vite‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。

【Vue3】‘vite‘ 不是内部或外部命令，也不是可运行的程序或批处理文件。

问题今天拿到别人项目的时候，我平时比较习惯用pnpm，我就使用pnpm i先下载依赖包，下载完成后，启动项目，就开始报以下错误！ 但是当我执行pnpm i的时候，vite不应该就已经被我下载下来了吗研究了…

阅读更多...

学习JAVA的第五天（基础）

学习JAVA的第五天（基础）

目录 API 字符串 String概述比较的是什么？ 关于字符串的比较字符串代码展示 StringBuilder概述 StringBuilder方法的代码展示 StringJoiner概述 StringJoiner方法的代码展示练习-用户登录 API API（Application Programing I…

阅读更多...

【Java程序设计】【C00307】基于Springboot的基Hadoop的物品租赁管理系统（有论文）

【Java程序设计】【C00307】基于Springboot的基Hadoop的物品租赁管理系统（有论文）

基于Springboot的基Hadoop的物品租赁管理系统（有论文） 项目简介项目获取开发环境项目技术运行截图项目简介这是一个基于Springboot的基于 Hadoop的物品租赁系统的设计与实现，本系统有管理员、用户二种角色权限； 前台首页&#…

阅读更多...

day11-项目集成SpringSecurity-今日指数

day11-项目集成SpringSecurity-今日指数

项目集成SpringSecurity 学习目标理解自定义认证和授权过滤器流程；理解项目集成SprignSecurity流程； 第一章自定义认证授权过滤器 1、SpringSecurity内置认证流程通过研究SpringSecurity内置基于form表单认证的UsernamePasswordAuthenticationFi…

阅读更多...

【工程院院士加盟】第四届计算机通信与人工智能国际会议

【工程院院士加盟】第四届计算机通信与人工智能国际会议

CCAI 2024 | Xian, Chinahttp://ccai.net/ - IEEE出版，EI核心和Scopus检索 - 工程院院士，IEEE Fellow等学术大咖主题演讲 - 会议时间-地点：2024年5月24-26日，中国西安会议简介 Brief Introduction 作为人工智能的重要传播技术…

阅读更多...

Linux环境下基本指令

Linux环境下基本指令

今天我们一起来认识一下Linux环境下一些基本的指令，这些指令是我们学习Linux的基础，只有掌握了这些指令，我们才能在Linux环境下进一步学习知识，话不多说，我们开始（以下演示操作是在云服务器的环境下&#x…

阅读更多...

基于SSM的车位租赁系统（有报告）。Javaee项目。ssm项目。

基于SSM的车位租赁系统（有报告）。Javaee项目。ssm项目。

演示视频： 基于SSM的车位租赁系统（有报告）。Javaee项目。ssm项目。项目介绍： 采用M（model）V（view）C（controller）三层体系结构，通过Spring Spri…

阅读更多...

最新文章