pyrouge(ROUGE-1.5.5)的安装步骤和使用说明(适用于Linux 系统)


摘要:本文讲解了如何配置和使用文本摘要的评价指标ROUGE(linux 系统)。


✅ NLP 研 1 选手的学习笔记

简介:小王,NPU,2023级,计算机技术
研究方向:摘要生成、大语言模型生成


文章目录

  • 一、为啥要写这篇博客?
  • 二、安装过程:
    • step1:检查 `perl` 版本
    • step2:安装 `XML::Parser`
    • step3: 安装 `XML::RegExp`
    • step4: 安装 `LWP::UserAgent`
    • step5: 安装 `XML::Parser::PerlSAX`
    • step6: 安装 `XML::DOM`
    • step7: 安装 `DB_File`
    • step8: 安装并测试 `ROUGE-1.5.5`
  • 三、所有完整安装命令
  • 四、参考文献
  • 五、补充说明


一、为啥要写这篇博客?

调侃:这个xxx玩意,我真的,安装了好久好久,关键很多投稿文摘任务的作者还就喜欢有这一版本的ROUGE…我不用还不行…

ROUGE 是由微软亚洲研究院知识挖掘组(The Knowledge Mining group at Microsoft Research Asia)调研经理(research manager) Chin-Yew Lin 研发的,用于摘要的自动评价,通过比较机器自动生成的摘要(called system_summary)与人工生成的摘要(called model_summary, 认为它是理想的)中重叠单元的数量,来评价机器自动生成的摘要。该方法中考虑的重叠单元有n-gram、word sequences、word-pairs等,并提出了四个测量标准 ROUGE-NROUGE-LROUGE-WROUGE-S。该包用 Perl 语言编写,目前版本为 ROUGE-1.5.5

● 首先安装 Perl 的一系列文件。直接用我的百度网盘:百度网盘链接,提取码:8fy5 里面的吧。当然如果你想去 github 下载也是可以的:https://github.com/summanlp/evaluation/tree/master/ROUGE-RELEASE-1.5.5。

● 如果你直接用的网盘里的几个压缩包,可以先将它们放到同一个文件夹里,如下图所示:

在这里插入图片描述

二、安装过程:

step1:检查 perl 版本

● 因为 DOM 要求 perl 版本要在 5.6.0 以上,所以先在终端用 perl -v 查看一下当前版本,版本较低的话先升级一下 perl

在这里插入图片描述
● 升级 perl 的 Linux 命令:

sudo apt upgrade perl


step2:安装 XML::Parser

● 假设使用的是百度网盘里的文件,那我们先将 XML-Parser-2.44.tar.gz 解压到当前文件夹(默认)或指定路径:

tar -zxvf XML-Parser-2.44.tar.gz

● 然后进入解压好的该文件,并进行编译和安装:

cd XML-Parser-2.44
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

● 前两个语句(cd XML-Parser-2.44perl Makefile.PL)应该大家都没问题:

在这里插入图片描述
● 但输入 make 后就会出现 Bug…OK,这一步我就卡了很久…

在这里插入图片描述
● 找了很久的资料,反正 ChatGPT 之类的也问了,最后找到个能解决问题的偏方,输入下面的命令:

Debian/Ubuntu系统用这个(我用的这个)sudo apt-get install libexpat1-dev
CentOS/RHEL系统用这个:
sudo yum install expat-devel

● 结果,libexpat1-dev 安装不上????然后我又陷入了沉思…并开始借助互联网的力量!

在这里插入图片描述
● 终于,我知道怎么回事了,输入下面的命令,更新一下软件包列表:

sudo apt-get update

● 然后再次输入 sudo apt-get install libexpat1-dev,终于安装好这玩意儿了:

在这里插入图片描述
● 好的,现在我可以 make 了吧?OK,终于解决了,搁这儿套娃了,一个 Bug 套另一 Bug…

在这里插入图片描述
● 咱们再接着 make 后面的语句一条条地执行,后面两条语句应该都没事了。

cd XML-Parser-2.44
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

● 进行 make test 之后的输出结果:

在这里插入图片描述
● 进行 sudo make install 之后的输出结果:

在这里插入图片描述



step3: 安装 XML::RegExp

● 过程和 step2 一样,我们先将 XML-RegExp-0.04.tar.gz 解压到当前文件夹(默认)或指定路径:

tar -zxvf XML-RegExp-0.04.tar.gz

● 需注意的是,别在刚刚的文件夹下解压,的回到上一层才行:
在这里插入图片描述

● 然后进入解压好的该文件,并进行编译和安装:

cd XML-RegExp-0.04
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

● OK,这个包应该全程安装 so easy~!直接来到第三个包!



step4: 安装 LWP::UserAgent

LWP::UserAgentlibwww-perl 中的一部分,直接用 apt-get 安装就可以:

sudo apt-get install libwww-perl


step5: 安装 XML::Parser::PerlSAX

● 这个模块是 libxml-perl 中的一部分,也可以直接用 apt-get 安装

sudo apt-get install libxml-perl


step6: 安装 XML::DOM

● 继续参考 step2 的方法,进入 XML::DOM 的安装包路径,解压到当前文件夹(默认)或指定路径:

tar -zxvf XML-DOM-1.46.tar.gz

● 然后进入解压好的该文件,并进行编译和安装:

cd XML-DOM-1.46
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

● 这个包应该也是全程安装 so easy~!直接来到倒数第二个包包!



step7: 安装 DB_File

● 继续参考 step2 的方法,进入 DB_File 的安装包路径,解压到当前文件夹(默认)或指定路径:

tar -zxvf DB_File-1.835.tar.gz

● 然后进入解压好的该文件,并进行编译和安装:

cd DB_File-1.835
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

● 问题又来了,这个问题是我花了 long long long long long time 才解决的…呜呜呜呜呜呜

在这里插入图片描述
● 反正,安装了下面这个依赖才可以:

sudo apt-get install libdb5.3-dev

● 安装 libdb5.3-dev 后再 make 的结果如下:

在这里插入图片描述
● 然后当我们执行 make test 时,竟然!Fail!!啊啊啊…真的要崩溃了…

在这里插入图片描述

● 鬼知道我咋想的,我原先的 DB_File-1.835 文件夹改名为 oldDB_File-1.835,还有原先的压缩包 DB_File-1.835.tar.gz 改名为 oldDB_File-1.835.tar.gz。然后,从网上新下载一个 DB_File,并重新执行一遍 step7:

sudo wget http://www.cpan.org/authors/id/P/PM/PMQS/DB_File-1.835.tar.gz
tar -zxvf DB_File-1.835.tar.gz
cd DB_File-1.835
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限

在这里插入图片描述
● 当再一次执行到 make test 时,噢~天呐!终于 PASS 了呜呜呜呜…

在这里插入图片描述
● 最后的 sudo make install 也应该没问题,终于可以到最后一步了…



step8: 安装并测试 ROUGE-1.5.5

● 首先解压 ROUGE-1.5.5.tar 到当前文件夹(默认)或指定路径,然后进入该目录:

tar -zxvf ROUGE-1.5.5.tgz
cd RELEASE-1.5.5

● 解压后的文件夹内容如下:
在这里插入图片描述
● 最后执行一下该文件夹里面的一个测试文件 runROUGE-test.pl

perl runROUGE-test.pl

● 当出现下面的画面时,那超级恭喜你!!!!成功啦!!!👏👏👏[此处附加哗啦啦的掌声!!!]👏👏👏

在这里插入图片描述



三、所有完整安装命令

● 一条一条执行即可。

sudo apt upgrade perl
sudo apt-get update
sudo apt-get install libexpat1-devtar -zxvf XML-Parser-2.44.tar.gz
cd XML-Parser-2.44
perl Makefile.PL
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限
cd ..tar -zxvf XML-RegExp-0.04.tar.gz
cd XML-RegExp-0.04
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限
cd ..sudo apt-get install libwww-perlsudo apt-get install libxml-perltar -zxvf XML-DOM-1.46.tar.gz
cd XML-DOM-1.46
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限
cd ..sudo wget http://www.cpan.org/authors/id/P/PM/PMQS/DB_File-1.835.tar.gz
sudo apt-get install libdb5.3-dev
tar -zxvf DB_File-1.835.tar.gz
cd DB_File-1.835
perl Makefile.PL 
make 
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了 
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限
cd ..tar -zxvf ROUGE-1.5.5.tgz
cd RELEASE-1.5.5
perl runROUGE-test.pl


四、参考文献

1.《NLP-文本摘要:Rouge评测方法【Rouge-1、Rouge-2、Rouge-L、Rouge-W、Rouge-S】》

2.《Ubuntu安装ROUGE教程》

3.《github pyrouge》

4.《github evaluation/ROUGE-RELEASE-1.5.5》

5.《rouge 及 pyrouge 安装、配置和使用》

五、补充说明

● 若有写得 不对/不妥 的地方,或有疑问,欢迎评论交流。


后记:这篇博客写于 2023-09-15 15:03:49,但是一直没有发出来…
现在 2024-06-10 15:20,端午节,想想哈,时过境迁好久啦,已经好长一段时间没有好好写博客了,得拾起来了…

⭐️ ⭐️ ⭐️

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/25736.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

问题汇总:MPU6050(软件iic)

以下为个人问题汇总,排查点汇总可能大有缺陷,如有错误,欢迎指正。 排查点汇总 检查软件iic的时序操作用示波器或逻辑分析仪检查波形 无法使用逻辑分析仪进行I/O引脚波形分析 充当SDA、SCL的引脚要配置为推挽输出; 另外,逻辑分…

DeepSORT(目标跟踪算法)中的解三角方程计算标准化残差(解线性方程组)

DeepSORT(目标跟踪算法)中的解三角方程计算标准化残差(解线性方程组) flyfish 《DeepSORT(目标跟踪算法)中的计算观测值与状态估计的马氏距离》这篇文章介绍了Cholesky 分解。Cholesky 分解将协方差矩阵分…

c++序列化和反序列化简单demo

序列化和反序列化是指将数据结构或对象转换为一种可以存储或传输的格式(序列化),然后再将其恢复为原来的数据结构或对象(反序列化)。在C中,通常使用标准库和一些辅助库来实现序列化和反序列化。下面是一个简…

mybatis条件构造bug

一、需求背景 (本文源自微博客,且已获得授权) 根据传递的参数,使用mybatis-plus动态构造查询语句。参数对象如下: private Integer id;private String ip;/*** 状态:0封锁;1:已解封*/private Integer status;/*** 开始时间*…

挑战绝对不可能:再证有长度不同的射线

黄小宁 一空间坐标系中有公共汽车A,A中各座位到司机处的距离h是随着座位的不同而不同的变数,例如5号座位到司机处的距离是h3,…h5,…。A移动了一段距离变为汽车B≌A,B中5号座位到司机处的距离h’h3,…h’h5…

2002NOIP普及组真题 3. 产生数

线上OJ 地址: 【02NOIP普及组】产生数 核心思想:组合数 dfs 高精度 1、如果一个数字有 3 位,每位有 2种可能性,则数字的 组合数 为 2*2*2 8 种 。故,只要求出每一位数字有多少种变体即可。 求 0 ~ 9 每一个数字的…

mysql 如何分布式部署

MySQL的分布式部署是一个涉及多个步骤和配置的过程,以确保数据库系统能够支持大规模数据存储、高并发访问和容错性。以下是MySQL分布式部署的主要步骤和要点,结合参考文章中的相关信息进行整理: 一、前期准备 环境准备: 选择合…

LLVM Cpu0 新后端 系列课程总结

想好好熟悉一下llvm开发一个新后端都要干什么,于是参考了老师的系列文章: LLVM 后端实践笔记 代码在这里(还没来得及准备,先用网盘暂存一下): 链接: https://pan.baidu.com/s/1yLAtXs9XwtyEzYSlDCSlqw?…

AtCoder Beginner Contest 355

C - Bingo 2 题意 有一个 n n n\times n nn 的网格,初始全白,有 t t t 次操作,每次操作涂黑一个指定的格子。 问执行第几个操作后,有一行或一列或对角线的格子全部被涂黑。 思路 如果暴力判断,那么总时间复杂度…

一文搞懂线性回归模型

1、简单介绍 线性回归模型是一种基础的预测建模技术,用于分析一个或多个自变量(特征)与因变量(目标)之间的关系。它的基本假设是目标变量(y)与特征(X)之间存在线性关系。…

提升篇---接口和抽象类的本质区别

大家好,这里是教授.F 语法区别: 方法实现:接口中定义的方法默认都是抽象的,不包含方法的实现;而抽象类可以包含抽象方法和具体方法的实现。 多继承:一个类只能继承一个抽象类,但可以实现多个接…

测试与开发

目录 按照测试目标分类 界面测试 功能测试 性能测试 可靠性测试 安全性测试 易用性测试 按照执行方式分类: 测试方法 白盒测试 语句覆盖 条件覆盖 判定条件覆盖 条件组合覆盖 路径覆盖 黑盒测试 灰盒测试 按照测试阶段分类 单元测试 集成测试 …

【iOS】界面推出的方法

【iOS】界面推出的方法 在学习过程中我们发现在iOS中有两种界面推出的方法:push 和 present这两种方法都可以用来推出一个新的界面 但是这两者是存在区别的 push 方法是通过 UINavigationController 进行导航,新的视图控制器会被压入导航栈中,可以跨级…

写给大数据开发,如何去掌握数据分析

这篇文章源于自己一个大数据开发,天天要做分析的事情,发现数据分析实在高大上很多,写代码和做汇报可真比不了。。。。 文章目录 1. 引言2. 数据分析的重要性2.1 技能对比2.2 业务理解的差距 3. 提升数据分析能力的方向4. 数据分析的系统过程4…

前端 JS 经典:Promise 详解

1. Promise 由来 在以前我们实现异步是用的回调函数,当一个异步请求需要依赖上一个异步请求返回的结果的时候,就会形成如下这种的调用结构。 请求1(function (结果1) {请求2(function (结果2) {请求3(function(结果3)) {请求4(function(结果4) {})}});…

Windows下载安装RabbitMQ客户端(2024最新篇)

文章目录 RabbitMQ认知RabbitMQ下载RabbitMQ安装 更多相关内容可查看 RabbitMQ认知 定义:RabbitMQ是一个消息中间件,它接受并转发消息。你可以把它当做一个快递站点,当你要发送一个包裹时,你把你的包裹放到快递站,快递…

2024年土建施工员考试题库及答案

一、单选题 1.某工程项目桩基工程采用套管成孔灌注桩,为了保证施工质量,桩管灌满混凝土后开始拔管,按照规定,管内应保持不少于()m高的混凝土。 A.1 B.1.5 C.2 D.2.5 答案:C 解析&…

免费!GPT-4o发布,实时语音视频丝滑交互

We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time. 5月14日凌晨,OpenAI召开了春季发布会,发布会上公布了新一代旗舰型生成式人工智能大模型【GPT-4o】,并表示该模型对所有免费…

JDBC简介以及快速入门

这些都是JDBC提供的API 简介 每一个数据库的底层细节都不一样 不可能用一套代码操作所有数据库 我们通过JDBC可以操作所有的数据库 JDBC是一套接口 我们自己定义了实现类 定义实现类 然后就能用Java操作自己的数据库了 MySQL对于JDBC的实现类 就是驱动 快速入门 创建新的项…

MySQL-函数/约束

MySQL-函数 distinct-去重 //放在select后 1、字符串函数 SELECT 函数(参数) CONCAT(S1,S2,S3...)-字符串拼接,拼接成一个字符串。 LOWER(str)-将字符串str全部转换为小写。 UPPER(str)-将字符串str全部转换为大写。 LPAD(str,n,pad)-左填充,用字…