【ChatIE】论文解读：Zero-Shot Information Extraction via Chatting with ChatGPT

【ChatIE】论文解读：Zero-Shot Information Extraction via Chatting with ChatGPT

news/2025/4/8 8:23:48/文章来源:https://blog.csdn.net/m0_72947390/article/details/136139702

文章目录

- 介绍
- ChatIE
- - Entity-Relation Triple Extration (RE)
  - Named Entity Recognition (NER)
  - Event Extraction (EE)
- 实验
- 结果
- 结论

论文：Zero-Shot Information Extraction via Chatting with ChatGPT
作者：Xiang Wei, Xingyu Cui, Ning Cheng, Xiaobin Wang, Xin Zhang, Shen Huang, Pengjun Xie, Jinan Xu, Yufeng Chen, Meishan Zhang, Yong Jiang, Wenjuan Han
时间：2023

zero-shot information extraction 的目是从未注释的文本中构建信息提取(IE)系统，由于大模型发展迅速，其下游任务效果有了质的提升，文章中考虑采用prompt技巧进行信息提取，观察zero-shot 提取信息的可取性；

为此创建了一个二阶段的多回合问答框架ChatIE，并在三个IE任务上广泛地评估：整体关系三重提取、命名实体识别和事件提取。在两种语言的6个数据集上的经验结果表明，ChatIE取得了令人印象深刻的性能；

介绍

首先information extration 的目的是从非结构化的文本中提取出结构化的信息，并将结构化的信息转化为结构化的数据格式，信息提取主要由三块任务构成：三元组提取，实体命名识别，事件提取 entity-relation triple extract (RE), named entity recognition (NER), event extraction (EE)；

在一般的处理工作中，以RE任务中PURE模型举例子[2010.12812] A Frustratingly Easy Approach for Entity and Relation Extraction (arxiv.org)，首先识别出两个实体，然后再预测两个实体之间的关系，虽然说效果很好，但是这只适用于特别的任务并且是监督训练的，需要大量的标注数据；

由于一般IE方法的特殊性和昂贵性，这里转向研究ChatGPT的prompt来进行IE任务处理；

作者提出了一个两阶段的多轮问答框架，在第一阶段找出相应的元素类型，在第二阶段对每个元素类型进行链式信息提取；利用该框架进行信息提取的效果很明显；

ChatIE

这是一个两阶段框架：在第一阶段，目标是在三个任务中分别找出句子中的实体、关系或事件的现有类型。这样，我们就可以过滤掉不存在的元素类型，以减少搜索空间和计算复杂度，从而提取信息。然后在第二阶段，我们根据第一阶段提取的元素类型以及相应的任务特定方案，进一步提取相关信息。

如果没有提取任何内容，每个阶段都将生成无token的回答；

Entity-Relation Triple Extration (RE)

三元组提取任务也就是在文本中提取 $(s, r, o)$ :

这里的r指的是第一阶段提取到的关系，q1指第一阶段的问题，qr指根据第一阶段得到的关系提出的第二阶段的问题，也就得到 $(s, r, o)$

Named Entity Recognition (NER)

第一阶段我们先去获得实体类型，第二阶段根据实体类型获得实体的名字；

例如：第一阶段得到人物，地点，导演；第二阶段得到人物是谁，地点在哪，导演是谁；

Event Extraction (EE)

第一阶段我们先去获得事件类型并进行分类，第二阶段再根据每个类型的事件去获得类型；

实验

数据

RE数据：NYT11-HRL 包含12个预定义的关系类型，DuIE2.0 该行业中最大的基于模式的中国RE数据集，包含48种预定义的关系类型。三元组中的一些对象具有多个属性；

NER数据：The conllpp dataset conll2003的修改版本包含4种实体类型，MSRA 一个针对新闻字段的中文命名实体识别数据集，其中包含3种实体类型。

EE数据：DuEE1.0 百度发布的中文事件提取数据集，The ACE05 corpus 来自新闻通讯社和在线论坛等各种领域的文档和句子级别的事件注释。

评价指标

micro F1

结果

可以看到ChatIE的效果很突出；同时观察下表：

可以发现，基于聊天的Chat-based prompt 要比一般的prompt得到的更准确；

结论

ChatIE 在 zero-shot information extration 任务中效果表现突出；

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/687412.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

嵌入式——EEPROM（AT24C02）

嵌入式——EEPROM（AT24C02）

目录一、初识AT24C02 1. 介绍 2. 引脚功能补： 二、AT24C02组成 1. 存储结构 2. AT24C02通讯地址 3. AT24C02寻址方式 （1）芯片寻址 （2）片内子地址寻址三、AT24C02读写时序 1. 写操作 （1&…

阅读更多...

数据结构实验之栈与队列八：栈的基本操作

数据结构实验之栈与队列八：栈的基本操作

数据结构实验之栈与队列八：栈的基本操作 Description 堆栈是一种基本的数据结构。堆栈具有两种基本操作方式，push 和 pop。push一个值会将其压入栈顶，而 pop 则会将栈顶的值弹出。现在我们就来验证一下堆栈的使用。 Input 首先输入整数t&am…

阅读更多...

Linux|centos7下的编译|ffmpeg的二进制安装

Linux|centos7下的编译|ffmpeg的二进制安装

Windows版本的ffmpeg： ###注意，高版本可能必须要windows10以及以上才支持，win7估计是用不了的下载地址：Builds - CODEX FFMPEG gyan.dev 或者这个下载地址：https://github.com/BtbN/FFmpeg-Builds/releases 这两个…

阅读更多...

ClickHouse--12-可视化工具操作

ClickHouse--12-可视化工具操作

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录可视化工具操作1 tabixhttp://ui.tabix.io/ 2 DBeaverhttps://dbeaver.io/download/ 可视化工具操作 1 tabix tabix 支持通过浏览器直接连接 ClickHouse&#xff…

阅读更多...

【制作100个unity游戏之25】3D背包、库存、制作、快捷栏、存储系统、砍伐树木获取资源、随机战利品宝箱12（附带项目源码）

【制作100个unity游戏之25】3D背包、库存、制作、快捷栏、存储系统、砍伐树木获取资源、随机战利品宝箱12（附带项目源码）

效果演示文章目录效果演示系列目录前言悬停显示物品详情源码完结系列目录前言欢迎来到【制作100个Unity游戏】系列！本系列将引导您一步步学习如何使用Unity开发各种类型的游戏。在这第25篇中，我们将探索如何用unity制作一个3D背包、库存、制作、快…

阅读更多...

11.【CPP】模版（深入理解模版的实例化，从编译链接的原理理解模版为何无法分离编译）

11.【CPP】模版（深入理解模版的实例化，从编译链接的原理理解模版为何无法分离编译）

非类型模版参数 1.模版参数分为类型模版参数和非类型模版参数，非类型模版参数一般都是整形常量（整形：size_t,int,char等） 2.浮点数、类对象以及字符串是不允许作为非类型模版参数的。非类型模版的参数必须在编译的时候就能确定结…

阅读更多...

leetcode hot100 拆分整数

leetcode hot100 拆分整数

在本题目中，我们需要拆分一个整数n，让其拆分的整数积最大。因为每拆分一次都和之前上一次拆分有关系，比如拆分6可以拆成2x4，还可以拆成2x2x2，那么我们可以采用动态规划来做。首先确定dp数组的含义，这里dp…

阅读更多...

第13章网络 Page744~746 asio核心类 ip::tcp::endPoint

第13章网络 Page744~746 asio核心类 ip::tcp::endPoint

2. ip::tcp::endpoint ip::tcp::socket用于连接TCP服务端的 async_connect()方法的第一个入参是const endpoint_type& peer_endpoint. 此处的类型 endpoint_type 是 ip::tcp::endpoint 在在 ip::tcp::socket 类内部的一个别名。 libucurl 库采用字符串URL表达目标的地…

阅读更多...

LeetCode 100题目（python版本）待续...

LeetCode 100题目（python版本）待续...

一.哈希 1.两数之和题目给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素在答案里不能重复…

阅读更多...

Linux系统上配置网络防火墙的工具iptables 和 ufw 区别详细介绍

Linux系统上配置网络防火墙的工具iptables 和 ufw 区别详细介绍

iptables 和 ufw（Uncomplicated Firewall）都是用于在Linux系统上配置网络防火墙的工具，但它们在用户友好性和使用方式上有所不同。 iptables： iptables 是Linux内核中的一个功能强大的工具，用于设置、…

阅读更多...

百倍量化之ACS和Demarker指标以及混合策略

百倍量化之ACS和Demarker指标以及混合策略

1. ACS指标含义 1.1 ACS指标 ACS策略主要通过计算 ADX（平均方向性移动指数）相对于收盘价的比值及其标准差来分析市场趋势的强度和稳定性。它结合了市场趋势的强度和价格的变动率。如果 acs 的值较大，说明相对于当前价格，市场的趋势强度大；如果这个值较小，则表明相对于当…

阅读更多...

Acwing---846. 树的重心

Acwing---846. 树的重心

树的重心 1.题目2.基本思想3.代码实现 1.题目给定一颗树，树中包含 n n n 个结点（编号 1 ∼ n 1∼n 1∼n）和 n − 1 n−1 n−1 条无向边。请你找到树的重心，并输出将重心删除后，剩余各个连通块中点数的最大值。 …

阅读更多...

【C Primer Plus第六版学习笔记】第十七章高级数据表示

【C Primer Plus第六版学习笔记】第十七章高级数据表示

有基础，进阶用，个人查漏补缺链表：假设要编写一个程序，让用户输入一年内看过的所有电影，要储存每部影片的片名和评级。 #include <stdio.h> #include <stdlib.h> /* 提供malloc()的原型 */ #include <s…

阅读更多...

QEMU源码全解析 —— 内存虚拟化（4）

QEMU源码全解析 —— 内存虚拟化（4）

接前一篇文章： 本文内容参考： 《趣谈Linux操作系统》 —— 刘超，极客时间《QEMU/KVM》源码解析与应用 —— 李强，机械工业出版社 QEMU内存管理模型浅谈QEMU Memory Region 与 Address Space 特此致谢！ QEMU内存…

阅读更多...

el-date-picker 选择年后输出的是Wed Jan 01 2025 00:00:00 GMT+0800 (中国标准时间)

el-date-picker 选择年后输出的是Wed Jan 01 2025 00:00:00 GMT+0800 (中国标准时间)

文章目录问题分析问题在使用 el-date-picker 做只选择年份的控制器时，出现如下问题：el-date-picker选择年后输出的是Wed Jan 01 2025 00:00:00 GMT0800 (中国标准时间)，输出了两次如下分析在 el-date-picker 中，我们使用…

阅读更多...

代码随想录第三十四天

代码随想录第三十四天

第八章贪心算法 part04 ● 860.柠檬水找零 ● 406.根据身高重建队列 ● 452. 用最少数量的箭引爆气球详细布置 860.柠檬水找零本题看上好像挺难，其实挺简单的，大家先尝试自己做一做。 https://programmercarl.com/0860.%E6%9F%A0%E6%…

阅读更多...

数学建模【非线性规划】

数学建模【非线性规划】

一、非线性规划简介通过分析问题判断是用线性规划还是非线性规划线性规划：模型中所有的变量都是一次方非线性规划：模型中至少一个变量是非线性非线性规划在形式上与线性规划非常类似，但在数学上求解却困难很多线性规划有通用的求解准…

阅读更多...

计算机网络之网络安全

计算机网络之网络安全

文章目录 1. 网络安全概述1.1 安全威胁1.1.1 被动攻击1.1.2 主动攻击 1.2 安全服务 2. 密码学与保密性2.1 密码学相关基本概念2.2 对称密钥密码体制2.2.1 DES的加密方法2.2.2.三重DES 2.3 公钥密码体制 3. 报文完整性与鉴别3.1 报文摘要和报文鉴别码3.1.1 报文摘要和报文鉴别码…

阅读更多...

Jenkins面试系列

Jenkins面试系列

1. Jenkins 是什么？ Jenkins是一个开源的、可扩展的持续集成、交付、部署（软件/代码的编译、打包、部署）的基于web界面的平台。允许持续集成和持续交付项目，无论用的是什么平台，可以处理任何类型的构建或持续集成。 2. 为什么使用 Jenkins？ Jenkins是一种使用Java编程语…

阅读更多...

Vim相关配置

Vim相关配置

记录一下有关vim的一些设置，以免电脑寄了不好重新配置 vscodevim 首先是vscode中的vim模式在应用商店中搜索vim插件安装即可然后在setting中添加以下有关vim 的配置 "vim.easymotion": true,"vim.surround": true,"vim.incsearch"…

阅读更多...

最新文章