如何使用大语言模型进行事件抽取与关系抽取

诸神缄默不语-个人CSDN博文目录

文章目录

  • 1. 什么是事件抽取与关系抽取?
  • 2. 示例:使用大语言模型进行事件抽取与关系抽取

1. 什么是事件抽取与关系抽取?

事件抽取是指从文本中识别出与某些“事件”相关的信息。这些事件通常包括动作、参与者、时间、地点等关键信息。

关系抽取则是从文本中识别并提取不同事件之间的关联,常见的关系包括因果关系和时序关系等。

2. 示例:使用大语言模型进行事件抽取与关系抽取

在本博文中,我们将通过一个简单的示例来展示如何使用智谱AI进行事件抽取和关系抽取。
对智谱AI的更多使用方式介绍可参考我撰写的另一篇博文:如何调用GLM-4 API实现智能问答

示例代码:

import logging
from zhipuai import ZhipuAI
import csv
import json# 初始化客户端
client = ZhipuAI(api_key="YOUR_ZHIPU_API_KEY"  # 替换为你的API密钥
)# 初始化日志记录
logging.basicConfig(filename=r"event_extraction_logs\process_log.log",  # 日志文件名level=logging.INFO,  # 设置日志级别format="%(asctime)s - %(levelname)s - %(message)s",  # 日志格式
)# 用户提示模板:事件抽取 + 关系抽取
user_prompt = """Based on the following example, extract events and their related attributes (主体、客体、触发词、时间、地点) as well as relationships (因果关系、时序关系) from the provided text.# EVENT EXTRACTION EXAMPLE:
Input text:
"甲公司在2023年5月成功收购了乙公司,导致了双方在市场上的竞争加剧。"Output:
{"事件抽取": [{"事件1": "甲公司收购乙公司","参与主体": "甲公司","参与客体": "乙公司","触发词": "收购","时间": "2023年5月","地点": "无"},{"事件2": "竞争加剧","参与主体": "甲公司、乙公司","参与客体": "市场","触发词": "加剧","时间": "无","地点": "市场"}],"关系抽取": [{"因果关系": {"因事件": "甲公司收购乙公司","果事件": "竞争加剧"}},{"时序关系": {"事件1": "甲公司收购乙公司","事件2": "竞争加剧"}}]
}Input text:
"2024年4月,华为公司宣布将进入新能源汽车市场,并计划在未来三年内投资100亿人民币。"
Output:
{"事件抽取": [{"事件1": "华为公司进入新能源汽车市场","参与主体": "华为公司","参与客体": "新能源汽车市场","触发词": "进入","时间": "2024年4月","地点": "新能源汽车市场"},{"事件2": "投资100亿人民币","参与主体": "华为公司","参与客体": "100亿人民币","触发词": "投资","时间": "未来三年","地点": "无"}],"关系抽取": [{"因果关系": "无"},{"时序关系": {"事件1": "华为公司进入新能源汽车市场","事件2": "投资100亿人民币"}}]
}Input text:
"2024年6月,张三开始在甲公司工作,接着他于2024年7月参与了一个重要项目,并在项目结束后的2024年9月晋升为经理。"
Output:
{"事件抽取": [{"事件1": "张三开始在甲公司工作","参与主体": "张三","参与客体": "甲公司","触发词": "开始","时间": "2024年6月","地点": "甲公司"},{"事件2": "张三参与了重要项目","参与主体": "张三","参与客体": "重要项目","触发词": "参与","时间": "2024年7月","地点": "无"},{"事件3": "张三晋升为经理","参与主体": "张三","参与客体": "经理","触发词": "晋升","时间": "2024年9月","地点": "无"}],"关系抽取": [{"因果关系": {"因事件": "张三开始在甲公司工作","果事件": "张三参与了重要项目"}},{"因果关系": {"因事件": "张三参与了重要项目","果事件": "张三晋升为经理"}},{"时序关系": {"前事件": "张三开始在甲公司工作","后事件": "张三参与了重要项目"}},{"时序关系": {"前事件": "张三参与了重要项目","后事件": "张三晋升为经理"}}]
}# Input text:
{specification}# Output:
"""# 系统提示
system_prompt = """You are a text information extraction engineer specializing in event extraction and relationship extraction.
Your task is to:
1. Extract events and their attributes: "事件", "参与主体", "参与客体", "触发词", "时间", "地点".
2. Identify relationships between events: "因果关系" and "时序关系".
Return the output as a JSON object with two main sections: "事件抽取" and "关系抽取".
"""# 定义函数:调用 ZhipuAI 接口进行事件抽取
def extract_events_and_relations(text):message = [{"role": "user", "content": user_prompt.replace("{specification}", text)},{"role": "assistant", "content": system_prompt},]try:response = client.chat.completions.create(model="glm-4", messages=message, temperature=0.2  # 替换为你要使用的模型名称)return response.choices[0].message.content.strip()except Exception as e:logging.error(f"Error while calling API: {e}")return None# 主逻辑:读取 CSV 文件并进行事件抽取
def process_csv(input_csv_path, output_json_path):results = []# 读取 CSV 文件with open(input_csv_path, mode="r", encoding="utf-8") as csv_file:csv_reader = csv.reader(csv_file)header = next(csv_reader)  # 跳过表头# 遍历每一行文本进行事件抽取for row in csv_reader:if row:  # 确保该行不为空text = row[0]  # 假设文本位于 CSV 的第一列logging.info(f"Processing text: {text}")extracted_info = extract_events_and_relations(text)if extracted_info:try:# 将结果解析为 JSONparsed_info = json.loads(extracted_info)results.append(parsed_info)except json.JSONDecodeError:logging.error(f"Failed to parse JSON for text: {text}")logging.error(f"Response content: {extracted_info}")results.append({"str": extracted_info})# 保存结果到 JSON 文件with open(output_json_path, mode="w", encoding="utf-8") as json_file:json.dump(results, json_file, ensure_ascii=False, indent=4)logging.info(f"事件抽取完成,结果已保存到 {output_json_path}")# 主程序入口
if __name__ == "__main__":input_csv_path = (r"event_extraction_data\input_data.csv"  # 输入的 CSV 文件路径)output_json_path = r"event_extraction_output\output_events.json"  # 输出的 JSON 文件路径logging.info("Starting process...")process_csv(input_csv_path, output_json_path)logging.info("任务完成!")

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/891769.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NAT网络技术

NAT(Network Address Translation,网络地址转换)是一种常用的网络技术,主要用于在私有网络和公共网络之间转换IP地址。在家庭和小型企业网络当中用的比较多。它的主要功能有IP地址重用和增强网络的安全性。   NAT允许一个整个网…

SpringBoot框架开发中常用的注解

文章目录 接收HTTP请求。RestController全局异常处理器Component依赖注入LombokDataBuildersneakyThrowsRequiredArgsConstructor 读取yml文件配置类注解 接收HTTP请求。 RequestMapping 接收HTTP请求。具体一点是 GetMapping PostMapping PutMapping DeleteMapping 一共…

FFmpeg(音视频处理的瑞士军刀)开发实战指南

【欢迎关注编码小哥,学习更多实用的编程方法和技巧】 FFmpeg开发实战指南 1. FFmpeg简介 开源多媒体处理框架支持音视频编解码跨平台(Windows/Linux/Mac) 2. 环境准备 2.1 安装FFmpeg # Ubuntu sudo apt-get install ffmpeg libavcodec-…

洛谷B4071 [GESP202412 五级] 武器强化

题目传送门! 思路 我愿称之为gesp5史上最难想。。。 做法:贪心模拟(or二分) 对于贪心算法来说,最最最无法理解的地方:选择价格最低的配件来转换,还是选择拥有最多配件的其他武器来转换。 选…

TVS二极管选型【EMC】

TVS器件并联在电路中,当电路正常工作时,他处于截止状态(高阻态),不影响线路正常工作,当线路处于异常过压并达到其击穿电压时,他迅速由高阻态变为低阻态,给瞬间电流提供一个低阻抗导通…

qt鼠标右键菜单

来看一个小例子 // 重写鼠标右键事件 void QtGuiApplication2::mousePressEvent(QMouseEvent* event) {if (event->button() Qt::RightButton){m_pMenuRD->exec(QCursor::pos());} } 鼠标右键启动菜单,菜单里面有啥呢? // 先来声明一下 // 右键…

用C++使用带头单向非循环链表,实现一个哈西桶

用C使用带头单向非循环链表,实现一个哈西桶 在C中使用带头单向非循环链表来实现哈希桶是一种常见的做法,特别是在实现哈希表时。哈希桶是哈希表的基本存储单元,用于存储具有相同哈希值的元素。以下是一个简单的示例,展示了如何使用…

Azkaban其二,具体使用以及告警设置

目录 Azkaban的使用 1、使用Flow1.0(比较老旧) 2、Flow2.0的用法 1、小试牛刀 2、YAML格式的数据 3、多任务依赖 4、内嵌流(嵌套流)案例 5、动态传参 3、Azkaban的报警机制 1)邮箱通知 2)电话报警机制 4、关…

文档 | Rstudio下的轻量级单页面markdown阅读器 markdownReader

需求:在写R数据分析项目的时候,代码及结果的关键变化怎么记录下来?最好git能很容易的跟踪版本变化。 markdown 是最理想的选择,本文给出一种Rstuidio下的轻量级md阅读器实现:markdownReader。书写md还是在Rstudio。更…

SonarQube相关的maven配置及使用

一、maven 全局配置 <settings><pluginGroups><pluginGroup>org.sonarsource.scanner.maven</pluginGroup></pluginGroups><profiles><profile><id>sonar</id><activation><activeByDefault>true</acti…

Arduino Uno简介与使用方法

目录 一、Arduino Uno概述 1. 硬件特性 2. 开发环境 二、Arduino Uno的基本使用方法 1. 硬件连接 2. 软件编程 三、Arduino Uno编程基础 1. 基本语法 2. 常用函数 四、Arduino Uno应用举例 1. LED闪烁 2. 温度检测 3. 超声波测距 五、Arduino Uno的扩展与应用 1…

UniApp | 从入门到精通:开启全平台开发的大门

UniApp | 从入门到精通:开启全平台开发的大门 一、前言二、Uniapp 基础入门2.1 什么是 Uniapp2.2 开发环境搭建三、Uniapp 核心语法与组件3.1 模板语法3.2 组件使用四、页面路由与导航4.1 路由配置4.2 导航方法五、数据请求与处理5.1 发起请求5.2 数据缓存六、样式与布局6.1 样…

【人工智能】Python实现时序数据预测:ARIMA与LSTM的对比

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 时序数据预测是数据科学中的一个重要任务,广泛应用于金融市场预测、天气预报、销售预测等领域。常见的时序数据预测方法包括传统统计学模型…

滑动窗口。

1456 定长子串中元音的最大数目 采用滑动窗口。每次移动一个位置&#xff0c;判断当前窗口内的子串内目标元素的个数&#xff0c;若比之前更大就更新结果。 如何判断是否更新结果&#xff1f;也即&#xff0c;如何判断当前窗口内所含目标元素个数&#xff0c;是否为遍历到这个…

公共数据授权运营系统建设手册(附下载)

在全球范围内&#xff0c;许多国家和地区已经开始探索公共数据授权运营的路径和模式。通过建立公共数据平台&#xff0c;推动数据的开放共享&#xff0c;促进数据的创新应用&#xff0c;不仅能够提高政府决策的科学性和公共服务的效率&#xff0c;还能够激发市场活力&#xff0…

java 常量池详解

目录 java 常量池详解一 静态常量池&#xff08;Static Constant Pool&#xff09;1.1 概述1.2 存储内容1.3 特点1.4 示例 二 运行时常量池&#xff08;Runtime Constant Pool&#xff09;2.1 概述2.2 存储内容2.3 特点2.4 示例 三 基础类型常量池&#xff08;Primitive Type C…

电脑主机后置音频插孔无声?还得Realtek高清晰音频管理器调教

0 缘起 一台联想电脑&#xff0c;使用Windows 10 专业版32位&#xff0c;电脑主机后置音频插孔一直没有声音&#xff0c;所以音箱是接在机箱前面版的前置音频插孔上的。 一天不小心捱到了音箱的音频线&#xff0c;音频线头断在音频插孔里面了&#xff0c;前置音频插孔因此用不…

【微服务】1、引入;注册中心;OpenFeign

微服务技术学习引入 - 微服务自2016年起搜索指数持续增长&#xff0c;已成为企业开发大型项目的必备技术&#xff0c;中高级java工程师招聘多要求熟悉微服务相关技术。微服务架构介绍 概念&#xff1a;微服务是一种软件架构风格&#xff0c;以专注于单一职责的多个响应项目为基…

UDP_TCP

目录 1. 回顾端口号2. UDP协议2.1 理解报头2.2 UDP的特点2.3 UDP的缓冲区及注意事项 3. TCP协议3.1 报头3.2 流量控制2.3 数据发送模式3.4 捎带应答3.5 URG && 紧急指针3.6 PSH3.7 RES 1. 回顾端口号 在 TCP/IP 协议中&#xff0c;用 “源IP”&#xff0c; “源端口号”…

《Spring Framework实战》2:Spring快速入门

欢迎观看《Spring Framework实战》视频教程 Spring快速入门 目录 1. Java™开发套件&#xff08;JDK&#xff09; 2. 集成开发人员环境&#xff08;IDE&#xff09; 3. 安装Maven 4. Spring快速入门 4.1. 开始一个新的Spring Boot项目 4.2. 添加您的代码 4.3. 尝…