基于RAG大模型的变电站智慧运维-第十届Nvidia Sky Hackathon参赛作品

第十届Nvidia Sky Hackathon参赛作品

1. 项目说明

变电站是用于变电的设施,主要的作用是将电压转化,使电能在输电线路中能够长距离传输。在电力系统中,变电站起到了极为重要的作用,它可以完成电能的负荷分配、电压的稳定、容错保护等重要功能,是电力系统的重要组成部分。
变电运维操作站是根据无人值班变电站的运行维护 倒闸操作、事故处理、 设备巡视和文明生产管理的需要,在地理位置、供电区域和交通方面适宜对无人值班变电站进行高效、合理的管理而设立的变电运行班组。智慧变电站运维项目基于RAG技术创新构建智能对话机器人,通过 NVIDIA NIM的强大功能,将大模型技术赋能变电运维操作,充分结合远程无人化高清视频和机器人联合巡检等技术,打造变电站智慧运维新范式 。

2. 功能模块

团队将功能分解为3个功能模块和1个辅助模块,其中变电运维知识库,固定巡检点位校验,场景变化判别是3个功能模块。缺陷识别检测辅助判断为辅助模块。整体界面如下图所示:
图 1 UI界面

2.1 变电运维知识库

基于RAG技术搭建变电运维知识库,按照运行维护、事故处理、设备巡视和文明生产管理四部分组织处理文档,全方位监测和解决变电运维领域中可能出现的问题及其成因。采用ai-embed-qa-4对模型进行向量化,使用ai-nemotron-4-340b-instruct"大模型对对话进行生成。
变电运维知识库示例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2固定巡检点位校验

当前,变电站巡检机器人所采用的方式为固定点与预置位相结合的巡检方式,具体而言,是借助自主导航系统抵达指定的巡检点位置,读取云台预置位的相关参数,设定云台的固定角度,进而完成图像信息的采集工作。然而,整个流程处于开环状态,难以控制,并且缺少对采集信息的反馈以及纠正机制。倘若在采集过程中,出现导航位置的偏差、摄像头的赃污、所采集设备位置的偏移,以及相机曝光参数设置不当等情况,均会致使巡检失效。
为此,团队运用 ai-phi-3-vision-128k-instruct大模型对采集的图像进行文本信息描述,实时判别采集设备是否正常采集信息。通过诸如图像是否模糊、曝光是否正常、所拍摄表计是否处于视野中心等一系列 image-to-text 问题,获取有效的信息,达成系统自动对固定巡检点位准确度的校验,主动察觉问题,并及时予以干预。
固定点为校验示例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.3场景变化判别

针对监控远程无人化高清视频,因为其相对固定特性,故设计场景变化判别模块,采用对不同时刻相同同角度拍摄的两张或多张图片进行对比,当出现不同表明场景发生变化,进行事故警报。当前传统模型采用以changenet为主导的场景变化语义检测模型,模型需要依靠大量的人工采集标注,泛化能力差。
本项目采用image-to-text大模型方法进行场景变化判别,具体的,通过ai-microsoft-kosmos-2对输入的两张图片进行文本描述,然后根据文本描述信息比较文本的异同,通过文本异同程度判断场景是否发生变化。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.4 大模型+小模型融合的缺陷检测新范式

变电站的缺陷检测工作极其复杂,在检测过程中,需要面对诸多技术难题和复杂的设备运行状况。当前检测模型主要以yolov8与cascade-rcnn系列模型为主。通常情况下,检测工作会特别注重召回率,然而这却导致了误检率偏高的问题。比如说,在对某些细微的潜在缺陷进行检测时(渗漏油缺陷),为了尽可能多地发现可能存在的缺陷,检测系统会放宽判定标准,从而将一些并非真正缺陷的情况(水渍,阴影)也纳入检测结果之中,使得误检情况屡屡发生。这不仅增加了后续的排查工作量,还可能会对正常的运维工作造成一定的干扰和误导。
因此,为了改善这一状况,我们打算引入大模型语义特性,充分利用大模型的强大逻辑特性,来完成对缺陷检测结果的过滤。通过对检测数据进行深入的语义分析和逻辑推理,大模型能够更加准确地判断哪些是真正的缺陷,哪些是误检。具体流程,输入一张图片,ai-phi-3-vision-128k-instruc大语言模型进行文本生成,本地yolov8小模型进行缺陷检测,将两个结果结合输入ai-nemotron-4-340b-instruct语言大模型进行最后的结果输出。
在这里插入图片描述
在这里插入图片描述

2.5 可视化文本切分

RAG(Retrieval-Augmented Generation,检索增强生成)体系中,可视化文本切分策略占据着至关重要的地位,其重要性主要体现在以下几个方面:
首先,从效率层面来看,将文本进行合理的分割成较小的部分,能够显著降低模型所需处理的文本规模,进而大幅提升处理效率。例如,对于篇幅较长的文本,若不进行切分,模型在处理过程中可能会耗费大量的时间和计算资源。
其次,在语义理解方面,恰当的切分策略能够有效地保留文本的语义完整性和连贯性,从而助力模型更精准、深入地理解文本的内在含义。以复杂的科技文献为例,若切分不当,可能导致关键语义的丢失或曲解。
再者,就检索效果而言,这一策略有助于更精确地检索到与特定问题高度相关的文本片段,显著增强检索的精准度和有效性。例如,在大规模的文本数据库中,准确的切分能提高检索的命中率。
最后,在优化生成结果方面,能够为模型提供更具针对性和有效性的上下文信息,进而从根本上优化生成的结果质量。比如,在进行文本生成任务时,合适的切分所提供的精准上下文能引导模型生成更准确、合理的内容。
项目采用可视化文本切分策略,选取合适的text splitter方法,调优chunk size与overlap的设置,使其更适合变电领域的文本数据切分。工具链接:https://chunvisualization.streamlit.app/,感谢作者:果粒奶优有果粒(哔哩哔哩)
在这里插入图片描述

3.结语

感谢NVIDIA官方和活动组织者,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/45217.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电影购票小程序论文(设计)开题报告

一、课题的背景和意义 随着互联网技术的不断发展,人们对于购票的需求也越来越高。传统的购票方式存在着排队时间长、购票流程繁琐等问题,而网上购票则能够有效地解决这些问题。电影购票小程序是网上购票的一种新型应用,它能够让用户随时随地…

06.截断文本 选择任何链接 :root 和 html 有什么区别

截断文本 对超过一行的文本进行截断,在末尾添加省略号(…)。 使用 overflow: hidden 防止文本超出其尺寸。使用 white-space: nowrap 防止文本超过一行高度。使用 text-overflow: ellipsis 使得如果文本超出其尺寸,将以省略号结尾。为元素指定固定的 width,以确定何时显示省略号…

笔记 4 :linux 0.11 中继续分析 0 号进程创建一号进程的 fork () 函数

(27)本条目开始, 开始分析 copy_process () 函数,其又会调用别的函数,故先分析别的函数。 get_free_page () ; 先 介绍汇编指令 scasb : 以及 指令 sstosd :…

什么是架构设计师?定义、职责和任务,全方位解析需要具备的专业素质

目录 1. 架构设计师的定义 2. 架构设计师的职责和任务 2.1 系统架构设计 2.1.1 模块划分 2.1.2 接口设计 2.1.3 通信方式 2.2 技术选型与决策 2.2.1 技术评估 2.2.2 技术选型 2.2.3 技术决策 2.3 性能优化与调优 2.3.1 性能分析 2.3.2 性能优化 2.3.3 性能调优 …

视图库对接系列(GA-T 1400)十七、视图库对接系列(本级)采集设备获取

背景 这一章的话,我们写写如何获取采集设备获取,之前其实也有说过类似的 就我们订阅的时候如果subscribeDetail=3的话,下级就会主动给我们推送采集设备。但这里的话,是下级主动推,如果下级平台不支持,或者说可能因为某个原因推的不全,怎么办? 我们能否主动获取采集设备…

WPF学习(4) -- 数据模板

一、DataTemplate 在WPF(Windows Presentation Foundation)中,DataTemplate 用于定义数据的可视化呈现方式。它允许你自定义如何展示数据对象,从而实现更灵活和丰富的用户界面。DataTemplate 通常用于控件(如ListBox、…

知识图谱和 LLM:利用 Neo4j 实现大型语言模型

这是关于 Neo4j 的 NaLLM 项目的一篇博客文章。这个项目是为了探索、开发和展示这些 LLM 与 Neo4j 结合的实际用途。 2023 年,ChatGPT 等大型语言模型 (LLM) 因其理解和生成类似人类的文本的能力而风靡全球。它们能够适应不同的对话环境、回答各种主题的问题,甚至模拟创意写…

NSSCTF中24网安培训day1中web的题目

我flag呢 直接查看源代码即可CtrlU [SWPUCTF 2021 新生赛]Do_you_know_http 用Burpsuite抓包,之后在User-agent下面添加XFF头,即X-Forwarded-For:127.0.0.1 [SWPUCTF 2022 新生赛]funny_php 首先是php的弱比较,对于num参数,我们…

hot100 | 十一、二分搜索

1-leetcode35. 搜索插入位置 注意&#xff1a; 看Labuladong的书&#xff0c;知道while的判断符号跟left right的关系 public int searchInsert(int[] nums, int target) {int left 0;int right nums.length - 1;while (left < right) {int mid left (right - left) /…

PostgreSQL日志文件配置,记录所有操作记录

为了更详细的记录PostgreSQL 的运行日志&#xff0c;我们一般需要修改PostgreSQL 默认的配置文件&#xff0c;这里整理了一些常用的配置 修改配置文件 打开 PostgreSQL 配置文件 postgresql.conf。该文件通常位于 PostgreSQL 安装目录下的 data 文件夹中。 找到并修改以下配…

【Qt 基础】绘图

画笔 QPen pen; pen.setWidth(3); // 线条宽度 pen.setColor(Qt::red);// 画笔颜色 pen.setStyle(Qt::DashLine);// 线条样式 pen.setCapStyle(Qt::RoundCap);// 线端样式 pen.setJoinStyle(Qt::BevelJoin);// 连接样式 painter.setPen(pen);线条 线端 连接 画刷 QBrush bru…

Spring容器详细介绍

Spring容器 1 Spring核心容器介绍 问题导入 问题&#xff1a;按照Bean名称获取Bean有什么弊端&#xff0c;按照Bean类型获取Bean有什么弊端&#xff1f; 1.1 创建容器 方式一&#xff1a;类路径加载配置文件 ApplicationContext ctx new ClassPathXmlApplicationContext…

复合类型的字节对齐

引子 #inlcude<stdio.h> struct s{int i;char a: }; struct s sVar {5,A}; int main(void){printf("%d\n",sizeof(sVar)); }问1&#xff1a;上面这个代码的输出结果是多少&#xff1f; 答1&#xff1a; 思考 明明sVar这个结构体就两个元素&#xff0c;5和…

uniapp实现水印相机

uniapp实现水印相机-livePusher 水印相机 背景 前两天拿到了一个需求&#xff0c;要求在内部的oaApp中增加一个卫生检查模块&#xff0c;这个模块中的核心诉求就是要求拍照的照片添加水印。对于这个需求&#xff0c;我首先想到的是直接去插件市场&#xff0c;下一个水印相机…

unity 环形循环切换UI

环形ui管理器 using System.Collections.Generic; using UnityEngine; using UnityEngine.UI; using DG.Tweening; using System.Collections; using Unity.VisualScripting;public class LevelSelector : MonoBehaviour {public GameObject levelButtonPrefab; // 关卡按钮的…

Elasticsearch:介绍 retrievers - 搜索一切事物

作者&#xff1a;来自 Elastic Jeff Vestal, Jack Conradson 在 8.14 中&#xff0c;Elastic 在 Elasticsearch 中引入了一项名为 “retrievers - 检索器” 的新搜索功能。继续阅读以了解它们的简单性和效率&#xff0c;以及它们如何增强你的搜索操作。 检索器是 Elasticsearc…

知识图谱与LLMs:实时图分析(通过其关系的上下文理解数据点)

大型语言模型 (LLM) 极大地改变了普通人获取数据的方式。不到一年前&#xff0c;访问公司数据需要具备技术技能&#xff0c;包括熟练掌握各种仪表板工具&#xff0c;甚至深入研究数据库查询语言的复杂性。然而&#xff0c;随着 ChatGPT 等 LLM 的兴起&#xff0c;随着所谓的检索…

Ubuntu系统安装mysql之后进行远程连接

1.首先要配置数据库允许进行远程连接 1.1 打开MySQL配置文件 /etc/mysql/mysql.conf.d/mysqld.cnf sudo vim /etc/mysql/mysql.conf.d/mysqld.cnf1.2 修改 bind-address 行 #按i进入插入模式 bind-address 0.0.0.0 #按 Esc 键退出插入模式。 #输入:wq 然后按 Enter 保存并退…

React学习笔记02-----

一、React简介 想实现页面的局部刷新&#xff0c;而不是整个网页的刷新。AJAXDOM可以实现局部刷新 1.特点 &#xff08;1&#xff09;虚拟DOM 开发者通过React来操作原生DOM&#xff0c;从而构建页面。 React通过虚拟DOM来实现&#xff0c;可以解决DOM的兼容性问题&#x…

Window10下安装WSL-Ubuntu20.04

1.开启并更新WSL 1.1开启WSL 首先先来看一下电脑是否能够开启WSL:待补充... 然后再来看一下如何开启WSL:win->设置->应用->应用和功能->程序和功能&#xff0c;如下所示&#xff1a; 最后选择启用或关闭Windows功能&#xff0c;开启两个选项&#xff1a;1.Hyper-V…