“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

“智能语音指令解析“ 基于NLP与语音识别的工单关键信息提取

    • 1. 背景介绍
      • 1.1 场景痛点
      • 1.2 方案选型
    • 2. 准备开发环境
    • 3. PaddleSpeech 语音识别快速使用
    • 4. PaddleNLP 信息抽取快速使用
    • 5. 语音工单信息抽取核心功能实现
    • 6. 语音工单信息抽取网页应用
      • 6.1 网页前端
      • 6.2 网页后端
      • 6.3 aistudio服务演示
      • 6.4 启动服务
      • 6.5 构造Post请求测试
    • 服务

本文将介绍如何利用 PaddleSpeech 的语音识别技术与 PaddleNLP 的通用信息抽取技术,实现基于智能语音指令解析的关键工单信息提取。我们将通过语音交互的方式,在交通报销场景下实现智能信息抽取,以提高工作效率与质量。

1. 背景介绍

智能语音指令解析集成了语音识别(ASR)与信息抽取(IE)等技术,广泛应用于智能语音填单、语音交互、手机APP语音唤醒等场景,提高人机交互效率。其中,智能语音填单可通过口述记录信息,并利用算法解析口述内容中的关键信息,完成自动信息录入。

1.1 场景痛点

  • 电话分析:边询问边记录,容易遗漏关键信息,例如社区疫情防控信息记录。
  • 工单生成:特定场景下无法完成文字录入,如电力路线巡检工作人员在高空巡检高压电线路。
  • 信息登记:重复性工作效率低易出错,例如汽车售后客服话务员每天接听大量电话。

针对以上场景,利用PaddleSpeech的语音识别技术和PaddleNLP的信息抽取技术,可以自动识别和抽取语音中的关键信息,帮助简化记录流程,提高工作效率和质量。

1.2 方案选型

  • PaddleSpeech语音识别模型:包含多种领先国际水平的语音算法与预训练模型,提供简单易用的语音识别功能。
  • PaddleNLP通用信息抽取模型(UIE):支持实体识别、关系和事件抽取、情感分析等多种信息抽取任务,具有良好的泛化效果。

2. 准备开发环境

安装PaddleSpeech与PaddleNLP:

!pip install paddlespeech
!pip install paddlenlp

下载必要数据包与示例音频,并进行初始化设置。

3. PaddleSpeech 语音识别快速使用

通过PaddleSpeech调用语音识别方法简单易行:

from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="ie.wav", force_yes=True)
print(result)

4. PaddleNLP 信息抽取快速使用

利用PaddleNLP提供的信息抽取能力,直接调用Taskflow API进行预测:

from paddlenlp import Taskflowschema = ["时间", "出发地", "目的地", "费用"]
ie = Taskflow("information_extraction", schema=schema, task_path="/home/aistudio/work")ie_result = ie(result)
print(ie_result)

5. 语音工单信息抽取核心功能实现

将语音识别与信息抽取功能进行串联,实现语音工单信息抽取的核心功能模块:

def audio_ie(audio_path):asr_result = asr(audio_file=audio_path, force_yes=True)ie_result = ie(asr_result)return ie_resultaudio_ie("ie.wav")

6. 语音工单信息抽取网页应用

构建网页应用,通过前后端交互实现语音工单信息抽取的服务。

6.1 网页前端

利用Vue框架,结合js-audio-recorder库实现网页前端的录音功能。

6.2 网页后端

利用FastAPI框架搭建后端服务,核心功能为语音信息抽取函数。

6.3 aistudio服务演示

在aistudio中,通过FastAPI搭建网页应用,模拟网页调用语音工单信息提取的后端服务。
在这里插入图片描述

6.4 启动服务

启动FastAPI服务,提供后端服务支持。

6.5 构造Post请求测试

通过requests库构造Post请求,模拟调用语音工单信息提取的后端服务。

通过以上步骤,你可以快速上手使用PaddleSpeech与PaddleNLP实现语音工单信息提取的应用,提高工作效率与质量。

服务

🛠 博主提供一站式解决方案,让您的工作变得更加轻松、高效!以下是我们提供的服务:

  1. 代部署

    🚀 为您提供快速、稳定的部署方案。无论是您的应用程序、网站还是其他软件项目,我们都可以帮助您将其部署到适当的平台上。

  2. 课程设计选题

    📚 为您量身定制符合课程要求和学生需求的选题方案。无论是基础课程还是高级课程,我们都能够为您提供专业的建议和支持。

  3. 线上辅导

    💻 提供线上辅导服务,为您提供个性化的指导和支持,帮助您解决在学习、工作或研究中遇到的各种问题和困难。
    如有需求,请随时私信

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/705717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# Onnx yolov8-obb 旋转目标检测

目录 效果 模型信息 项目 代码 下载 C# Onnx Yolov8-OBB 旋转目标检测 效果 模型信息 Model Properties ------------------------- date:2024-02-26T08:38:44.171849 description:Ultralytics YOLOv8s-obb model trained on runs/DOTAv1.0-ms.ya…

解决:“出现问题,Outlook 无法设置你的账户”

原文:https://blog.iyatt.com/?p14213 1 问题描述 Office 专业版 2024 预览版 在 Outlook 输入邮箱后无法进一步配置登录信息(腾讯企业邮箱 Exchange 登录) 2 解决方法 通过控制面板里的邮箱设置可以正常添加登录,而且能…

【总第49篇】2.3深度学习开发任务实例(2)机器学习和深度学习的对比【大厂AI课学习笔记】

机器学习和深度学习都是用于图片分类任务的强大工具,但它们采用的方法和原理有所不同。下面我将分别解释这两种技术是如何应用于图片分类的,并着重讨论深度学习中的卷积概念。 机器学习在图片分类中的应用 传统的机器学习方法在进行图片分类时&#xf…

用GGUF和Llama .cpp量化Llama模型

用GGUF和Llama .cpp量化Llama模型 什么是GGML如何用GGML量化llm使用GGML进行量化NF4 vs. GGML vs. GPTQ结论 由于大型语言模型(LLMS)的庞大规模,量化已成为有效运行它们的必要技术。通过降低其权重的精度,您可以节省内存并加快推理…

多模态表征—CLIP及中文版Chinese-CLIP:理论讲解、代码微调与论文阅读

我之前一直在使用CLIP/Chinese-CLIP,但并未进行过系统的疏导。这次正好可以详细解释一下。相比于CLIP模型,Chinese-CLIP更适合我们的应用和微调,因为原始的CLIP模型只支持英文,对于我们的中文应用来说不够友好。Chinese-CLIP很好地…

Linux使用Docker部署在线协作白板WBO并结合内网穿透发布公网远程访问

文章目录 前言1. 部署WBO白板2. 本地访问WBO白板3. Linux 安装cpolar4. 配置WBO公网访问地址5. 公网远程访问WBO白板6. 固定WBO白板公网地址 前言 WBO在线协作白板是一个自由和开源的在线协作白板,允许多个用户同时在一个虚拟的大型白板上画图。该白板对所有线上用…

【Vue3】插槽使用和animate使用

插槽使用 插槽slot匿名插槽具名插槽插槽作用域简写 动态插槽transition动画组件自定义过渡class类名如何使用animate动画库组件动画生命周期appear transition- group过渡列表 插槽slot 插槽就是子组件中提供给父组件使用的一个占位符父组件可以在这个占位符智能填充任何模板代…

SpringBoot -【BeanPostProcessor】基础使用及应用场景

BeanPostProcessor应用与优化 1. 引言 在现代软件开发中,企业开发面临着越来越复杂的系统架构和业务需求。随着项目规模的扩大和技术栈的增多,需要更高效的工具来应对这些挑战,并确保代码的可维护性和扩展性。 在这样的背景下,Be…

滴滴在合规宽限期内不能出车,滴滴平台会怎么处罚

滴滴合规宽限期内违规出车,平台严惩不贷! 滴滴合规政策回顾 滴滴出行作为国内领先的出行平台,始终致力于为用户提供安全、合规的出行服务。为了保障乘客权益,滴滴对司机和车辆都有严格的合规要求。在合规宽限期内,滴…

MySQL的SQL语句

1.MySQL连接 连接命令一般是这样写的 mysql -h$ip -P$port -u$user -p比如:mysql -h127.0.0.1 -P3306 -uroot -p -h 指定连接的主机地址;-P 指定连接端口号;-u 指定用户名 -p指定用户名密码 2.SQL分类 DDL(Data Definition Language) 数据定义语言&…

动态规划的时间复杂度优化

作者推荐 视频算法专题 本文涉及知识点 动态规划汇总 优化动态规划的时间复杂度,主要有如下几种: 一,不同的状态表示。 比如:n个人,m顶帽子。 第一种方式:dp[i][mask] ,i表示前i个人已经选择帽子&…

再见,Visual Basic——曾经风靡一时的编程语言

2020年3月,微软团队宣布了对Visual Basic(VB)的“终审判决”:不再进行开发或增加新功能。这意味着曾经风光无限的VB正式退出了历史舞台。 VB是微软推出的首款可视化编程软件,自1991年问世以来,便受到了广大…

国际生物发酵产品技术展2024-齐力控股

参展企业介绍 齐力控股集团凭借在此领域多年的生产经验,为客户提供各种优质的产品。齐力控股集团与世界同步的生产宗旨,确立完整的角色定位和明确方向,向大众传递本公司的营销特点和服务模式。本公司是一家集科研、生产为一体的现代企业&…

如何进行Appium实现移动端UI自动化测试?

🍅 视频学习:文末有免费的配套视频可观看 🍅 关注公众号【互联网杂货铺】,回复 1 ,免费获取软件测试全套资料,资料在手,涨薪更快 Appium是一个开源跨平台移动应用自动化测试框架。 既然只是想学…

瑞_Redis_Redis客户端

文章目录 1 Redis客户端1.1 Redis命令行客户端1.2 图形化桌面客户端1.2.1 资源准备1.2.2 安装1.2.3 建立连接 🙊 前言:本文章为瑞_系列专栏之《Redis》的基础篇的Redis客户端章节。由于博主是从B站黑马程序员的《Redis》学习其相关知识,所以本…

Spring11、整合Mybatis

11、整合Mybatis 步骤&#xff1a; 导入相关jar包 junit <dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.12</version> </dependency> mybatis <dependency><groupId>org.my…

Qt QWidget 简约美观的加载动画 第二季

&#x1f603; 第二季来啦 &#x1f603; 简约的加载动画,用于网络查询等耗时操作时给用户的提示. 这是最终效果: 一共只有三个文件,可以直接编译运行 //main.cpp #include "LoadingAnimWidget.h" #include <QApplication> #include <QVBoxLayout> #i…

如何保护企业免受人工智能网络钓鱼攻击

文章目录 前言一、生成式人工智能带来了新的网络安全威胁二、人工智能将使网络钓鱼攻击变得更加危险三、企业如何阻止人工智能驱动的网络钓鱼四、网络钓鱼模拟确保责任感和适应性前言 网络钓鱼是网络犯罪分子社会工程武器库中的超级武器。网络钓鱼尤其危险,因为它是网络犯罪分…

Redis 管道详解

Redis 管道 关键词&#xff1a;Pipeline Pipeline 简介 Redis 是一种基于 C/S 模型以及请求/响应协议的 TCP 服务。通常情况下&#xff0c;一个 Redis 命令的请求、响应遵循以下步骤&#xff1a; 客户端向服务端发送一个查询请求&#xff0c;并监听 Socket 返回&#xff08…

美创科技荣获“2023年网络安全国家标准优秀实践案例”

近日&#xff0c;全国网络安全标准化技术委员会正式公布2023年网络安全国家标准优秀实践案例获奖名单。 杭州美创科技股份有限公司&#xff08;以下简称&#xff1a;美创科技&#xff09;申报的“GB/T 20281-2020《信息安全技术 防火墙安全技术要求和测试评价方法》在政企领域数…