自然语言处理,基于预训练语言模型的方法,车万翔,引言部分

文章目录

  • 自然语言处理应用任务
    • 1. 信息抽取
    • 2. 情感分析
    • 3. 问答系统
    • 4. 机器翻译
    • 5. 对话系统

自然语言处理应用任务

1. 信息抽取

信息抽取(Information Extraction, IE),是从非结构化的文本中,抽取出结构化信息的过程,通常包含以下这些子任务

在这里插入图片描述
下面举一个例子,来说明这些子任务分别是干什么的,以及它们之间的差别是什么。
在这里插入图片描述
不同信息抽取子任务,抽取的结果如下方表格所示:

信息抽取子任务抽取结果
命名实体识别公司名:AMD
公司名:赛灵思
关系抽取赛灵思 ⇒ 从属于 \xRightarrow{\text{从属于}} 从属于 AMD
时间表达式抽取10月28日
时间表达式归一化10月28日 → \xrightarrow{} 2020年10月28日
事件抽取事件:收购
时间:2020年10月28日
收购者:AMD
被收购者:赛灵思
被收购金额:350亿美元
  • 命名实体识别可以实现从文本中抽取出子串“AMD”和“赛灵思”,并标注出它们的类型均为“公司名”。
  • 关系抽取在命名实体识别的基础上,进一步挖掘不同实体之间的关系,在本文中可以挖掘出AMD和赛灵思的关系为母公司和子公司的关系。
  • 时间表达式抽取,可以抽取出原文中的日期和时间,本文中就是10月28日。
  • 时间表达式归一化是为了使时间表达式抽取的结果更加规范化,“10月28日”毕竟是个比较模糊的日期,应该能够进一步识别出它是“2020年的10月28日”这种特定的日期。
  • 事件抽取以一种结构化的方式,抽取出整个收购事件的来龙去脉,类似于对多种实体抽取任务进行一种组合。这里可以抽取出与收购事件相关的所有信息,如时间,收购者,被收购者,被收购金额等。

2. 情感分析

情感(Sentiment)是人类重要的心理认知能力,使用计算机自动感知和处理人类情感已经成为人工智能领域重要的研究内容之一。自然语言处理中的情感分析主要研究人类通过文字表达的情感,因此也称为文本情感分析。但是,情感又是一个相对比较笼统的概念,既包括个体对外界事物的态度、观点或倾向性,如正面、负面等;又可以指人自身的情绪(Emotion),如喜、怒、哀和惧等。随着互联网的迅速发展,产生了各种各样的用户生成内容(User Generated Content,UGC),其中很多内容包含着人们的喜怒哀惧等情感,对这些情感的准确分析有助于了解人们对某款产品的喜好,随时掌握舆情的发展。
因此,情感分析成为目前自然语言处理技术的主要应用之一。
在这里插入图片描述
在这里插入图片描述
情感分类主要注重识别文本中的情感类型或者情感强度,而情感信息抽取主要注重识别文本中的评价词,评价对象,以及二者之间的搭配。

3. 问答系统

问答系统的主要分类以及简要介绍
问答系统的主要分类以及简要介绍

4. 机器翻译

随着全球化和互联网的普及,不同语言之间的交流变得日益重要。目前全球约有7,000种语言,其中超过300种拥有超过100万使用者。语言障碍成为国际交流的一个挑战。机器翻译,作为克服这一难题的有效技术手段,旨在实现不同语言间的自动翻译,促进无障碍交流。自然语言处理领域的发展推动了机器翻译技术的进步。近年来,谷歌、百度等公司推出了在线机器翻译服务,而科大讯飞等公司则推出了能将语音从一种语言翻译成另一种语言的翻译机,这些进展为不同语言使用者之间的交流提供了便利。
图片描述
机器翻译自诞生以来,主要围绕理性主义和经验主义两种方法进行研究。“理性主义”是基于规则的方法,“经验主义”是数据驱动的统计方法。近年来兴起的基于深度学习的机器翻译方法利用深度神经网络学习源语言句子到目标语言句子的隐式翻译规则,即所有的翻译规则都被编码在神经网络的模型参数中。该方法又被称为神经机器翻译(Neural MachineTranslation,NMT)。

5. 对话系统

在这里插入图片描述
在这里插入图片描述
开放域对话系统类似于一个娱乐型聊天机器人,而非是某个领域的专家。为了取悦用户,机器人应该能够与用户源源不断地对话,提供的回答应该多种多样,最好类似于一个专业的人类陪聊,提高用户的满意度。

在这里插入图片描述
任务型对话系统往往是为了服务于用户,完成用户要求的某项特定任务而存在的。
例如我们使用Siri进行订票。我们会说“Siri,订一张明天去北京的机票”。
Siri会首先解析并理解用户的请求,分析用户的语义,获得用户的领域为机票,意图为订机票,并将关键信息存入槽值构成的列表。
之后,Siri在和用户的不断对话中,会不断跟踪当前用户语义和状态,例如用户想将机票从北京改到上海,Siri会在槽值中,将到达地所在槽对应的值修改为上海。此外,Siri会根据当前用户语义和状态,利用语义计算进行决策,决定下一步应该做什么,即给出什么回答。
最后,Siri会选择一个适当的模板来生成问题,比如使用模板“请问您从哪里出发?”然后把这个问题直接问用户。这种方法比较简单,因为模板是固定的,只需要在适当的时候选择合适的模板就可以了。生成的文本之后会传递给文本到语音(TTS)模块。TTS模块的作用是把文本转换成语音,这样用户就可以听到计算机发出的声音,而不仅仅是看到屏幕上的文字。这样一来,对话系统就能通过语音与用户进行互动了。
简而言之,NLG负责创建文本消息,TTS负责将这些文本消息转换为用户可以听到的语音消息。
由于用户与Siri的对话是多轮对话,会一直持续下去直至满足用户需求,以上三个流程会循环往复,直至满足用户需要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/661252.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 单一附合导线平差程序

一、以下图附合导线为例,图形如下: 二、第一步,读取测量数据,读取界面设计如下: 读取数据文本文件格式如下: (1)已知点坐标数据格式: (2)角度观测…

【C++杂货铺】详解类和对象 [下]

个人博客:代码菌-CSDN博客 专栏:C杂货铺_代码菌的博客-CSDN博客 目录 🌈前言🌈 📁 初始化列表(灰常重要) 📂 引入 📂 概念 📂 特性 📁 拓展构…

51单片机编程应用(C语言):数码管

目录 1.数码管原理 一位数码管引脚定义: 四位一体数码管: 多个数码管同时显示不同数字 51单片机的数码管的原理图 51单片机实现静态显示和动态显示 静态显示: 动态显示: 1.数码管原理 一位数码管引脚定义: 数码…

外包干了10个月,技术退步明显...

先说一下自己的情况,大专生,18年通过校招进入武汉某软件公司,干了接近4年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落! 而我已经在一个企业干了四年的功能测…

【代码随想录】LC 349. 两个数组的交集

文章目录 前言一、题目1、原题链接2、题目描述 二、解题报告1、思路分析2、时间复杂度3、代码详解 前言 本专栏文章为《代码随想录》书籍的刷题题解以及读书笔记,如有侵权,立即删除。 一、题目 1、原题链接 349. 两个数组的交集 2、题目描述 二、解题报…

C语言实战项目<贪吃蛇>

我们这篇会使用C语言在Windows环境的控制台中模拟实现经典小游戏贪吃蛇 实现基本的功能: 结果如下: 1.一些Win32 API知识 本次实现呢我们会用到一些Win32 API的知识(WIN32 API也就是Microsoft Windows 32位平台的应用程序编程接口): 1)控制窗口大小 我们可以使用…

【Qt学习笔记】(二)信号和槽

信号和槽 1 信号和槽概述2 信号和槽的使用3 可视化生成槽函数4 自定义信号和槽5 带参数的信号和槽6 信号与槽的连接方式7 信号与槽的断开8 使用 Lambda 表达式来定义槽函数 1 信号和槽概述 在Qt中,用户和控件的每次交互过程称为一个事件。比如"用户点击按钮&q…

实时时钟芯片DS1307单片机C语言驱动程序

实时时钟RTC相关索引 1.单片机RTC及时钟芯片的时间到底从哪一年起始? 2.STM32F103单片机内部RTC实时时钟驱动程序 3.实时时钟芯片DS1302单片机C语言驱动程序 4.实时时钟芯片DS1307单片机C语言驱动程序 一、DS1307简介 DS1307是一款非易失性实时时钟(R…

【Java程序设计】【C00209】基于SSM个人求职管理系统(论文+PPT)

基于SSM个人求职管理系统(论文PPT) 项目简介项目获取开发环境项目技术运行截图 项目简介 这个一个基于SSM的个人求职管理系统,本系统共分为三种权限:管理员、普通管理员、用户 管理员:首页、个人中心、用户管理、管理…

go并发编程-介绍与Goroutine使用

1. 并发介绍 进程和线程 A. 进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中的多个…

Go语言的100个错误使用场景(11-20)|项目组织和数据类型

前言 大家好,这里是白泽。 《Go语言的100个错误以及如何避免》 是最近朋友推荐我阅读的书籍,我初步浏览之后,大为惊喜。就像这书中第一章的标题说到的:“Go: Simple to learn but hard to master”,整本书通过分析100…

DevSecOps 参考模型介绍

目录 一、参考模型概述 1.1 概述 二、参考模型分类 2.1 DevOps 组织型模型 2.1.1 DevOps 关键特性 2.1.1.1 模型特性图 2.1.1.2 特性讲解 2.1.1.2.1 自动化 2.1.1.2.2 多边协作 2.1.1.2.3 持续集成 2.1.1.2.4 配置管理 2.1.2 DevOps 生命周期 2.1.2.1 研发过程划分…

leetcode刷题(剑指offer)54.螺旋矩阵

54.螺旋矩阵 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: 输入:matrix [[1,2,3],[4,5,6],[7,8,9]] 输出:[1,2,3,6,9,8,7,4,5]示例 2: 输入:ma…

Java基础-集合框架

集合框架: 内存层面可考虑的数据存储容器:数组,集合 数组的特点:长度,存储元素类型确定,既可以放基本数据类型,也可以放引用数据类型 缺点:长度不可变,存储元素特点单…

从零开始 Linux(一):基础介绍与常用指令总结

从零开始 Linux 01. 概念理解 1.1 什么是 Linux? Linux 是一个开源免费的 操作系统,具有很好的稳定性、安全性,且有很强的处理高并发的能力 Linux 的应用场景: 可以在 Linux 下开发项目,比如 JavaEE、大数据、Python…

3D词云图

工具库 tagcanvas.min.js vue3&#xff08;框架其实无所谓&#xff0c;都可以&#xff09; 实现 <script setup> import { onMounted, ref } from vue; import ./tagcanvas.min.js;const updateFlag ref(false);// 词云图初始化 const initWordCloud () > {let …

RabbitMQ快速实战

目录 什么是消息队列&#xff1f; 消息队列的优势 应用解耦 异步提速 削峰填谷 总结 主流MQ产品特点比较 Rabbitmq快速上手 创建用户admin Exchange和Queue Connection和Channel RabbitMQ中的核心概念总结 什么是消息队列&#xff1f; MQ全称Message Queue&#xf…

Spring5深入浅出篇:Spring中ioc(控制反转)与DI(依赖注入)

Spring5深入浅出篇:Spring中ioc(控制反转)与DI(依赖注入) 反转(转移)控制(IOC Inverse of Control) 控制&#xff1a;对于成员变量赋值的控制权 反转控制&#xff1a;把对于成员变量赋值的控制权&#xff0c;从代码中反转(转移)到Spring⼯⼚和配置⽂件中完成好处&#xff1a;…

七、并发工具(上)

一、自定义线程池 1&#xff09;背景&#xff1a; 在 QPS 量比较高的情况下&#xff0c;我们不可能说所有的访问都创建一个线程执行&#xff0c;这会导致内存占用过高&#xff0c;甚至有可能出现 out of memory另外也要考虑 cpu 核数&#xff0c;如果请求超过了cpu核数&#…

【bitonicSort学习】

bitonicSort学习 什么是Bitonic Sort核心 什么是Bitonic Sort https://zhuanlan.zhihu.com/p/53963918 这个是用来并行排序的一个操作 之前学过一些CPU排序&#xff0c;快排 冒泡 归并啥的&#xff0c;有一些能转成并行&#xff0c;有一些不适合 像快排这种二分策略就可以考虑…