自然语言处理(NLP)是什么?

NLP(自然语言处理) 和 Phoebe Liu 的简介

您有没有和聊天机器人互动过?或者您是否向虚拟助手,例如 Siri、Alexa 或您车上的车载娱乐系统发出过某些请求?您使用过在线翻译吗?我们大多数人都曾与这些人工智能 (AI) 互动过,我们也从未停止过思考如何便捷地表达我们的需求并获得适当的回应。如果我和Siri说:“hey Siri,今天我失恋了,能放首让我快乐的歌吗?”,下一秒,你的手机开始播放:昨天已是过去明天更多回忆,今天你要嫁给我。你的世界会在那一刻突然吐粉色泡泡吗?但是,如果你听到:分手快乐,祝你快乐.. 你的内心是不是有一万头草泥马飞奔而过,然后立马关机? 但是,只要停下来想一想人类语言的复杂性,机器能够和人类交流难道不是一个奇迹吗? 这一切要归功于自然语言处理。那究竟什么是自然语言处理 (NLP)?自然语言处理是教会计算机如何以人类的方式理解问题并让其给出适当回应的技术。借助 NLP,机器可以学习阅读、解密和解释人类的书面和口头语言,并创建以类似人类的方式描述、概括或解释输入(结构化数据)的叙述。NLP 是您经常与之交互的诸多 AI 解决方案的驱动力,并促成了人类与机器之间的理解。 如今,由于数据访问的巨大进步和计算机技术的提高,NLP 变得越来越受欢迎。  

NLP 技术

NLP 将语言分解为较短的语段,以便理解语段之间的关系以及各语段怎样结合起来产生意义。语言成分有两类:句法(单词在句子中按照语法意义进行排列)和语义(文本所传达的含义)。每一类中都有核心的NLP 技术:

句法分析

以下是机器用于分析句法的一些标准方法:

  • 分割:将一句话分解为较小的语段。
  • 词形还原:将一个词缩小至词基,并将具有相似词基的词组合在一起。
  • 词性标注:指出每个词的词性。
  • 提取词干:删除词的前缀和后缀以获得词根。

请注意,这里只选取了诸多语法分析方法中的一部分。

语义分析

以下是机器用于分析语义的两种流行方法:

  • 命名实体识别:确定预设组(例如人物和地点)并将其分类
  • 词义消歧:根据语境确定词义。

机器可以结合使用上述技术来获取给定文本中的句法和语义。  

自然语言处理能做什么?

什么是自然语言处理

 NLP 的应用场景有很多。它使机器能够执行原本由人类执行的重复性任务,从而帮助扩大与语言相关的任务的规模。许多行业都在使用 NLP,其中较为常见的包括:

  • 社交媒体分析:NLP 可以跟踪与品牌、产品或特定主题有关的情绪,并确定客户如何做出选择。它还可以通过检测政治偏见来过滤虚假新闻。
  • (TTS)文本转语音应用程序: 文本转语音应用程序通过更多方式提供信息以提高包容性,并为呼叫中心、视频游戏和语言教育领域提供更丰富的交互体验。
  • 个人助手和聊天机器人:NLP 使 AI 能够与人们就日常问题和事务进行交流,为人类腾出更多时间来进行更高层次的战略性工作。
  • 搜索结果查询:NLP 在电子商务领域特别有用,它可以帮助确定关键搜索词,从而获得更相关的搜索结果。
  • 语言翻译:NLP 广泛应用于各种语言和方言的翻译。
  • 信息提取:例如,用于医疗保健行业进行患者病历处理时,通过 NLP 进行数据提取对于快速提取关键信息至关重要。

以上只是NLP的一些常见应用场景,还有更多场景我们就不一一道来了。这充分说明了自然语言处理方面已经取得了惊人的进步。NLP 的变革力量将继续为我们与技术的交互增添光彩。随着人机通信差距的进一步缩小,我们必将看到这一领域的更多突破。  

为什么NLP难以实施?

NLP 具有挑战性。为什么自然语言处理难以实施?计算机的基础语言是数百万个 1 和 0 的集合,即“是”和“否”的二进制组合。计算机不会像人类那样在语境中思考,它们只会从逻辑上进行思考。当您对支持 AI 的计算机说话时,这台机器必须以某种方式理解和解释您所说的内容,计算出一个适当的响应,并将该响应转换为人类(或自然)语言,而这一切仅在几毫秒之内就能完成。很难想象实现这一壮举所需的处理能力水平,而计算机一直在这样做。 同样,自然语言的复杂性也不应该被低估。人类以无数种方式表达自己。全世界有数百种语言和方言,而且每种语言,无论是书面的还是口头的,都有自己的语法规则和俚语,并且各不相同。每个人的书写和说话方式也大相径庭。例如,有些人可能讲话口齿不清,或者在书写中使用缩写词。为了使计算机理解所有这些差异,它必须事先遇到过这些差异。它必须接受类似数据的培训。另一个挑战是,训练数据库与预期的应用程序应属于同一个领域。例如,在医疗环境中收集的对话不同于客户所处领域内会发生的对话,这种情况使得数据收集更具挑战性,因为从正确的领域收集数据很困难,但这又是必需的。 这些因素都导致了 NLP 实施中的困难。您必须访问大量的自然语言数据,以便计算机可以进行广泛的交互。为这些交互提供服务并弥合二进制语言与自然语言之间的差距,计算能力至关重要。所以 NLP 直到最近才成为了机器学习中的重要组成部分。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/61250.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ELK安装、部署、调试(三)zookeeper安装,配置

1.准备 java安装,系统自带即可 2.下载zookeeper zookeeper.apache.org上可以下载 tar -zxvf apache-zookeeper-3.7.1-bin.tar.gz -C /usr/local mv apache-zookeeper-3.7.1-bin zookeeper 3.配置zookeeper mv zoo_sample.cfg zoo.cfg /usr/local/zookeeper/con…

微前端:重塑大型项目的前沿技术

引言 随着互联网技术的飞速发展,前端开发已经从简单的页面制作逐渐转变为复杂的应用开发。在这个过程中,传统的前端开发模式已经难以满足大型项目的需求。微前端作为一种新的前端架构模式,应运而生,它旨在解决大型项目中的前端开…

C++-list实现相关细节和问题

前言:C中的最后一个容器就是list,list是可以在常数范围内在任意位置进行插入和删除的序列式容器,并且该容器可以前后双向迭代。list的底层是双向链表结构,双向链表中每个元素存储在互不相关的独立节点中,在节点中通过指…

方面级别情感分析之四元组预测

情感四元组预测现有方法 阅读本文之前我们默认你对情感分析有基本的认识。 如果没有请阅读文章(https://tech.tcl.com/post/646efb5b4ba0e7a6a2da6476) 情感分析四元组预测涉及四个情感元素: 方面术语a,意见术语(也叫观点术语)o, 方面类别ac&#xff0c…

0基础学习VR全景平台篇 第93篇:智慧景区教程

一、上传素材 1.上传全景素材 第一步:进入【素材管理】 第二步:选择【全景图智慧景区】分类 第三步:选择相对景区作品分组,上传全景素材 2.素材标注 第一步:选择上传成功后素材,点击【未标注】 第二步&…

15-数据结构-二叉树的遍历,递归和非递归

简介: 本文主要是代码实现,二叉树遍历,递归和非递归(用栈)。主要为了好理解,直接在代码处,加了详细注释,方便复习和后期默写。主要了解其基本思想,为后期熟练应用…

VMware 设置仅主机模式无法访问外网的问题说明

参考链接 VMware仅主机模式访问外网 如果根据以上参看仍旧无法访问物理机网段其他设备以及无法访问外网,可以尝试在虚拟机上根据 vmnet1 网卡设置的 ip 地址添加默认路由,如下图所示: 首先查看对应网卡设置的 ip 地址 然后在虚拟机上执行如…

为什么别的职业都是越老越值钱,唯独程序员越老越容易失业?

因为其他职业都是技术稀缺型产业,而程序员却是技术密集型产业。 那些越老越值钱的职业有一个特征:越资深越稀缺,靠技术经验积累或是人脉资源吃饭,如医生、律师、老师等,而程序员这一职业的技术经验、人脉资源的积累相对…

git-tf clone 路径有空格处理方案

git-tf clone 路径存在空格情况下,运行命令报错; 需要对路径进行双引号处理

应用TortoiseSVN的SubWCRev管理VisualStudio C#项目编译版本号

首先要安装 TortoiseSVN, 并确保TortoiseSVN的bin目录被加入到系统环境变量Path中。 1、拷贝Porperties目录下的文件AssemblyInfo.cs生成副本AssemblyInfo.template, 作为版本管理的模板文件。 2、修改模板文件中的想要管理的版本号信息 // [assembly: AssemblyVersion(&quo…

MySQL 日期格式 DATETIME 和 TIMESTAMP

MySQL日期格式介绍 存储日期的方式mysql中存储日期的格式datetimetimestampDatetime和Timestamp的比较相同点:不同点: 数值型时间戳(INT)DATETIME vs TIMESTAMP vs INT,怎么选? 存储日期的方式 字符串Date…

EasyAVFilter的初衷:把ffmpeg.c当做SDK来用,而不是当做EXE来用

之前我们做一个视频点播的功能,大概的流程就是将上传上来的各种格式的视频,用FFmpeg统一进行一次转码,如果probe到视频的编码格式是H.264就调用-vcodec copy,如果probe到视频的编码格式不是H.264就调用-vcodec libx264&#xff0c…

SSH远程连接macOS服务器:通过cpolar内网穿透技术实现远程访问的设置方法

文章目录 前言1. macOS打开远程登录2. 局域网内测试ssh远程3. 公网ssh远程连接macOS3.1 macOS安装配置cpolar3.2 获取ssh隧道公网地址3.3 测试公网ssh远程连接macOS 4. 配置公网固定TCP地址4.1 保留一个固定TCP端口地址4.2 配置固定TCP端口地址 5. 使用固定TCP端口地址ssh远程 …

kali的学习

网络配置 1.kali的网络设置 首先我们了解kali的网络设置 DHCP:动态主机配置协议 是一个局域网的协议 使用UDP 协议工作静态IP:用于大部分的中小型网络 通过网络管理员手动分配IP原理进程 /etc 系统大部分服务启动过程都要访问该目录 我们直接去看看…

算法笔记:球树

1 KD树的问题 算法笔记:KD树_UQI-LIUWJ的博客-CSDN博客 在kd树中,导致性能下降的最核心因素是因为kd-tree中被分割的子空间是一个个的超方体,而求最近邻时使用的是欧式距离(超球)。超方体与超球体相交的可能性是极高…

keepalived + lvs (DR)

目录 一、概念 二、实验流程命令 三、实验的目的 四、实验步骤 一、概念 Keepalived和LVS(Linux Virtual Server)可以结合使用来实现双机热备和负载均衡。 Keepalived负责监控主备服务器的可用性,并在主服务器发生故障时,将…

maven可用的插件列表

maven可用的插件列表:https://maven.apache.org/plugins/ 在插件列表页面找到自己想要了解的插件,点击进去,可以看到插件的详细信息,例如这个插件有哪些goals,goal的参数、用法、样例等,还是很有用的。 B…

​LeetCode解法汇总57. 插入区间

目录链接: 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目: https://github.com/September26/java-algorithms 原题链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 描述: 给你一个 …

自动化测试之unittest框架

unittest 1、什么是Unittest框架? python自带一种单元测试框架 2、为什么使用UnitTest框架? >批量执行用例 >提供丰富的断言知识 >可以生成报告 3、核心要素 1).TestCase(测试用例) 2).TestSuite(测试套件)…

用Idea把SpringBoot项目打包镜像上传至docker

1、设置docker把2375端口开起来 命令查看docker装在哪里 vim docker.service 新增 -H tcp://0.0.0.0:2375 -H unix://var/run/docker.sock 2、配置Dockerfile 我在跟pom同一层 3、配置docker-maven-plugin <plugin><groupId>com.spotify</groupId><arti…