NLP技术发展和相关书籍分享

自然语言处理(Natural Language Processing,NLP)是计算机科学领域和人工智能领域的重要研究方向之一,旨在探索实现人与计算机之间用自然语言进行有效交流的理论与方法。它融合了语言学、计算机科学、机器学习、数学、认知心理学等多学科内容,涉及从字、词、短语到句子、段落、篇章的多种语言单位,以及处理、理解、生成等不同层面的知识点,研究内容涉及的知识点多且复杂。自 20 世纪 90 年代以来,自然语言处理发展迅猛,各类任务和算法和研究范式层出不穷,在搜索引擎、医疗、金融、教育、司法等众多领域展示出重要作用。下面是NLP的发展历程:

  1. 起源与基础:

    • NLP 技术起源于计算机科学、人工智能和语言学的交叉领域。

    • 早期的 NLP 主要集中在基本的文本处理任务,如分词、词性标注和句法分析。

  2. 统计方法的兴起:

    • 随着统计方法在机器学习领域的兴起,NLP 开始采用统计模型,如隐马尔可夫模型(HMM)和条件随机场(CRF)等。

    • 统计方法带来了更好的性能和效果,使得 NLP 在文本分类、信息检索和情感分析等任务上取得了重大进展。

  3. 深度学习的革新:

    • 进入21世纪后,深度学习技术的崛起彻底改变了 NLP 领域。

    • 基于神经网络的模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)和注意力机制(Attention)等,大幅提升了 NLP 任务的性能和复杂度。

    • 著名的模型包括词嵌入模型(如 Word2Vec、GloVe)、序列到序列模型(Seq2Seq)和Transformer等。

  4. 预训练模型的兴起:

    • 近年来,预训练模型如BERT、GPT和RoBERTa等预语言模型的出现,引领了 NLP 技术的新发展。

    • 这些模型通过大规模语料库的预训练,使得 NLP 在各种任务上都取得了巨大的突破,如语义理解、文本生成和问答系统等。

  5. 大语言模型以及多模态融合:

    • 大语言模型如ChatGPT以其庞大的参数规模和深度学习涌现能力,在自然语言处理领域展现出卓越的理解、生成和推理能力。

    • 最新的发展趋势是将多模态信息(文本、图像、语音等)结合到 NLP 技术中。

    • 这种融合使得 NLP 可以更全面地理解和处理多源信息,推动了领域的进一步发展和创新。

随着时间的推移,NLP技术经历了从基于规则到基于统计再到基于深度学习的发展历程,如今正处于预训练大语言模型和多模态大语言模型的新阶段。未来,我们可以期待更多创新和突破,为NLP技术带来更大的进步和应用。

更有学者从专业的角度,系统地分析和阐述了自然语言处理的基本概念和简要历史,以及基础技术、核心技术和模型分析。下面分享的这本书是:

《自然语言处理导论》

  • 作者:复旦大学的张奇、桂韬和黄萱菁老师

  • 这本书的电子版和PPT在2023年7月就已经开放给大家免费下载,本书作者们都长期从事自然语言处理方面的教学和科研工作,积累了丰富的经验,用了近三年时间多次对内容和结构的讨论和修改,终于在2023年初完成了初稿。书中第一部分讨论的是语言学中的问题,按处理对象粒度从小到大,依次为词汇分析、句法分析、语义分析、篇章分析和语言模型。第二部分分别介绍自然语言处理的主要应用及相应的技术,包括信息抽取、机器翻译、情感分析、智能问答、文本摘要和知识图谱。

PS:上面书籍PDF电子稿和PPT可以通过关注下面公众号,并留言“NLP”关键字获取^_^.。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/843400.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

外卖系统源码解读:校园外卖APP开发全攻略

外卖系统源码解读:校园外卖APP开发全攻略 今天,小编将深入解读外卖系统的源码,详细介绍如何开发一款功能齐全的校园外卖APP,帮助开发者快速上手,打造出高质量的外卖应用。 一、需求分析 应具备以下基本功能&#xff…

idea的project structure下project [lauguage ]()level 没有java的sdk17选项如何导入

idea的project structure下project lauguage level 没有java的sdk17选项如何导入 别导入了,需要升级idea版本。idea中没有project language level没有17如何添加 - CSDN文库 别听这文章瞎扯淡 2021版本就是没有,直接卸载升级到最新版本就可以了。没办法…

AcWing 2568:树链剖分 ← 线段树+DFS

【题目来源】https://www.acwing.com/problem/content/2570/【题目描述】 给定一棵树,树中包含 n 个节点(编号 1∼n),其中第 i 个节点的权值为 ai。 初始时,1 号节点为树的根节点。 现在要对该树进行 m 次操作&#xf…

央视网视频下载和花屏问题处理

央视网(www.cctv.com)视频下载往往是花屏的,如何处理呢? 如果您是IT技术开发者,那么您可以通过下面步骤自己实现。 用chrome浏览器,F2打开开发者工具,找到当前页面的network 然后找一个接口:https://vdn.a…

文生图模型演进:AE、VAE、VQ-VAE、VQ-GAN、DALL-E 等 8 模型

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集&#x…

OC IOS 文件解压缩预览

热很。。热很。。。。夏天的城市只有热浪没有情怀。。。 来吧,come on。。。 引用第三方库: pod SSZipArchive 开发实现: 一、控制器实现 头文件控制器定义: // // ZipRarViewController.h // // Created by carbonzhao on 2…

OTFS系统建模、通信性能分析、信道估计、模糊函数【附MATLAB代码】

文献来源:​微信公众号:EW Frontier OTFS简介 OTFS信道估计 % Clear command window, workspace variables, and close all figures clc; clear all; close all; ​ % Define Eb values in dB EbdB -10:2:10; ​ % Convert Eb values from dB to lin…

【测评】香橙派 AIpro上手初体验

AI毋庸置疑是近年来,热度最高的技术之一,作为一名工程师拥抱新技术的同时不可或缺的需要一块强悍的开发板,香橙派 AIpro除了拥有好看的皮囊之外,还拥有一个有趣且充满魅力的灵魂。作为一位长期活跃在嵌入式开发领域的工程师&#…

OrangePi AIpro (8T)使用体验,性能测试报告

前言 这段时间收到了CSDN和香橙派的邀请,对OrangePi AIpro进行体验测评,在此感谢CSDN对我的信任,也感谢香橙派能做出如此优秀的开发板。 可喜可贺,周三晚上我收到了官方寄出的OrangePi AIpro。出于对国产芯片的好奇&#xff0c…

二分答案思想下的二进制问题

序列合并 题目描述 给定一个长度为 n n n 的非负整数序列 { a n } \{a_n\} {an​},你可以进行 k k k 次操作,每次操作你选择两个相邻的数,把它们合并成它们的按位或。 形式化地,一次操作中,你选择一个下标 i i …

李廉洋:5.29黄金原油持续震荡,今日美盘行情走势分析及策略。

黄金消息面分析:美联储理事鲍曼周二表示,她支持要么先等等再开始放缓缩减资产负债表,要么采取比本月早些时候宣布的更温和的放慢缩表进程。鲍曼认为商业银行准备金水平仍然充足,这让官员们有更多时间来推进缩表进程。“在准备金接…

你的手机是如何控制你的手表之广播篇

前言 要让手机能够控制手表,第一步当然要让手机能够“看见”手表,人类作为上帝视角,我们是能够通过眼睛直接看见手机和手表的,但要让手机“看见”手表,就需要一端把自己的信息通过电磁波的形式发往空中,另…

Excel中怎样将第一行建立好的规则套用到每一行?

考虑使用条件格式来完成,有两种方式可以尝试: 一、一次性创建条件格式 1.选中需要设置条件格式的区域,如果是不连续的区域,可以按住Ctrl键,然后用鼠标依次选中需要的数据区域 2.点击 开始选项卡,条件格式…

解决Plugin ‘maven-clean-plugin:3.1.0‘ not found的问题

1. 问题描述 当导入别人的Maven项目时,可能会出现Plugin maven-clean-plugin:3.1.0 not found的错误信息。 2. 解决方案 2.1 方案一 检查自己的Maven仓库地址是否正确,一般引入其他人的项目时,Maven仓库的目录以及配置都会是别人的&#xff…

Broker的主从架构

为了保证MQ的数据不丢失而且具备一定的高可用性,所以一般都是得将Broker部署成Master-Slave模式的,也就是—个Master Broker对应一个Slave Broker Master需要在接收到消息之后,将数据同步给Slave,这样一旦Master Broker挂了&#…

新能源汽车为乙炔炭黑行业带来了发展机遇

新能源汽车为乙炔炭黑行业带来了发展机遇 乙炔炭黑(Acetylene carbon black)又称乙炔黑,外观为黑色极细粉末,相对密度1.95(氮置换法),纯度很高,含碳量大于99.5%,氢含量小…

Java 泛型 <? super T> 中 super 怎么 理解?与 extends 有何不同?

作者:zhang siege 链接:https://www.zhihu.com/question/20400700/answer/91106397 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 首先,泛型的出现时为了安全,所有与…

VSCode安装platformio插件

文章目录 一、安装VSCode二、安装platformio(一)整理文件夹(二)整理Python环境(三)安装platformio 三、创建ESP8266项目四、使用命令行创建项目五、创建项目太久怎么办六、参考链接 一、安装VSCode VSCode…

AIGC笔记--基于PEFT库使用LoRA

1--相关讲解 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS LoRA 在 Stable Diffusion 中的三种应用:原理讲解与代码示例 PEFT-LoRA 2--基本原理 固定原始层,通过添加和训练两个低秩矩阵,达到微调模型的效果; 3--简单代…

AIGC 009-DaLLE2遇见达利!文生图过程中另外一种思路。

AIGC 009-DaLLE2遇见达利!文生图过程中另外一种思路。 0 论文工作 首先,遇见达利是我很喜欢的名字,达利是跟毕加索同等优秀的画家。这个名字就很有意思。 这篇论文提出了一种新颖的分层文本条件图像生成方法,该方法利用 CLIP&…