NLP技术发展和相关书籍分享

自然语言处理(Natural Language Processing,NLP)是计算机科学领域和人工智能领域的重要研究方向之一,旨在探索实现人与计算机之间用自然语言进行有效交流的理论与方法。它融合了语言学、计算机科学、机器学习、数学、认知心理学等多学科内容,涉及从字、词、短语到句子、段落、篇章的多种语言单位,以及处理、理解、生成等不同层面的知识点,研究内容涉及的知识点多且复杂。自 20 世纪 90 年代以来,自然语言处理发展迅猛,各类任务和算法和研究范式层出不穷,在搜索引擎、医疗、金融、教育、司法等众多领域展示出重要作用。下面是NLP的发展历程:

  1. 起源与基础:

    • NLP 技术起源于计算机科学、人工智能和语言学的交叉领域。

    • 早期的 NLP 主要集中在基本的文本处理任务,如分词、词性标注和句法分析。

  2. 统计方法的兴起:

    • 随着统计方法在机器学习领域的兴起,NLP 开始采用统计模型,如隐马尔可夫模型(HMM)和条件随机场(CRF)等。

    • 统计方法带来了更好的性能和效果,使得 NLP 在文本分类、信息检索和情感分析等任务上取得了重大进展。

  3. 深度学习的革新:

    • 进入21世纪后,深度学习技术的崛起彻底改变了 NLP 领域。

    • 基于神经网络的模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)和注意力机制(Attention)等,大幅提升了 NLP 任务的性能和复杂度。

    • 著名的模型包括词嵌入模型(如 Word2Vec、GloVe)、序列到序列模型(Seq2Seq)和Transformer等。

  4. 预训练模型的兴起:

    • 近年来,预训练模型如BERT、GPT和RoBERTa等预语言模型的出现,引领了 NLP 技术的新发展。

    • 这些模型通过大规模语料库的预训练,使得 NLP 在各种任务上都取得了巨大的突破,如语义理解、文本生成和问答系统等。

  5. 大语言模型以及多模态融合:

    • 大语言模型如ChatGPT以其庞大的参数规模和深度学习涌现能力,在自然语言处理领域展现出卓越的理解、生成和推理能力。

    • 最新的发展趋势是将多模态信息(文本、图像、语音等)结合到 NLP 技术中。

    • 这种融合使得 NLP 可以更全面地理解和处理多源信息,推动了领域的进一步发展和创新。

随着时间的推移,NLP技术经历了从基于规则到基于统计再到基于深度学习的发展历程,如今正处于预训练大语言模型和多模态大语言模型的新阶段。未来,我们可以期待更多创新和突破,为NLP技术带来更大的进步和应用。

更有学者从专业的角度,系统地分析和阐述了自然语言处理的基本概念和简要历史,以及基础技术、核心技术和模型分析。下面分享的这本书是:

《自然语言处理导论》

  • 作者:复旦大学的张奇、桂韬和黄萱菁老师

  • 这本书的电子版和PPT在2023年7月就已经开放给大家免费下载,本书作者们都长期从事自然语言处理方面的教学和科研工作,积累了丰富的经验,用了近三年时间多次对内容和结构的讨论和修改,终于在2023年初完成了初稿。书中第一部分讨论的是语言学中的问题,按处理对象粒度从小到大,依次为词汇分析、句法分析、语义分析、篇章分析和语言模型。第二部分分别介绍自然语言处理的主要应用及相应的技术,包括信息抽取、机器翻译、情感分析、智能问答、文本摘要和知识图谱。

PS:上面书籍PDF电子稿和PPT可以通过关注下面公众号,并留言“NLP”关键字获取^_^.。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/843400.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++中的异常处理

文章目录 前言一、异常处理的代码实现二、异常规范总结 前言 异常处理是一种在软件开发中用于处理程序运行时错误的机制。在C中,异常处理的基本思想是将异常情况与正常情况进行区分,当异常情况发生时,程序不会继续执行下去,而是转…

外卖系统源码解读:校园外卖APP开发全攻略

外卖系统源码解读:校园外卖APP开发全攻略 今天,小编将深入解读外卖系统的源码,详细介绍如何开发一款功能齐全的校园外卖APP,帮助开发者快速上手,打造出高质量的外卖应用。 一、需求分析 应具备以下基本功能&#xff…

idea的project structure下project [lauguage ]()level 没有java的sdk17选项如何导入

idea的project structure下project lauguage level 没有java的sdk17选项如何导入 别导入了,需要升级idea版本。idea中没有project language level没有17如何添加 - CSDN文库 别听这文章瞎扯淡 2021版本就是没有,直接卸载升级到最新版本就可以了。没办法…

关系型数据库的三范式理解

关系型数据库的三范式(Third Normal Form,3NF)是数据库设计中的一种规范化理论,用于减少数据冗余和提高数据一致性。三范式是建立在第一范式(1NF)和第二范式(2NF)的基础上的。以下是…

MySQL之创建高性能的索引(四)

创建高性能的索引 空间数据索引(R-Tree) MyISAM表支持空间索引,可以用作地理数据存储。和B-Tree索引不同,这类索引无须前缀查询。空间索引会从所有维度来索引数据。查询时,可以有效地使用任意维度来组合查询。必须使用MySQL的GIS相关函数如…

AcWing 2568:树链剖分 ← 线段树+DFS

【题目来源】https://www.acwing.com/problem/content/2570/【题目描述】 给定一棵树,树中包含 n 个节点(编号 1∼n),其中第 i 个节点的权值为 ai。 初始时,1 号节点为树的根节点。 现在要对该树进行 m 次操作&#xf…

5.28总结

HTML 三剑客&#xff1a; JS CSS HTML 入门实例 新建一个test.html文件&#xff0c;内容如下 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-wi…

央视网视频下载和花屏问题处理

央视网(www.cctv.com)视频下载往往是花屏的&#xff0c;如何处理呢&#xff1f; 如果您是IT技术开发者&#xff0c;那么您可以通过下面步骤自己实现。 用chrome浏览器&#xff0c;F2打开开发者工具&#xff0c;找到当前页面的network 然后找一个接口&#xff1a;https://vdn.a…

【Python-基础】字典合集

遍历所有键 # vis_params{vis_level: -1, line_thickness: 500} for key in vis_params.keys():注&#xff1a; vis_params &#xff1a; 字典数据 未完待续…

Android UI:ViewTree: 监听

文章目录 涉及设计模式 ​​​​​​​​​​​​​​观察者模式+策略模式API源码分析总结涉及设计模式 观察者模式+策略模式 被观察者:ViewTree ViewTree持有一个观察器ViewTreeObserver 系统在ViewRootImpl和View的相关方法中调用ViewTreeObserver上的注册的监听器的方法,…

文生图模型演进:AE、VAE、VQ-VAE、VQ-GAN、DALL-E 等 8 模型

节前&#xff0c;我们星球组织了一场算法岗技术&面试讨论会&#xff0c;邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集&#x…

OC IOS 文件解压缩预览

热很。。热很。。。。夏天的城市只有热浪没有情怀。。。 来吧&#xff0c;come on。。。 引用第三方库&#xff1a; pod SSZipArchive 开发实现&#xff1a; 一、控制器实现 头文件控制器定义&#xff1a; // // ZipRarViewController.h // // Created by carbonzhao on 2…

JavaScript与版本控制:编译时光机的双重奏——git仓库

JavaScript与版本控制&#xff1a;编译时光机的双重奏——git仓库 JavaScript&#xff1a;代码的魔法棒版本控制&#xff1a;时光机的钥匙案例一&#xff1a;初始化Git仓库与基本操作初始化仓库添加文件至暂存区提交更改分支管理 案例二&#xff1a;JavaScript项目中的Gitignor…

OTFS系统建模、通信性能分析、信道估计、模糊函数【附MATLAB代码】

文献来源&#xff1a;​微信公众号&#xff1a;EW Frontier OTFS简介 OTFS信道估计 % Clear command window, workspace variables, and close all figures clc; clear all; close all; ​ % Define Eb values in dB EbdB -10:2:10; ​ % Convert Eb values from dB to lin…

【测评】香橙派 AIpro上手初体验

AI毋庸置疑是近年来&#xff0c;热度最高的技术之一&#xff0c;作为一名工程师拥抱新技术的同时不可或缺的需要一块强悍的开发板&#xff0c;香橙派 AIpro除了拥有好看的皮囊之外&#xff0c;还拥有一个有趣且充满魅力的灵魂。作为一位长期活跃在嵌入式开发领域的工程师&#…

OrangePi AIpro (8T)使用体验,性能测试报告

前言 这段时间收到了CSDN和香橙派的邀请&#xff0c;对OrangePi AIpro进行体验测评&#xff0c;在此感谢CSDN对我的信任&#xff0c;也感谢香橙派能做出如此优秀的开发板。 可喜可贺&#xff0c;周三晚上我收到了官方寄出的OrangePi AIpro。出于对国产芯片的好奇&#xff0c…

二分答案思想下的二进制问题

序列合并 题目描述 给定一个长度为 n n n 的非负整数序列 { a n } \{a_n\} {an​}&#xff0c;你可以进行 k k k 次操作&#xff0c;每次操作你选择两个相邻的数&#xff0c;把它们合并成它们的按位或。 形式化地&#xff0c;一次操作中&#xff0c;你选择一个下标 i i …

前端 webSocket配置代理

vue, react. nginx 配置反向代理&#xff0c;解决跨域问题 前端请求 如果配置了 wss 协议&#xff0c; 可以将ws 替换为 wss 这里和我们通常使用的方式不同websocket 需要传入完整的地址&#xff0c;然后才能去做代理 let url ${location.protocol https ? wss : ws}://$…

李廉洋:5.29黄金原油持续震荡,今日美盘行情走势分析及策略。

黄金消息面分析&#xff1a;美联储理事鲍曼周二表示&#xff0c;她支持要么先等等再开始放缓缩减资产负债表&#xff0c;要么采取比本月早些时候宣布的更温和的放慢缩表进程。鲍曼认为商业银行准备金水平仍然充足&#xff0c;这让官员们有更多时间来推进缩表进程。“在准备金接…

unity 多个相机的问题

前段时间写个小功能&#xff0c;发现个问题在scene里面写好了程序&#xff0c;但是导出后显示的和场景里面完全不一样经过查找后发现&#xff0c;原来是我购买的模型下面他自己带了一个相机&#xff0c;在打包出去后&#xff0c;显示的是这个相机的渲染内容。只要把这个相机删除…