大模型改变了NLP的游戏规则了吗

NLP已经死了吗?

自从 ChatGPT 横空出世以来,自然语言处理(Natural Language Processing,NLP) 研究领域就出现了一种消极的声音,认为大模型技术导致 NLP “死了”。在某乎上就有一条热门问答,大家热烈地讨论了这个问题。

228cca5cdb4b9752373ed7affade2c3f.png

有人认为 NLP 的市场肯定有,但 NLP 的研究会遇到麻烦,因为大模型的训练建立在海量数据与超高算力之上,普通研究者难以获取这样的资源,只能做些应用研究;也有人认为大模型为 NLP 打开了一片新天地,NLP 的研究整体上会再上一个新台阶。

看看专家们怎么说,上海交通大学 ACM 班创办人俞勇教授等几位 AI 学界大咖认为,不了解过去,就无法理解当下。NLP 技术的发展历经了几十年,期间经历了多次重大技术革新,如果我们的讨论脱离历史发展,那是没有意义的。

所以俞勇教授等大佬们决心为 NLP 技术编写一本在历史和现代之间更加平衡的教科书——《动手学自然语言处理》,这本书将为我们讲透 NLP 的经典技术,梳理整个领域的发展脉络,启发我们思考 NLP 的未来。

8f23861247c70909a56a36e469697fde.png

点击下方即可购书,限时特惠

https://item.jd.com/14544280.html

 本书书课包同步上线,可以点击书课一起购买,更高效哦!

30c7b977f887cac0389e7ef141959ae1.jpeg

点击图片购买书课包

现在,让我们探究一下 NLP 的发展历程。

NLP 迎来新时代

NLP 的发展之路充满了探索与创新,2013年前后,基于符号系统和统计学习的方法主导着 NLP 研究的潮流。研究者通过制定复杂的规则和使用统计模型,尽力使计算机能够理解和生成自然语言。

然而,这种方法在处理复杂的语言结构和语义理解上存在着一定的局限性,难以适应不断增长的数据规模和复杂的语言任务。随着深度学习技术的兴起,特别是深度神经网络的发展,NLP 研究迈上了新台阶。

深度学习模型强大的表征学习能力,使得计算机可以更好地理解和处理自然语言,在诸多 NLP 任务上取得了突破性的进展。这一时期,神经网络模型开始成为 NLP 研究的主流,为文本分类、情感分析、机器翻译等任务提供了更加高效和灵活的解决方案。

真正让 NLP 脱胎换骨的是 2018 年,基于 Transfomer 架构的预训练语言模型崛起。预训练模型利用大规模语料库进行无监督学习,为各种 NLP 任务提供了强大的基础。

到 2022 年底,ChatGPT 的发布引发了前所未有的热潮。ChatGPT 不仅拥有惊人的生成能力,而且能够进行有意义的对话和语言理解,自然语言处理进入新时代。

 

b3a92253ec414e3207a1dea525b62e34.png

NLP 的快速发展也为专业教学带来考验,一方面是已有教材在技术层面过时了,另一方面是市场上的一些新书只关注神经自然语言处理,不涉及传统技术。《动手学自然语言处理》就弥补了这两个缺憾,将带领我们温故而知新。

本书的作者团队堪称豪华,我们来认识一下。

 

7b3557ea37ab4fd77162cbb65ebcb075.png

屠可伟

上海科技大学信息科学与技术学院长聘副教授、研究员、博士生导师。研究方向包括自然语言处理、机器学习等,主要研究将符号、统计和神经方法相结合用于语言结构的表示、学习与利用。发表论文100余篇,主要发表在ACL、EMNLP、AAAI 等人工智能领域顶级会议。担任多个顶级会议程序委员会委员和领域主席。曾获 ACL 2023 杰出论文奖,以及 SemEval 2022 和 SemEval 2023 最佳系统论文奖。

 

28f0942c324ad4a1bf0d3fa279fb4f98.png

王新宇

上海科技大学博士,长期从事自然语言处理研究工作,在 ACL、EMNLP、NAACL 等顶级会议上发表论文10余篇,担任ACL、NAACL 会议的领域主席以及ACL滚动审查(ACL Rolling Review)执行编辑。曾获得中国中文信息学会优秀博士学位论文提名、SemEval 2022 最佳系统论文奖等荣誉。

 

38d9025e1f46c9a5a210d0ca53e9225f.png

曲彦儒

伊利诺伊大学厄巴纳-香槟分校博士生,长期从事自然语言处理研究工作,在 ACL、NAACL、AAAI、ICLR 等会议上发表了多篇论文。

 

8ba41b1b378dfeee55c99b825156e213.png

俞勇

上海交通大学 ACM 班创始人,国家级教学名师,上海交通大学特聘教授。2018 年创办伯禹人工智能学院,在上海交通大学ACM 班人工智能专业课程体系的基础上,对人工智能课程体系进行创新,致力于培养卓越的人工智能算法工程师和研究员。

有如此多的名师指点,学透 NLP 只需要走好三步。

玩转NLP要走好这三步

在学习本书的内容之前,读者需要具备一些基础知识,包括基本的数学概念和机器学习的基础知识,如概率论、概率图模型、神经网络等。如果你已经准备好了,那我们继续前进。

本书将 NLP 的知识分为三部分,分别是基础、序列、结构

第一步:基础

从最基础的自然语言处理技术入手,讲解了文本规范化、文本表示、文本分类和文本聚类等内容。通过学习这些基础知识,读者可以了解如何将文本转化为计算机可以理解和处理的形式,以及如何对文本进行分类和聚类,为后续的学习打下坚实的基础。

第二步:序列

书中深入探讨了自然语言的序列建模技术,包括语言模型、序列到序列模型、预训练语言模型和序列标注等内容。

通过学习这些内容,读者将了解对文本序列进行概率建模的方法。书中还介绍了预训练语言模型将语言模型和序列到序列模型在大量数据上进行预训练,获取通用语言学知识的过程。

这部分内容是本书的重点,涵盖了当前应用最广泛的自然语言处理技术。读者可以学习到构成大模型的基础技术,包括循环神经网络、注意力机制、Transformer 模型。书中对这些知识点给出了详尽的代码说明,帮助读者全盘消化掌握。

 

5f55c77408062993d20676fc75ddef13.png

第三步:结构

书中探讨了自然语言文字序列背后更为复杂的结构,包括句法结构、语义结构和篇章结构等内容。

学习这些知识,读者可以了解句子中词语之间的连接关系、文本表达含义的结构化表示,以及多个句子如何组合形成段落和文章,从而更深入地理解和应用自然语言处理技术。

这部分内容曾经是自然语言处理的主流技术,也很有可能是未来自然语言处理的重要发展方向,读者可以在这里探索将来的发展机会。

把这三步走好,读者就摸透了 NLP 技术,可以在工作中大显身手了。

特色介绍

NLP 的研究方法也许会改变,但是 NLP 的应用市场会更加广阔。学习 NLP 不仅要追踪热门技术,也要透彻了解 NLP 发展的来龙去脉,《动手学自然语言处理》就可以很好地帮助读者通盘掌握 NLP。

本书最大的特色就是理论与实践紧密结合,提供了大量的配套学习资源。我们来看一下究竟可以获得哪些资源:纸书 + 可以扫码观看的理论视频课 + 配套课件方便教学 + 课后习题 + 配套代码(可在线运行也可离线运行)+ 配套代码实战课 + 针对高校教师的师资培训计划。

这几乎就是背靠一个强大的后勤军团,读者根本不用担心学习中会遇到困难,只要将这些资源善加利用,定能啃透 NLP 技术。

如书名中的“动手学”所示,本书给读者提供了极其便利的学习环境,每一章都由一个 Python Notebook 组成, Notebook 中包括概念定义、理论分析、方法讲解和可执行代码。读者可根据自己的需要学习理论,或者动手实践。

 

6d91f4c5877f3b3a3829d145deedf096.png

精彩代码示例

内容如此精湛的佳作,自然博得学界、业界各位大佬的一片赞誉之声。

本书深度整合了自然语言处理的理论精髓与实战智慧,内容讲解深入浅出、代码实例丰富易学,为培养自然语言处理领域的实战型人才提供了坚实的理论基石与丰富的实战资源,是渴望学习自然语言处理的读者必备的入门宝典。

——文继荣 中国人民大学高瓴人工智能学院执行院长、信息学院院长

在智能化浪潮下,懂技术、知应用的实战型人工智能人才的重要性日益凸显。本书以深入浅出的理论讲解为基础,辅以清晰明了的代码解析,帮助读者将自然语言处理的理论与实战融会贯通,值得广大读者深度研读。

——周明 澜舟科技创始人,ACL 原主席,CCF 原副理事长,微软亚洲研究院原副院长

学习自然语言处理需要将理论与实战相结合。本书凭借详尽的理论阐述、可运行的代码实例以及配套的习题与教学资源,构建了一座连接理论与实战的桥梁。无论是新手还是老手,均可使用本书深化对自然语言处理的理解并提升实战能力。

——邱锡鹏 复旦大学计算机科学技术学院教授

本书具有两大亮点。一是以序列和结构为主线来组织自然语言处理的关键技术。序列、结构和语义是语言文字的3个重要属性,语言文字是离散符号的序列,文本又由带有语义信息的结构组成。二是以指导动手实战为目标,每个章节均提供可执行代码,并加以解读。本书非常适合作为自然语言处理领域的高校教材,也适合作为工程师的常备工具书。

——李磊 卡内基梅隆大学计算机科学学院助理教授

本书作为一本全面且系统的自然语言处理教材,深入浅出地讲解了自然语言处理的基本概念和关键方法,无论是学生还是行业人士,都能够通过本书有效掌握自然语言处理的知识体系并进行动手实战。

——杨笛一 斯坦福大学计算机科学系助理教授

凡是对 NLP 原理和应用有兴趣的读者,包括本科生、研究生、教师、企业研究人员及工程师等,都可以从本书中获得自己想要的知识,助力学习工作得到提升。

如果读者对 AI 技术还有更广泛的兴趣,也可以将以下几本“动手学”系列好书给学起来。

《动手学深度学习(PyTorch版)》:大神李沐和阿斯顿·张的作品,本书通过经典的 PyTorch 深度学习框架,帮助读者掌握深度学习的精髓。

43c7fdd12be3653ee7cb55c12aca399a.png

《动手学强化学习》《动手学机器学习》:这两本书都是在俞勇教授的指导下,集合交大 ACM 班优秀的学者参与编写的,讲透了强化学习与机器学习的基本概念与关键技术。

 

e749c8a8040aca0e5e3b4fe2879de182.jpeg

 

78ffd05df7fd52048856912d58f26102.png

这些书同样提供了丰富的配套资源和友好的交互式学习环境。大家还等什么,就从《动手学自然语言处理》开始,通晓 AI 理论与应用,成为新时代的超级个体吧!

粉丝福利

  • 现在点赞收藏评论“人生苦短,我爱人工智能”
  • 评论区将随机抽取1名小伙伴免费赠书1本(包邮)
  • 截止日期:2024年4月25日

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/1804.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ 构造函数实战指南:默认构造、带参数构造、拷贝构造与移动构造

C 构造函数 构造函数是 C 中一种特殊的成员函数,当创建类对象时自动调用。它用于初始化对象的状态,例如为属性分配初始值。构造函数与类同名,且没有返回值类型。 构造函数类型 C 支持多种类型的构造函数,用于满足不同的初始化需…

Docker 部署网页版 vscode (code-server)

什么是 code-server code-server 是一个基于 Visual Studio Code 的开源项目,它允许你通过 Web 浏览器来使用 Visual Studio Code 的编辑功能。这意味着你可以在任何设备上,只要有浏览器和网络连接,就可以访问和使用 Visual Studio Code&…

漫谈HAMR硬盘的可靠性-2

很显然,HAMR已经成为业内用于提升HDD硬盘容量硬盘的技术手段。三家机械硬盘HDD厂商,希捷、西数、东芝都已对HAMR硬盘进行了十多年的研究,但只有希捷大胆押注HAMR。相反,东芝和西部数据在采用HAMR之前选择了能量辅助垂直磁记录&…

Axure中的样式

样式 首先说一下Axure里面的原点位置 如下图: 还有一个办法是我们选中我们的按钮,如上图,然后打开右边的样式,可以看按钮的x,y属性,类似于游戏中unity软件的x,y属性,类似于html中…

程序设计语言—Python几种语言区别的总结

程序设计语言篇—Python&几种语言区别的总结 文章目录 程序设计语言篇—Python&几种语言区别的总结一、Python介绍&理解1.1 Python基础1.2 Python规范 二、标识符&变量&常量三、数据类型&运算符和表达式3.1 数据类型3.2 运算符&表达式 四、常用的函…

Java实战:JSON文件到Excel文件的转换

步骤 添加依赖 首先&#xff0c;确保你的项目中已经添加了fastjson和poi的依赖。如果你使用的是Maven&#xff0c;可以在pom.xml中添加以下依赖&#xff1a; xml复制代码 <!-- fastjson --> <dependency> <groupId>com.alibaba</groupId> <artif…

Linux 系统IO函数之stat、lstat函数

1、stat函数 要点&#xff1a; int stat(const char *pathname, struct stat *statbuf); 作用&#xff1a;查看文件的信息 man 2 stat/return value1、stat结构体&#xff1a; 2、sturct stat 结构体中 st_mode 的含义&#xff08;文件的类型和存取的权限&#xff09;: st_mo…

华媒舍:百度竞价排名如何提升点击率

在网络推广中&#xff0c;提升点击率是十分重要的。运用百度搜索引擎广告是一种常用的提升点击率的形式。而百度竞价推广是搜索引擎所提供的一种付费流量方法&#xff0c;根据提高网站在搜索结果中的排名&#xff0c;可以有效提升点击率。下面我们就详细介绍如何运用百度竞价推…

每日OJ题_其它背包问题①_力扣474. 一和零(二维费用01背包)

目录 力扣474. 一和零 解析代码 代码优化 力扣474. 一和零 474. 一和零 难度 中等 给你一个二进制字符串数组 strs 和两个整数 m 和 n 。 请你找出并返回 strs 的最大子集的长度&#xff0c;该子集中 最多 有 m 个 0 和 n 个 1 。 如果 x 的所有元素也是 y 的元素&…

【Linux】权限(shell运行原理、概念,Linux权限)

&#x1f308;个人主页&#xff1a;秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343&#x1f525; 系列专栏&#xff1a;https://blog.csdn.net/qinjh_/category_12625432.html 目录 shell命令以及运行原理 创建和删除用户 创建新普通用户 删除用户 Linux权…

Unity中的UI系统之UGUI

目录 概述UGUI基础——六大基础组件六大基础组件概述Canvas画布组件CanvasScaler画布缩放控制器组件必备知识恒定像素模式缩放模式恒定物理模式3D模式 Graphic Raycaster图形射线投射器EventSystem和Standalone Input ModuleRectTransform UGUI基础——三大基础控件Image图像控…

混淆原理与实践指南

引言 &#x1f680; 在当今的软件开发领域&#xff0c;保护代码的安全性和保密性变得越来越重要。混淆&#xff08;Obfuscation&#xff09;技术作为一种保护代码的手段&#xff0c;在应对逆向工程和代码盗用方面发挥着关键作用。本文将深入探讨混淆的原理&#xff0c;以及如何…

!!!!!文章

我是一名普通本科院校的学生&#xff0c;即将升入大三&#xff0c;接下来的两年&#xff0c;我一定要用心沉淀&#xff0c;踏实前行&#xff0c;为了进入大厂努力付出。 &#xff08;1&#xff09;我的编程目标&#xff1a; 1> 拿到蓝桥杯的国奖&#xff0c;把自己的代码能…

javaWeb项目-财务管理系统功能介绍

项目关键技术 开发工具&#xff1a;IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架&#xff1a;ssm、Springboot 前端&#xff1a;Vue、ElementUI 关键技术&#xff1a;springboot、SSM、vue、MYSQL、MAVEN 数据库工具&#xff1a;Navicat、SQLyog 1、Springboot框架 …

[lesson45]不同的继承方式

不同的继承方式 不同的继承方式 C中支持三种不同的继承方式 public继承 父类成员在子类中保持原有的访问级别 private继承 父类成员在子类中变为私有成员 protected继承 父类中公有成员变为保护成员&#xff0c;其他成员保持不变 遗憾的事实 一般而言&#xff0c;C工程项目…

镭眸T52激光雷达:无人叉车定位及避障新选择

在传统物料搬运领域&#xff0c;叉车虽扮演了重要角色&#xff0c;但人工操作的局限性——高昂的人力成本、有限的操作效率以及潜在的安全隐患&#xff0c;一直是企业面临的难题。随着劳动力成本的不断攀升&#xff0c;企业对降低成本、提升效率、减少安全事故的需求愈发迫切。…

【iOS开发】(四)react Native第三方组件五个20240419-20

react native 外的 第三方组件 目录标题 react native 外的 第三方组件&#xff08;一&#xff09;与rn核心组件的使用步骤区别&#xff1a;&#xff08;二&#xff09;第三方组件概览1 WebView2 Picker3 Swiper4 AsyncStorage5 Geolocation6 Camera (三)详细学习1 WebViewCoco…

K8s: 集群内Pod通信机制之DNS

集群内Pod通信机制之DNS Kubernetes 支持两种基本的服务发现模式 —— 环境变量和 DNS 1 &#xff09; DNS 概述 可以使用附加组件 为 Kubernetes 集群设置 DNS 服务支持群集的 DNS 服务器&#xff08;例如 CoreDNS&#xff09;监视 Kubernetes API 中的新服务&#xff0c;并…

Navicat 干货 | 掌握 PostgreSQL 规则语法

PostgreSQL 规则提供了一种强大的机制&#xff0c;控制查询执行并在数据库内部实施数据操作。理解规则的语法和用法对于有效利用其功能至关重要。在上周的文章中&#xff0c;我们探讨了 PostgreSQL 规则的工作原理及其与触发器的区别。今天的文章将使用免费的 “dvdrental”示例…

程序员35岁会失业吗?针对中年危机的5种解决方案

在程序员的职业生涯中&#xff0c;35岁被许多人认为是一道重要的分水岭。这个年龄被赋予了特殊的意义&#xff0c;因为在这个年龄段&#xff0c;许多程序员开始对自身的职业发展进行反思和重新定位。一方面&#xff0c;随着科技的飞速发展&#xff0c;新的编程语言和技术层出不…