如何看待NLP领域的内卷:我不配找工作?

在过去几年时间里,NLP领域取得了飞速的发展,这也推动了NLP在产业中的持续落地,以及行业对相关人才的需求。 

但这里我们要面对的现实是,行业上90%以上的NLP工程师是“不合格的”。在过去几个月时间里,我们其实也面试过数百名已经在从事NLP的工程师,但明显发现绝大部分对技术深度和宽度的理解是比较薄弱的,大多还是只停留在调用现有工具比如BERT、XLNet等阶段。 

我们一直坚信AI人才的最大壁垒是创造力,能够持续为变化的业务带来更多的价值。但创造的前提一定是对一个领域的深度理解和广度认知,以及不断对一个事物的追问比如不断问自己为什么。

 对于二分类,我应该选择交叉熵还是Hinge Loss?BERT模型太大了,而且效果发现不那么好比如next sentence prediction, 能不能改一改? 为什么CRF要不HMM在不少NLP问题上效果更好? 文本生成效果不太好,如何改造Beam Search让效果更好呢?训练主题模型效率太慢了,如果改造吉布斯采样在分布式环境下运行呢? 数据样本里的标签中有一些依赖关系,能不能把这些信息也加入到目标函数里呢?

另外,有必要保持对前沿技术的敏感性,但事实上,很多人还是由于各种原因很难做到这一点。基于上述的目的,贪心学院一直坚持跑在技术的最前线,帮助大家不断地成长。贪心学院这次重磅推出了《自然语言处理高阶研修》。

01 课程大纲

课程内容上做了大幅度的更新,课程覆盖了从预训练模型、对话系统、信息抽取、知识图谱、文本生成所有必要的技术应用和学术前沿。课程采用全程直播授课模式。带你全面掌握自然语言处理技术,能够灵活应用在自己的工作中;深入理解前沿的技术,为后续的科研打下基础;通过完成一系列课题,有可能成为一个创业项目或者转换成你的科研论文。

第一章:预训练模型基础

  • | 预训练模型基础、语言模型回顾

  • | N-gram、Neural语言模型回顾

  • | 预训练方法的发展历程

  • | 预训练和transfer learning

  • | Pre-BERT时代的transfer learning

  • | word2vec,transfer learning in NER

  • | Post-BERT时代的transfer learning

  • | Pre-train fine-tune范式

第二章:ELmo与BERT

  • | Elmo、Transformer、BERT

  • | 更强的BERT:RoBERTa

  • | 基于Elmo和BERT的NLP下游任务

  • | Huggingface Transformers库介绍 

  • | 构建基于BERT的情感分类器

 第三: GPT系列模型

  • | GPT、GPT2、GPT3 

  • | 基于GPT的fine-tuning

  • | 基于GPT的Zero-shot learning

  • | 基于GPT模型的文本生成实战

  • | Top-k + Top-p 采样

  • | 基于给定Prompt生成续写文本

第四: Transformer-XL与XLNet

  • | 处理长文本 

  • | Transformer-XL

  • | 相对位置编码

  • | Permutation Language Model

  • | Two-stream attention

  • | XLNet

  • | 更进阶的预训练任务:MPNet

第五:其他前沿的预训练模型

  • | 考虑知识的预训练模型:ERINE

  • | 对话预训练模型:PLATO2, DialoGPT

  • | SpanBERT

  • | MASS,UniLM

  • | BART,T5

  • | 实现基于T5的文本分类模型

第六: 低计算量下模型微调和对比学习

  • | 低计算量情况下的预训练模型微调

  • | Adapter-based fine-tuning,

  • | Prompt-search,P-tuning 

  • | 基于对比学习的预训练

  • | 对比学习目标:Triplet Loss,InfoNCE Loss

  • | 对比学习在NLP中的前沿应用:SimCSE

第七:多模态预训练和挑战

  • | 多模态预训练模型

  • | 多模态匹配模型:CLIP,文澜

  • | VQ-VAE

  • | 多模态生成模型:DALLE,CogView

  • | 预训练模型面临的挑战及其前沿进展

  • | 模型并行带来的挑战

  • | 对于Transformer的改进:Reformer

第一:对话系统综述

  • | 对话系统发展历程

  • | 对话系统的主要应用场景

  • | 常见的对话系统类别以及采用的技术

  • | 对话系统前沿的技术介绍

  • | 基础:语言模型

  • | 基础:基于神经网络的语言模型

第二:对话系统综述

  • | 任务型对话系统的总体架构

  • | 案例:订票系统的搭建

  • | 自然语言理解模块简介

  • | 对话管理模块技术

  • | 对话生成模型技术

  • | 基于神经网络的文本分类和序列标注

第三:自然语言处理理解模块

  • | 自然语言理解模块面临的挑战

  • | NLU模型中意图和槽位的联合识别

  • | 考虑长上下文的NLU

  • | NLU中的OOD检测

  • | NLU模型的可扩展性和少样本学习

  • | 少样本学习方法介绍

  • | 孪生网络、匹配网络、原型网络

第四:对话管理和对话生成

  • | 对话状态追踪

  • | 对话策略详解

  • | POMDP技术

  • | 对话管理的最新研究进展

  • | 基于RL的对话管理

  • | 对话生成技术

  • | 端到端的对话系统

  • | 基于预训练模型的DST

第五:闲聊对话系统

  • | 闲聊对话系统基础技术

  • | 基于检索的闲聊对话系统

  • | 基于生成的闲聊对话系统

  • | 融合检索和生成的闲聊对话系统

  • | Protoype rewriting, Retrieval augmented generation

  • | 闲聊对话系统的主要应用场景

  • | 闲聊对话系统技术所面临的主要挑战

  • | FAQ系统实战,实现一个自己的FAQ系统

  • | 基于RNN/Transformer/BERT的文本匹配模型

第六:对话系统进阶

  • | 情感/共情对话系统

  • | 生成带情绪的回复

  • | 个性化对话生成

  • | 生成符合特定个性人设的回复

  • | 风格化对话生成

  • | 对话回复的多样性

  • | Label Smoothing, Adaptive label smoothing

  • | Top-K Sampling, Nuclear Sampling

  • | Non-autoregressive 算法在生成模型中的应用

  • | 基于Transformer的对话生成模型

  • | TransferTransfo

第七:开源对话系统架构RASA详解

  • | RASA的主要架构

  • | 基于RASA搭建自己的对话系统

  • | 多模态对话、VQA

  • | 考虑图像模态的对话回复检索和生成

  • | 基于预训练模型的对话系统

  • | 基于GPT模型的对话模型

  • | Meena,PLA

第一:知识图谱与图数据模型

  • | 知识图谱:搜索引擎,数据整合,AI

  • | 实体抽取、关系抽取、词向量

  • | graph embedding

  • | 图数据模型:RDF, Cyper

  • | 结构化数据的关系抽取

  • | 介绍关系抽取的基本方法

  • | 介绍结构化数据的信息过滤

第二:知识图谱的设计

  • | RDF和Property graph的设计

  • | 创建KG:数据处理、文本和图像

  • | 推断用到的基本方法

  • | Path detection

  • | Centrality and community Detection

  • | 图结构嵌入方法

  • | 重要性的基本方法:node,edge

第三:关系抽取和预测

  • | Hand-built patterns

  • | Bootstrapping methods

  • | Supervised methods

  • | Distant supervision

  • | Unsupervised methods

  • | 实体识别的基本方法

第四:低资源信息抽取和推断

  • | Low-resource NER 

  • | Low-resource structured models

  • | Learning multi-lingual Embeddings

  • | Deepath 

  • | DIVA

  • | Generic Statistical Relational Entity Resolution in Knowledge Graphs 

第五:结构化预测模型

  • | Sequence labeling

  • | 结构化数据类别:Dependency,constituency

  • | Stack LSTM

  • | Stack RNNS

  • | Tree-structure LSTM

第六:图挖掘的热门应用

  • | 基本图概念

  • | Link Prediction

  • | Recommendation system

  • | Anomaly detection

  • | Gated Graph Sequence Neural Networks

第一:Seq2Seq模型与机器翻译

  • | Seq2seq 模型与机器翻译任务

  • | 机器翻译中未登录词UNK与subword

  • | 文本生成coverage

  • | length normalization

  • | 低资源语言生成

  • | 多任务学习

  • | Tearch Force Model

第二:文本摘要生成(1)

  • | 摘要生成技术类别

  • | 生成式摘要生成技术

  • | 抽取式摘要生成技术

  • | 基于CNN的文本生成

  • | 基于RNN的文本生成

第三:文本摘要生成(2)

  • | Pointer Network 及其应用

  • | CopyNet 于工业界的落地

  • | Length Normalization 

  • | Coverage Normalization

  • | Text summarization 前沿研究

第四:Creative Writing

  • | 可控性文本生成

  • | Story Telling 与预先训练GPT

  • | 诗词,歌词,藏头诗等文本生成

  • | 创作性文本生成技巧

第五:多模态文本生成

  • | ResNet 

  • | Inception 等预训练图片特征抽取模型

  • | Image Caption 及其应用

  • | Table2text

  • | 图神经网络与文本生成

第六:对抗式文本生成与NL2sql

  • | 对抗生成网络 GAN模型

  • | 强化学习基础

  • | 基于 Policy Gradient 的强化学习

  • | SeqGAN

  • | NL2sql :自然语言转SQL

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

02 部分案例和项目

学员可以选择每个模块完成我们提供的固定项目(以个人为单位),或者以小组为单位完成一个开放式项目(capstone),当然你也可以提出你自己的项目。从项目的立项、中期验收到最终答辩,在这个过程中我们的导师团队会给你建议、并辅助你完成课题, 该课题最终很有可能成为你的创业项目或科研论文!

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

03直播授课,现场推导演示

区别于劣质的PPT讲解,导师全程现场推导,让你在学习中有清晰的思路,深刻的理解算法模型背后推导的每个细节。更重要的是可以清晰地看到各种模型之间的关系!帮助你打通六脉!

▲源自:LDA模型讲解


▲源自:Convex Optimization 讲解

▲源自:Convergence Analysis 讲解

04 科学的课程安排

采用直播的授课方式,每周3-4次直播教学,包含核心理论课、实战课、复习巩固课以及论文讲解课。教学模式上也参考了美国顶级院校的教学体系。以下为其中一周的课程安排,供参考。 

02 项目讲解&实战帮助

训练营最终的目的是帮助学员完成项目,理解项目中包含核心知识技能,训练营中会花大量的时间帮助学员理解项目以及所涉及到的实战讲解。

▲节选往期部分课程安排

03 专业的论文解读

作为AI工程师,阅读论文能力是必须要的。在课程里,我们每1-2周会安排一篇经典英文文章供学员阅读,之后由老师帮助解读。   

    

▲仅供参考

04 代码解读&实战

对于核心的模型如BERT,XLNet都会精心安排代码解读和实战课,帮助学员深入理解其细节并有能力去实现。

▲BERT模型代码实战讲解

05 行业案例分享

训练营过程中会邀请合作的专家来分享行业案例以及技术解决方案,如知识图谱的搭建、保险领域的客服系统等。

▲专家分享

《Google YouTube 基于深度学习的视频推荐》

嘉宾简介:曾博士

计算机视觉,机器学习领域专家

先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 会议等发表超过30篇论文

06 日常社群答疑

为了帮助解决学员遇到的问题,专业助教会提供全天社群答疑服务。我们的助教均来来自于一线AI公司和国内外名校,扎实的理论和工业界应用也是我们选拔助教老师的重要标准,拒绝空谈理论。

▲社群内老师专业的解答

07 日常作业&讲解

为了巩固对一些核心知识点,学员除了大项目,也需要完成日常的小作业。之后助教会给出详细的解答。

▲课程学习中的小作业

适合什么样的人来参加呐?

  • 从事AI行业多年,但技术上感觉不够深入,遇到了瓶颈; 

  • 停留在使用模型/工具上,很难基于业务场景来提出新的模型; 

  • 对于机器学习背后的优化理论、前沿的技术不够深入;

  • 计划从事尖端的科研、研究工作、申请AI领域研究生、博士生; 

  • 打算进入顶尖的AI公司如Google,Facebook,Amazon, 阿里等;

  • 读ICML,IJCAI等会议文章比较吃力,似懂非懂,无法把每个细节理解透。

05 报名须知

1、本课程为收费教学。

2、本期招收学员名额有限

3、品质保障!学习不满意,可在开课后7天内,无条件全额退款。

4、学习本课程需要具备一定的机器学习基础和Python编程基础。

●●●

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 537. 复数乘法

文章目录1. 题目2. 字符串提取数字1. 题目 给定两个表示复数的字符串。 返回表示它们乘积的字符串。注意,根据定义 i2 -1 。 示例 1: 输入: "11i", "11i" 输出: "02i" 解释: (1 i) * (1 i) 1 i2 2 * i 2i ,你需…

Storm 的可靠性保证测试

Storm 是一个分布式的实时计算框架,可以很方便地对流式数据进行实时处理和分析,能运用在实时分析、在线数据挖掘、持续计算以及分布式 RPC 等场景下。Storm 的实时性可以使得数据从收集到处理展示在秒级别内完成,从而为业务方决策提供实时的数…

NLP数据增强、数据增广

点击上方,选择星标或置顶,每天给你送干货! 作者:李博涵 来自:哈工大SCIR 1.摘要 本文介绍自然语言处理领域的数据增广方法。数据增广(Data Augmentation,也有人将Data Augmentation翻译为“数据…

开源开放|CCKS2021入选开放图谱资源简介

笔记整理 | 王萌(东南大学)、张宁豫(浙江大学)全国知识图谱与语义计算大会(CCKS)由中国中文信息学会语言与知识计算专委会定期举办的国内知识图谱、语义技术等领域的核心会议。知识图谱以结构化的形式描述真…

腾讯天衍实验室招聘科研实习生

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1腾讯天衍实验室专注于AI算法研究及落地,旨在依托NLP、知识图谱、大数据、医疗影像等技术系统,将算法能力输出到公卫、医保、基层辅助诊断等领域的行业解决方案,以及腾…

LeetCode 475. 供暖器(双指针二分查找)

文章目录1. 题目2. 解题2.1 双指针2. 二分查找1. 题目 冬季已经来临。 你的任务是设计一个有固定加热半径的供暖器向所有房屋供暖。 现在,给出位于一条水平线上的房屋和供暖器的位置,找到可以覆盖所有房屋的最小加热半径。 所以,你的输入将…

ReactiveCocoa核心元素与信号流

ReactiveCocoa(以下简称“RAC”)是一个函数响应式编程框架,它能让我们脱离Cocoa API的束缚,给我们提供另外一套编码的思路与可能性,它能在宏观层面上提升代码易读性与稳定性,让程序员写出富有“诗意”的代码…

【安利向】入坑半年的GPU云平台,三分钟训练起飞!xiu~

大家好,我是Joyce,和小瑶一样,也是搞算法的,不过还在学术界摸鱼,偶尔能抓到一条顶会锦鲤,大多数时候,都是一些小鱼小虾,目前已被boss放养,每周组会都是隐形人...转眼&…

rocketQA学习笔记

端到端问答系统 rocketQA 问答技术发展回顾:

开源开放 | 糖尿病知识图谱DiaKG(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/diakg阿里云天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId88836开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:妙健康(常德杰、刘朝振、…

LeetCode 501. 二叉搜索树中的众数(中序遍历)

文章目录1. 题目2. 中序遍历1. 题目 给定一个有相同值的二叉搜索树(BST),找出 BST 中的所有众数(出现频率最高的元素)。 假定 BST 有如下定义: 结点左子树中所含结点的值小于等于当前结点的值 结点右子树…

开源开放 | 移动应用知识图谱MAKG(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/makgGitHub地址:https://github.com/Everglow123/MAKGMAKG网站:http://www.makg.com.cn开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:东南大学(周恒、…

恕我直言,你的实验结论可能严重依赖随机数种子!

文 | python编 | 小轶God does not play dice with the universe ......But BERT Does !包括BERT在内的预训练模型已经是现今NLP工作的标配。但你有没有考虑过,这些工作的实验结论可能都是虚假的?在 Bertology 中,大家从 huggingface 上下载 …

Spring MVC注解故障追踪记

Spring MVC是美团点评很多团队使用的Web框架。在基于Spring MVC的项目里,注解的使用几乎遍布在项目中的各个模块,有Java提供的注解,如:Override、Deprecated等;也有Spring提供的注解,如:Control…

LeetCode 951. 翻转等价二叉树(递归)

文章目录1. 题目2. 递归解题1. 题目 我们可以为二叉树 T 定义一个翻转操作,如下所示:选择任意节点,然后交换它的左子树和右子树。 只要经过一定次数的翻转操作后,能使 X 等于 Y,我们就称二叉树 X 翻转等价于二叉树 Y…

开源开放 | 开源大学在线实践数据集及知识图谱MOOPer(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/mooper头歌平台:https://www.educoder.net/ch/rest开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:湖南智擎科技有限公司(黄井泉)&#xff0…

python实现文件传输

发送者: send_file.py def send_file(filename: str "mytext.txt", testing: bool False) -> None:import socketport 12312 # Reserve a port for your service.sock socket.socket() # Create a socket objecthost socket.gethostname() # …

不同于NLP,数据驱动、机器学习无法攻克NLU,原因有三

文 | Walid S. Saba源 | 机器之心自然语言理解(NLU)是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。近年来,机器学习虽然被广泛使用,但是却不能很好的解决自然语言理解问题,其中可能涉…

分布式系统互斥性与幂等性问题的分析与解决

随着互联网信息技术的飞速发展,数据量不断增大,业务逻辑也日趋复杂,对系统的高并发访问、海量数据处理的场景也越来越多。如何用较低成本实现系统的高可用、易伸缩、可扩展等目标就显得越发重要。为了解决这一系列问题,系统架构也…

开源开放 | 多模态实体链接数据集MELBench(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/melbenchGitHub地址:https://github.com/seukgcode/MELBench开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:东南大学(汪鹏、周星辰、邓臻凯、李国正、谢…