推荐几个NLP出论文的好方向!!

如果你准备发NLP方向的论文,或准备从事科研工作或已在企业中担任NLP算法岗的工作。那么我真诚的向大家推荐,贪心学院《自然语言处理高阶研修班》,目前全网上应该找不到类似体系化的课程。课程精选了四大主题进行深入的剖析讲解,四个模块分别为预训练模型、对话系统、知识图谱、文本生成

01 课程大纲

课程内容上做了大幅度的更新,课程覆盖了从预训练模型、对话系统、信息抽取、知识图谱、文本生成所有必要的技术应用和学术前沿。课程采用全程直播授课模式。带你全面掌握自然语言处理技术,能够灵活应用在自己的工作中;深入理解前沿的技术,为后续的科研打下基础;通过完成一系列课题,有可能成为一个创业项目或者转换成你的科研论文。

第一章:预训练模型基础

  • | 预训练模型基础、语言模型回顾

  • | N-gram、Neural语言模型回顾

  • | 预训练方法的发展历程

  • | 预训练和transfer learning

  • | Pre-BERT时代的transfer learning

  • | word2vec,transfer learning in NER

  • | Post-BERT时代的transfer learning

  • | Pre-train fine-tune范式

第二章:ELmo与BERT

  • | Elmo、Transformer、BERT

  • | 更强的BERT:RoBERTa

  • | 基于Elmo和BERT的NLP下游任务

  • | Huggingface Transformers库介绍 

  • | 构建基于BERT的情感分类器

 第三: GPT系列模型

  • | GPT、GPT2、GPT3 

  • | 基于GPT的fine-tuning

  • | 基于GPT的Zero-shot learning

  • | 基于GPT模型的文本生成实战

  • | Top-k + Top-p 采样

  • | 基于给定Prompt生成续写文本

第四: Transformer-XL与XLNet

  • | 处理长文本 

  • | Transformer-XL

  • | 相对位置编码

  • | Permutation Language Model

  • | Two-stream attention

  • | XLNet

  • | 更进阶的预训练任务:MPNet

第五:其他前沿的预训练模型

  • | 考虑知识的预训练模型:ERINE

  • | 对话预训练模型:PLATO2, DialoGPT

  • | SpanBERT

  • | MASS,UniLM

  • | BART,T5

  • | 实现基于T5的文本分类模型

第六: 低计算量下模型微调和对比学习

  • | 低计算量情况下的预训练模型微调

  • | Adapter-based fine-tuning,

  • | Prompt-search,P-tuning 

  • | 基于对比学习的预训练

  • | 对比学习目标:Triplet Loss,InfoNCE Loss

  • | 对比学习在NLP中的前沿应用:SimCSE

第七:多模态预训练和挑战

  • | 多模态预训练模型

  • | 多模态匹配模型:CLIP,文澜

  • | VQ-VAE

  • | 多模态生成模型:DALLE,CogView

  • | 预训练模型面临的挑战及其前沿进展

  • | 模型并行带来的挑战

  • | 对于Transformer的改进:Reformer

第一:对话系统综述

  • | 对话系统发展历程

  • | 对话系统的主要应用场景

  • | 常见的对话系统类别以及采用的技术

  • | 对话系统前沿的技术介绍

  • | 基础:语言模型

  • | 基础:基于神经网络的语言模型

第二:对话系统综述

  • | 任务型对话系统的总体架构

  • | 案例:订票系统的搭建

  • | 自然语言理解模块简介

  • | 对话管理模块技术

  • | 对话生成模型技术

  • | 基于神经网络的文本分类和序列标注

第三:自然语言处理理解模块

  • | 自然语言理解模块面临的挑战

  • | NLU模型中意图和槽位的联合识别

  • | 考虑长上下文的NLU

  • | NLU中的OOD检测

  • | NLU模型的可扩展性和少样本学习

  • | 少样本学习方法介绍

  • | 孪生网络、匹配网络、原型网络

第四:对话管理和对话生成

  • | 对话状态追踪

  • | 对话策略详解

  • | POMDP技术

  • | 对话管理的最新研究进展

  • | 基于RL的对话管理

  • | 对话生成技术

  • | 端到端的对话系统

  • | 基于预训练模型的DST

第五:闲聊对话系统

  • | 闲聊对话系统基础技术

  • | 基于检索的闲聊对话系统

  • | 基于生成的闲聊对话系统

  • | 融合检索和生成的闲聊对话系统

  • | Protoype rewriting, Retrieval augmented generation

  • | 闲聊对话系统的主要应用场景

  • | 闲聊对话系统技术所面临的主要挑战

  • | FAQ系统实战,实现一个自己的FAQ系统

  • | 基于RNN/Transformer/BERT的文本匹配模型

第六:对话系统进阶

  • | 情感/共情对话系统

  • | 生成带情绪的回复

  • | 个性化对话生成

  • | 生成符合特定个性人设的回复

  • | 风格化对话生成

  • | 对话回复的多样性

  • | Label Smoothing, Adaptive label smoothing

  • | Top-K Sampling, Nuclear Sampling

  • | Non-autoregressive 算法在生成模型中的应用

  • | 基于Transformer的对话生成模型

  • | TransferTransfo

第七:开源对话系统架构RASA详解

  • | RASA的主要架构

  • | 基于RASA搭建自己的对话系统

  • | 多模态对话、VQA

  • | 考虑图像模态的对话回复检索和生成

  • | 基于预训练模型的对话系统

  • | 基于GPT模型的对话模型

  • | Meena,PLA

第一:知识图谱与图数据模型

  • | 知识图谱:搜索引擎,数据整合,AI

  • | 实体抽取、关系抽取、词向量

  • | graph embedding

  • | 图数据模型:RDF, Cyper

  • | 结构化数据的关系抽取

  • | 介绍关系抽取的基本方法

  • | 介绍结构化数据的信息过滤

第二:知识图谱的设计

  • | RDF和Property graph的设计

  • | 创建KG:数据处理、文本和图像

  • | 推断用到的基本方法

  • | Path detection

  • | Centrality and community Detection

  • | 图结构嵌入方法

  • | 重要性的基本方法:node,edge

第三:关系抽取和预测

  • | Hand-built patterns

  • | Bootstrapping methods

  • | Supervised methods

  • | Distant supervision

  • | Unsupervised methods

  • | 实体识别的基本方法

第四:低资源信息抽取和推断

  • | Low-resource NER 

  • | Low-resource structured models

  • | Learning multi-lingual Embeddings

  • | Deepath 

  • | DIVA

  • | Generic Statistical Relational Entity Resolution in Knowledge Graphs 

第五:结构化预测模型

  • | Sequence labeling

  • | 结构化数据类别:Dependency,constituency

  • | Stack LSTM

  • | Stack RNNS

  • | Tree-structure LSTM

第六:图挖掘的热门应用

  • | 基本图概念

  • | Link Prediction

  • | Recommendation system

  • | Anomaly detection

  • | Gated Graph Sequence Neural Networks

第一:Seq2Seq模型与机器翻译

  • | Seq2seq 模型与机器翻译任务

  • | 机器翻译中未登录词UNK与subword

  • | 文本生成coverage

  • | length normalization

  • | 低资源语言生成

  • | 多任务学习

  • | Tearch Force Model

第二:文本摘要生成(1)

  • | 摘要生成技术类别

  • | 生成式摘要生成技术

  • | 抽取式摘要生成技术

  • | 基于CNN的文本生成

  • | 基于RNN的文本生成

第三:文本摘要生成(2)

  • | Pointer Network 及其应用

  • | CopyNet 于工业界的落地

  • | Length Normalization 

  • | Coverage Normalization

  • | Text summarization 前沿研究

第四:Creative Writing

  • | 可控性文本生成

  • | Story Telling 与预先训练GPT

  • | 诗词,歌词,藏头诗等文本生成

  • | 创作性文本生成技巧

第五:多模态文本生成

  • | ResNet 

  • | Inception 等预训练图片特征抽取模型

  • | Image Caption 及其应用

  • | Table2text

  • | 图神经网络与文本生成

第六:对抗式文本生成与NL2sql

  • | 对抗生成网络 GAN模型

  • | 强化学习基础

  • | 基于 Policy Gradient 的强化学习

  • | SeqGAN

  • | NL2sql :自然语言转SQL

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

02 部分案例和项目

学员可以选择每个模块完成我们提供的固定项目(以个人为单位),或者以小组为单位完成一个开放式项目(capstone),当然你也可以提出你自己的项目。从项目的立项、中期验收到最终答辩,在这个过程中我们的导师团队会给你建议、并辅助你完成课题, 该课题最终很有可能成为你的创业项目或科研论文!

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

03直播授课,现场推导演示

区别于劣质的PPT讲解,导师全程现场推导,让你在学习中有清晰的思路,深刻的理解算法模型背后推导的每个细节。更重要的是可以清晰地看到各种模型之间的关系!帮助你打通六脉!

▲源自:LDA模型讲解


▲源自:Convex Optimization 讲解

▲源自:Convergence Analysis 讲解

04 科学的课程安排

采用直播的授课方式,每周3-4次直播教学,包含核心理论课、实战课、复习巩固课以及论文讲解课。教学模式上也参考了美国顶级院校的教学体系。以下为其中一周的课程安排,供参考。 

02 项目讲解&实战帮助

训练营最终的目的是帮助学员完成项目,理解项目中包含核心知识技能,训练营中会花大量的时间帮助学员理解项目以及所涉及到的实战讲解。

▲节选往期部分课程安排

03 专业的论文解读

作为AI工程师,阅读论文能力是必须要的。在课程里,我们每1-2周会安排一篇经典英文文章供学员阅读,之后由老师帮助解读。   

    

▲仅供参考

04 代码解读&实战

对于核心的模型如BERT,XLNet都会精心安排代码解读和实战课,帮助学员深入理解其细节并有能力去实现。

▲BERT模型代码实战讲解

05 行业案例分享

训练营过程中会邀请合作的专家来分享行业案例以及技术解决方案,如知识图谱的搭建、保险领域的客服系统等。

▲专家分享

《Google YouTube 基于深度学习的视频推荐》

嘉宾简介:曾博士

计算机视觉,机器学习领域专家

先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 会议等发表超过30篇论文

06 日常社群答疑

为了帮助解决学员遇到的问题,专业助教会提供全天社群答疑服务。我们的助教均来来自于一线AI公司和国内外名校,扎实的理论和工业界应用也是我们选拔助教老师的重要标准,拒绝空谈理论。

▲社群内老师专业的解答

07 日常作业&讲解

为了巩固对一些核心知识点,学员除了大项目,也需要完成日常的小作业。之后助教会给出详细的解答。

▲课程学习中的小作业

适合什么样的人来参加呐?

  • 从事AI行业多年,但技术上感觉不够深入,遇到了瓶颈; 

  • 停留在使用模型/工具上,很难基于业务场景来提出新的模型; 

  • 对于机器学习背后的优化理论、前沿的技术不够深入;

  • 计划从事尖端的科研、研究工作、申请AI领域研究生、博士生; 

  • 打算进入顶尖的AI公司如Google,Facebook,Amazon, 阿里等;

  • 读ICML,IJCAI等会议文章比较吃力,似懂非懂,无法把每个细节理解透。

05 报名须知

1、本课程为收费教学。

2、本期招收学员名额有限

3、品质保障!学习不满意,可在开课后7天内,无条件全额退款。

4、学习本课程需要具备一定的机器学习基础和Python编程基础。

●●●

如果对课程感兴趣,请联系

添加课程顾问小姐姐微信

报名、课程咨询

????????????

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478155.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android热更新方案Robust

美团是中国最大的O2O交易平台,目前已拥有近6亿用户,合作各类商户达432万,订单峰值突破1150万单。美团App是平台主要的入口之一,O2O交易场景的复杂性决定了App稳定性要达到近乎苛刻的要求。用户到店消费买优惠券时死活下不了单&…

会议研讨 | TF45: 知识图谱新技术、新场景、新应用

基于“新基建”面向新产业、新业态和新模式的背景下,知识图谱作为人工智能的重要基石正在火热发展中。新的知识图谱技术在新的场景和应用中使人工智能从感知智能逐渐向认知智能过渡。知识图谱与产业的结合愈加紧密,除了在搜索与推荐、知识问答等通用领域…

LeetCode 653. 两数之和 IV - 输入 BST(二叉搜索树迭代器双指针)

文章目录1. 题目2. 解题1. 题目 给定一个二叉搜索树和一个目标结果,如果 BST 中存在两个元素且它们的和等于给定的目标结果,则返回 true。 案例 1: 输入: 5/ \3 6/ \ \ 2 4 7Target 9 输出: True案例 2: 输入: 5/ \3 6/ \ \ 2 4 7Tar…

盘点来自工业界的GPU共享方案

文 | 阎姝含源 | 极市平台进年来工业界一直孜孜不倦地寻求提升GPU利用率的方案,能被更多用户理解和使用的GPU共享走进工程师的视野中。本文将总结目前有公开PR的、来自工业界的部分GPU容器计算共享方案,看看工业界对GPU共享的定位和需求。本文将依旧着眼…

百面机器学习|第二章模型评估知识点 蓝白绛

前言 如果你能找到这里,真是我的幸运~这里是蓝白绛的学习笔记,本集合主要针对《百面机器学习——算法工程师带你去面试》这本书。主要记录我认为重要的知识点,希望对大家有帮助。 第二章 模型评估 1、评估指标的局限性 准确率(Accuracy)&…

美团外卖订单中心的演进

美团外卖从2013年9月成交第一单以来,已走过了三个年头。期间,业务飞速发展,美团外卖由日均几单发展为日均500万单(9月11日已突破600万)的大型O2O互联网外卖服务平台。平台支持的品类也由最初外卖单品拓展为全品类。 随…

论文浅尝 | 基于知识图谱的智能调研方法(DI佳作)

转载公众号 | 数据智能英文刊题目:A Knowledge Graph Based Approach to Social Science Surveys引用:Z. Pan, Z.J., et al.: A Knowledge Graph Based Approach to Social Science Surveys. Data Intelligence 3(3). doi: 10.1162/dint_a_00107文章摘要…

NYU Google: 知识蒸馏无处不在,但它真的有用吗?

文 | 小伟编 | 小轶导师: 小伟,听说你对知识蒸馏比较了解,你来给我说说知识蒸馏有什么用?我: 知识蒸馏是一种很典型的模型压缩的方法,我们可以用它来有效地从大型教师模型学习小型学生模型,并且学生模型的性能也很不错…

pyscript+py-env实现python+html效果

参考链接:https://developer.aliyun.com/article/976083?spma2c6h.12873581.group.dArticle976083.3a8057c73DINVs 今天我们要介绍的东西,叫做PyScript,使用它,不需要安装任何软件。只要有一个记事本,就能写一段HTMLP…

美团的DBProxy实践

本文整理自美团技术沙龙第10期:数据库技术架构与实践。 美团技术沙龙由美团技术团队主办,每月一期,每期沙龙邀请美团及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 本次沙龙主要围绕数据库相关的主题&a…

LeetCode 606. 根据二叉树创建字符串(递归)

文章目录1. 题目2. 递归解题1. 题目 你需要采用前序遍历的方式,将一个二叉树转换成一个由括号和整数组成的字符串。 空节点则用一对空括号 “()” 表示。而且你需要省略所有不影响字符串与原始二叉树之间的一对一映射关系的空括号对。 示例 1: 输入: 二叉树: [1,…

论文浅尝 | 面向开放域的无监督实体对齐

笔记整理 | 谭亦鸣,东南大学博士生来源:DASFAA’21链接:https://arxiv.org/pdf/2101.10535.pdf概述与动机知识图谱对齐的目的是建立两个不同知识图谱之间实体的对应关系,如图1,本文作者发现现有的实体对齐方法依赖于标…

聊聊推荐系统

这两天,有种把某宝卸载的冲动,它的“猜你喜欢”推荐简直是我肚子里的蛔虫,每次看都忍不住剁手,钱包就这么日渐消瘦……但从技术的角度想想,不得不说阿里的推荐系统的确做得不错。其实,除了电商平台&#xf…

LeetCode 695. 岛屿的最大面积(图的BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS广度优先搜索2.2 DFS深度优先搜索1. 题目 给定一个包含了一些 0 和 1的非空二维数组 grid , 一个 岛屿 是由四个方向 (水平或垂直) 的 1 (代表土地) 构成的组合。你可以假设二维矩阵的四个边缘都被水包围着。 找到给定的二维数组中最大的岛屿面…

Neo4j:入门基础(一)之安装与使用

原文链接:https://blog.csdn.net/sinat_36226553/article/details/108541370 # 图数据库 链接:什么是原生(Native)图数据库 一般认为具有“无索引邻接”特性的图数据库才称为原生图数据库 链接:常用的图数据库 图存储可以分为属性图、三元组…

论文浅尝 | 问题多样性对于问答的帮助

笔记整理 | 毕胜 东南大学在读博士,研究方向:自然语言处理 知识图谱问题生成通过生成一些合成的问题作为训练语料有效提高了问答系统的效果,本文的研究点是:在QG中,生成问题的文本多样性是否对下游的QA有帮助&#xf…

RDS平台介绍

本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 本次沙龙主要围绕数据库相关的主题&#…

你已经是一个成熟的地图了,该学会帮我...

文 | 小戏当我们打开百度地图,选定到达目的地,导航软件里的小姐姐马上就用不紧不慢的语调告诉我们“准备出发,全程12公里,预计需要30分钟……”但一看手表上显示的不风驰电掣铁定迟到的时间,肯定不允许我们和导航软件里…

LeetCode 427. 建立四叉树(递归)

1. 题目 我们想要使用一棵四叉树来储存一个 N x N 的布尔值网络。网络中每一格的值只会是真或假。树的根结点代表整个网络。对于每个结点, 它将被分等成四个孩子结点直到这个区域内的值都是相同的. 每个结点还有另外两个布尔变量: isLeaf 和 val。isLeaf 当这个节点是一个叶子…

基于 KIF 的 iOS UI 自动化测试和持续集成

客户端 UI 自动化测试是大多数测试团队的研究重点,本文介绍猫眼测试团队在猫眼 iOS 客户端实践的基于 KIF 的 UI 自动化测试和持续集成过程。 一、测试框架的选择 iOS UI 自动化测试框架有不少,其中 UI Automation 是 Apple 早期提供的 UI 自动化测试解决…