这份NLP研究进展汇总请收好,GitHub连续3天最火的都是它

014738ad83f1b38b270a220b38b6cef6224c80e2

最近,有一份自然语言处理 (NLP) 进展合辑,一发布就受到了同性交友网站用户的疯狂标星,已经连续3天高居GitHub热门榜首位。

合集里面包括,20多种NLP任务前赴后继的研究成果,以及用到的数据集。

这是来自爱尔兰的Sebastian Ruder,倾力汇总而成。

7f76a2a39e806a0344a286444611cdb2b275db58

他在爱尔兰国立大学 (戈尔韦) 读博。另一个身份,是AI创业公司Aylien的研究人员。

塞巴斯蒂安说,NLP近来发展太快了,即便作为局内人,也很难顺畅地跟进这个领域里发生的事。

无微不至的仓库

要找到最常用的数据集,要了解自己研究的问题有了哪些新进展,还是很费力的。

6ea1073095fa1f1979c07602438fa75699aded8e

所以,他就在GitHub上面建了一个仓库,追踪各种自然语言任务的研究成果,还有对应的数据集。

这是一间整齐的仓库,任务是按字母顺序排列——

· CCG supertagging
· Chunking
· Constituency parsing
· Coreference resolution
· Dependency parsing
· Dialog
· Domain adaptation
· Language modelling
· Machine translation
· Multi-task learning
· Multimodal
· Named entity recognition
· Natural language inference
· Part-of-speech tagging
· Question answering
· Semantic textual similarity
· Sentiment analysis
· Semantic parsing
· Semantic role labeling
· Summarization
· Text classification

作为一个情绪型选手,我点开了情绪分析 (Sentiment Analysis) 的页面。

e2d8d9ddb9fbeb591e04d177b7a85770f122ba0e

这里的数据集很亲切,比如IMDb,电影评分网站的数据。

再比如,“ (姑且称为) 美国的大众点评”,Yelp的店铺评论数据集。

6f4010133c2fac720c21f9f28cd88dee2e18e6f4

每个数据集下面,都有相关研究的列表,以及所用模型的准确度

当然,情绪的二分类 (Binary Classification) ,以及细粒度分类 (Fine-Grained Classification) ,作为两种问题,列表也是分开的。

e4dc71761c335681cad61b848c34d269ed18bbcd

这人文关怀,无微不至。

未解之谜

塞巴斯蒂安还说了,上面列出的那些,是已经开始追踪的NLP任务。

fc616ae7e2c8dcd96a84142abaa501a4e471cc14

还有一些任务,被他加入了心愿单——

· Bilingual dictionary induction
· Discourse parsing
· Entity Linking
· Information extraction
· Keyphrase extraction
· Knowledge base population (KBP)
· More dialogue tasks
· Relation extraction
· Semi-supervised learning

这些问题的进展,在他那里还是未解之谜。

深知以一己之力难以将这部分内容补充完整,程序员还给了详细的参与步骤,希望广大NLP战士,可以互相取暖。

去看一看

塞巴斯蒂安给NLP的爱,很深沉了。

54fa099fa2fb8eda7bc9deb05d2184bd9a766915

他的博客,各位同行或许也很眼熟了。

变身前:Sebastianruder.com
变身后:Ruder.io

没有收藏的话,现在可以收藏一下。

当然,这里也要手动贴上NLP仓库的地址:

https://github.com/sebastianruder/NLP-progress

且去走一遭。


原文发布时间为:2018-06-27

本文作者:方栗子

本文来自云栖社区合作伙伴“量子位”,了解相关信息可以关注“量子位”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/390200.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于模型的嵌入式开发流程_如何使用基于模型的测试来改善工作流程

基于模型的嵌入式开发流程Unit testing is not enough – so lets start using model-based testing to improve our workflows.单元测试还不够–因此,让我们开始使用基于模型的测试来改善我们的工作流程。 Software testing is an important phase in building a …

166. 分数到小数

166. 分数到小数 给定两个整数,分别表示分数的分子 numerator 和分母 denominator,以 字符串形式返回小数 。 如果小数部分为循环小数,则将循环的部分括在括号内。 如果存在多个答案,只需返回 任意一个 。 对于所有给定的输入…

最近用.NET实现DHT爬虫,全.NET实现

最近用.NET实现DHT爬虫,全.NET实现,大家可以加我QQ交流下 309159808 转载于:https://www.cnblogs.com/oshoh/p/9236186.html

C++贪吃蛇

动画链接 GitHub链接:https://github.com/yanpeng1314/Snake 1 #include "Snake.h"2 3 int iScore 0;4 int iGrade 1;5 6 //蛇头蛇尾初始位置7 int x_head 1, y_head 3;8 int x_tail 1, y_tail 1;9 10 //地图坐标11 int i_Map 1, j_Map 1;12 13 /…

远程办公招聘_招聘远程人才时要寻找的5种技能

远程办公招聘Remote work is a fast emerging segment of the labor market. How to embrace this shift as an employer - and find, recruit, and empower remote staff - is a question many companies and hiring managers are grappling with.远程工作是劳动力市场中快速崛…

10分钟腾讯云配置免费https

腾讯云免费证书申请地址: https://console.cloud.tencent... 填写相关信息 域名身份验证 文件验证 将fileauth.text 创建在网站访问根目录的 .well-known/pki-validation/目录使得 www.**.com/.well-known/pki-validation/fileauth.text 能够访问详情 等待5分钟左右…

1588. 所有奇数长度子数组的和

1588. 所有奇数长度子数组的和 给你一个正整数数组 arr ,请你计算所有可能的奇数长度子数组的和。 子数组 定义为原数组中的一个连续子序列。 请你返回 arr 中 所有奇数长度子数组的和 。 示例 1: 输入:arr [1,4,2,5,3] 输出&#xff1…

洛谷P3195 [HNOI2008]玩具装箱TOY(单调队列优化DP)

题目描述 P教授要去看奥运,但是他舍不下他的玩具,于是他决定把所有的玩具运到北京。他使用自己的压缩器进行压缩,其可以将任意物品变成一堆,再放到一种特殊的一维容器中。P教授有编号为1...N的N件玩具,第i件玩具经过压…

680. 验证回文字符串 Ⅱ

680. 验证回文字符串 Ⅱ 给定一个非空字符串 s,最多删除一个字符。判断是否能成为回文字符串。 示例 1: 输入: s “aba” 输出: true 示例 2: 输入: s “abca” 输出: true 解释: 你可以删除c字符。 示例 3: 输入: s “abc” 输出: false 解题思路 使用…

Android--RxJava2更新体验

截止日前最新版2017-3-15: RxJava compile ‘io.reactivex:rxjava:1.2.7’ compile ‘io.reactivex:rxandroid:1.2.1’ RxJava2 compile “io.reactivex.rxjava2:rxjava:2.0.7” compile “io.reactivex.rxjava2:rxandroid:2.0.1” 1:create操作改变 Rxjava CompositeSubscri…

kotlin和java语言_Kotlin VS Java – 2020年您应该学习哪种编程语言?

kotlin和java语言It has been several years since Kotlin came out, and it has been doing well. Since it was created specifically to replace Java, Kotlin has naturally been compared with Java in many respects.自Kotlin问世以来已经有好几年了,而且一切…

oracle部署--安装oracle软件与部署单实例数据库

一、安装oracle数据库软件 1.创建相应的用户组及用户 groupadd oinstall groupadd oper groupadd dba useradd -g oinstall -G oper,dba oracle 2.创建oracle software安装路径 mkdir -p /u01/app/oracle/product/11.2.0/db_1 3.修改安装路径权限 chown -R oracle:oinstall …

web前端【第十一篇】jQuery属性相关操作

知识点总结 1、属性 属性(如果你的选择器选出了多个对象,那么默认只会返回出第一个属性)、 attr(属性名|属性值) - 一个参数是获取属性的值,两个参数是设置属性值 - 点击加载图片示例 re…

528. 按权重随机选择

528. 按权重随机选择 给定一个正整数数组 w ,其中 w[i] 代表下标 i 的权重(下标从 0 开始),请写一个函数 pickIndex ,它可以随机地获取下标 i,选取下标 i 的概率与 w[i] 成正比。 例如,对于 w…

sql语句语法多表关联_SQL创建表语句-带有示例语法

sql语句语法多表关联SQL is one of the most reliable and straightforward querying languages around. It provides clear cut syntax that reads easily without abstracting away too much of the functionalitys meaning.SQL是最可靠,最直接的查询语言之一。 它…

分布式改造剧集三:Ehcache分布式改造

第三集:分布式Ehcache缓存改造 前言 ​ 好久没有写博客了,大有半途而废的趋势。忙不是借口,这个好习惯还是要继续坚持。前面我承诺的第一期的DIY分布式,是时候上终篇了---DIY分布式缓存。 探索之路 ​ 在前面的文章中,…

85. 最大矩形

85. 最大矩形 给定一个仅包含 0 和 1 、大小为 rows x cols 的二维二进制矩阵,找出只包含 1 的最大矩形,并返回其面积。 示例 1: 输入:matrix [[“1”,“0”,“1”,“0”,“0”],[“1”,“0”,“1”,“1”,“1”],[“1”,“1”…

TP单字母函数

A方法 A方法用于在内部实例化控制器 调用格式:A(‘[项目://][分组/]模块’,’控制器层名称’) 最简单的用法: $User A(User); 表示实例化当前项目的UserAction控制器(这个控制器对应的文件位于Lib/Action/UserAction.class.php)…

Angular问题03 @angular/material版本问题

1 问题描述 应用使用 angular4在使用angular/material时,若果在导入模块时使用mat开头,就会报错。 2 问题原因 angular/material版本出现问题,angular/material 从版本5开始就必须要angular5的核心依赖;想要在angular5之前版本中的…

onclick判断组件调用_从子组件Onclick更新状态

onclick判断组件调用How to update the state of a parent component from a child component is one of the most commonly asked React questions.如何从子组件更新父组件的状态是最常见的React问题之一。 Imagine youre trying to write a simple recipe box application, …