好久木有在知乎冒泡了,不知道还能不能出现在大家的timeline上哇QAQ
正文开始之前还是先习惯性的碎碎念一下。前段时间换了研究方向,重新pick了问答和检索,为了追上相关问题的最新进展,就顾不上写文的刷了一堆paper,加上几件事情的从0到1确实费了一些精力,因此停更了好几个月。
这几个月的时间里,大部分为数不多的业余精力都放在了运营「卖萌屋」上,跟小伙伴们努力维持一些有趣有料的原创输出,小屋也更好看啦。另一些精力就是放在本文要讲的事情上啦!几个算法工程师强行上阵web前后端甚至UI,做了一个帮助大家高效率刷paper的学术小站。一顿踩坑之后,终于近期把小站收拾的“看起来像个样子了”(´Д` )
小站地址!
arxiv.xixiaoyao.cn
很好记有木有( ̄∇ ̄)别忘了传送回来赞赞赞!
卖萌屋学术站的诞生
顾名思义,学术站就是为学术信息而生嗒!
虽然AI行业变得越来越卷,但CV、NLP等热点方向依然在持续高速的发(灌)展(水)中,经常涌现出一些有趣的paper,可能哪天就被借鉴用于解决手上的问题了。所以入门后,养成追前沿、刷paper的习惯是非常非常必要的,无论你是在学术界还是工业界。
不过由于众所周知的某墙,以及某些不是很好用的国外服务,导致新手刷paper的效率很低,又经常分不清哪些paper(可能)含金量更高一些,哪些疑似不可靠的灌水,很容易出现费力不讨好的情况,受挫之后又开始选择咀嚼各大小媒体的论文解读了。以卖萌屋为例,虽然每周能为大家递上两三篇原创已经看起来很高产了,但是实话讲,那些我们发现的有趣的paper里,最终能呈现到粉丝面前的可能只有2~3成。毕竟,理解容易生成难哇。。。
所以本着授人以鱼不如授人以渔的想法,就跟小伙伴们把自己平时刷paper的服务努力优化了一下,开放出来啦~希望能帮到各位爱追AI前沿的小伙伴们。
小站的目标
就是为了方便大家更加高效便捷的获取CV、NLP、IR等领域的学术信息啦(后面悄咪咪观察一下,用的人多的话再考虑加研究方向)。这里的高效便捷体现在几方面吧
- 不用跟那个什么墙斗智斗勇了,访问速度很快的
- 抽出来了一些paper质量相对比较高的机构名和学术会议/期刊名,如果精力有限,可以优先刷刷这些,如下图所示,一篇paper录用的会议名会在标题上放用橙色的tag标出,机构名会用蓝色的tag标出。比如图里这篇《TeaForN:Teacher-Forcing with N-grams》的paper就是今天刚放出来的Google发表于EMNLP20的论文(快夸夸我们
不过,这种抽取会议名和机构名置顶的做法也会导致一些公平性问题。有的好paper确实没投顶会也不是来自大厂或名校,就容易被淹没掉。对于这个为求便捷导致的公平性问题,我们也在努力优化中,后续会同时通过NLP和排序算法优化,以及人的力量来努力不让金子埋没(认真脸
建议&吐槽
学术站右侧有专门的交(吐)流(槽)群,很懒的小伙伴也可以直接在本文评论区留言~