谁说2021届秋招算法岗一定要灰飞烟灭啦?

没错,这是一碗鸡汤,希望肝完这碗鸡汤的师弟师妹们就不要过度焦虑啦~理性上车,理性下车,希望萌新们都能遇到最适合自己的坑位

2014年末入坑AI,一路见证了AI行业的快速起飞、爆炸、焦虑和冷却。

小夕前几天在知乎上看到一个问题《如何看待2021年秋招算法岗灰飞烟灭》被顶上了热榜。

v2-3043f5e23af7d56f7b33336a1f0a8fd8_b.jpg

有点感叹,怎么就灰飞烟灭了呢??

2018届的讨论:“算法岗是否值得进入?”;
2019届的讨论:“怎样看待算法岗竞争激励,供大于求?”;
2020届的讨论:“算法岗已经是一片红海,诸神黄昏,要不要转开发?”;
而今年,直接变成“算法岗已经灰飞烟灭”啦??

v2-f57b4c8f3418b138a4c7a2dd9aaa7a9b_b.jpg

喂喂,是谁带的节奏。。。这车毁人亡的速度也太快了哇

可事实真的是这样吗?还在车上的小伙伴是不是要赶快跳下车?

不!是!哒!

在很多人眼里,AI行业的岗位数量变化趋势是:↘,而涌入这个行业的人数变化趋势是:↗,所以大家普遍认为按照这个趋势下去该到了灰飞烟灭的程度了。而据小夕观测,2018年,企业主招不够合适的人;2019年,企业主招不够合适的人;2020年,企业主依然招不够合适的人!

这说明了什么?

虽然AI行业涌入的人越来越多,行业也变得日趋成熟了,竞争有所加剧。但!是!真正导致应届生一片哀嚎的,不是岗位消失了,而是市场需求变化了,应届生们却还停留在几年前的认知上。

接下来,本文从以下三个层面分析今年的算法岗秋招形势,并给今年找工作的师弟师妹们给出一些建议。

  • “供”与“需”
  • “研究“与”落地“
  • “梦想“与”现实“

“供”与“需”

在2015年、2016年等早些时候,市场普遍认为能手推SVM的应届生就是优秀的,毕竟那时深度学习还是新鲜事物,很多厂都还停留在规则+统计机器学习的技术栈上嘛。

后来,到了2017、2018年,大厂小厂们疯狂的拼论文、刷榜单,这时候能发顶会论文、靠炼丹术刷爆比赛榜单的应届生自然就成了香饽饽,而这时候那些思维还停留在白板手撸SVM的应届生们就开始一片哀嚎,“为啥我已经可以5分钟全程推导SVM了还是拿不到offer哇!”,于是抱怨“2019届太难了!供过于求,我们被剩下了!”

再后来,时间线进展到去年和今年,各种AI Lab开始“名存实亡”,大小厂们都开始认真考虑AI的落地和变现问题,不再那么热衷于秀论文&刷榜单了。然而,应届生们终于认识到,“只会推导SVM是不够的!我要开始憋论文了!”于是憋了一两年,终于有了一篇论文,然后发现“哇,为什么我有论文你们都不要我!算法岗灰飞烟灭了哇”

最近又看了一些粉丝和师弟师妹们发来的简历,越发感到这个“供”与“需”错位的严重性。需求方已经从研究导向转变到落地应用导向了,而作为供给方的很多应届生们依然思维停留在几年前的“进企业搞研究刷榜单”的旧思维上。努力错了方向,自然眼中满满的都是“市场饱和,灰飞烟灭”的景象。甚至,已经2020年了,我还能在一些简历中看到“熟练推导决策树、逻辑回归、SVM等常用机器学习算法”这样的表述,实在是有些无力吐槽了(´Д`)

“研究”与“落地”

没错,2019届,手握一两篇不错的paper,有几个含金量不错比赛的Top 10经历,混混大厂实习,就够收割offer到手软了。无论技术研究部门还是业务部门。

去年,也就是2020届秋招,我惊恐的发现,怎么一些大厂技术研究部门/团队的研究类岗位的招聘bar提高了这么多?有顶会,有比赛,有实习,但是都不给面试资格?有SQuAD Top 3的经历还要再考虑下?

看了看手里的一沓简历,想了想那捉襟见肘的head count数量,哦,确实优秀的候选太多了。手里有两三篇顶会的同学已经够多了,咱们只有一个研究岗hc,其余这些就都刷掉吧╮( ̄▽ ̄"")╭(虽然这些简历被刷的同学放在2017、2018年,很可能是SP甚至SSP的水平)。

但是!在去年这种看似非常惨烈的情况下,照样有轻松收割一二十个offer,拿SSP offer也没有太大压力的师弟师妹!如果参考上面这段描述,你可能觉得“那不得是神仙哇?10篇ACL的那种??”

错了错了!一篇ACL都没有,却轻松干掉了手握几篇顶会的同学,还拿了各大厂核心团队的SSP offer。

我的一个可爱小师弟就是这方面的范例╮(╯▽╰)╭

为什么呢?并不是说算法岗真的已经内卷到非神仙不要的程度了,而是说,市场对优秀人才的定义已经发生了变化。现在市场最迫切需要的是能把AI落地,能求解真实业务问题的工程师,注意是工程师! 只会侃侃而谈学术动态,却不具备能力求解真实业务问题的人,放在今年的工业界是相当不优秀的。哪怕是在技术研究部门,如果只会写paper却解不动真实业务问题,也是相当容易被动的。

未工作之前,大家对工作场景的想象更多的是“我复现了一篇paper,所以我求解了一个业务问题”。而实际上,在一些重要的AI商业化场景(如搜索、推荐、计算广告),有大量的问题是当今学术界的这些论文解决不了的,而这些问题切实的关系到产品的用户体验和变现能力。而求解这些业务问题,并不是复现一两篇论文就结束了,而是你要无所不用其极,或许是迭代模型,或许只是迭代数据,或许是拍脑袋的训练策略,或许要进一步拆解问题甚至重新建模,或许仅仅是生写一千条规则,甚至是死磕自上而下的性能优化,乃至考虑从产品维度推动解决问题。

而这一切的背后,依托的不仅是业务经验(这就是为什么对口的实习经历很重要),更重要的是过硬的工程能力。至于学术上的创新,是锦上添花而不是必要条件。

举个实际场景中的例子。

你可能遇到了一个难解的算法问题,于是你拿来BERT、XLNet、RoBERTa一顿猛调,终于把指标刷上去一大截。但!是!你发现根本上不了线哇,几百上千台的线上GPU机器依然远远扛不住模型的计算复杂度。怎么办呢?

有人说,好像XX厂刚出了一篇做知识蒸馏的paper,声称在GLUE上面获得了重大提升…

too naive!

然后你发现,哪怕用上几台V100来跑,也要跑上十天半个月,还是收益未知的,谁会等你复现paper呢?创新就更无从谈起了。

学术经验仅仅是决策的一方面,你知道这个paper没必要复现,但是或许有的结论你可以借鉴。更重要的是靠多年的炼丹直觉+工程能力,快速搭建一个简单粗暴、易于实施且预期有迭代空间和足够不错的起点的基线,然后才是堆砌多年积累的上分tricks,快速刷分。虽然下一步就是要搞创新了,不过堆tricks上分这一步完成后,在业务部门很多场景下其实问题已经解了,就可以考虑下一个问题了。显然,如果是到此为止的话,手速和代码质量才是最重要的,至于你的学术sense,sorry还没来得及发挥,leader说已经可以考虑开始下个需求了。

遗憾的是,现在市场上大部分的算法岗都是这种程度的。你可以考虑一下,这种情况下,你简历上就挂着几条不痛不痒的水文,你能证明自己的优势吗?灰飞烟灭也不足为奇吧。

于是,有人会觉得在技术研究部门情况会好些?

nono,这时候你要面对的问题难度可能要上升一个level了,你发现完成上一步堆tricks刷分之后还是无法求解这个问题。于是终于有追前沿、搞创新的理由了。然后,这时候你以为就可以整体泡着茶看看paper,跟小伙伴们愉快的讨论学术idea?

天真了=,=

你会面对更大的压力,会对你的coding能力、炼丹速度和学术sense同时提出更大的挑战,毕竟别人写的1000行代码,那都是十之八九要上线产生收益的,而你的代码,又难,又容易出错,收益还未知,学术sense差点的小伙伴可能一周下来全是fail的实验,coding能力差的小伙伴可能一周下来就是一个fail的实验╮( ̄▽ ̄"")╭

于是,你为了对抗这种不确定,保证每周都有正向产出,你只能有更快的手速、更多的策略迭代以及挤出时间尽可能的从近期的paper找下灵感。这种感觉跟在学校实验室开心的做科研完全不同的好吧!!

当然,现在国内的工业界依然存有非常少量的团队,依然在快乐的做着不过问业务和落地的研究。在那里或许你可以继续找回在学校实验室做科研的感觉,但是,或许你要考虑一下你决定赴身工业界的目的是什么?快乐的理想派研究是不是就是你的全部诉求?是不是无所谓升职加薪与可持续性的那种?对大部分人来说,是矛盾的,需要做出一个选择。

“梦想“与”现实“

可能是因为技术研究部门往往可以回避一些业务上的dirty work,更加专注在算法研究上,于是很多小伙伴会蜜汁嚷嚷着要去大厂做研究。就像小夕之前在这篇《拒绝跟风,谈谈几种算法岗的区别和体验》中提到的,不同定位的算法岗都会有其存在的问题,也都会有其相应的优势。梦想是要有的,但是更重要的是认清自己,选择最适合自己、最契合实际的道路。

从性格上来讲,如果你像小夕一样,喜欢死磕一些比较困难的算法问题,idea丰富,喜欢试错和追前沿,又有还不错的炼丹直觉和动手能力,那么说明你最少具备胜任偏研究性质算法岗的基本素质。如果背景、经历和热情都够,那么就勇敢尝试去有核心业务支撑的技术研究部门/团队吧,在这里你能更加充分地释放自己的潜力,发挥自己的价值。

当然啦,按照去年和今年的形势,虽然硕士仅凭一篇普通的AAAI、IJCAI论文,一般不足以让你找到一个靠谱的research团队,但是,凭借顶会经历(背景好的话没顶会也有机会)去心仪团队做research intern,然后在实习期间产出研究成果得到认可进而转正,也往往是比较可行的道路。当然啦,还有一条路,就是成为神仙,用学术成果和影响力证明自己。

一句话总结,除非性格合适,背景、科研sense和手速真的还不错,否则2021年谨慎死磕研究型算法岗

如果你真的喜欢算法(准确说是热爱AI),已经上了算法的车,又有了一些积累,下车的代价也比较高了,那么,不管你是CV、Speech、NLP还是IR、Rec、DM,请务必重点提高自己的工程能力,努力让自己成为一个机器学习全栈工程师——不会写paper但跟得上前沿,写得了规则修得了badcase,能炼丹上分也会部署模型,Java/C++跟Python一样熟练。那么是非常容易得到青睐的。如果这时,你还有学术sense,发表了一些不错的论文,或者有更硬核的机器学习系统优化经验甚至更底层的开发和优化能力(如CUDA),那我相信你肯定不会灰飞烟灭的,最起码不会感觉到很被动。

一句话总结,对大部分2021年应届生而言,会写系统,比会写论文更重要

如果还在犹豫要不要上车算法,或者上车后基本没什么积累,自己的学校、基础和兴趣又都非常一般,仅仅是希望找到一份薪资还不错的IT方面的工作,那么果断下车吧,去转Java开发,尤其是应用开发,AI流行之前的10分资历如今或许只需要7分就能够到offer的bar了,也更容易谈到更好的薪资。

一句话总结,无背景、无经历、无兴趣、一心只为高薪的三无人员建议下车

总之,虽然大家都在唱衰算法岗,疯狂劝退,但是对于已经上车的师弟师妹,除了徒增焦虑也没什么用了(下车代价可能更大),因此不如好好琢磨一下你现在会什么,简历上有什么,以及市场需要什么。

2021届了,用人单位依然招不到合适的人,应届生们依然在抱怨优秀而努力的自己遇不到伯乐。放弃焦虑吧!2021届秋招算法岗没有灰飞烟灭。

文末小尾巴

本文首发于微信公众号【夕小瑶的卖萌屋】,对秋招攻略感兴趣的小伙伴们欢迎来蹲首发( ̄∇ ̄)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480182.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文链接:https://arxiv.org/pdf/1805.09927.pdf来源:ACL2018Motivation:远程监督是以一种生成关系抽取训练样本的方法,无需人工标注数据。但是远程监督引入了噪音,即存在很多的假正例。本文的出发点非常简单&#xff…

字符串匹配算法(AC自动机 Aho-Corasick)

文章目录1. 多模式串匹配2. 经典多模式串匹配--AC自动机2.1 AC自动机构建2.2 在AC自动机上匹配主串2.3 复杂度分析3. python包1. 多模式串匹配 前面学的BF、RK、BM、KMP都是单模式串匹配算法(一个模式串,一个主串)多模式串匹配,即…

Redis系列教程(五):Redis哨兵、复制、集群的设计原理,以及区别

前一篇文章高并发架构系列:Redis为什么是单线程、及高并发快的3大原因详解谈了Redis高并发快的3个原因,本篇主要谈Redis的高可用,两篇合起来就可以把redis的高并发和高可用搞清楚了。 谈到Redis服务器的高可用,如何保证备份的机器…

论文浅尝 | 区分概念和实例的知识图谱嵌入方法

链接:https://arxiv.org/pdf/1811.04588.pdf知识图谱的表示学习最近几年被广泛研究,表示学习的结果对知识图谱补全和信息抽取都有很大帮助。本文提出了一种新的区分概念和实例的知识图谱表示学习方法,将上下位关系与普通的关系做了区分&#…

写在校招季,谈谈机器学习岗的Offer选择问题

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 吴海波 现在校招开始的越来越早,今年的实习生招聘还是异常火爆,简历一堆,而且是越来越没有区分度,以前面个xgboost的论文细节,就能区分很多人&…

Redis系列教程(六):Redis缓存和MySQL数据一致性方案详解

需求起因 在高并发的业务场景下,数据库大多数情况都是用户并发访问最薄弱的环节。所以,就需要使用redis做一个缓冲操作,让请求先访问到redis,而不是直接访问MySQL等数据库。 这个业务场景,主要是解决读数据从Redis缓存…

贪心算法(Greedy Algorithm)之霍夫曼编码

文章目录1. 贪心算法2. 应用2.1 找零钱2.2 区间覆盖2.3 霍夫曼编码霍夫曼编码完整代码1. 贪心算法 我们希望在一定的限制条件下,获得一个最优解每次都在当前的标准下做出当下最优决策(整体不一定最优),做出的决策不可以后悔&…

数据结构中基本查找算法总结

原文地址:https://www.cnblogs.com/xuzhp/p/4638937.html 基本查找算法 一、查找的基本概念 查找,也可称检索,是在大量的数据元素中找到某个特定的数据元素而进行的工作。查找是一种操作。 二、顺序查找 针对无序序列的一种最简单的查找方式…

领域应用 | 大众点评搜索基于知识图谱的深度学习排序实践

本文转载自公众号:美团技术团队。 本文介绍了大众点评搜索核心排序层模型的演化之路,包括结合知识图谱信息构建适合搜索场景的Listwise深度学习排序模型LambdaDNN以及特征工程实践和相关工具建设。1. 引言挑战与思路搜索是大众点评App上用户进行信息查…

KDD2020 | 揭秘Facebook搜索中的语义检索技术

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 江城编 | 可盐可甜兔子酱导读:今天分享一下 Facebook 发表在 KDD2020 的一篇关于社交网络搜索中的 embedding 检索问题的工作,干货很多,推荐一读。论文题目&#xff1…

Redis系列教程(八):分布式锁的由来、及Redis分布式锁的实现详解

在很多场景中,我们为了保证数据的最终一致性,需要很多的技术方案来支持,比如分布式事务、分布式锁等。那具体什么是分布式锁,分布式锁应用在哪些业务场景、如何来实现分布式锁呢?今天来探讨分布式锁这个话题。 什么是…

技术交流:老刘说NLP技术公众号开通

我有一个念想:在当今PR文章满天飞的背景下,我们能够保持人间清醒,对NLP技术有客观、公正的了解,并实事求是地进行技术实践和知识共享。老刘说NLP,将定期发布更多、更简单、更有趣的语言知识、想法、笔记,包…

POJ 2453 贪心应用

文章目录1. 题目1.1 题目链接1.2 题目大意1.3 解题思路2. Accepted 代码1. 题目 1.1 题目链接 http://poj.org/problem?id2453 1.2 题目大意 一个数x的二进制表示有n个1,求一个有相同个数1的二进制数(比x大,且要最小的) 1.3…

ICML2020 | 一行代码就能实现的测试集上分技巧

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 苏剑林编 | 夕小瑶在训练模型的时候,我们需要损失函数一直训练到0吗?显然不用。一般来说,我们是用训练集来训练模型,但希望的是验证集的损失越小越好&…

Redis系列教程(七):Redis并发竞争key的解决方案详解

Redis高并发的问题 Redis缓存的高性能有目共睹,应用的场景也是非常广泛,但是在高并发的场景下,也会出现问题: 高并发架构系列:Redis缓存和MySQL数据一致性方案详解 如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难…

技术动态 | 北京大学计算机所邹磊教授研究组开源面向 RDF 知识图谱的自然语言问答系统 gAnswer...

项目网站: http://ganswer.gstore-pku.com/代码地址: https://github.com/pkumod/gAnswerOpenKG发布地址: http://openkg.cn/tool/ganswer研究组主页: http://mod.icst.pku.edu.cn一、KBQA 任务简介基于知识库的自然语言问答 (Question Answering over Knowledge Base, KBQA) 主…

POJ 2287 田忌赛马(贪心)

文章目录1. 题目1.1 题目链接1.2 题目大意1.3 解题思路2. Accepted 代码1. 题目 1.1 题目链接 http://poj.org/problem?id2287 1.2 题目大意 双方各有n匹战斗力各异的马,分别派出来PK,假设对方先出牌,我方后出,求我方最多能胜…

Netty的实现原理、特点与优势、以及适用场景

高并发编程系列 高并发编程系列:NIO、BIO、AIO的区别,及NIO的应用和框架选型 高并发编程系列:ConcurrentHashMap的实现原理(JDK1.7和JDK1.8) 高并发编程系列:CountDownLatch、Semaphore等4大并发工具类详解 高并发编程系列&…

拒绝无脑吹!从ACL20看预训练缺陷

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 舒意恒、兔子酱以 BERT 为代表作的预训练模型的研究热度一直很高,到 0202 年了,预训练的研究依旧层出不穷,而且 ACL 2020 Best Paper 荣誉提名也选择了这一主题的研究…

论文浅尝 | AMUSE: 基于 RDF 数据的多语言问答语义解析方法

来源:ISWC 2017链接:https://link.springer.com/content/pdf/10.1007%2F978-3-319-68288-4.pdf本文主要关注基于RDF数据的多语言问答任务中,对不同语言问句的语义分析工作。作者提出一种基于DUDES(Dependency-based Underspecified Discourse…