我,大学没毕业,在OpenAI搞AI,想教教你如何提升“研究品味”

文 | 蒋宝尚
源 | AI科技评论

在AI圈里有这么一个人,虽然大学没有毕业,但却做过谷歌大脑研究员,担任过OpenAI团队的领导人。他被人称作“怪胎”,也被人称作神童。

他的名字叫做Chris Olah。在众人眼里,他的成长树在一开始似乎长“歪”:18岁那一年,进入多伦多大学读本科,随后辍学开始研究计算机。他运气不错,在刚刚开始进行AI研究的时候,他就得到了知名学者、量子物理学家 Michael Nielsen 的指导。

2013 年,图灵奖得主 Yoshua Bengio 曾邀请他去做自己的研究生,但Chris居然拒绝了Bengio的邀请,去谷歌大脑团队做了实习生,跟随Jeff Dean研究卷积神经网络、交互媒体相关的内容。

仍然是运气不错。2015年,在 Greg Corrado 的帮助下,他转为了谷歌的正式员工。在谷歌的那段日子,发过多篇论文,带过博士生,并和贾扬清、Ian Goodfellow等顶尖研究员一起合作过。

根据谷歌学术,其h指数甚至达到了19,总引用数达到了32616,远超拥有博士学位的研究者。其中,最高引用的一篇文章,TensorFlow: Large-scale machine learning on heterogeneous systems”,是他在谷歌大脑和40多作者,包括Jeffrey Dean、 Ian Goodfellow等知名学者合写的关于tensorflow详细介绍。

Chris Olah 在最近的一篇博客中介绍了自己对于“如何提升研究品味”的看法以及背后的一些决策思考,以下为博客内容整理。

如何提升研究品味

要成为一名研究人员,最重要的一个能力就是培养研究品味(审美),因为,品味背后代表着能够选择一个好的研究问题。培养品味很难,下面我在分享一些可操作的训练方法。

在说明具体方法之前,有必要思考一下为什么培养研究品味如此之难。最核心的问题是:验证研究想法是否有价值的成本非常高昂。直观体现在时间成本上,通常情况下,验证想法需要耗费几个月的时间,这意味着,每年只能得到有限的几条关于审美的反馈。下面介绍的练习方法,将教你如何快速获反馈。

值得一提的是,不建议强迫自己去做不感兴趣的事情,即理智上认为它很重要。其实,最重要的问题应该是能让你感到极度兴奋。

练习方式

练习1:列出研究想法的清单。找一位导师,让他给每个想法打分。然后和他讨论你不同意的观点。

相比通常需要几个月才能验证研究想法。请教导师是极具性价比的方式。

练习2:当别人尝试你的研究想法时,将他的结果和你的预期相比。

当和别人头脑风暴时,你可能投入大量的时间精力,但同时你也可能拥有数十个研究想法。如果别人实现了你的想法,并发表了论文。那么,你可能会感到不舒服,但记住这是一个免费获得宝贵反馈的机会。

练习3:采访你周围的研究人员,了解他们的审美。弄明白他们为什么要努力解决他们所面临的问题?他们是如何挑选问题的?他们研究的“蓝图”是什么?

额外好处:如果感觉采访很棒,可以考虑获得允许后,把这些东西写下来。

另外,大多数博士生经常会和访问他们实验室的研究人员开一些简短的会议。目的之一是向来访者“推销”他们的项目,如果他们没有类似的兴趣,便可能没有什么成效。

练习4:阅读有关科学史的书籍。反思为什么一些研究者把注意力集中在被他们同时代人所忽略的重要方向上。

注:库恩的《科学革命的结构》(The Structure of Scientific Revolutions)是我最喜欢的书之一。

练习5:批判性地思考你的研究审美,以及你周围的社群审美。你的审美很可能会受到你的研究集群(合作者、顾问等)的影响。

思考的一些方向可以有:在过去几年里,你自己的研究或你所在的社群的看法在哪些方面是错误的?

是否有相邻的研究“流派”具有明显不同的研究审美?如果是这样,试着说出他们"最强烈"的观点,以及你同意或不同意的原因。

你在哪些方面不同意你自己社群的研究审美?你认为你的社群在哪些方面可能是错误的?

你的研究目标是什么?是为了寻找研究的乐趣?想让世界变得更美好?你正在处理的问题是否与这些目标有关系?

失败模式

列举一些失败的研究审美的模式:

失败模式1:过于依赖一个研究方向或者陷入沉没成本。

许多研究人员开始研究一个问题(通常是由于环境而不是预期的决定),然后发现很难继续下去。

可能的解决办法:留出一到两周的时间,后退一步,列出你认为最有前途的其他研究方向,可以看看新的研究,与他人交流,等等。然后问一下如果你从头开始,你想做什么。根据需要每1-2年重复一次。

失败模式2:缺乏背景知识或者亲密感。

理论知识是研究品味形成的重要因素,因为你的研究品味不可能凭空得来。

有时,人们陷入了一个陷阱,试图在动手之前就选择一个完美的问题或有一个卓越的见解。然而你的研究审美不可能凭空的来,因此你需要理论知识和研究亲密感。

可能的解决办法:在你感兴趣的领域帮助别人完成他们的项目。你会发现,在这过程中会学到很多东西,并且不用过度投入到长期的工作中。理想情况下,如果不担任项目的“头头”,或者做短期项目,能够让你比较轻松,也可以帮助保持你的研究感觉和研究热度。

失败模式3:环境与你的兴趣不一致。

我有时会和一些博士生交谈,这些博士生和他们的导师有不同的兴趣,他们试图把自己的研究兴趣扭曲成他们导师喜欢的东西。这通常会形成一些为了折衷而不是为了质量而进行优化的想法。如此一来,会导致不甚理想的研究,也会让你失去建立研究审美的机会。

即使你周围的人名义上支持你从事任何你感兴趣的工作,上述情况也会发生。而当你周围的人都缺乏热情的时候,要追求一个方向是很有挑战性的。

可能的解决办法:要么“搬家”到一个与你的兴趣相一致的环境,要么暂时融入你的社群,并尝试在这些兴趣范围内锻炼良好的研究品味。我通常认为,一旦你对自己感兴趣的东西进行了大量反思,并拥有了自己感到非常兴奋的东西,你就可以跳到另一个环境中去。

其他人的建议

在twitter上的讨论中,很多人提出了其他的想法。请注意,所有这些都是“构建品味的练习”。

• 雷切尔•普鲁登建议

想象另一个小组发表了你脑海中的论文。你会对读到它而感到兴奋吗?

Chris评论:我认为这是一个很好的启发式。

• Andy Matuschak建议

就你的观点提出反汉明(anti-Hamming)的问题。在你的领域里最有趣(但不重要)的问题是什么?你为什么不去做呢?

Chris评论:这是个很好的问题。参见汉明著名的“你和你的研究”演讲。

• 安迪也分享了一个失败模式:

试着让一个想法在看起来容易处理的时候去做。有一个令人兴奋而可行的方法是——让我想去做它!如果有一个想法,我长时间思考它,通常可以进化出更深层次的变体,并将其付诸实践。

• 迈克尔·尼尔森(Michael Nielsen)的《有效研究原则》(Principles of Effective research)指出了关注混乱领域的价值:

当你发现“混乱”时,很多人第一反应是回避,去寻找更容易理解的东西。但一个混乱的领域其实是一个机遇。很有可能会有一些深入的统一和简化的概念仍然等待着某人——也许是你——的理解和发展。

• 亚索·奥尔希尔(Arthur Allshire)

你所在领域的瓶颈问题是什么?如在许多强化学习的研究中,很多关注的是对算法的细微调整,但最大的改进来自于对RL的模拟的改进。

• Preetum Nakkiran

我发现写短期的“项目建议书”和长期的“研究陈述或计划”是思考动机和目标(在不同的时间尺度)的很好的练习。所谓的“项目提案”是指:一旦你决定花超过1个月的时间在什么问题上,那么不妨写下几页文字来告诉自己:为什么这个问题是有趣的,为什么这个答案是有价值的,以及你希望找到什么(比如初始证据),然后得到反馈。

…另外,建议你向你遇到的每个人询问他们的“大蓝图”研究目标。因为这非常有趣和重要,但一般不会出现在论文上。

• Christian Szegedy

事后看来,我在研究中所犯的大多数错误都是因为我听取了我尊敬的导师的批评,而我所做的大部分很酷的东西,最初都被大家认为是无用的、无趣的,或“祝你好运!”。一般来说,研究中的想法要么领先于其他想法,要么挑战传统智慧。加入后一种阵营需要较少的技巧,但需要更多的勇气。

Chris评论:我认为很有道理,但是要注意幸存者偏差,记住不同的人在他们职业生涯的不同阶段可能有不同的科学成熟度或审美。我猜想,许多博士生会发现,从一开始就制定自己的研究议程是非常具有挑战性的,因为成长或许会让他们改变想法。

• Sergey Gorbunov

关于研究品味,我对研究生或初级研究员的唯一建议是“不要”听你的导师或知名研究员的话……因为研究生院是唯一一个让你有机会尝试和失败的地方。研究生应该想出非常规的问题或者解决方案。(因为已建立的研究有自己的流程和思考方式????)。同样,建议也可以用来推翻自己。

• Boaz Barak

我喜欢“20/80项目”,即你做了80%的工作却实现了20%的目标:而不是问“我用最小的努力能得到的最好的结果是什么?”或者“我能否找到足以概括出主要障碍的问题,即使最终结果听起来并不怎么样?”

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1] https://colah.github.io/notes/taste/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479170.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 889. 已知前序后序 求二叉树(不唯一)

1. 题目 返回与给定的前序和后序遍历匹配的任何二叉树。 pre 和 post 遍历中的值是不同的正整数。 示例:输入:pre [1,2,4,5,3,6,7], post [4,5,2,6,7,3,1] 输出:[1,2,3,4,5,6,7]来源:力扣(LeetCode) 链…

论文浅尝 | TANDA: Transfer and Adapt Pre-Trained Transformer Models

论文笔记整理:王春培,天津大学硕士。链接:https://arxiv.org/pdf/1911.04118.pdf动机这篇文章聚焦的是问答系统(Q&A)中的一个问题:回答句子选择(Answer Sentence Selection,AS2&…

深入浅出排序学习:写给程序员的算法系统开发实践

引言 我们正处在一个知识爆炸的时代,伴随着信息量的剧增和人工智能的蓬勃发展,互联网公司越发具有强烈的个性化、智能化信息展示的需求。而信息展示个性化的典型应用主要包括搜索列表、推荐列表、广告展示等等。 很多人不知道的是,看似简单的…

从ScrollView嵌套EditText的滑动事件冲突分析触摸事件的分发机制以及TextView的简要实现和冲突的解决办法

本篇文章假设读者没有任何的触摸事件基础知识,所以我们会从最基本的触摸事件分发处说起。 ScrollView为什么会出现嵌套EditText出现滑动事件冲突呢?相信你会有这种疑问,我们来看这么一种情况: 有一个固定高度的EditText&#xff…

LeetCode 1185. 一周中的第几天

1. 题目 给你一个日期,请你设计一个算法来判断它是对应一周中的哪一天。 输入为三个整数:day、month 和 year,分别表示日、月、年。 您返回的结果必须是这几个值中的一个 {“Sunday”, “Monday”, “Tuesday”, “Wednesday”, “Thursda…

使用NLP和ML来提取和构造Web数据

原文链接:https://blog.csdn.net/fendouaini/article/details/109374462 作者|Conner Brew 编译|VK 来源|Towards Data Science 介绍 在本文中,我们将创建一个基于战争研究所(ISW)的结构化文档数据库。ISW为外交和情报专业人员提供…

如何评价一个推荐系统的好坏?

文 | Nemo知乎本文已获作者授权,禁止二次转载现如今,推荐系统几乎无处不在。电商购物,有猜你喜欢。资讯阅读,有个性推荐。听歌看电影,都能识别你的兴趣。就连工作社交,也会提示你可能认识的人...推荐系统火…

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱、自然语言处理。动机消息传递神经网络(MPNN)已成功应用于现实世界中的各种应用中。但是MPNN聚合器的两个基本弱点限制了它们表示图结构数据的能力&#…

ScrollView嵌套EditText联带滑动的解决办法

本篇文章的相关内容需结合上文:从ScrollView嵌套EditText的滑动事件冲突分析触摸事件的分发机制以及TextView的简要实现和冲突的解决办法 在说完了如何解决ScrollView嵌套EditText的滑动事件冲突之后,我们接下来说一下如何实现它们两者之间的联带滑动。什…

数据库智能运维探索与实践

从自动化到智能化运维过渡时,美团DBA团队进行了哪些思考、探索与实践?本文根据赵应钢在“第九届中国数据库技术大会”上的演讲内容整理而成,部分内容有更新。 背景 近些年,传统的数据库运维方式已经越来越难于满足业务方对数据库的…

论文浅尝 | PAKDD2020 - 利用支持集中匹配信息的 few shot 事件分类方法

论文笔记整理:申时荣,东南大学博士生。来源:PAKDD 2020链接:https://arxiv.xilesou.top/pdf/2002.05295.pdf1.介绍:事件分类是一个重要的信息抽取任务,其目的是根据事件的提及实例对事件类别进行分类。目前…

梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?

文 | Summer Clover知乎本文已获作者授权,禁止二次转载这是Deep Learning Theory里很基本也很核心的一个问题。在这个问题上,初学者容易被入门教学误导,非此研究方向的业内人士也容易有过时的认知。首先问题描述不够准确。更准确的说法是&…

机器学习在美团配送系统的实践:用技术还原真实世界

在2018 AI开发者大会(AI NEXTCon)上,美团配送AI方向负责人何仁清,分享了美团在即时配送领域中机器学习技术的最新进展,以及如何通过大数据和机器学习手段,建立对线下真实世界各种场景的感知能力&#xff0c…

LeetCode 99. 恢复二叉搜索树(中序遍历)

1. 题目 二叉搜索树中的两个节点被错误地交换。 请在不改变其结构的情况下,恢复这棵树。 你能想出一个只使用常数空间的解决方案吗? 2. 解题 循环中序遍历(栈),记录不满足的节点,交换其valO(n)O(n)O(n)…

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了?

文 | 苏剑林编 | Sheryc_王苏单位 | 追一科技去年笔者写过博文《如何应对Seq2Seq中的"根本停不下来"问题?》[1],里边介绍了一篇论文中对Seq2Seq解码不停止现象的处理,并指出那篇论文只是提了一些应对该问题的策略,并没有…

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文笔记整理:杨帆,浙江大学计算机学院。动机现有的用于图结构的预训练方法要么只关注node-level,导致在图表示空间没有区分度,要么只关注graph-level,导致在节点表示空间没有区分度。一种优质的节点表示应该保证不仅在…

常见的距离算法和相似度计算方法

原文链接:https://zhuanlan.zhihu.com/p/138107999 首发于算法加油站写文章常见的距离算法和相似度计算方法奋发的菜鸟酱​华东师范大学 计算机技术博士在读91 人赞同了该文章注:不定时更新1.常见的距离算法1.1 欧几里得距离(Euclidean Dista…

美团AI全景图:吃喝玩乐背后的黑科技

很多人都会发现日常生活已经越来越离不开美团了,这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情,非常接地气。黄色的美团外卖骑手,橙色的摩拜单车,还有美团和大众点评的Logo……会不时出现在各个角落&#xf…

LeetCode 547. 朋友圈(图的遍历BFS DFS)

文章目录1. 题目2. 解题2.1 BFS 广度优先2.2 DFS 深度优先1. 题目 问有几个连通网络 2. 解题 2.1 BFS 广度优先 参考图的数据结构 class Solution { public:int findCircleNum(vector<vector<int>>& M) {int n M.size(), groups 0, i;bool visited[n] …

开源开放 | 《大词林》开源 75 万核心实体和围绕核心实体的细粒度概念、关系列表...

1《大词林》简介《大词林》(http://101.200.120.155/)是由哈尔滨工业大学社会计算与信息检索研究中心推出&#xff0c;由我中心秦兵教授和刘铭副教授主持开发&#xff0c;是一个自动构建的大规模开放域中文知识库。自2014年11月推出第一版《大词林》&#xff0c;《大词林》共经…