Sora 作者被曝读博期间仅发表两篇论文,我们是否需要重塑科研价值观?

众所周知,在当今学术界,论文数量和产出速度常常被视为研究者生产力和学术成就的重要标尺。笔者也面试过很多博士生候选人,大家普遍会以自己读博期间发表过10几篇甚至几十篇论文而骄傲,很少有候选人会强调自己读博期间虽然发表论文数量不多,但对某一课题有很深的insight并拿出自己的代表作。

而在高校实验室,大家对于“大神”的认定普遍也是以某某师兄/师姐曾经发表过XX篇顶会论文来完成和比较的。

这种对论文数量的偏重引人质疑,以量取胜的趋势是否能真正反映一个科研人员成果的价值和质量呢?

图片

最近备受瞩目的文生视频模型 Sora,它的两位联合负责人在直博的三年半时间里,并未大量发表论文,仅见刊两三篇论文,这一现象激发了对学术界一个普遍而深刻的思考:很多场景下是否应该坚持以论文数量作为评价标准?在科研实践中,论文的质量到底扮演着怎样的角色?

让我们一起来探索,在追求学术的道路上,应如何权衡论文的数量与质量,以及这种权衡对于自身职业发展和整个学术生态的影响。

天才成员博士期间的亮眼履历

Sora 项目的领导团队中,除了 OpenAI 的资深成员 Aditya Ramesh,他本科毕业后便加入了该公司,Sora 的两位联合负责人 Bill Peebles 和 Tim Brooks 作为应届博士毕业生,都 师从 UC Berkeley 的 Alyosha Efros 教授,在博士期间都取得了显著的成就。

Bill Peebles

图片

Bill Peebles 在 MIT 本科毕业后,仅用了3年零9个月便完成了博士学位。博士在读期间发表了 2 篇一作论文[1]:

  1. The Hessian Penalty: A Weak Prior for Unsupervised Disentanglement(ECCV 2020)

  2. GAN-Supervised Dense Visual Alignment(CVPR 2022,最佳论文候选)

以及 2 篇在投的论文:

  1. Learning To Learn With Generative Models Of Neural Network Checkpoints

  2. Scalable Diffusion Models with Transformers(中稿 ICCV 2023,据悉这是 Sora 背后的核心技术之一,它将 Diffusion 模型与 Transformer 结合起来。Diffusion Model 最初由德国慕尼黑大学提出,据 Meta 的 AI 科学家 Yann LeCun 透露,Sora 的这项基础研究 DiT 曾在 CVPR 2023 的审稿过程中被认为“缺乏创新性”而遭拒稿[2]。然而,这并不影响 Sora 在发布后的短短几天内获得的广泛关注和成功。)

图片

▲图源 X,@Yann LeCun

Tim Brooks

图片

Sora 的另一位联合负责人 Tim Brooks 有着同样引人注目的履历。他于 2023 年取得博士学位,博士生涯仅历时 3 年零 5 个月,尽管他直到博士第三年才开始发表论文,但他以第一作者身份发表了三篇高质量的论文:

  1. Hallucinating pose-compatible scenes(ECCV 2022)

  2. Generating long videos of dynamic scenes(NeurIPS 2022)

  3. Instructpix2pix: Learning to follow image editing instructions(CVPR 2023)

除了在 Sora 项目中的贡献外,他还是著名的 DALL.E 项目的作者之一。

你可能会认为他仅仅是 AI 领域的一位科研大佬,但他的兴趣远不止于此。他在学术研究之外还有广泛的艺术爱好,他静可摄影,动可演唱,在文艺界里他也游刃有余,他的个人主页中有很多原创作品[3]。

从高中开始,Tim 的摄影就曾获国家地理、自然最佳摄影和国家野生动物联合会等机构颁发的奖项

图片

图片

他还曾在百老汇舞台上表演,并因参与阿卡贝拉 beatboxing 获得了国际奖项

由此可见,Tim 是个妥妥的文艺青年,而 Sora 的诞生,也少不了他在摄影、影片和音乐方面的兴趣驱动。

现在,我们言归正传,探讨这两位联合负责人的经历给我们带来的启示。

从传统的优秀博士研究生标准来看,他们的特点有所不同:读博时间较短(直博时间仅 3 年半左右)、论文发表数量不够突出

导师 Alyosha Efros

这可能和导师的风格有关,Sora 的两位联合负责人的博导 Alyosha Efros 并不是那种极其严肃的学者形象,他当年的毕业论文附录中甚至包含了一章《伯克利周边的爬山指南》,可见他也是一位很有趣的人。

Alyosha 在个人主页中提到,他正尝试实践“slow science”,也许这是他没有 push 这两位博士量产文章的原因之一吧。

图片

究竟什么是“slow science”呢?它甚至有一个专门的网站[4],这个概念阐述了一种对待科研的态度,其中提到的“科学需要时间来思考,科学需要时间阅读、需要时间失败”令人深受触动。

在当今竞争激烈的科研环境中,与追求短期成果和即时反馈的快节奏科学不同,“slow science”强调了科学研究的持久性和深度,呼吁我们更加注重科研的质量。

图片

对论文的追求逐渐走偏

想起之前与导师的闲聊,他感慨现在毕业评优对于论文数量的要求越来越卷,听说有位同学靠着读博期间十几篇论文拿到了优秀毕业生,这样的产出能力让我大受震撼。

为何学术研究的风向变成了追赶顶会 DDL、比拼论文数量的“快餐式”科研?目前,学术界普遍存在对论文数量和发表速度的过度追求,许多研究者深受“发表或湮灭(publish or perish)”压力的驱使,这背后的原因错综复杂。

图片

  • 职称评定:在众多高校和研究机构中,学术职称的评定通常与研究人员发表的论文数量和质量紧密相关。在高影响力期刊或会议上发表更多论文,往往被看作是学术成就的关键指标。因此,为了晋升或保留职位,人们可能会感到压力,去发更多的论文。

  • 科研经费:科研资金的申请竞争异常激烈,评审过程中常常会考虑申请者的论文发表记录。丰富的科研成果往往被视为研究者生产力和研究质量的体现,从而提高获取资助的可能性。

  • 学术影响力:论文数量和引用次数是衡量学术影响力的常见指标。一些排名和评估机构利用这些指标来评价研究机构和个人研究者的表现。因此,追求发表更多论文以提升个人及所属机构的学术排名成为一些人的目标。

  • 个人职业发展:对于学者自身而言,发论文是展示其研究能力和专业知识的重要方式。这不仅有助于职称评定和资金申请,也对求职、升职和获得学术认可至关重要。

在学术界,尤其是国内的高等教育和研究机构中,论文数量常常被用作衡量学术成就和招聘条件的重要指标。在某些招聘条件中,甚至会明确要求应聘者在特定期刊上发表一定数量的论文,据此给应聘者打上对应的标签。

图片

在算法岗位的求职过程中,为了迅速筛选不同水平的候选者,比较论文数量可能成为最有效的方法。有时候,顶会论文数量的差距可能就是求职者之间的分水岭。

然而,这种“快餐式”科研的趋势虽然在某种程度上促进了知识的快速传播和产出,但也带来了一系列负面影响。对论文的过度追求可能导致学术质量的降低、研究不端行为(如数据造假、剽窃等)、以及对创新和深入研究的忽视,这些问题都指向了学术评价体系的不足。

学术评价体系亟待完善

去年,《Nature》杂志上发表的一篇文章指出,“近年来科研论文数量激增,却缺少颠覆性创新”,研究人员跨越多个学科,通过分析数十年来科技成就的创新动态指数趋势,旨在评估研究成果在颠覆性方面的整体变化。然而结果显示,论文和专利更倾向于深化既往研究,而非开拓新的领域

当前的科研体系已经高度成熟并形成了一种“产业化”模式,科学家们被困在了一个忙碌的“职业陷阱”中,不断追逐所谓的职业发展,却往往缺乏进行重大科技创新所需的自由和时间。导致大部分学者没有足够的动力,在科研任务之外考虑工业界落地的问题。

研究人员提出了几点建议:

  • 高校和科研机构在评价论文时,应更注重质量而非数量;

  • 科学家们应获得更充足的资金支持和更合理的休假安排;

  • 资助机构则应当倾向于支持更长期、更高风险、更注重个人研究的项目,而不是仅仅局限于特定的研究项目资助。

图片

AI 领域的一些研究人员在顶级会议上大量发表论文,甚至一些团队采取流水线作业方式高频产出文章,这也反映了学术评价体系存在的一定缺陷。正是由于缺乏有效的后续验证和相对较低的实验门槛,使得该领域的论文数量和发表速度相比于计算机科学的其他分支显得略为夸张。

图片

实际上,我们不应对学术界过于苛责。一篇顶会或顶刊,加上编辑也就寥寥几人的评审流程,别说发掘一项研究的全部价值,就算能够完全理解核心观点并在很全面的维度上评估已经实属不易。

然而,真正具有前瞻性的优秀研究,在最初出现时往往难以获得正确的评价,因为它们可能超出了当前的研究范畴,或是提出了全新的概念。这样的研究可能需要时间来被学界广泛接受和理解,因此在初次提交时可能不被充分认可,正如被拒稿后重投的《Scalable Diffusion Models with Transformers》一文,当 Sora 出现在公众视野时,这篇论文才重新受到关注。

重塑学术价值观:做有意义的工作≠写更多的论文

长期以来,学术界普遍认同一个观点:撰写学术论文是一种有价值和有意义的活动。这种认识逐渐演化成了一个等式——做有意义的工作等同于撰写更多的学术论文。这一思维模式不仅在学术界获得了广泛认可,而且成为了评估学者工作和贡献的重要标准。

然而,过于追求发表论文,可能扭曲了许多人的价值观。学者们可能会过度关注论文的数量和产出速度,忽视了论文的质量、研究的深度以及对社会的实际影响。这种偏向可能导致学术界过度追求短期成就,而忽略了长期的知识积累和创新

图片

更为严重的是,这种趋势可能会淡化科研的根本目的:探索未知、解决实际问题、传播知识和促进社会进步。当论文成为目的而非手段时,科研的真正价值就可能会被忽视。在这种情况下,科研工作可能会变得形式化和功利化,不再是出于对知识的纯粹追求和对社会贡献的真诚愿景。

因此,我们需要重新审视和调整我们的价值观,以确保科研活动不仅仅是为了发表论文,而是为了追求更深层次的学术探索和社会发展。这可能需要学术界、资助机构和政策制定者共同努力,创造一个更加平衡和健康的科研环境,让学者们可以自由地追求有深度、有影响力且真正有意义的研究。

总结

经过深入讨论,我们得出结论:尽管论文数量和发表速度在一定程度上能够反映研究者的学术活跃度和影响力,但它们决不能成为评价科研价值的唯一或最重要的标准。

Sora 的两位作者向我们展示了,论文的价值在于质量而非数量,只要其质量过硬,同样能够在社会各界产生重大影响,并推动科学的进步。因此,我们应该鼓励学术界和评价体系更加重视研究的创新性、深度和实际影响,而非一味地追求产出更多论文。

图片

不要在日复一日的实验中变得麻木,拥有一个热爱生活并有趣的灵魂也至关重要。有时,放慢步伐实际上是为了提升工作质量,让我们一起试着“slow science”。科学需要时间来思考,我们应该更多地关注实验设计和批判性思考,努力提升研究的深度和广度,不为了发论文而去发论文。

最终,我们期待一个更健康、公正且多元的学术评价环境的出现,这将是推动科研工作质量真正提升的关键。让我们共同努力,为了一个以质量和创新为核心的学术未来,不断探索和前行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/730788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UE5.1_TimeLine

UE5.1_TimeLine 问题引入:UE的Timeline可以在一个场景下无限制的使用多少次?一个动画流程的Timeline的时间持续怎么算?TimeLine中嵌套Timeline的做法是否是合理的?

【数据结构】泛型

文章目录 一、什么是泛型二、引出泛型1、语法 三、泛型类的使用1、语法2、示例3、类型推导(Type Inference) 四、裸类型(Raw Type)五、泛型如何编译的六、泛型的上界1、语法2、示例 七、泛型方法八、通配符九、包装类 一、什么是泛型 一般的类和方法,只能使用具体的…

Matlab|基于目标级联法的微网群多主体分布式优化调度

目录 主要内容 1.1 上层微网群模型 1.2 下层微网模型 部分程序 实现效果 下载链接 主要内容 本文复现《基于目标级联法的微网群多主体分布式优化调度》文献的目标级联部分, 建立微网群系统的两级递阶优化调度模型: 上层是微网群能量调度中心优化调度…

java中的字符串比较(题目作示例)

错误的代码 import java.util.Scanner; public class one {public static void main(String[] args) {Scanner scnew Scanner(System.in);String b"47568";int i0;for ( i 0; i <3; i){String asc.next();if(ab){System.out.println("密码正确&#xff0c;登…

C++ 类的前向声明的用法

我们知道C的类应当是先定义&#xff0c;然后使用。但在处理相对复杂的问题、考虑类的组合时&#xff0c;很可能遇到俩个类相互引用的情况&#xff0c;这种情况称为循环依赖。 例如&#xff1a; class A { public:void f(B b);//以B类对象b为形参的成员函数//这里编译错位&…

在外包公司干了4年,技术退步2年...

先说情况&#xff0c;大专毕业&#xff0c;18年通过校招进入湖南某软件公司&#xff0c;干了接近6年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&#xf…

【Linux】常见的基本指令(中)

在本篇博客中&#xff0c;将会继续介绍Linux的常见的基本指令 一.rmdir指令 rmdir [空文件夹名] 删除空文件夹&#xff08;空目录&#xff09; 二.rm指令 rm [文件名] 删除文件 rm -r 递归删除文件夹&#xff08;目录&#xff09; rm -f 强制…

白话模电:1.绪论与半导体(考研面试常问问题)

一、什么是信号&#xff1f;什么是电信号&#xff1f; 信号反映消息的物理量&#xff0c;电信号是反应电压或电流变化的物理量。 二、什么是模拟信号&#xff1f;什么是数字信号&#xff1f; 模拟信号是时间和数值上均连续的信号&#xff0c;数字信号是时间和数值上均离散的信号…

[HackMyVM]靶场 Zeug

kali:192.168.56.104 主机发现 arp-scan -l # arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:d2:e0:49, IPv4: 192.168.56.104 Starting arp-scan 1.10.0 with 256 hosts (https://github.com/royhills/arp-scan) 192.168.56.1 0a:00:27:00:00:05 (Un…

2024年起该地推行「软考电子证书」!关于软考证书常见问题解答!

近日&#xff0c;安徽省人力资源和社会保障厅发布“关于2024年度安徽省专业技术人员职业资格考试工作计划及有关事项”的通知&#xff1a;从2024年起&#xff0c;推行电子证书&#xff0c;原则上不再发放纸质证书&#xff0c;电子证书与纸质证书具有同等效力。 安徽也推行电子…

Seata 2.x 系列【5】直接部署

有道无术&#xff0c;术尚可求&#xff0c;有术无道&#xff0c;止于术。 本系列Seata 版本 2.0.0 本系列Spring Boot 版本 3.2.0 本系列Spring Cloud 版本 2023.0.0 源码地址&#xff1a;https://gitee.com/pearl-organization/study-seata-demo 文章目录 1. 概述2. 环境要…

学习嵌入式C语言要掌握到什么程度?

学习嵌入式C语言要掌握到什么程度&#xff1f; 在开始前我分享下我的经历&#xff0c;我刚入行时遇到一个好公司和师父&#xff0c;给了我机会&#xff0c;一年时间从3k薪资涨到18k的&#xff0c; 我师父给了一些 电气工程师学习方法和资料&#xff0c;让我不断提升自己&#…

Java注解介绍

Java注解 注解介绍元注解RetentionTargetDocumentedInherited接口类测试结果 注解介绍 Java注解&#xff08;Annotation&#xff09;是一种元数据&#xff08;Metadata&#xff09;的形式&#xff0c;它可以被添加到Java代码中的类、方法、变量、参数等元素上&#xff0c;以提…

一分钟带你入门Selenium入门!【建议收藏】

Selenium入门 欢迎阅读Selenium入门讲义&#xff0c;本讲义将会重点介绍Selenium的入门知识以及Selenium的前置知识。 自动化测试的基础 在Selenium的课程以前&#xff0c;我们先回顾一下软件测试的基本原理&#xff0c;为我们进一步完成Selenium自动化测试做好准备。 软件…

考研数学|张宇30讲,搭配什么基础题?

如果基础跟的是张宇&#xff0c;那么基础做的题目要根据自己的题目来决定 题集的选择最好不要太难&#xff0c;而且基础也不用做太多题目&#xff0c;以数学知识点的运用&#xff0c;培养做题感觉为主。 张宇老师的课程在基础阶段也有配套的课程&#xff0c;就是《张宇基础30…

2023郑州大学招新赛暨选拔赛补题

U287342 A.NANA与字符串 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) U287344 B.NANA学跳舞 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) U287345 C.NANA去上课 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) #include <bits/stdc.h> using namespace std; #de…

关于进程和线程

目录 前言: 1进程: 1.1定义&#xff1a; 1.1.1进程是操作系统分配资源的基本单元&#xff0c;拥有自己的独立空间和资源。 1.1.2每个进程都有一个唯一的PID&#xff08;进程标识符&#xff09;来标识。 1.2进程间通信&#xff1a; 1.2.1进程不是孤立的&#xff0c;它们之…

搜索引擎都没流量啦,官网建设还有啥意义?

百度等搜索引擎都没啥流量了&#xff0c;再建设官网还有啥用&#xff1f;如果你把官网定位于获客&#xff0c;那真的没啥太大用处&#xff0c;但是官网不仅仅是用来获客的。 一、搜索引擎的流量被稀释了 搜索引擎流量减少的原因有多个&#xff0c; 1. 社交媒体的崛起&#xf…

电机控制系列模块解析(第八篇)—— 高频注入法

一、基本原理 在电机控制领域&#xff0c;高频方波注入法常用于估计转子的位置和转速。其工作原理是每隔一定的时间间隔在电机输出电压上叠加一个电压脉冲。然后&#xff0c;在两相静止坐标系下或者同步旋转坐标系下对采样时刻的电压和电流进行相应的计算&#xff0c;以实现对…

基于Python3的数据结构与算法 - 11 基数排序

一、引入 多关键字排序&#xff1a;假如现在有一个员工表。要求按照薪资排序&#xff0c;薪资相同的员工按照年龄排序。 先按照年龄进行排序&#xff0c;再按照薪资进行稳定的排序 按照这种思路我们对[32,13,94,52,17,54,93]排序&#xff1a; 先比较十位数的数字大小&#…