清华本科、港科大准博士被指论文抄袭,网友:这是有技巧的“洗稿”

来源:整理自新智元、Reddit、知乎等

不是吧?清华自动化本科,香港科技大学硕士生发表的顶会论文竟然是抄的?

 

而且抄袭对象还是另一篇顶会论文?

 

近日,眼尖的网友发现两篇分别发表在 ICML 2021 和 ICCV 2021 两大顶会的论文有着惊人的相似之处!

PS:ICCV、ICML均为中国计算机学会在人工智能方向推荐的A类国际学术会议,为世界顶级的学术会议。

 

ICML 2021上发表的论文

 

ICCV 2021上发表的论文

而随着更多网友对论文的分析,有人指出这是一种很高明的“洗稿”技巧,Reddit上还有网友跑去了「抄袭者」的网站上看了作者的资料,发现这位作者已经发表过12篇顶会论文,而且还是准博士生,也不禁怀疑是不是一直都有这样的操作……

舆论关注之下,被指论文抄袭的两位作者及一作的导师在知乎上进行了回应。一作作者李铎发表致歉,表示将就此事“积极配合调查”,目前对该论文已采取撤稿措施。

顶会论文被指抄袭

网友指这是一种“技术活”抄袭

事情起源于法国国家科学研究中心博士后研究员Pierre Ablin在社交平台发的一篇推文。

他写道「模仿是最真诚的赞美形式?」

并贴出两篇内容有重合的论文。

这两篇论文分别是ICML 2021和ICCV 2021两大顶会的论文。

其中,被指控抄袭的论文一作,是清华自动化本科,香港科技大学的硕士,并且已获香港博士研究生奖学金计划(HKPFS)资助,将在2021年至2024年攻读博士学位。

导师还是张潼和陈启峰两位业界知名大佬,硕士两年在被视为计算机视觉方面的三大国际顶尖会议(ICCV、CVPR、ECCV)上共发表12篇论文,其中7篇一作,还曾在英特尔、商汤科技、字节跳动、英伟达实习。

此人还是之前小有名气的被CVPR 2021被接收的论文 Involution 模型的一作。

有着如此优秀、令绝大多数人羡慕不已的履历,还要搞论文抄袭,你敢相信吗?

而随着更多网友对被指控论文的分析,有人指出,这是一种“有技巧”的抄袭方式。

先来看看两篇论文的对比:

首先是论文的公开时间。

 

「正主」ICML论文题为Momentum residual neural networks,作者是Michael Sander, Pierre Ablin, Mathieu Blondel and Gabriel Peyré。

 

今年2月15日首次上传至Arxiv,2月17日开源代码,7月22日发布论文最新版。

 

论文地址:https://arxiv.org/abs/2102.07870

开源代码:https://github.com/michaelsdr/momentumnet/

 

「被指抄袭」ICCV论文题为m-RevNet: Deep Reversible Neural Networks with Momentum,作者是Duo Li(李铎)和Shang-Hua Gao(高尚华)。

 

今年8月12日上传至Arxiv,而ICCV 2021论文收录的截止时间为3月17日。

 

论文地址:https://arxiv.org/abs/2108.05862(文章现已被删除)

雷同一:提出想法相同

 

两篇文章都提出了替换残差网络的前向方程方法,也同样讨论了这种方法的好处:由于ODE机制中的动量,可逆性和更大的表征容量减少了内存负载。

 

其中,利用的动量方程取代残差网络的前向方程

 

雷同二:图表相似

 

左图为ICML论文,右图为ICCV论文

 

雷同三:表格相似

 

表格中有3列内容是相似的:

closed form inversion = analytical reversal,

same parameters = architecture preservation

unconstrained training = end-to-en optimization.

 

而ICCV论文中只是添加了ResNet基线。

 

ICML论文

 

ICCV论文

 

雷同四:完全相同的初始数据集,四个嵌套环

 

两篇论文都引用了一篇前人的研究(https://arxiv.org/abs/1904.01681) ,在这篇引文中,作者使用了2个嵌套环。

 

以前从来没有人用过四个嵌套环作为说明。

 

ICML论文

 

ICCV论文

 

雷同五:主要贡献的公式相似

 

ICCV只是把ICML中的临界参数「gamma」换成了「1-mu」。

 

左图为ICML论文,右图为ICCV论文

 

雷同六:文内引用相同

 

左图为ICML论文,右图为ICCV论文

两篇文章同样以Maclaurin等人的算法作为关键的应用。

 

左图为ICML论文,右图为ICCV论文

 

雷同七:命题和证明相同

 

只不过符号略有变化,ICCV将时间导数表示为 ,而ICML中为 

 

 左图为ICML论文,右图为ICCV论文

雷同八:论文贡献列表相似

 

两篇论文的贡献列表都是大同小异,但很明显能够感觉到ICCV论文是「洗稿」的。

 

左图为ICML论文,右图为ICCV论文

 

雷同九:微积分方程完全相同

 

ICCV中的例1基本上就是修改了一下符号,微积分方程本质上完全相同。

 

另外,两篇文章解决方案中的顺序也完全相同。

 

 左图为ICML论文,右图为ICCV论文

左图为ICML论文,右图为ICCV论文

 

雷同十:同样是得到两个嵌套环的启发

 

左图为ICML论文,右图为ICCV论文 

这两篇论文说一样吧,又不是完全一样;要说是偶然,这得多巧合才能「偶然」出十个雷同点。

知乎上更有答主直接指出:这种洗稿方式,也算是项工作量巨大的“技术活”了。

知乎匿名用户回答

抄袭惯犯?

随着这篇论文被曝光,有人还扒出了这位一作疑似用这种手法在2020年就给CVPR投稿了一篇「照搬」2019年CVPR的文章。

CVPR 2019接收论文,作者来自清华大学。

论文地址:https://arxiv.org/abs/1906.00675

 

CVPR 2020接收论文,作者李铎。

论文地址:https://arxiv.org/abs/2003.10739

「其通篇向人们展示了如何包装出一篇顶会论文!实在是触目惊心,看得我头皮发麻。」

 

具体参照知乎回答:

https://www.zhihu.com/question/480075870/answer/2064933570

作者和导师火速回应

这一事件迅速引起了极大的舆论关注,知乎上的相关话题甚至有100多万次浏览。

 

兹事体大,论文一作首先撤回了Arxiv上的论文,针对抄袭指控,该论文的二作、一作导师及一作先后在知乎作出回应。

导师致歉,表示自己有「不可推卸的督导不严的责任」。

一作导师、香港科技大学助理教授陈启峰表示,“对于李铎相关论文涉嫌严重学术不端,作为导师的我有不可推卸的督导不严的责任。”


并表示我们正在深入调查包括其他的论文在内的李铎的工作。在调查之后严肃处理相关问题,于近日公布相关处理措施。

二作:对于文章合作方面的不严谨,对于自己没有充分贡献但成为作者感到十分抱歉和羞愧。

该论文的二作高尚华,现为南开大学博士研究生,师从南开大学计算机科学与技术系系主任兼教授程明明。高尚华本科毕业于西安电子科技大学,研究兴趣包括计算机视觉和OAM通信。

二作作为涉事论文的改稿人,第一时间要求一作提供相关工作证据,但一作却声称数据已损坏。

 

面对这么可疑的解释,二作决定向ICCV反映相关情况,并要求撤稿。

二作在知乎上的澄清与道歉

 

二作向ICCV大会发送要求撤稿的邮件

其表示对该文章与ICML的工作相似性如此之高感到震惊和诧异。在仔细对比两篇工作后,我也很难相信这是两篇无关的同期工作。

我在这个事件中承认并深刻检讨我对于文章合作方面的不严谨,我对自己在没有对这项工作有充分贡献但成为作者感到十分抱歉和羞愧。

我深知我的错误是不可推卸的,我对因为这件事情造成伤害的ICML文章作者致以最诚挚的抱歉。我知道无论如何也无法挽回我的过错,我今后一定更加严格要求自己,严格规范自己与他人的文章合作,我也一定会尽自己最大努力做出有意义的工作来回报所有帮助和支持我的人。对不起大家,让你们失望了!

一作:已经采取了撤稿的措施。郑重道歉,积极配合调查。

针对抄袭指控,一作李铎17日下午作出致歉回应,并表示“已经采取了撤稿的措施。我在这里向大家郑重道歉,会在此事中积极配合调查。”针对“在行文过程中无意识地产生了相似之处”,他进行了解释。



我深知自己在科研中对于相关工作的调研出现了严重疏漏,导致与已有的工作出现了雷同,造成了不好的影响。我已经进行了深刻的自我反省和检讨,对于在此事件中受到伤害的Paper A的作者们,以及Paper B的合作者表示衷心的抱歉(高尚华同学仅参与到paper revision,对于细节不甚了解),同时对于给两位导师引起的不必要的麻烦和误解表示诚挚的歉意。鉴于已有相同idea的文章发表,我们目前已经采取了撤稿的措施。我在这里向大家郑重道歉,会在此事中积极配合调查,也虚心接受大家的批评!

对于大家密切关注的疑似抄袭的问题,我们根据Paper A作者提供的对比,仔细总结了两篇文章的异同以及我当时的构思:由于文章核心idea非常简明,导致在行文过程中无意识地产生了相似之处。

详细回应:

https://www.zhihu.com/question/480075870/answer/2065820430

科研不易,且行且珍惜,愿大家都珍惜羽毛,不触碰学术不端的事。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484090.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MATLAB深度学习入门

1. 加载图像 1.1 使用imread函数加载图像,可以加载GIF、JPEG、PNG等大多数标准文件格式图像。 Import an image img imread("file.jpg")1.2 采用**imshow()**来显示图像。 imshow(img)1.3 采用alexnet函数可以创建预定义的深度网络AlexNet的副本。 de…

SpringBoot笔记整理(三)

SpringBoot笔记整理(一) SpringBoot笔记整理(二) SpringBoot笔记整理(三) SpringBoot笔记整理(四) Web开发 1、使用SpringBoot: 1)创建SpringBoot应用&…

图神经网络,如何变深?

来源:智源社区版式制作:Camel撰文:侯振宇编辑:贾 伟现实世界中很多很多任务可以描述为图(Graph)问题,比如社交网络,蛋白质结构,交通路网数据,图是一个很值得研究的领域。近年来&am…

机器学习分类与性能度量

机器学习分类与性能度量 数据集:训练集(Training Set)、验证集(Validation Set)和测试集(Test Set) 1、 当模型无需人为设定超参数,所用参数都通过学习得到,则不需要验证集。验证集适合多个不同超参数训练多个模型,通过验证集,…

中国人民大学孟小峰教授:“科学数据智能——人工智能在科学发现中的机遇与挑战”...

来源:国家自然科学基金委员会微信公号 孟小峰 博士,中国人民大学教授,博士生导师,CCF会士。主要研究方向为数据库理论与系统、大数据管理系统、大数据隐私保护、大数据融合与智能、大数据实时分析、社会计算等。摘 要随着全球各科…

Java 面向对象语言基础

面向过程 就是分析出解决问题所需要的步骤,然后用函数把这些步骤一步一步实现,使用的时候一个一个依次调用就可以了。 面向对象 是把构成问题事务分解成各个对象,建立对象的目的不是为了完成一个步骤,而是为了描叙某个事物在整个解…

全球首例!这台机器人发明了两项新技术,已获专利授权!

文章来源:EETOP几天前前人工智能系统专利申请权有最新发展。南非率先成为第一个授予人工智能专利权的国家,承认人工智能机器人DABUS为「发明者」,6日澳大利亚联邦法院也做出裁决:发明者可以是非人类。 这算是有历史里程碑意义的判…

成员变量、局部变量、实例变量、静态变量、类变量、常量

成员变量: 直接在类中声明的变量叫成员变量(又称全局变量) ▲ 初始化: 如果未对成员变量设置初始值,则系统会根据成员变量的类型自动分配初始值:int分配初始值0、boolean分配初始值false,而自定义类型则分配初始值null…

行业洞见 | 一文了解自动驾驶汽车

文章来源:ancholabs.medium.com文字翻译: 新能源情报局封面配图:原作者驾驶是人类日常从事的活动中最困难的之一。遵循交通规则,通过眼神与其他司机沟通交流、对天气状况做出反应是成为优秀司机的先决条件。在自动驾驶汽车中&…

MATLAB高光谱图像处理基础

介绍高光谱图像的基本知识,便通过MATLAB对高光谱图像进行基本的处理。 文章目录前言一、高光谱图像二、MATLAB高光谱图像处理1.加载.MAT文件数据2.图像的显示3.图像维度变换总结前言 高光谱图像是一个立方体结构,维度为M x N x B,M为水平方向…

中国千亿科技巨头,成功收购英国最大芯片制造商!

来源:世界先进制造技术论坛内容来源:每日经济新闻综合自每经App、界面新闻、财联社等本期编辑:小艾 在全球缺芯的背景下,8月15日,国产芯片巨头闻泰科技(600745.SH)披露,旗下全资子公…

MATLAB图自编码器

通过MATLAB来实现图自编码器,用于高光谱图像特征的提取。 文章目录前言一、MATLAB相关知识二、编写算法1.图自编码器搭建2.可视化相关参数总结前言 算法输入数据: 图节点属性矩阵;邻接矩阵;概率p; W为自编码器的隐藏…

考夫曼:破解大脑代码并创建真正的人工智能

来源:CSDN博主「CDA数据分析师」原文链接:https://blog.csdn.net/yoggieCDA/article/details/1045567421955年,计算机科学家约翰麦卡锡(John McCarthy)首次创造了“人工智能”一词。当时,人工智能是对可以表…

MATLAB高光谱图像构建KNN图

在高光谱图像的特征提取过程中,采用非线性降维的方式对高光谱图像降维的过程中,采用图自编码器来对数据进行降维,需要将利用高光谱图像的结构信息和内容信息,则需要将高光谱图像数据构造为一个图结构,图结构的构建需要…

类脑量子叠加脉冲神经网络:从量子大脑假说到更好的人工智能

来源:神经现实作者:曾毅研究团队 |封面:Mario De Meyer排版:光影以深度神经网络为代表的现代人工智能模型在识别图像、语音、文字等模式信息任务取得优异表现。然而,生物大脑具有处理复杂多变的环境信息的能力&#xf…

遥感图像分类原理

1.原理 1.1 每一个像元作为一个样本,波段作为特征,理想情况下,同类地物应该具有相同或相似的特征描述,因此像元在n维特征空间中聚集在一起,而不同地物应该具有不同的特征描述,因此不同特征地物像元在n维空间…

2019第一次作业

10.实验代码 include <stdio.h> int main(void) { int i, f, X, N; scanf("%d",&N); int a [N]; scanf("%d",&X); f0; for(i0;i<N;i){ scanf("%d",&a[i]); if(a[i]X){ printf("%d",i); f; } } if(f0){ printf(&q…

分布式——ACID原则 CAP理论

分布式计算的原理 分布式计算就是将计算任务分摊到大量的计算节点上&#xff0c;一 起完成海量的计算任务。而分布式计算的原理和并行计算 类似&#xff0c;就是将一个复杂庞大的计算任务适当划分为一个个 小任务&#xff0c;任务并行执行&#xff0c;只不过分布式计算会将这些…

Matlab高光谱样本相关性分析

一.高光谱图像数据分析 1.分析光谱波段的相关性 1.1 对于维度为(m,n,b)的高光谱数据&#xff0c;使用reshape函数将其变换为(N,b)维度的&#xff0c;其中N m x n&#xff0c;表示像素数量&#xff0c;b表示波段数。 1.2 分析样本(像素)间波段的相关性&#xff0c;采用函数c…

万众瞩目的特斯拉AI日,会有哪些惊喜?

来源&#xff1a;华尔街见闻作者&#xff1a;方凌8月19日&#xff0c;特斯拉AI日即将举行。马斯克此前曾表示&#xff0c;此次AI日将展示特斯拉在人工智能方面硬件和软件开发的进展&#xff0c;并且招募顶级人才。活动的日子日渐临近&#xff0c;对于特斯拉究竟将在放出什么“大…