斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

6月4日,两名斯坦福大学生Aksh Garg和Siddharth Sharma,承认抄袭清华和面壁智能联合开发的MiniCPM-Llama3-V2.5(以下简称V2.5)多模态大模型事件,并在社交平台公开道歉、删掉开源项目。

该抄袭事件也得到了斯坦福大学AI实验室主任Christopher Manning的认证,表扬了国内大学、企业对开源大模型的贡献,并表示对该事件毫不知情。

V2.5开源地址:https://github.com/OpenBMB/MiniCPM-V?tab=readme-ov-file

图片


两位同学发的道歉信一样

整个抄袭事件全过程

其实昨天这个事情在国内相当炸裂,登上了好几个平台的热搜榜首,「AIGC开放社区」就根据多方已经证实的内容,为大家梳理一下抄袭事件的全过程。

5月29日,斯坦福大学的AI团队宣称,他们开源了一款名叫Llama3-V的多模态模型(https://github.com/mustafaaljadery/llama3v已删除无法访问),只需要500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。

发布没多久,Llama3-V便成为Hugging Face上非常火热的一款开源产品。

6月2日,有开发者质疑Llama3-V抄袭国内清华和面壁智能联合开源的最新项目V2.5,主要抄袭的证据有以下几点。

图片

1)特色功能一样:V2.5的特色功能之一是可以识别“清华简”,这是中国战国时期写在竹子上的一种非常特殊且罕见的中国古文字。

而Llama3-V居然也能识别。但这个训练数据是清华2500多张竹简中扫描下来的,并非是从公开训练数据中提取的。

图片

2)Llama3-V的模型架构、代码、配置文件、分词器基本一样,只是增加了高斯噪声、变量名称不一样而已。

图片

3)重叠度高达87%:为了验证是否抄袭,用户将V2.5与其他几个基于Llama3的多模态模型进行了比较,例如,Bunny-Llama-3-8B-V、Bunny-Llama-3-8B-V,模型的重叠率为0。但与Llama3-V进行比对时,重叠率居然高达87%。

此外,两者还有非常相似的误差分布。Llama3-V和V2.5分别做出了236个和194个错误预测,而重叠部分为182个。如果是原创模型根本不会有如此高的重叠度

图片

4)犯的错误一样:用户将Llama3-V用于测试WebAgent时,居然与V2.5犯的错误一样。但V2.5使用的是内部从未公开过的训练数据,这也再一次证明Llama3-V的抄袭行为。

图片

网上还罗列出了不少抄袭的证据,但上面4点是最致命的,基本都是同一架构、训练数据才能犯的错误Llama3-V居然全中了。

相当于两个人的脸型、眼睛、鼻子、嘴巴几乎一模一样,只是你的头发比我多一些,难道就不认我这个秃头兄弟了吗~

斯坦福AI实验室主任证实

起初这个抄袭事件并没有引起太大关注,但随着证据越来越多被实锤,就连斯坦福大学AI实验室主任Christopher Manning也下场道歉了,表示,犯了错误就要勇于承!

同时表扬了清华大学对开源项目的贡献,而他自己对该事件毫不知情。但是有人指出,这位教授在6月3日是知道该事件的。

图片

两位学生迫于各界压力,昨天在社交平台进行了公开道歉,但是态度并不是很诚恳。首先,他们居然使用了同样的道歉信,难道不需要仔细说明一下你在这个项目的角色、最初想法以及为什么要这么做吗?

图片

还有一个就是甩锅,两位公开道歉的学生表示,他们只是负责该模型的社区宣传,实际写代码的是一位叫Mustafa Aljadery的。

图片

这就更严重了,既然你们只是负责宣传,那为啥在作者栏那里加上自己的名字呢?在宣发的时候难道不验证一下论文和项目吗?并且表示对V2.5这个开源项目毫不知情。

都是成年人,既然犯错了,就应该像个爷们一样勇敢承担起来,下次改过就可以了。如果试图继续掩盖,只会越描越黑。

这个抄袭事件也折射出了我国在AI芯片制裁的大背景下对大模型开发、训练的无奈,没有超强GPU集群支撑,只能从算法、脚骨、训练数据去打磨。

同时我们的大模型开源生态也被低估了,通义千问、面壁智能、百川智能等一大批优秀的开源项目已经获得了世界的认可并迅速崛起。

图片

本文素材来源网络、斯坦福社交平台,如有侵权请联系删除

END

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22492.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【python】成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南

成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南 在Python编程中,尤其是在使用scipy这个科学计算库时,可能会遇到ImportError错误,提示无法从scipy.linalg模块中导入名为triu的函数。这个错误通…

ROS系列rqt的安装以及使用方法介绍

目录 1. 安装 2. 部分工具的功能介绍及使用方法 1)rqt_gui 2)rqt_topic 3)rqt_graph 4)qt_plot 5)rqt_service_caller 6)rqt_bag 1. 安装 安装极其简单,不多介绍,直接上命令…

反向海淘代购系统中的API接口列表

API测试入口|代购系统演示 item_get 获得淘宝商品详情item_get_pro 获得淘宝商品详情高级版item_review 获得淘宝商品评论item_fee 获得淘宝商品快递费用item_password 获得淘口令真实urlitem_list_updown 批量获得淘宝商品上下架时间seller_info 获得淘宝店铺详情item_search…

CrossPrefetch: Accelerating I/O Prefetching for Modern Storage——论文泛读

ASPLOS 2024 Paper 论文阅读笔记整理 问题 目前计算设备和存储设备之间的性能差距仍然很大。因此,主内存缓存和缓冲区被广泛用于操作系统、用户级文件系统[32]和I/O运行时,在隐藏性能差距和减少I/O瓶颈方面发挥关键作用[23,26,3…

python运算符和表达式

目录 算数运算符 赋值运算符 关系运算符 逻辑运算符 位运算符 成员运算符 运算符优先级 易错点: 算数运算符 赋值运算符 关系运算符 int可以转换成float 逻辑运算符 可以是一个运算也可以是一个字符串 左边为空格,为假,输出为空 优…

MySQL中获取时间的方法

大家好,在MySQL数据库开发中,获取时间是一个常见的需求。MySQL提供了多种方法来获取当前日期、时间和时间戳,并且可以对时间进行格式化、计算和转换。 以下是一些常用的MySQL时间函数及其示例: 1、NOW():用于获取当前…

Mysql:通过一张表里的父子级,递归查询并且分组分级

表:gc_jzst_single_base 需求:要求返回这张表里符合条件的数据,且有父子级关系的,展示为同一组且分级,给后续业务调用 代码 WITH RECURSIVE t1 AS (SELECTsingle_id,old_build_single_id,single_name,bulid_code,1 A…

Mybatis Map接收数据tinyint(1)类型错误

Mybatis Map接收数据tinyint 1 类型错误 问题描述数据库字段Mybatis查询语句问题处理方案一方案二方案三 问题描述 Mybatis开发过程中,使用Map接收返回数据时发现tinyint(1)类型字段自动转换成了Boolean类型,导致查询的数据出现问题 数据库字段 数据库…

实验四、零比特插入《计算机网络》

但凡这句话有一点用的话也不至于一点用都没有。 目录 一、实验目的 二、实验内容 三、实验小结 一、实验目的 掌握零比特插入原理及方法使用任意编程语言实现零比特插入方法。 二、实验内容 掌握零比特插入原理及方法 点对点协议 PPP(Point-to-Point Protoco…

Elasticsearch:基于多个 kNN 字段对文档进行评分

作者:来自 Elastic Madhusudhan Konda 通过具有多个 kNN 字段的最接近的文档对文档进行评分 Elasticsearch 不仅仅是一个词法(文本)搜索引擎。 Elasticsearch 是多功能搜索引擎,除了传统的文本匹配之外,还支持 k 最近…

【C++】优先级队列介绍与模拟实现

💞💞 前言 hello hello~ ,这里是大耳朵土土垚~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 💥个人主页&#x…

Hadoop3:MapReduce之InputFormat数据输入过程整体概览(0)

一、MapReduce中数据流向 二、MapTask并行度 1、原理概览 数据块:Block是HDFS物理上把数据分成一块一块。数据块是HDFS存储数据单位。 数据切片:数据切片只是在逻辑上对输入进行分片,并不会在磁盘上将其切分成片进行存储。数据切片是MapRed…

哇噻,Zabbix7.0 LTS正式发布!功能又进化了!

📢📢📢📣📣📣 作者:IT邦德 中国DBA联盟(ACDU)成员,10余年DBA工作经验, Oracle、PostgreSQL ACE CSDN博客专家及B站知名UP主,全网粉丝10万 擅长主流Oracle、My…

全平台自定义小程序源码系统 一个后台控制7端 自主设计属于你的小程序 前后端带完整的安装代码包以及搭建教程

系统概述 在当今数字化时代,小程序以其轻量级、跨平台、即用即走的特点,成为企业、个人及开发者们追捧的热门工具。为了满足不同用户的需求,小编给大家分享一款全平台自定义小程序源码系统。该系统通过一套强大的后台管理系统,实…

游泳预约报名小程序开发源码案例模板之前端功能介绍

越来越多游泳馆使用线上预约报名管理系统,以此来提升游泳馆预约的便捷性以及管理的效率。馆客多小程序是一款实用、便捷的线上运动服务平台,可以让用户轻松预订游泳馆场地并享受自助线上服务,同时也减轻了游泳馆运营压力,提高游泳…

XLA - 加速线性代数

文章目录 一、关于 XLAXLA目标XLA 运作方式 二、Community沟通渠道其他资源存储库 一、关于 XLA XLA : Accelerated Linear Algebra github : https://github.com/openxla/xlaOpenXLA Community : https://github.com/openxla/communityXLA - TensorFlow : https://tensorflo…

Flink SQL查询语法部分详解(提供需求、数据练习复现)

一、Hints 动态表选择:可以在查询表的时候动态修改表的参数配置 1、读取kafka的数据建表 CREATE TABLE students (id STRING,name STRING,age INT,sex STRING,clazz STRING ) WITH (connector kafka,topic students, -- 指定topicproperties.bootstrap.servers …

高效扫码点餐:简餐茶饮外卖新体验

前言 在快节奏的现代生活中,高效便捷的扫码点餐系统正逐渐成为简餐茶饮行业的新宠。这一系统不仅提升了顾客的点餐体验,还优化了门店的运营效率,特别是基于总部多门店的连锁模式,更是将这一优势发挥得淋漓尽致。 一、这款扫码点餐…

如何通过PHP语言实现远程控制多路照明

如何通过PHP语言实现远程控制多路照明呢? 本文描述了使用PHP语言调用HTTP接口,实现控制多路照明,通过多路控制器,可独立远程控制多路照明。 可选用产品:可根据实际场景需求,选择对应的规格 序号设备名称厂…

软理复习范围

1.直觉主义逻辑常采用三值逻辑来处理命题的真值,包括以下三个真值: 真(True):表示命题是确定为真的。假(False):表示命题是确定为假的。未知(Unknown)&#…