NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富

NeurIPS,全称 Neural Information Processing Systems Conference,是神经信息处理系统的年度学术会议。该会议始于 1987 年,当时名为 NIPS。随着人工智能领域的快速发展,其影响力逐渐扩大,被越来越多的研究者和企业关注并熟知。为了更好地反映会议涵盖的广泛领域,NIPS 于 2017 年正式更名为 NeurIPS。

如今,NeurIPS 已经成为全球人工智能领域最具权威性的学术会议之一,吸引了来自世界各地的学者、企业家和研究人员。

今年是 NeurIPS 举办的第 38 届 (NeurIPS 2024),学术成果盛况依旧。据悉,今年共收到 15,671 篇有效投稿,最终接收了 4,000 篇左右论文。

HyperAI超神经从大会接收的数据集中为大家汇总了 9 个高质量开源数据集,覆盖云层去除、化学光谱、歌声音频、自动驾驶、昆虫标本等多个方面,大家可以按需下载~

点击了解更多顶会信息:
https://go.hyper.ai/vWvAW

NeurIPS 2024 数据集汇总

1、AllClear 公共云层去除数据集

发布机构:康奈尔大学、哥伦比亚大学

预估大小:22.42 GB

下载地址:https://go.hyper.ai/uVwmU

卫星图像中的云层对于下游应用构成了重大挑战,当前云去除研究面临的一个主要问题是缺乏全面的基准测试和足够大且多样化的训练数据集。而 AllClear 是目前最大的公共云层去除数据集,包含 23,742 个全球分布的兴趣区域 (ROIs),覆盖了多样的土地利用模式,总共包含 400 万张图像。

2、Muharaf 手写阿拉伯文数据集

发布机构:北卡罗来纳州立大学、卡斯利克圣灵大学、黎巴嫩历史协会

预估大小:9.83 GB

下载地址:https://go.hyper.ai/HBEuz

Muharaf 数据集是一个专注于手写阿拉伯文识别的机器学习数据集,包含了超过 1.6k 张历史手写页面图像,这些图像由档案阿拉伯语专家转录。每张文档图像都伴随着其文本行的空间多边形坐标以及基本页面元素的信息,旨在推进手写文本识别 (HTR) 领域的技术进步。

3、化学多模光谱数据集

发布机构:IBM Research 、苏黎世大学、 EPFL 、NCCR Catalysis

预估大小:9.7 GB

下载地址:https://go.hyper.ai/sXVdm

该数据集包含了从专利数据中的化学反应中提取的 79 万种分子的模拟 1H-NMR 、13C-NMR、HSQC-NMR 、红外和质谱(正负离子模式)光谱数据。这个数据集的核心价值在于其能够整合多种光谱模态的信息,模拟人类专家分析分子结构的方法,从而有望自动化结构解析,简化从合成到结构确定的分子发现流程。

4、GTSinger 歌声音频数据集

发布机构:浙江大学

预估大小:28.94 GB

下载地址:https://go.hyper.ai/gLb3t

该数据集包含了 80.59 小时的专业录音棚录制的歌声,这些歌声由 20 位专业歌手演唱,覆盖了 9 种不同的语言,包括汉语、英语、日语、韩语等,为研究者提供了一个音色和风格极为丰富的资源库。

5、DrivingDojo 自动驾驶数据集

发布机构:中国科学院、美团、中国科学院香港创新研究院人工智能与机器人中心

下载地址:https://go.hyper.ai/a85sN

该数据集包含约 18k 个视频片段,涵盖北京、深圳、徐州等城市,并在不同的天气条件和日光条件下录制。它不仅包括了加速、紧急刹车、停车启动等纵向操作,还包括了掉头、超车和变道等横向操作。此外,数据集特别设计了包含大量多主体交互轨迹的视频,旨在提升世界模型在复杂驾驶环境中的预测和控制能力。

6、多模态昆虫生物多样性数据集

发布机构:生物多样性基因组学中心、圭尔夫大学、滑铁卢大学等

预估大小:37.71 GB

下载地址:https://go.hyper.ai/narLh

BIOSCAN-5M 数据集包含了超过 500 万昆虫标本的详细信息,显著扩展了现有的基于图像的生物数据集,不仅包括分类标签、原始核苷酸条形码序列、分配的条形码索引号和地理信息,还涵盖了标本大小等多模态信息,旨在理解和监测全球昆虫生物多样性。

7、OpenSatMap 高分辨率卫星数据集

发布机构:中国科学院、中国科学院香港信息系统研究所人工智能与机器人研究中心、腾讯地图和北京邮电大学

预估大小:57.7 GB

下载地址:https://go.hyper.ai/mFXUw

该数据集是一个高分辨率卫星数据集,专为大规模地图构建而设计。其特点是细粒度的实例级注释和高分辨率图像,包含了 3,787 张高分辨率卫星图像,其中不仅包括中国多个城市的图像,还涵盖全球 50 多个城市和 18 个国家的图像。

8、自然物种声音数据集

发布机构:马萨诸塞大学阿默斯特分校、iNaturalist

预估大小:131.26 GB

下载地址:https://go.hyper.ai/R8Ix7

该数据集收集了 230,000 个音频文件,捕捉了来自超过 5,500 个物种的声音,这些声音由全球超过 27,000 名记录者贡献。这个数据集包含了鸟类、哺乳动物、昆虫、爬行动物和两栖动物的声音,音频和物种标签来源于提交给 iNaturalist 的观察记录。

9、MINT-1T 文本图像对多模态数据集

发布机构:华盛顿大学、斯坦福大学、Salesforce Research 等

下载地址:https://go.hyper.ai/l5vvj

该数据集包含 1 万亿个文本标记和 34 亿张图像,其规模是之前最大开源数据集的 10 倍。它不仅包括 HTML 文档,还涵盖 PDF 文档和 ArXiv 论文,其多样性显著提升了科学文档的覆盖率。

10、AudioSetCaps 音频字幕数据集

发布机构:西北工业大学、西安联丰声学技术有限公司、南洋理工大学、中国科学院声学研究所等

下载地址:https://go.hyper.ai/WRZDQ

AudioSetCaps 是一个音频-字幕数据集,数据来源于 AudioSet 、YouTube-8M 和 VGGSound,包含 6,117,099 个 10 秒的音频文件。每个音频文件都附有一个描述性标题,还附有 3 个 Q&A 对作为生成最终标题的元数据(共 18,414,789 对 Q&A 数据)。

以上就是 HyperAI超神经为大家汇总的 NeurIPS 2024 数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62524.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

服务器作业4

[rootlocalhost ~]# vim 11.sh #关闭防火墙 systemctl stop firewalld setenforce 0 #1.接收用户部署的服务名称 read -p "服务名称:(nginx)" server_name if [ $server_name ! nginx ];then echo "输入的不是nginx,脚本退出" exit 1 fi # 判断…

二,[ACTF2020 新生赛]Include1感谢 Y1ng 师傅供题。

进入靶场后,发现tips可以点击 点击后进入此页面 猜测此为文件包含漏洞,构造payload,并成功得到base64编码后的源码 详解payload: php://filter/readconvert.base64-encode/resourceflag.php 1.php://filter是PHP中的一个流封装协议&#xf…

APP聊天项目介绍

项目结构说明 res/layout目录:存放布局相关的 XML 文件,用于定义界面的外观,包含activity_main.xml(主界面布局)和message_item.xml(聊天消息项布局)。 res/drawable目录:存放一些…

vue3.0 根据富文本html页面生成压缩包(含视频在线地址、图片在线地址、前端截图、前端文档)

vue3.0生成压缩包(含在线地址、前端截图、前端文档) 需求描述效果开始下载插件包基本代码构造 点击下载按钮1.截图content元素,并转化为pdfcanvas putImageData、getImageDatagetImageData 获取指定矩形区域的像素信息putImageData 将这些数据…

图像小波去噪与总变分去噪详解与Python实现

目录 图像小波去噪与总变分去噪详解与实现1. 基础概念1.1 噪声类型及去噪问题定义1.2 小波去噪算法基础1.3 总变分去噪算法基础2. 小波去噪算法2.1 理论介绍2.2 Python实现及代码详解2.3 案例分析3. 总变分去噪算法3.1 理论介绍3.2 Python实现及代码详解3.3 案例分析4. 两种算法…

单细胞细胞通讯全流程分析教程,代做分析和辅导

0. 分析参数文件和细胞通讯的演示数据 0.1 细胞通讯分析总的参数文件,后面部分细胞通讯分析模块会用到 分析参数文件 参数文件名称:total_analysis_params_demo.xlsx ,很多分析模块都是这个总的参数文件,我的这个总的参数文件如…

auto与decltype

auto: 1.定义&#xff1a; 在C中&#xff0c; auto 是一个类型说明符&#xff0c;它让编译器在编译阶段自动推导变量的类型&#xff0c;其类型取决于初始化表达式的类型。auto 在声明变量时使用&#xff0c;编译器会根据变量初始化表达式自动推断类型。 #include<iostrea…

[Code]R2U-Net中的眼部血管分割

DenseUnet.py import torch import torch.nn as nn import torch.nn.functional as F# 定义一个名为Single_level_densenet的类,继承自nn.Module,它构建了一个单层级的DenseNet结构 class Single_level_densenet(nn.Module):def __init__(self, filters, num_conv=4):super…

Java中的“封装“详解

封装&#xff08;Encapsulation&#xff09;是面向对象编程&#xff08;OOP&#xff09;的四大基本特性之一。它通过将数据和操作数据的方法绑定在一起&#xff0c;并隐藏对象的内部实现细节&#xff0c;只提供有限的访问接口来实现。这种机制不仅提高了代码的安全性&#xff0…

深度学习常用方法(一)

1. Dropout 的原理 Dropout 是一种防止神经网络过拟合&#xff08;学习得过于复杂&#xff0c;导致泛化能力差&#xff09;的方法。 原理&#xff1a;在每次训练时&#xff0c;随机“丢弃”一部分神经元&#xff08;即暂时让它们失效&#xff0c;设置为零&#xff09;&#x…

C++趣味编程:基于树莓派Pico的模拟沙漏-倾斜开关与LED的互动实现

沙漏,作为一种古老的计时工具,利用重力让沙子通过狭小通道,形成了计时效果。在现代,我们可以通过电子元件模拟沙漏的工作原理。本项目利用树莓派Pico、倾斜开关和LED,实现了一个电子沙漏。以下是项目的详细技术解析与C++代码实现。 一、项目概述 1. 项目目标 通过倾斜开关…

【Oracle】个人收集整理的Oracle常用SQL及命令

【建表】 create table emp( id number(12), name nvarchar2(20), primary key(id) ); 【充值一】 insert into emp select rownum,dbms_random.string(*,dbms_random.value(6,20)) from dual connect by level<101; 【充值二】 begin for i in 1..100 loop inser…

RAG (Retrieval Augmented Generation) 检索增强和生成

1 RAG技术简介 1.1 RAG技术概述 RAG&#xff08;Retrieval Augmented Generation&#xff09; 是一种结合了检索&#xff08;Retrieval&#xff09;和生成&#xff08;Generation&#xff09;的技术&#xff0c;旨在通过利用外部知识库来增强大型语言模型&#xff08;LLMs&am…

Android 编译和使用libheif

项目中需要使用libheif,libde265,libyuv。一下是相应的cmakelist.txt。这里直接使用了静态库。 里面涉及到c包的链接&#xff0c;需要stdc。 ${PROJECT_SOURCE_DIR}/../jniLibs/${ANDROID_ABI}/liblibde265.a这个路径由于操作过程中copy出现问题&#xff0c;多了一层路径&…

【无标题】多模态对齐

第一章 绪论 1.1 研究背景和意义 在现实生活中,人类往往是以事件为单位来认识和理解世界的,一个事件包 含了时间、地点、参与者等多个静态因素。将这些事件信息从非结构化数据中提 取出来,已逐渐成为信息抽取领域的关键任务之一。事件通常并非孤立存在,而 是彼此关联,它…

DIY-Tomcat part 3 实现对动态资源的请求

实现ServletRequest package connector;import javax.servlet.RequestDispatcher; import javax.servlet.ServletInputStream; import javax.servlet.ServletRequest; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.i…

黑马程序员Java笔记整理(day05)

1.面向对象编程 2.用法 3.对象是什么 4.对象在计算机中是啥 5.无参与有参构造器 小结: 6.this的作用 7.小结 8.封装 9.小结 10.实体类 11.小结 12.static 13.小结 14.static修饰方法 15.static应用前景 16.几个注意事项 17.java中可以直接用类的名字创建数组&#xff0c;如: M…

Perforce SAST专家详解:自动驾驶汽车的安全与技术挑战,Klocwork、Helix QAC等静态代码分析成必备合规性工具

自动驾驶汽车安全吗&#xff1f;现代汽车的软件包含1亿多行代码&#xff0c;支持许多不同的功能&#xff0c;如巡航控制、速度辅助和泊车摄像头。而且&#xff0c;这些嵌入式系统中的代码只会越来越复杂。 随着未来汽车的互联程度越来越高&#xff0c;这一趋势还将继续。汽车越…

《Python基础》之数据加密模块hashlib的用法

目录 一、简介 二、用法 步骤一、导入hashlib库 步骤二、创建哈希对象 步骤三、往哈希对象中传值 1、可以在创建对象的时候传值 2、使用updata传值 步骤四、获取经过哈希对象加密后的值 三、注意事项 1、编码问题 2、安全性 3、多次传值 四、总结 一、简介 hashli…

QT实战--qt各种按钮实现

本篇介绍qt一些按钮的实现&#xff0c;包括正常按钮&#xff1b;带有下拉箭头的按钮的各种实现&#xff1b;按钮和箭头两部分分别响应&#xff1b;图片和按钮大小一致&#xff1b;图片和按钮大小不一致的处理&#xff1b;文字和图片位置的按钮 效果图如下&#xff1a; 详细实现…