机器人开源项目分享,助力一户一机器人

图片

最初,因隋炀帝思念心切,命工匠按照柳抃的形象制作了木偶机器人,被认为是历史上最早的机器人之一。这些木偶机器人通过精巧设计的机关,能够执行坐、起、拜、伏等动作。

如今,随着科技的发展,机器人已经广泛应用于医疗、军事、教育、服务等各个领域,为人类提供更安全、更便捷、更高效的服务。

因此,本文整理了一些机器人相关的开源数据集、模型和项目,旨在帮助研究人员更好地开展相关领域的工作。

LeRobot

LeRobot 是由 Hugging Face 开源的一个机器人代码库,提供模型、数据集和工具。它通过预训练模型、数据集和模拟来拉低机器人入门门槛。

核心特点:

  • 开源:与各方合作创建一个庞大的众包机器人数据集,增强了开发复杂人工智能驱动机器人的资源。

  • 多功能:一个用于共享、可视化数据和训练最先进模型(SOTA)的库。用户可以访问大量预训练模型,快速启动项目。

  • 兼容性高:兼容各种机器人硬件,从简单的机械臂到复杂的类人机器人。

推人表示 Hugging Face 这一举动将削弱大型人工智能技术公司的垄断地位,加速人工智能机器人技术的创新!!!

  • Github:https://github.com/huggingface/lerobot

  • Huggingface:https://huggingface.co/lerobot

图片

RoboFlamingo

RoboFlamingo 是机器人领域首个开源的视觉-语言操作大模型,由 ByteDance 团队开发。通过简单的微调,即可使 RoboFlamingo 适应基于语言的机器人操作任务。此外,它能够通过开环控制实现实时响应,并且可以灵活部署在性能较低的平台上。

  • 论文链接:https://arxiv.org/abs/2311.01378

  • 项目链接:https://roboflamingo.github.io/

图片

Open X-Embodiment

Open X-Embodiment 数据集是迄今为止最大的开源真实机器人数据集,由全球 34 个机器人研究实验室提供的 60 个现有机器人数据集构建而成。该数据集包含超过 1 百万条真实机器人轨迹,涵盖了 22 种不同的机器人具身,从单臂机器人到双手臂机器人和四足机器人。

  • 论文链接:https://arxiv.org/abs/2310.08864

  • 项目链接:https://robotics-transformer-x.github.io/

图片

RoboAgent

由 CMU 和 Meta AI 共同开发的通用的 RoboAgent,仅在 7500 条轨迹数据上进行训练,就能在 38 个任务中展示 12 种多样的操作技能,且不限于拾取 / 推动,还包括关节对象操纵和物体重新定位,以及能将这些技能推广应用于数百个不同的未知情境(未知物体、未知任务,甚至完全未知的厨房环境)。

其中用于训练 RoboAgent 的数据集 RoboSet(MT-ACT)仅包括 7500 条轨迹(比 RT-1 的数据少 18 倍)。除此之外,还发布了一个更大的数据集 RoboSet,该数据集是在几个相关项目过程中收集的,总共包含 100050 条轨迹,其中包括非厨房场景。并且已开源。

  • 论文链接:https://arxiv.org/pdf/2309.01918.pdf

  • 项目链接:https://robopen.github.io/

图片

Mobile ALOHA

Mobile ALOHA 是由斯坦福大学的研究团队开发的一个机器人开源项目。它的运动控制能力采用模仿学习,通过人类操作机器人,机器人学习模仿人类行为,形成机器人的行为逻辑。仅需要进行 50 次演示的训练,就能够在处理日常家务时达到 80% 以上的成功率。

例如,在论文中列出的任务执行成功率如下:擦拭红酒、呼叫电梯、击掌、收纳平底锅、冲洗平底锅、推椅子成功率分别为 95%、95%、85%、85%、80%、80%。

其中,最令人惊讶的是制作滑蛋虾仁这项长达 75 秒的艰巨烹饪任务,尽管成功率只有40%。

  • 论文链接:http://arxiv.org/abs/2401.02117

  • 项目链接:https://mobile-aloha.github.io/

Dobb·E

Dobb·E 是由纽约大学的研究团队开发的一个开源家庭机器人系统,仅需约 20 分钟就可以教会机器人完成一项家务,成功率达到 81%。

Homes of New York(HoNY)数据集包含纽约 22 户家庭使用 Stick 工具收集的 13 小时互动的视频,包含每秒 30 帧的 RGB 和深度视频,以及 6D 握爪姿势和握爪张开角度的完整动作标注。

  • 论文链接:https://arxiv.org/abs/2311.16098

  • 项目链接:https://dobb-e.com/

MCD

MCD 是由南洋理工开源的大规模多校区机器人感知数据集。该数据集在亚洲和欧洲的大型校园区域不同季节收集而成,具有以下特点:

  • 多种感测模态

    • 3D spinning lidar

    • Non-repetItive lidar

    • Stereo cameras

    • High quality IMUs

    • UWB ranging sensors

  • 覆盖领域广:横跨欧亚的三个大学校区

  • 逐点标注的NRE点云

  • 高精度连续时间真实值

  • 迎接感知中的挑战

  • 广泛的基准测试

收录于 CVPR 2024。

  • 论文链接:https://arxiv.org/abs/2403.11496v1

  • 项目链接:https://mcdviral.github.io/

图片

TreeScope

TreeScope 是一个用于精准农业和林业的机器人数据集,用于对林业和果园中的树木进行计数和绘图。

特点如下:

  • 超 1800 多个人工标注的树干语义标签和实地测量的树木直径

  • 10 小时的 ROS bags,2.2 TB 的数据,覆盖 50 公顷的地形

  • 使用无人机和移动机器人平台收集数据

  • 弗吉尼亚州和新泽西州森林中的各种松树和橡树林

  • 加利福尼亚中部开心果和杏仁果园的树冠开启和关闭情况

  • 无人机自主飞行和传感器数据可供飞行一小时使用

收录于 ICRA 2024。

  • 论文链接:https://arxiv.org/abs/2310.02162

  • 项目链接:https://treescope.org/

USTC FLICAR Dataset

USTC FLICAR Dataset 是由中国科大发布的首个高空作业机器人多模态感知数据集,超过 1.5TB 个数据,包括 4 万个立体图像对、10万个单目图像、7万帧激光雷达点云以及高频IMU/INS和激光跟踪仪运动测量数据。

  • 中文介绍:https://lmbd.ustc.edu.cn/2023/1012/c10217a614638/page.htm

  • 论文链接:https://journals.sagepub.com/doi/abs/10.1177/02783649231195650

  • 项目链接:https://ustc-flicar.github.io/

图片

RoboNet

RoboNet 是由伯克利人工智能研究公司开源的大规模多机器人学习数据集,包含超过 1500 万个机器人与物体交互的视频帧,这些视频帧来自 113 个独特的摄像机视角。

RoboNet 示例及数据统计如下:

图片

  • 论文链接:https://arxiv.org/abs/1910.11215

  • 项目链接:https://www.robonet.wiki/


随着机器人技术的不断进步,其应用范围越来越广泛,对操作精度等性能的要求也在持续提升。面对这一挑战,开发者们积极采取各种措施进行应对,从构建大规模数据集到引入先进的机器学习技术,不断涌现各种方法以适应精准机器人技术的不断演变。然而,技术的升级离不开算力的支持。作为算力服务商,趋动云拥有高性能的计算资源,能够快速处理海量数据,为开发人员提供强大的支持。

趋动云是面向企业、科研机构和个人 AI 开发者构建的开发和推理训练服务,也是全球首个基于 GPU 算力池化云的服务。

趋动云的使命是连接算力·连接人:

📍通过连接全球算力,趋动云可以为用户提供便宜、好用的 AI 算力。
📍通过为AI算法开发全流程提供优化服务、构建全球开发者项目和数据社区,趋动云可以帮助AI开发者接入丰富的生态,快速实现最佳实践

趋动云

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/14014.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从ES5迈向ES6:探索 JavaScript 新增声明命令与解构赋值的魅力

个人主页:学习前端的小z 个人专栏:JavaScript 精粹 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! ES5、ES6介绍 文章目录 💯声明命令 let、const🍟1 let声明符&a…

Linux磁盘初始化与fstab文件更新

环境: Redhat 7.9 本文操作: >>给disk设置分区 (fdisk) >>给disk设置file system格式 (mkfs ) >>创建路径,并将disk mount上(mkdir和mount ) >>修改fstab文件 初始化Disk 初始化前&#xff…

【计算机网络原理】对传输层TCP协议的重点知识的总结

˃͈꒵˂͈꒱ write in front ꒰˃͈꒵˂͈꒱ ʕ̯•͡˔•̯᷅ʔ大家好,我是xiaoxie.希望你看完之后,有不足之处请多多谅解,让我们一起共同进步૮₍❀ᴗ͈ . ᴗ͈ აxiaoxieʕ̯•͡˔•̯᷅ʔ—CSDN博客 本文由xiaoxieʕ̯•͡˔•̯᷅ʔ 原创 CSDN 如…

桌面文件不见了怎么恢复?五种方法解决文件恢复难题,建议收藏

不小心误删除了桌面文件,导致文件丢失。事实上误删的文件并没有被永久删除,而是被移动到了回收站中,可以恢复这些文件。本文将分享多种方法,具体步骤如下。 方法一:从回收站中恢复 大多数操作系统都有回收站或垃圾桶的…

【C语言】结构体内存对齐:热门面试话题

🔥引言 书接上文,我们了解关于结构体的基本知识,这篇将深入剖析结构体中一个重要的知识点:内存对齐 关于内存对齐是属于热门面试话题,对此单独放在一篇来分享 🌈个人主页:是店小二呀 🌈C语言笔记…

3D工业视觉

前言 本文主要介绍3D视觉技术、工业领域的应用、市场格局等,主要技术包括激光三角测量、结构光、ToF、立体视觉。 一、核心内容 3D视觉技术满足工业领域更高精度、更高速度、更柔性化的需求,扩大工业自动化的场景。 2D视觉技术基于物体平面轮廓&#…

软件无线电学习-第二代移动通信系统过程理解

本文知识内容摘自《软件无线电原理和应用》 无线通信领域让大家感受最深的是民用移动通信的快速发展。民用移动通信在短短的二十年时间里已发展了三代:20世纪80年代的模拟体制(TACS/AMPS)为第一代移动通信(简称1G);20世纪90年代的数字体制(GSMCDMATDMA)…

Git提交和配置命令

一、提交代码到仓库 在软件开发中,版本控制是一个至关重要的环节。而Git作为目前最流行的版本控制系统之一,为我们提供了便捷高效的代码管理和协作工具。在日常开发中,我们经常需要将本地代码提交到远程仓库,以便于团队协作和版本…

Java基础教程 - 9 集合

更好的阅读体验:点这里 ( www.doubibiji.com ) 更好的阅读体验:点这里 ( www.doubibiji.com ) 更好的阅读体验:点这里 ( www.doubibiji.com ) 9 集合 什么是集合&…

【stm32/CubeMX、HAL库】嵌入式实验六:定时器(2)|PWM输出

参考: 【【正点原子】手把手教你学STM32CubeIDE开发】 https://www.bilibili.com/video/BV1Wp42127Cx/?p13&share_sourcecopy_web&vd_source9332b8fc5ea8d349a54c3989f6189fd3 《嵌入式系统基础与实践》刘黎明等编著,第九章定时器&#xff0c…

爱普生TG5032SFN温补晶振在机器人控制中的应用

机器人控制是机器人技术的核心组成部分,它涉及通过传感器采集外部环境信息,然后经过信号处理、运动规划和执行控制等步骤,最终实现机器人的运动控制和任务执行。在技术的不断更选,机器人控制也在不断进步和演变。智能化机器人具备…

Z缓冲技术在AI去衣中的关键角色

引言: 人工智能(AI)技术的飞速发展,为图像处理领域带来了革命性的变化。其中,AI去衣技术作为一种新兴的应用,引起了广泛关注。它不仅在多媒体内容的编辑、虚拟现实和增强现实等领域具有重要的应用价值&…

Jenkins 构建 Maven 项目:项目和服务器在一起的情况

bash.sh内容 #!/bin/bash#删除历史数据 rm -rf ruoyi-admin.jar# appname$1 appnamevideo.xxxxx.com #获取传入的参数 echo "arg:$appname"#获取正在运行的jar包pid # pidps -ef | grep $1 | grep java -jar | awk {printf $2} pidps -ef | grep $appname | grep ja…

1673. 找出最具竞争力的子序列

题目 给定一个整数数组 nums 和一个正整数 k,返回长度为 k 且最具竞争力的 nums 子序列。 数组的子序列是从数组中删除一些元素(可能不删除元素)得到的序列。 在子序列 a 和子序列 b 第一个不相同的位置上,如果 a 中的数字小于…

mysql 删除特殊字符 表中存了特殊字符 换行符 回车符 word字符 查询不到

省流: UPDATE t1 SET f1 REPLACE(REPLACE( f1 , CHAR(10), ), CHAR(13), ); 用 replace() 函数将 换行符char(10) 和 回车符char(13) 替换为空字符串。 char(10):换行 char(13):回车 发现表里存进很多换行符,如下图&#xff1a…

Python中文分词工具库之jieba使用详解

概要 在自然语言处理(NLP)领域,中文文本的分词是一个重要且基础的任务。Python的jieba库是一个广泛使用的中文分词工具,提供了丰富的功能,包括精准模式、全模式、搜索引擎模式等,适用于不同的应用场景。本文将详细介绍jieba库,包括其安装方法、主要特性、基本和高级功能…

java技术:oauth2协议

目录 一、黑马程序员Java进阶教程快速入门Spring Security OAuth2.0认证授权详解 1、oauth服务 WebSecurityConfig TokenConfig AuthorizationServer 改写密码校验逻辑实现类 2、oauth2支持的四种方式: 3、oauth2授权 ResouceServerConfig TokenConfig 4、…

MySQL的索引是什么

MySQL的索引 一、索引概述二、索引结构1.简要概述2.从二叉树说起3.再在说下B-Tree4.为什么选择BTree5.Hash又是什么6.博主被面试官经常问的题目 三、索引分类四、聚集索引&二级索引五、索引语法 一、索引概述 1.索引是帮助MySQL 高效获取数据的数据结构(有序)。在数据之外…

[STM32-HAL库]Flash库-HAL库-复杂数据读写-STM32CUBEMX开发-HAL库开发系列-主控STM32F103C6T6

目录 一、前言 二、实现步骤 1.STM32CUBEMX配置 2.导入Flash库 3.分析地址范围 4.找到可用的地址 5.写入读取普通数据 6.写入读取字符串 6.1 存储相关信息 6.2 存取多个参数 三、总结及源码 一、前言 在面对需要持久化存储的数据时,除了挂载TF卡,我们…

燃数科技前端25-40K*14薪一面超简单,下周二面啦

一面 1、自我介绍 2、低代码如何设计的 3、react路由原理 4、react生命周期 5、什么是回调地狱,如何解决 6、jwt和session有什么区别 7、js文件相互引用有什么问题?如何解决 8、一个很大的json文件,前端读取如何优化 面试我的不像是…