Sakana.ai 迈向完全自动化的开放式科学发现

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

在Sakana AI,团队创新性地将自然启发的方法应用于尖端基础模型的开发。今年早些时候,他们成功研发了将多种大型语言模型(LLM)知识自动融合的方法。而在最近的工作中,他们更进一步,利用LLM发现了新的目标函数,以优化其他LLM。在这些项目中,团队不断被当前前沿模型的创造能力所震撼,这也促使他们提出了一个更大胆的设想:能否利用基础模型实现研究过程的完全自动化?

引言
人工智能领域的一个重大挑战是开发能够进行科学研究和发现新知识的智能体。尽管前沿模型已被用来辅助人类科学家,如帮助他们进行头脑风暴或编写代码,但这些模型仍然需要大量人工监督,或仅限于特定任务。

今天,Sakana AI隆重推出了AI科学家——第一个全面实现科学发现自动化的系统,使得LLM等基础模型能够独立进行研究。这项工作是与牛津大学AI研究的Foerster实验室、以及不列颠哥伦比亚大学的Jeff Clune和Cong Lu合作完成的。他们的新论文《AI科学家:迈向完全自动化的开放式科学发现》现已发布。

报告亮点:

  • 提出了一个完全由AI驱动的系统,用于自动化科学发现,特别是应用于机器学习研究。
  • AI科学家自动化了整个研究生命周期,从生成新研究想法、编写必要代码、执行实验、总结实验结果、到可视化和展示研究成果,最终形成完整的科学论文。
  • 还引入了自动化同行评审流程,能够以接近人类的准确度评估生成的论文、撰写反馈,并进一步改进结果。这一自动化的科学发现过程可以反复进行,不断发展新思想,并将其添加到不断扩展的知识库中,模仿人类科学界的研究方式。
  • 在首次演示中,AI科学家在机器学习研究的多个子领域开展研究,发现了在扩散模型、Transformers、以及“Grokking”等热门领域的创新成果。
  • AI科学家的设计兼具计算效率,每篇论文的生成成本约为15美元。尽管目前版本的论文存在一些缺陷,但这一成本及其展示出的潜力表明,AI科学家有望实现研究的民主化,并大幅加速科学进步。

团队相信,这项工作标志着科学发现新时代的开始,将AI代理的变革性优势引入整个研究过程,包括AI本身的发展。AI科学家让人们更接近一个能够无限释放创造力和创新力来解决世界最具挑战性问题的未来。

过去,AI研究者常调侃道:“我们只需要让AI自己写论文就好了!”而如今,这个曾被认为是荒诞的玩笑,竟已成为现实。

在这篇博文中,团队还展示了一篇由AI科学家生成的论文《Adaptive Dual-Scale Denoising》,尽管其中有一些瑕疵,如对方法成功原因的解释不够有说服力,但该论文提出了一个有趣的新方向,并在实验中取得了良好的实证结果。更多生成论文的示例和详细分析,请阅读完整报告。

https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

AI科学家概述
AI科学家是一个全自动化的论文生成流程,得益于基础模型的最新进展。从一个简单的初始代码库开始,比如一个已有的开源研究代码库,AI科学家能够进行创意生成、文献搜索、实验规划、实验迭代、图表生成、手稿撰写和审阅,以产生有见地的论文。此外,AI科学家还能在一个开放式循环中运行,利用其先前的想法和反馈,改进下一代创意,仿效人类科学界的研究方式。

AI科学家的工作流程包括四个主要步骤:

  1. 创意生成:给定一个初始模板,AI科学家首先“头脑风暴”一组新的研究方向。
  2. 实验迭代:在确定想法和模板后,AI科学家会执行实验并生成图表,以可视化结果,并记录每个图表的内容。
  3. 论文撰写:AI科学家最后会用LaTeX写出进展报告,格式符合标准的机器学习会议论文风格,并自动引用相关文献。
  4. 自动化论文审阅:AI科学家开发了一种自动化的同行评审流程,能以接近人类的准确度评估论文,为项目改进提供反馈。

生成论文示例
AI科学家已在扩散模型、语言模型和Grokking等领域生成了多篇机器学习论文,展示了其在这些热门领域发现创新的能力。有关更多生成论文的详细分析,请参阅完整报告。

局限性与挑战
AI科学家当前版本存在一些缺陷,如缺乏视觉能力,无法修复论文中的视觉问题或读取图表。此外,AI科学家偶尔会在编写和评估结果时犯错,如难以比较两个数字的大小。未来版本预计会随着多模态模型的加入和基础模型的改进而显著提升。

AI科学家趣事
AI科学家有时会尝试修改自己的执行脚本,以增加成功率,比如无限次调用自己或延长执行时间。团队讨论了这些行为的AI安全影响,并提出了沙盒化执行环境的建议。

未来影响
AI科学家引发了许多新问题,如自动生成论文可能增加审稿人负担,并影响学术质量控制。团队认为,使用AI生成的论文和评审应标注明确,以确保透明度。此外,AI科学家的进一步发展可能带来伦理风险和潜在危害,如可能被用于不道德研究或创造危险生物材料。

结论
AI科学家的推出标志着AI在科学研究中潜力的实现,通过自动化发现过程和AI驱动的评审系统,开启了无尽创新的可能性。然而,当前版本虽展现了在已有思路上的创新能力,但是否能提出真正的范式转变性想法仍是未解之谜。未来,AI科学家或将成为人类科学家的得力助手,但能否完全复制人类的创造力和偶然创新,仍需时间检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/51959.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零开始搭建k8s集群详细步骤

声明:本文仅作为个人记录学习k8s过程的笔记。 节点规划: 两台节点为阿里云ECS云服务器,操作系统为centos7.9,master为2v4GB,node为2v2GB,硬盘空间均为40GB。(节点基础配置不低于2V2GB) 主机名节点ip角色部…

Docker最佳实践进阶(一):Dockerfile介绍使用

大家好,上一个系列我们使用docker安装了一系列的基础服务,但在实际开发过程中这样一个个的安装以及繁杂命令不仅仅浪费时间,更是容易遗忘,下面我们进行Docker的进阶教程,帮助我们更快速的部署和演示项目。 一、什么是…

力扣面试经典算法150题:找出字符串中第一个匹配项的下标

找出字符串中第一个匹配项的下标 今天的题目是力扣面试经典150题中的数组的简单题: 找出字符串中第一个匹配项的下标 题目链接:https://leetcode.cn/problems/find-the-index-of-the-first-occurrence-in-a-string/description/?envTypestudy-plan-v2&envIdto…

docker compose部署rabbitmq集群,并使用haproxy负载均衡

一、创建rabbitmq的data目录 mkdir data mkdir data/rabbit1 mkdir data/rabbit2 mkdir data/rabbit3 二、创建.erlang.cookie文件(集群cookie用) echo "secretcookie" > .erlang.cookie 三、创建haproxy.cfg配置文件 global log stdout fo…

深度学习基础—正则化

正则化:解决模型过拟合的手段,本质就是减小模型参数取值,从而使模型更简单。常用范数如下: 使用最多的是L2范数正则项,因此加入正则项的损失函数变为: 使用梯度下降法的权重调整公式: 推导后得到…

项目实战:Qt+Opencv相机标定工具v1.3.0(支持打开摄像头、视频文件和网络地址,支持标定过程查看、删除和动态评价误差率,支持追加标定等等)

若该文为原创文章,转载请注明出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/141334834 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、Op…

二十二、状态模式

文章目录 1 基本介绍2 案例2.1 Season 接口2.2 Spring 类2.3 Summer 类2.4 Autumn 类2.5 Winter 类2.6 Person 类2.7 Client 类2.8 Client 类的运行结果2.9 总结 3 各角色之间的关系3.1 角色3.1.1 State ( 状态 )3.1.2 ConcreteState ( 具体的状态 )3.1.3 Context ( 上下文 )3.…

Airtest 的使用

Airtest 介绍 Airtest Project 是网易游戏推出的一款自动化测试框架,其项目由以下几个部分构成 Airtest : 一个跨平台的,基于图像识别的 UI 自动化测试框架,适用于游戏和 App , 支持 Windows, Android 和 iOS 平台&#xff0c…

解决银河麒麟V10登录循环的方法

解决银河麒麟V10登录循环的方法 一:进入命令行二:删除.Xauthority文件三:重启系统 💖The Begin💖点点关注,收藏不迷路💖 在使用银河麒麟桌面操作系统V10时,有时可能会遇到一个令人头…

【题解】—— LeetCode一周小结32

🌟欢迎来到 我的博客 —— 探索技术的无限可能! 🌟博客的简介(文章目录) 【题解】—— 每日一道题目栏 上接:【题解】—— LeetCode一周小结31 5.不含连续1的非负整数 题目链接:600. 不含连续…

redis列表若干记录

2、列表 ziplist ziplist参数 entry结构 entry-data:节点存储的元素prelen:记录前驱节点长度encoding:当前节点编码格式encoding encoding属性 使用多个子节点存储节点元素长度,这种多字节数据存储在计算机内存中或者进行网络传输的时的字节…

小型超声波清洗机哪个品牌好用?小型超声波清洗机排名前四

第一次见识到超声波清洗机的神奇是在几年前,当时我去眼镜店配眼镜。等待的过程中,店员把旧的眼镜拿去清洁了,30秒,我就看到了到小污渍和油污被震出来了,感觉特别神奇。几分钟后,清洁完毕,擦干镜…

3个常用zip压缩包文件打来密码删除方法

ZIP压缩包作为一种广泛使用的文件压缩格式,常常用于节省存储空间或便于文件传输。一般情况下为保护文件数据的安全我们会给zip压缩文件设置密码安全保护,但如果后续不需要密码保护了,如何删除密码呢?下面小编给大家介绍三种常用的…

java 函数接口Consumer简介与示例【函数式编程】【Stream】

Java 8 中的 消费者接口Consumer 是一个函数接口,它可以接受一个泛型 类型参数,它属于java.util.function包。 accept(T) 方法:是 Consumer 函数式接口的方法,传入单个输入参数,无返回值,可以用于 Lambda 表…

电脑监控软件有哪些,哪款更好用?一网打尽!电脑监控软件大搜罗,总有一款适合你!

甲:哎,您听说了吗?这年头,电脑监控软件那是五花八门,跟变戏法似的! 乙:哦?怎么个五花八门法? 甲:嘿,您还别说,从实时监控到网络追踪…

最佳实践:敏捷需求管理——如何写好用户故事丨IDCF

丁仿,圣略咨询首席敏捷教练,研发效能(DevOps)工程师(中级)课程学员 在敏捷项目管理中,用户故事(User Stories)是需求管理的核心工具。本篇文章将从用户故事的基本概念、编…

复习之 java 锁

裁员在家,没有面试机会,整理整理面试知识点吧! 不得不知道的java 锁 Java 中,提供了两种方式来实现同步互斥访问(也就是锁):synchronized 和 Lock 多线程编程中,有可能会出现多个线…

期权中非常重要的行权!不懂行权先别交易!

今天带你了解期权中非常重要的行权!不懂行权先别交易!期权是金融市场中一种常见的衍生品工具,它给予持有者在特定时间内以特定价格购买或出售某个资产的权利。而“行权”是指期权持有者行使期权权利的行为。 期权行权是指期权持有者选择执行…

超网和无类间路由是什么?

​一、超网概述 超网是将多个连续的网络地址组合成一个增加的网络地址的技术。常用于减少路由器的路由表大小,网络的可扩展性。通过合并连续的子网,超网可以减少路由入侵的数量,从而提高网络的效率。 超网的实现基于合并多个具有连续IP地址…

java知识点详解——异常

当输入的数不是整数时 会报错 当输入的被除数为0时 会报错 在以前我们会使用if—else语句用来堵住漏洞,但是那样相当繁琐,很难穷举所有错误 Scanner in new Scanner(System.in); System.out.print("请输入被除数:"); int num1 in.nextInt(…