能跟“猫主子”聊天了!生成式AI最快5年内破译第一种动物语言

image.png

image.png

ChatGPT用它自己的方式来理解世界,类似的技术是否也能用来学习动物的语言?

所罗门能够与动物交流并不是因为他拥有魔法物品,而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》

在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者经常会将角色拟人化,用人类的思考和交流方式来推进剧情。

不过,这类作品也会导致认知失调,当我们与动物进行交流时,可能会把自己的想法和偏见投射到动物身上,例如「羊羔跪乳」与感恩、孝道无关,而是因为羊特殊的胃部构造,但人类会把自身投射到羊羔的行为上。

图片

图片

传统的动物认知工作主要是建立一个词汇表,但比如「水」、「喝」、「干燥」等概念在水生生物的世界中可能不存在或没有意义,在动物交流中也就不存在和人类概念之间的对应;并且动物之间的交流也并不一定通过发声,还包括手势、动作序列或皮肤纹理的变化等。

从理论上讲,机器学习模型要比人类要更擅长总结出词汇之间松散的相关性,神经网络的输入不对输入数据的性质做任何假设,只要某种模式频繁出现,就有可能发现动物交流中蕴含的信息。

由纽约城市大学、、UC伯克利、MIT、哈佛、谷歌研究院和《国家地理》等研究机构发起的鲸语翻译计划(Cetacean Translation Initiative, CETI),使用自然语言处理系统分析海量抹香鲸数据,并计划未来与野外抹香鲸直接对话。

图片

图片

Aza Raskin等人联合创立的地球物种项目(Earth Species Project,ESP)开源了首个动物发声基准BEANS,可以测量机器学习算法在生物声学数据上的性能;还开发了首个用于动物发声的基础模型AVES,可用于如信号检测和分类等各种任务。

随着生成式AI技术的进步,或许某天我们真有可能揭开动物交流背后的真正含义。

复杂的动物王国

1974年,哲学家托马斯·内格尔发表了一篇开创性的论文,名为《当蝙蝠是什么感觉?》(What Is It Like to Be a Bat?”),他认为,蝙蝠的生活与人类的生活有着非常大的差异,以至于人类可能永远无法真正知道这个问题的答案。

我们对世界的理解是由人类的概念塑造的,想要知道蝙蝠是什么样子的唯一方法就是成为蝙蝠,并拥有蝙蝠的概念。

不过,我们还是可以推测出蝙蝠的部分思维方式,比如蝙蝠生活在高处,可能上下的概念是颠倒的,通过回声定位等,但我们无法拥有蝙蝠的生活体验。

如果狮子会说话,我们也无法理解它,因为人类的大脑无法共情狮子语言中所传达的感受和概念。——Ludwig Wittgenstein

图片

图片

但并非所有动物的思维都与人类迥然不同,从心理上讲,人类与其他灵长类动物的共同点比章鱼和鱿鱼更多:人类与黑猩猩的最后一个共同祖先生活在600万到800万年前,而与章鱼的最后一个共同祖先生活在大约6亿年前的前寒武纪海洋中。

经过教导后,黑猩猩可以学会人类的手语,甚至能够理解复杂的人类指令,并使用键盘符号进行交流,但也正如开头所说的,我们可能也过度拟人化地理解了猩猩的行为。

对于与人类关系更远的物种,理解他们的交流方式则变得更困难,例如蜜蜂和一些鸟类可以看到可见光谱中的紫外线,蝙蝠、海豚、狗和猫能听到超声波等,每个物种都有其独特性。

用AI理解动物

地球物种项目(Earth Species Project)的计算机科学家Britt Selvitelle表示,他们正在努力破译第一种非人类语言,并且有可能在五到十年内实现。

在动物语言领域,虽然研究人员数十年来已经积累了大量知识,但世界上还并不存在一块能够翻译人类语言和动物语言的「罗塞塔石碑」,也就不存在「动物语言」的标注金标准。

从根本上说,人工智能是一种数据驱动的工具,预训练语言模型可以通过海量数据,以无监督的形式学习到数据的内部表征。

从ChatGPT强大的表现来看,生成式AI技术可能有自己独特的内部表征方法,而非套用人类的概念,所以研究人员开始转向AI技术来分析数据,获取对动物有意义的术语。

图片

图片

在地球物种项目中,收集的数据形式包括声音、运动和视频,涵盖野外或圈养环境中的动物,数据中还附有生物学家对动物当时在做什么和在什么背景下做什么的注释。

随着物联网的成熟,将廉价可靠的记录设备(如麦克风或生物记录仪)放在野外动物身上也越来越容易,可以提供大量数据供人工智能工具进行组织和分析,以帮助发现数据背后的意义,然后使用生成式方法进行测试,最终实现重新创建动物的声音,进行双向交流。

动物声音基准BEANS

在生物声学领域,基于机器学习技术的成功应用需要在特定任务上精心策划出一组高质量数据,但在此之前还不存在一个涵盖多任务、多物种的公共基准,无法以受控和标准化的方式测量机器学习技术的性能并将新提出的技术与现有技术进行基准测试。

image.png

image.png

论文链接:https://arxiv.org/pdf/2210.12300.pdf

数据链接:GitHub - earthspecies/beans: BEANS: The Benchmark of Animal Sounds

BEANS((the BEnchmark of ANimal Sounds,动物声音的基准)是一个生物声学任务和公共数据集的集合,专门用于测量生物声学领域机器学习算法的性能,包括生物声学中的两个常见任务:分类和检测。

BEANS中包括12个数据集,涵盖多个物种,包括鸟类、陆地和海洋哺乳动物、无尾两栖动物和昆虫。

除了数据集,文中还提出了一组标准机器学习方法的性能作为任务性能的基线。

image.png

image.png

基准和基线代码都已开源公开,研究人员希望BEANS可以为基于机器学习的生物声学研究建立一个新的标准数据集。

动物发声大模型AVES

在生物声学领域,由于缺乏标注好的训练数据,极大阻碍了该领域以有监督方式训练的大规模神经网络模型的使用。

为了利用大量未标注的音频数据,研究人员提出了AVES(Animal Vocalization Encoder based on Self-Supervision,基于自我监督的动物发声编码器),一种自监督的、基于Transformer模型的音频表征模型,可用于编码动物发声。

论文链接:https://arxiv.org/pdf/2210.14493.pdf

模型链接:GitHub - earthspecies/aves: AVES: Animal Vocalization Encoder based on Self-Supervision

研究人员在一组不同的无标注音频数据集上对AVES模型进行预训练,并针对下游生物声学任务对模型进行微调。

分类和检测任务的综合实验表明,AVES优于所有强基线,甚至优于在带注释的音频分类数据集上训练的有监督topline模型。

实验结果还表明,精心设计出一个与下游任务相关的小训练子集是训练高质量音频表示模型的有效方法。

伦理问题

1970年代,当西方社会第一次发现鲸鱼的歌声后,人类社会暂停了对深海鲸鱼的捕杀,并促成了环境保护局(Environmental Protection Agency)的成立。

image.png

image.png

随着地球物种项目技术路线图的推进,我们可以更了解周围的生物,进行更多的数据收集,开发新的基准和基础模型,从而可以更好地保护这颗蓝色星球。

Raskin认为,在未来12-36个月内,团队就可以实现与动物交流,比如做出一个人造鲸鱼或乌鸦,能以一种无法分辨的方式与鲸鱼或乌鸦交谈,不过关键点在于,我们也需要理解模型在说什么,才能进一步对话。

Raskin团队也在讨论如何负责任地使用这些人工智能方法,目前已经规定在任何测试中都要准备好这些方法,技术路线中指出了潜在的风险,如干扰狩猎和觅食或交配,也可能发送错误给动物。

人类是在10万到30万年前才学会如何用声音说话和交流的,而鲸鱼和海豚用声音来传承文化和歌曲已经有3400万年历史了。

如果随意在鲸群中发送AI音频,可能会对3400万年的文化造成破坏。

这就是为什么到目前为止,地球物种项目中的大部分工作都是在收集数据和创建基础,即推动未来进步的基准和基础模型,与世界各地的公司和组织每天利用人工智能和机器学习所做的事情没有什么不同,只是规模更宏大。

如果人工智能可以帮助我们理解动物在说什么,那么我们使用人工智能的能力的限制是什么?

如果人工智能可以帮助我们了解动物,那么它会教我们关于人类的什么?

image.png

image.png

Raskin 和Zacarian希望动物语言的最终翻译成为世界历史上的转折点之一,就像鲸鱼的歌声首次被发现或1990年蓝点(A Pale Blue Dot)的照片一样,这些时刻改变了我们对世界的看法和理解。

参考资料:

https://cloud.google.com/blog/transform/can-generative-ai-help-humans-understand-animals-earth-species-project-conservation

更多AI资讯请查阅365文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/140392.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java通过JNI技术调用C++动态链接库的helloword测试

JNI调用原理 原理就不细说了&#xff0c;其实就是写个库给Java调&#xff0c;可以百度一下Java JNI&#xff0c;下面是HelloWorld代码测试 编写一个本地测试类 package com.my.study.cpp_jni;/*** 测试Java调用C库* <p>使用命令javac -h . NativeTest.java自动生成C头…

红海云签约湘湖实验室,助力科研机构人力资源数字化全面升级

湘湖实验室&#xff08;农业浙江省实验室&#xff09;是由浙江省农业科学院和萧山区人民政府共同举办的新型研发机构&#xff0c;定位为农业核心种质资源生物制造与生物互作科学问题和核心技术研究&#xff0c;瞄准世界农业科技发展前沿&#xff0c;面向国家重大战略&#xff0…

Ubuntu(WSL2) mysql8.0.31 源码安装

要在 Ubuntu 上使用调试功能安装 MySQL 8.0 的源码&#xff0c;可以按照以下详细步骤进行操作&#xff1a; 1. 更新系统 首先&#xff0c;确保你的 Ubuntu 系统是最新的。运行以下命令更新系统软件包&#xff1a; sudo apt update sudo apt upgrade 2. 下载 MySQL 源码 访…

通讯协议学习之路(实践部分):UART开发实践

通讯协议之路主要分为两部分&#xff0c;第一部分从理论上面讲解各类协议的通讯原理以及通讯格式&#xff0c;第二部分从具体运用上讲解各类通讯协议的具体应用方法。 后续文章会同时发表在个人博客(jason1016.club)、CSDN&#xff1b;视频会发布在bilibili(UID:399951374) 本文…

gpt支持json格式的数据返回(response_format: ‘json_object‘)

Api.h5.chatCreateChatCompletion({model: gpt-3.5-turbo-1106,token: sk-f4fe8b67-fcbe-46fd-8cc9-fd1dac5d6d59,messages: [{role: user,content:使用json格式返回十二生肖&#xff0c;包含中文名和英文名&#xff0c;[{id:"1", enName:"", cnName: &quo…

初始MySQL(二)(表的增删查改)

目录 修改表 CRUD(增删改查) insert语句(表中增加数据) update语句(修改表中的数据) delete删除语句 select语句 修改表 添加列 ALTER TABLE tablename ADD (column datatype [DEFAULT expr] [, column datatype] ...); 修改列 ALTER TABLE tablename MODIFY (column …

ROS机器人毕业论文数量井喷-数据日期23年11月13日

背景 ROS机器人论文数量在近3年井喷发展&#xff0c;仅硕士论文知网数据库可查阅就已经达到2264篇&#xff0c;实际相关从业者远远远大于这个数值。 按日期排序&#xff0c;每页20篇&#xff0c;23年还未结束&#xff0c;检索本身也不一定完备&#xff0c;就超过200。 相关从业…

语音识别芯片在产品应用上的难点列举

语音识别技术&#xff0c;作为人工智能领域中的一颗璀璨明珠&#xff0c;已经广泛应用于用户交互、智能家居、语音助手等多个领域。它为我们的生活带来了诸多便利&#xff0c;使得我们可以更加高效地与电子设备进行互动。然而&#xff0c;语音识别技术的实现&#xff0c;依赖于…

PostgreSQL 入门教程

PostgreSQL 入门教程 1. 历史背景2. 概念3. 特点4. 用法4.1 数据库连接4.2 数据库创建4.3 表创建4.4 数据插入4.5 数据查询4.6 数据更新4.7 数据删除 5. 安装步骤6. 简单示例7. 扩展7.1 数据类型7.2 查询优化7.3 并发控制7.4 数据备份和恢复7.5 扩展性和高可用性7.6 安全性加固…

pyTorch Hub 系列#2:VGG 和 ResNet

一、说明 在上一篇教程中,我们了解了 Torch Hub 背后的本质及其概念。然后,我们使用 Torch Hub 的复杂性发布了我们的模型,并通过相同的方式访问它。但是,当我们的工作要求我们利用 Torch Hub 上提供的众多全能模型之一时,会发生什么? 在本教程中,我们将学习如何利用称为…

「Verilog学习笔记」4bit超前进位加法器电路

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 分析 timescale 1ns/1nsmodule lca_4(input [3:0] A_in ,input [3:0] B_in ,input C_1 ,output wire CO ,output wire [3:0] …

SpringBoot3+Vue3+Mysql+Element Plus完成数据库存储blob类型图片,前端渲染后端传来的base64类型图片

前言 如果你的前后端分离项目采用SpringBoot3Vue3Element Plus&#xff0c;且在没有OSS&#xff08;对象存储&#xff09;的情况下&#xff0c;使用mysql读写图片&#xff08;可能不限于图片&#xff0c;待测试&#xff09;。 耗时三天&#xff0c;在踩了无数雷后&#xff0c…

Lightroom Classic 2023 v12.4

Lightroom Classic 2023是一款图像处理软件&#xff0c;是数字摄影后期制作的重要工具之一。与其他图像处理软件相比&#xff0c;Lightroom Classic具有以下特点&#xff1a; 高效的图像管理&#xff1a;Lightroom Classic提供了强大的图像管理功能&#xff0c;可以轻松导入、…

网易数帆:云原生向左,低代码向右

网易数帆&#xff0c;前身是网易杭州研究院于2016年孵化的网易云&#xff0c;历经7载探索与沉淀&#xff0c;如今已进化成为覆盖云原生、低代码、大数据和人工智能四大技术赛道的数智化服务提供商&#xff0c;服务于金融、央国企、能源、制造等领域300余家头部企业。 近日&…

怎么录制游戏视频?超简单步骤,一看就会!

随着游戏产业的不断发展&#xff0c;录制游戏视频成为许多玩家记录游戏过程、分享游戏体验的重要方式。但是很多人不知道怎么录制游戏视频&#xff0c;其实一款好的录屏软件可以使游戏视频的录制变得更加简单、高效。本文将介绍两种录制游戏视频的方法&#xff0c;这两种方法各…

【LeetCode:307. 区域和检索 - 数组可修改 | 树状数组 or 线段树】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…

阿里云国际站:云备份

文章目录 一、阿里云云备份的概念 二、云备份的优势 三、云备份的功能 四、云备份的应用场景 一、阿里云云备份的概念 云备份作为阿里云统一灾备平台&#xff0c;是一种简单易用、敏捷高效、安全可靠的公共云数据管理服务&#xff0c;可以为阿里云ECS整机、ECS数据库、文件…

马达加斯加市场开发攻略,收藏一篇就够了

马达加斯加是位于非洲南部一个国家&#xff0c;虽然经济是比较落后的一个国家&#xff0c;但是一直以来跟中国的关系都还不错&#xff0c;生产生活资料也是比较依赖进口的&#xff0c;市场潜力还是不错的。今天就来给大家分享一下马达加斯加的相关攻略。大家点赞收藏关注慢慢看…

如何成功创建百度百科词条?教你从零开始创建自己的百度百科【建议收藏】

百度百科是一个开放的网络百科全书&#xff0c;用户可以自由编辑和贡献内容。如果你想创建一个百度百科页面&#xff0c;需要做好以下准备&#xff1a; 1.确定主题&#xff1a;选择一个你熟悉或者感兴趣的主题&#xff0c;确保该主题在百度百科上还没有相关的页面。 2.收集资…