用大模型读取你的想法,并转化成文本!恐怖的DeWave模型

悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。

DeWave的使用方法非常简单,用户只需要戴上EEG,然后开启你的思维活动,DeWave就能将你的想法直接翻译成文本,就像现实版的《读心人》非常“恐怖”。

相比马斯克的Neuralink脑机接口芯片,DeWave使用更加简单方便,无需做昂贵的手术植入芯片,通过海量数据训练的大模型就能将脑电波翻译成文本。

DeWave可帮助那些无法说话的脑血栓、中风、聋哑人等,可与正常人进行交流,目前翻译的准确率在40%左右。其实这个产品用于谈恋爱场景也不错,双方都带上这个,再也不怕对方撒谎了。

值得一提的是,该研究已经被全球顶级机器学习大会“NeurIPS”,评选为重要论文。

论文地址:https://arxiv.org/abs/2309.14030v3

其实这项技术与去年10月19日,Meta发布的通过MEG(另外一种大脑活动检测工具)重构人类大脑成像过程有点类似。都是通过EEG、MEG等工具捕获大脑微弱活动电流,检测这些磁场变化,然后获得脑部活动数据

获得原始大脑数据后,研究人员就可以用大语言模型等对其进行解码,提取重要的视觉、文本信息。所以,获取大脑活动数据是翻译、重构人类想法、思维画面的关键基础

Meta的论文地址:https://ai.meta.com/static-resource/image-decoding

DeWave简单介绍

DeWave的核心技术思路是,将连续的脑电波信号转化为离散的编码,然后输入预训练的大语言模型进行文本翻译。

首先,通过向量量化变分编码器的结构,将接收到的脑电波信号,转换成一系列向量化的特征表示。

图片

然后,这些特征表示会被进一步转化为一系列离散的代码,每个代码都对应码本里的一个离散词向量。码本就像一个字典,里面有限个数的离散词向量。特征表示通过在码本中找到最匹配的那个离散词向量,来获得对应的离散代码。

在得到一系列离散代码之后,就可以像处理语言词向量一样,输入到预训练的大语言模型,最终生成翻译的文本内容。

DeWave训练流程

DeWave的训练流程主要分为三个阶段:1)自监督编码器预训练(仅原始EEG脑磁波),这一阶段会先训练一个脑电波自编码模型,输入原始EEG波形,通过重建实现自监督。这样可以提取有用的时域和频域特征。

图片

2)编码器和码本训练,固定好波形编码器后,训练Transformer编码器与离散码本,获得稳定可分离的脑电波表示。

3)端到端微调,解冻大语言模型允许端到端训练。在编码器引导下微调BART模型,实现EEG到文本的生成。需要注意的是,对词级特征输入并不需要第一阶段的预训练,可以直接从第二阶段开始。

DeWave局限性

研究人员表示,DeWave模型在将脑电波转化为文本的任务中取得了一定的成果,但也存在一些局限性。

依赖于预训练大语言模型:DeWave在实现脑电波到文本的转换过程中使用了预训练大语言模型,如BART。

这意味着DeWave方法的性能受限于预训练语言模型的质量和能力。如果预训练语言模型不够准确或不具备广泛的语言理解能力,可能会影响到DeWave方法的翻译性能。

对平行数据的依赖性:DeWave方法在训练过程中需要使用平行的脑电波和文本对数据,以进行监督学习。

图片

然而,获取大规模的平行数据对于某些任务可能是困难的或成本较高的。因此,如果缺乏足够的平行数据,DeWave方法的性能可能会受到限制。

对标记的依赖性:尽管DeWave方法在文中声称可以在没有标记(如眼动追踪)的情况下实现脑电波到文本的翻译,但它仍然依赖于基于标记的对齐过程。

DeWave使用了事件标记来将脑电波分割成单词级别的特征,这可能导致在没有标记的情况下无法准确地对脑电波进行分割和翻译。

悉尼科技大学首席研究员兼DeWave作者, Chin-Teng Lin表示,DeWave是第一个将离散编码集成在大脑到文本翻译领域的产品,引入了一种创新的神经解码方法。同时与大语言模型的集成,也开辟了神经科学和AI相结合的全新探索。

什么是EEG

EEG 是电脑图(Electroencephalogram) 的缩写,它是一种记录大脑电活动的检测方法。EEG 主要是通过头皮上的电极来捕捉大脑神经细胞之间通信的微小电信号。

大脑活动产生电流,当神经细胞(神经元)被激活时,它们会产生电信号。EEG 检测的是大量神经元同步活动所产生的电位变化。主要用于科学研究、脑部检测、脑部疾病治疗等。

什么是MEG

MEG,全称为脑磁图(Magnetoencephalography),是一种神经成像技术,用于测量大脑活动中产生的极微弱的磁场。MEG能够提供关于大脑功能的空间和时间信息。

MEG的工作原理是基于生物电活动产生磁场的物理原理。当大脑中的神经元活动时,它们会产生微小的电流,这些电流会产生相应的磁场。

MEG设备使用一种非常灵敏的传感器,称为超导量子干涉设备(SQUIDs),来检测这些微小的磁场。

MEG主要应用:定位脑功能、研究大脑通信、诊断和治疗规划、研究神经发育和疾病等。

本文素材来源DeWave论文,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/596004.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vivo 互联网技术 2023 年度盘点

在龙年到来之际,vivo互联网技术2023年货如约而至,让我们一起盘点下vivo互联网技术在过去一年的成长与收获吧。 01 年度技术文章 2023年,vivo 互联网技术公众号共推送技术干货文章 70,我们根据文章阅读量等指标,精选出…

[书生·浦语大模型实战营]——书生·浦语大模型全链路开源体系

大模型成为发展通用人工智能的重要途径 书生浦语大模型开源历程 书生浦语模型性能 从模型到应用 应用例子:智能客服/个人助手/行业应用 实现流程: 开源开放体系: 1.数据——书生万卷 价值观对齐这个挺有意思嗷! 2.预训练工具…

docker容器添加新的端口映射

通常在运行容器时,我们都会通过参数 -p来指定宿主机和容器端口的映射,例如 docker run -it -d --restart always --name [指定容器名] -p 8899:8080 [指定镜像名]上述命令将容器内的8080端口映射到宿主机的8899端口。 参数说明 -d 表示后台运行容器 -t…

【51单片机系列】LCD1602液晶模块

本文是关于液晶显示屏的相关介绍。相对于静态数码管、动态数码管、LED点阵等,LCD1602液晶显示器能够显示更多的字符数字信息,并且也是常用的一种显示装置。 文章目录 一、LCD1602介绍1.1、LCD1602简介1.2、LCD1602常用指令1.3、LCD1602使用 二、LCD1602使…

openGauss学习笔记-174 openGauss 数据库运维-备份与恢复-导入数据-管理并发写入操作

文章目录 openGauss学习笔记-174 openGauss 数据库运维-备份与恢复-导入数据-管理并发写入操作174.1 事务隔离说明174.2 写入和读写操作174.3 并发写入事务的潜在死锁情况 openGauss学习笔记-174 openGauss 数据库运维-备份与恢复-导入数据-管理并发写入操作 174.1 事务隔离说…

Parallels虚拟机启动后,Mac主机无法上网怎么办

文章目录 1.问题2.解决: 1.问题 部分用户在运行Parallels Desktop的Windows 11打开后,Windows上网没有问题 ,但是Mac主机不能访问带域名的网站,而访问带ip的网站没问题,退出parallels虚拟机以后,mac网络恢…

docker 部署来自Hugging Face下机器翻译模型

机器翻译模型(Hugging Face官网) 模型翻译api服务代码 # 离线翻译服务代码 # -*-coding:utf-8-*-import os import json import logging from logging.handlers import RotatingFileHandler from datetime import datetime from flask import Flask, request,jsonify from geve…

HarmoryOS Ability页面的生命周期

接入穿山甲SDK app示例: android 数独小游戏 经典数独休闲益智 广告接入示例: Android 个人开发者如何接入广告SDK,实现app流量变现 Ability页面的生命周期 学习前端,第一步最重要的是要理解,页面启动和不同场景下的生命周期的…

内联函数的作用

目的 主要为了提升程序运行速度。 分析 当程序调用一个函数时,程序暂停执行当前指令,跳到函数体处执行,在函数执行完后,返回原来的位置继续执行。如果该函数为内联函数,则不需跳,是因为该内联函数直接插…

基于TIC6000的DSP教学实验箱操作教程:5-18 RGB24图像灰度转换(LCD显示)

一、实验目的 学习RGB24图像灰度转换的原理,掌握图像的读取方法,并实现在LCD上显示灰度转换前后的图像。 二、实验原理 RGB24图像灰度转换 RGB颜色空间作为一种常用的彩色图像表示模型,分别用红(R)、绿&#xff08…

《代码整洁之道之程序员的职业素养》-专业主义

专业主义有很深的含义,它不但象征着荣誉和骄傲,而且明确意味着责任和义务担当责任,“为了按时交付软件,没测例行程序,测试例行程序需要几个小时,当时必须交付软件,因为故障修复部分都不涉及例行…

文件摆渡系统如何实现网络隔离后的数据交换、业务流转?

近年来全球网络安全威胁态势的加速严峻,使得企业对于网络安全有了前所未有的关注高度。即便没有行业性的强制要求,但在严峻的安全态势之下,企业的网络安全体系建设正从“以合规为导向”转变到“以风险为导向”,从原来的“保护安全…

鸿蒙系列--动态共享包的依赖与使用

一、前言 HarmonyOS的共享包相当于Android的Library,在HarmonyOS中,给开发者提供了两种共享包,HAR(Harmony Archive)静态共享包,和HSP(Harmony Shared Package)动态共享包 区别&…

Python从入门到网络爬虫(函数详解)

前言 函数是变成语言中最常见的语法,函数的本质就是功能的封装。使用函数可以大大提高编程效率与程序的可读性。函数是能够实现特定功能的计算机代码而已,他是一种特定的代码组结构。 函数的作用 1.提升代码的重复利用率,避免重复开发相同代…

js——json对象相互转化——js基础积累

js——json对象相互转化——js基础积累 需求场景解决步骤1:定义一个变量接收此字段,方便处理解决步骤2: { 外面的双引号要去掉解决步骤3:使用正则去除参数中的\\解决步骤4:如果此参数必须以{开头,以}结尾解…

一文快速了解超声功率放大器基础知识

超声功率放大器是一种电子设备,用于放大超声信号的能量。它在多个领域中发挥重要作用,包括医疗、工业、科学研究等。超声功率放大器通过将输入信号的能量放大到所需的级别,以便更好地驱动其他设备或实现特定的应用。下面就给大家介绍一下超声…

C++ 多态向上转型详解

文章目录 1 . 前言2 . 多态3 . 向上转型4 . 总结 【极客技术传送门】 : https://blog.csdn.net/Engineer_LU/article/details/135149485 1 . 前言 此篇博文详解C的多态向上转型平台 : Qt 2 . 多态 【Q】什么是多态? 【A】解释如下 : 通俗来说,就是多种形态,具体…

2024,这将是量子计算的真正挑战

2023年,一项项量子计算纪录被打破。 谷歌量子AI团队证明了将多个量子比特分组合成为一个逻辑量子比特的纠错方法可以提供更低的容错率。以往的纠错研究随着比特数的增加,错误率会提高,都是“越纠越错”,而这次谷歌首次实现了“越纠…

【springboot+mybatis实现CURD模版项目-Jesus】

springbootmybatis实现CURD模版项目-Jesus STEP 1 项目创建 1.1 新建Spring Initializr项目   1.2 选择需要的依赖 springboot有2.7.2直接选272STEP 2 配置更改 2.1更改maven配置   2.2 检查项目配置jdk、sdk、jre版本一致   2.3 检查pom文件,Maven-Reload pr…