数字生命计划1.0

一. 背景

即使人们强调思维与肉体是两大构成个体的先决条件,但科学界始终没有放弃探索摆脱肉体的介质,从而让思维上载的研究。

这就是数字生命计划的初衷。所谓数字生命,就是将人类的意识思维抽离,上传至云端或智能终端,从而实现"永生"。当然这其中一定会牵扯到复杂的伦理与道德问题,但就目前技术层面而言,距离实现数字形式的生命还有很长的路要走。

本文将着重探讨数字生命技术的最新进展,详细分析由NTU、商汤科技、上海AI实验室共同推出的项目—— "Digital Life Project: Autonomous 3D Characters with Social Intelligence"。这或许也是被大众所知的数字生命计划的最前沿的研究。

二. 技术

该项目提出了一个利用语言作为通用媒介来构建自主3D角色的框架,这些角色能够进行社会互动并配合适当的动作表达,同时基于自身的性格与外在的环境,自主的发展对话与行为。整体来看,该项目实现了一定程度的社会智能。

1. 框架核心模块

  • SocioMind:一个精心设计的基于严格心理学原则的数字大脑,能够模拟角色的个性和自主性,从而实现思考与判断的过程。该模块的底层是语言大模型(LLM),同时使用了少量的系统化的心理测试样本来指导人格建模。
  • MoMat-ModelGen:一套用于控制3D角色的数字身体,其本质是一个文本驱动的动作合成系统。基于动作匹配与动作生成技术,让角色做出与情景更相关的肢体动作。

2. SocioMind:人格、记忆、自主生成

数字生命之所以能被称为生命,其中一个重要因素就是它拥有类人的思维模式。人类能够在世界的历史长河中留下足迹,是因为能够思考并不断总结经验不断进化,同时每个人又都是独立的个体,拥有不同的性格差异。

数字生命的构建也基于此,SocioMind为角色注入灵魂。它赋予了角色人格,使得他们能够自主地发起对话参与其中,并规划接下来的故事发展,这些故事的进展不仅依托于角色的性格、当时所处的背景,还有他们对历史事件的反思。尽管LLM能够模拟单一时间点上可信的类人反应,但生命不应局限于此,还要确保长期的一致性,也就是人们常说的经验。基于此,SocioMind又赋予了角色记忆,使得他们会对历史事件进行检索,模拟记忆流,同时结合了社会心理学理论,进行更高层次的思想层面的反思,从而归纳总结出新的结论。

SocioMind创新的地方在于给予了角色自主性。

3. SocioMind各模块实现细节

(1)心理状态。从心理学角度来看,人类由内部的心理过程和外部的行为动作构成,判定3D角色是否自主的一个重要因素就是是否具有各种心理活动状态。

  • 性格方面,使用了大五人格理论(Big Five Trait),包括五个维度,分别是开放性、尽责性、外向性、亲和性和神经质。通过李克特量表或文本描述,来为角色提供性格预设。
  • 情绪方面,使用了PAD模型,包括三个维度,分别是愉悦度、激活度、优势度。
  • 动机方面,分为长期动机和短期动机两方面,长期动机被预设。
  • 自我方面,强调中心信仰,反映个人世界观。
  • 社会关系方面,引入了三个维度,分别是信任、亲密关系和支持性。通过李克特量表表示程度,同时用文本描述表示对他人的态度。

一个角色心理状态的示例:

通过给LLM提供全局预设,实现数值到文本的转换:

(2)角色说明。为了提高LLM的内部心理过程和外部行为关联一致性的推理能力,设计了一个逆向工程去构建角色说明数据库,其目的是为了产生与人类预期一致的合理行为。

(3)事件和思想。事件代表主体所感知到的事实,思想则是主体根据其个性和过去的经历而产生的想法或思考。随着时间的推移,记忆系统会逐渐增大,会影响检索事件和思想的效率。因此提出记忆强化和遗忘机制来缓解这类问题。

(4)短期交流的生成。在短期交流中生成交互行为,向LLM提供预设。

(5)心理反射。提出了一个层次反思系统,根据每个场景后的总结,不断更新预设。即模拟大脑根据当前事件和相关的过去事件,产生新想法。

(6)计划与主题建议机制。为构建外部行为的长期演变,促进故事线的发展。

4.MoMat-MoGen:动作匹配、动作生成

仅有意识还不够,配合意识同步产生的动作也至关重要。目前学界针对双人交互动作的研究仍不成熟,涉及到双人空间对其、肢体接触、时序同步等难题。因此,该项目结合了动作匹配与动作生成两种技术,以产生多样化和精确的双人动作。

在数字大脑的驱动下,根据角色当前的姿态和目标轨迹,MoMat会从动作数据库中检索高质量的运动片段并选择最为匹配的片段,确保角色动作的自然性和准确性。同时基于MoMat,MoGen会根据文本输入去创建新的动作,生成更为多样化的运动来保持角色间的互动关系。并且根据角色间关系的不同,肢体动作也会有差异。

MoMat-MoGen让角色能够根据自我意识运动并产生交互。

5.MoMat-MoGen各模块实现细节

(1)主动被动机制。人类的互动中存在一种内在秩序,即主动方和被动方以及二者的切换。

(2)运动同步。为适应场景切换时存在的运动长度的潜在不匹配问题,交互式运动合成需要四个步骤来"对齐"。

Behave —— Move —— Align —— Synthesize

(3)重定向。使用Auto-Rig Pro重定向工具将合成的运动重新定位到目标角色,以更好地展示在沉浸式模拟场景中双方的交互行为。

(4)运动匹配。包含两个步骤,首先是利用预训练的LLM提取查询文本,其次结合运动学特征增强查询轨迹的一致性和对齐性。

(5)运动生成。设计了双路径语义调制注意模块(DSMA)来模拟两个个体之间的交互作用,从而解决由数据驱动下动作生成的物理引擎限制。

(6)运动字幕。该模块用来实现动作到文本的翻译,类似于运动编码器,但采用了多模态数据集成放大了运动特征提取。

 三. 展望

数字生命计划提出了一个创新型的框架,利用最新的生成模型技术来创建自主3D角色。

其中最令人感到振奋的是角色的自主性。尽管是在预设的场景中,但角色间的交互是自发动态衍生的,而非拘泥于设置的固定脚本。虽然仍然存在各式的资源限制、数据依赖等问题,但这似乎就是智能生命体发展的起点,让我们逐渐看到了未来数字生命体的轮廓。

碳基生命到硅基生命的演化将是最具想象力也最具挑战性的事件,但人类从未停止探索。或许在未来的某天,我们能够将意识上载到云端从而摆脱肉体,从而实现向硅基生命的过渡,也或许是人工智能在某个奇点后涌现出了自我意识,从而进化成硅基生命。无论是哪种形式,我们目前仍然都处在边缘地带,领域的深处有无数的未知等待发掘,但终究只是时间问题,现在我们已经逐渐完成了由0向1的过渡,之后便是1后面的0能有多少了。

《西部世界》距离我们也许不再遥远,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/22510.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

eMMC的封装类型及特点有哪些?

eMMC(Embedded MultiMediaCard)是一种高度集成的嵌入式存储解决方案,广泛应用于智能手机、平板电脑、笔记本电脑、消费电子产品和物联网设备等领域。eMMC的封装形式对其性能、应用和设备设计有着重要的影响。目前,eMMC主要有两种封…

航空航天技术翻译要求

航空航天技术是一项国际化产业,航空技术更新迅速涉及的专业知识较为广泛。在航空领域,每一个术语都有着特定的含义和用法,稍有差池就可能导致翻译出现严重的后果,因此,航空航天翻译扮演者至关重要的角色。 专业航空航天…

【ARM Cache 与 MMU 系列文章 7.6 -- ARMv8 MMU 相关寄存器介绍】

文章目录 MMU 转换控制寄存器 TCR_ELxTCR_ELx 概览TCR_ELx 寄存器字段详解TCR 使用示例Normal MemoryCacheableShareability MMU 内存属性寄存器 MAIR_ELx寄存器结构内存属性字段使用实例 MMU 地址翻译表基址寄存器 TTBR0/1_ELxTTBR0_ELx 寄存器概述寄存器结构功能和用途编程示…

idea Pycharm Webstorm 2024年 最新版 永久使用2099年教程 附激活码亲测可用

idea Pycharm Webstorm 2024年 最新版 永久使用2099年教程 附激活码亲测可用 链接: 下载 IntelliJ IDEA – 领先的 Java 和 Kotlin IDE (jetbrains.com)(这是官网的) 下载 安装 1.双击idea的安装包,点击next 选择创建桌面快捷…

深入剖析时序Prophet模型:工作原理与源码解析|得物技术

随着得物业务的快速发展,积累了大量的时序数据,这些数据对精细化运营,提升效率、降低成本有着重要作用。在得物的时序数据挖掘场景中,时序预测Prophet模型使用频繁,本文对Prophet的原理和源码进行深入分析,…

边缘计算网关:企业数字化转型的重要支撑-天拓四方

在数字化浪潮席卷全球的今天,企业对于数据处理和传输的需求日益增强。然而,传统的数据处理模式往往依赖于中心化的数据中心,这种方式在处理大量数据时存在延迟高、成本高、安全性差等问题。数据量的激增和实时性要求的提高,使得传…

让AI给你写代码(9.3):一点改进,支持扩展本地知识库

改进目标,当输入提示问题后,能匹配到本地知识库的需求,然后AI按匹配到的需求给出代码并进行自动测试; 如果无法匹配到本地需求,可以直接输入生成逻辑,再由AI生成,然后支持用户把新需求插入本地库…

XML概述、格式、解析-WEB

XML概述 XML(Extensible Markup Language) 可扩展的标识语言 数据传输的一种格式 树形结构(节点) 优点 解析的更快 : 使用标签语言,能够很快定位 占用空间小 : 纯文本格式 可读性强 : 带有名字的标签我们都很喜欢 跨平…

MathType7.9最新免费注册机注册码激活码分享

MathType作为一个强大的数学公式编辑器,广泛用于教育、科研和出版领域。它支持多种文档格式和数学符号,是撰写科技文档不可或缺的工具。对于一些个人用户和小型机构来说,正版软件的高昂价格可能是一个负担。因此,寻找合法途径下的…

Windows 10 以上版本用久了应该重新安装还是重置呢?

今天明月工作电脑的 Windows 10 因为安装过太多软件和使用太久了的缘故造成网络总是很不稳定,总是出现一些莫名其妙的问题,实在是懒得去查找和排错了,就想着干脆推到重来吧,这样性能表现还会提升不少,并且可以一次性的…

向量化:机器学习中的效率加速器与数据桥梁

在机器学习领域的广袤天地中,向量化技术以其独特的魅力,为数据处理和模型训练注入了强大的动力。本文将深入探讨向量化在机器学习领域中的体现,剖析其如何助力模型实现高效的数据处理和精确的结果预测,并通过丰富的案例和详尽的数…

容器中运行ping提示bash: ping: command not found【笔记】

容器中运行ping提示bash: ping: command not found 原因是容器中没有安装ping命令 在容器中安装ping命令,可以使用以下命令: 对于基于Debian/Ubuntu的容器,使用以下命令: apt-get update apt-get install -y iputils-ping对于基…

Nginx在线部署和离线部署方式

Nginx 有两种安装方式: 1)在线安装的方式 1.添加Nginx 到yum源 sudo rpm -Uvh <http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpm> 2.安装Nginx,直接使用yum方式 yum install -y nginx 3.启动nginx,刚安装的nginx不…

一图读懂:Flink CDC如何流式写入Paimon?

一图读懂&#xff1a;Flink CDC如何流式写入Paimon&#xff1f; 以Mysql CDC至Paimon为例 整体架构 MySQL CDC SourceSnapshotReader读取快照全量数据&#xff0c;BinlogReader读取增量数据。 paimon sink 实现桶级别的写入&#xff0c;compactManager实现异步compaction co…

第六讲:AD、DA的工作原理及实现、运放电路

DA 数模转换器 (DAC) 数模转换器&#xff08;Digital-to-Analog Converter&#xff0c;简称DAC&#xff09;是一种将数字信号转换为模拟信号的电子装置。DAC在各种电子设备中广泛应用&#xff0c;如音频设备、通信系统、测量设备和控制系统中。以下是DAC的主要概念和应用。…

Windows下从源码编译ONNX Runtime

前言&#xff1a;作者在做深度学习模型部署过程中&#xff0c;遇到一些算子问题&#xff0c;需要在ONNX Runtime平台上实现一些自定义算子&#xff0c;在此过程中&#xff0c;onnxruntime官方给的现成的库缺少一些必要文件&#xff0c;遂需要下载onnxruntime源码并进行编译。 …

调用万维易源API生成AI艺术二维码

目录 1. 作者介绍2. 艺术二维码2.1 艺术二维码的作用2.2 艺术二维码的应用场景2.3调用万维易源API生成AI艺术二维码 3. 实验过程3.1算法流程3.2完整代码3.3测试结果 1. 作者介绍 韩阳&#xff0c;男&#xff0c;西安工程大学电子信息学院&#xff0c;2023级研究生 研究方向&am…

两种参与茶树O-甲基化儿茶素生物合成的O-甲基转移酶的特征分析-文献精读20

Characterization of two O-methyltransferases involved in the biosynthesis of O-methylated catechins in tea plant 两种参与茶树O-甲基化儿茶素生物合成的O-甲基转移酶的特征分析 茶树三维基因组-文献精读19 比较转录组分析揭示了116种山茶属(Camellia)植物的深层系统…

设计模式23——状态模式

写文章的初心主要是用来帮助自己快速的回忆这个模式该怎么用&#xff0c;主要是下面的UML图可以起到大作用&#xff0c;在你学习过一遍以后可能会遗忘&#xff0c;忘记了不要紧&#xff0c;只要看一眼UML图就能想起来了。同时也请大家多多指教。 状态模式&#xff08;State&am…

《幸福》期刊杂志投稿发表

《幸福》杂志是由国家新闻出版总署批准&#xff0c;武汉出版社主管&#xff0c;武汉市妇联和武汉出版社联合主办&#xff0c;面向全国发行的人文社科综合期刊。办刊宗旨&#xff1a;宣传普及科学知识及科学方法的研究&#xff1b;倡导新型的人际关系&#xff0c;推介健康的家庭…