向机器人传授人类社会同步的艺术

在数字时代,社交机器人正迅速成为主流社会的一部分,从培训医生和教育儿童到提供谈话疗法和客户服务。现在,这是一个价值数十亿美元的全球产业,对具有类似人类社交智能的机器人的需求不断增长,这标志着我们技术史上的一个重要里程碑。由于人工智能 (AI) 的快速发展,机器人——曾经主要局限于沉闷、肮脏和危险的工作,例如放货架、清洁地板和停用炸弹——现在被提升到加入人类社会世界,为社会带来巨大的变革潜力 (1)。此外,作为人类数字孪生,这种机器人可以作为科学探究的宝贵工具,使研究人员能够模拟、研究和更好地理解复杂的人类社会行为和认知过程(2)。
但是,如果您与社交机器人互动过,您可能很快就会意识到这种潜力的局限性。尽管他们的外表越来越令人印象深刻,但他们的互动往往笨拙、生硬和尴尬。感觉有些不对劲。为什么?一个关键的局限性是,当前的社交机器人缺乏社交同步的艺术,在这种艺术中,点头、微笑、手势和语音都是在对话伙伴之间精心策划的(3)。虽然这种轮流对我们大多数人来说似乎毫不费力,但它是一项高度复杂的技能,涉及快速处理他人的言语、声调、面部表情和手势,并精确计划何时以及如何做出回应(4)。这些复杂的交流动态存在于每一种语言中,包括口语和手语,被广泛认为是成功社交互动的基本“引擎”(5)。因此,对于社交机器人来说,要进行人类的社交互动,这种社交同步技能是必不可少的。然而,与许多其他人类社交行为一样,为社交机器人配备复杂的类人社交智能具有挑战性(6)。
在他们最近的论文中,胡等人(7)通过赋予一个人形社交机器人Emo来讨论社会同步的艺术。Emo 是一款皮肤柔软的拟人化面部机器人,可以使用 26 个磁力控制的面部执行器显示各种细微的面部表情。它的眼眶中还有高分辨率摄像头,可以检测不同类型的面部表情。尽管 Emo 可以模仿它检测到的人类面部表情,但参与社会同步涉及更精细的计划和执行响应。为了实现这一目标,胡及其同事使用神经网络训练Emo,根据人类对话者早期的面部动作预测他们的面部表情。例如,检测到嘴角上扬表明将显示快乐的面部表情。Emo 的预测能力使其能够计划和执行自己的面部表情作为响应,从而实现更像人类的社交同步。胡及其同事还升级了Emo的处理能力,使其在轻量级计算设施上运行,从而释放了处理能力,用于开发其他功能,如语音和听力。
使用这种简单而优雅的方法,胡及其同事将Emo的社交互动技能从单纯的模仿(图1A)提升到社交同步的艺术(图1B)。这样的发展对社交机器人的未来有着深远的影响。例如,即使在这种仅基于面部表情的新生形式中,这些轮流技能也可以从根本上改善人机交互中的信任和融洽关系,使社交机器人更接近发挥其潜力。重要的是,Emo新技能的成功将取决于其人类对话伙伴对它们的看法。这些新技能是否改善了与人类用户的社交交流,产生了信任和同理心?还是有些东西还没关?如果是这样,它是什么?鉴于 Emo 的面部表情可以精确控制,解决这个问题的一个富有成效的方法是使用来自人类行为科学的数据驱动的社会心理物理学方法 (8)。具体来说,Emo表情的不同特征,例如它们开始的确切时间或特定的面部运动成分,将被实验操纵,以测试它们如何影响人类用户行为,例如参与者对Emo的信任或参与程度。通过确定促进或阻碍人类用户参与的特定功能,这些反馈可用于提高 Emo 的一般用途和定制应用(包括跨文化互动)的社交沟通技巧 (9),从而提高其实用性、可访问性和适销性 (10)。
在这里插入图片描述

图 1.机器人与人类互动中的面部表情模仿与面部表情社交同步。
(A)在面部表情模仿中,社交机器人复制人类的面部表情,这不可避免地涉及明显的延迟和随后的异步。例如,在时间点 3 时,当人类展示他们的面部表情时,机器人保持中立,从而在机器人和人类之间产生不匹配。(B)在面部表情社会同步中,机器人可以从早期的面部动作中预测人类的面部表情(见时间点2)。这使机器人能够将其面部表情与人类的面部表情同步。例如,在时间点 3,机器人和人类同时显示相同的面部表情。信用:改编自胡等人。(7)
最后,人类的社交互动本质上是多模态的,涉及视觉和听觉信号的复杂组合,如点头、“嗯”和“啊”、扬起眉毛、回避目光、长时间眨眼和手势。在这里,胡及其同事专注于单一模式 - 面部表情 - 但他们的结果为开发具有更复杂多模态信号的社交同步技能铺平了道路。这样的壮举,虽然是一个复杂的跨学科努力,但可以真正使社交机器人加入人类的社会世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/779671.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux之冯诺依曼体系,操作系统,进程的理解,进程状态,以及进程的优先级

个人主页:点我进入主页 专栏分类:C语言初阶 C语言进阶 数据结构初阶 Linux C初阶 算法 欢迎大家点赞,评论,收藏。 一起努力,一起奔赴大厂 目录 一.冯诺依曼体系 二.操作系统 2.1概念 2.2结构示意图&…

主流公链 - BCH BSV BTG

为什么出现分叉 BTC是自由的,BTC社区也是自由的,自然而然的会出现不同观点的群体 1. 比特币现金(Bitcoin Cash,BCH) 分叉日期: 2017年8月1日主要目的: 提高比特币的交易吞吐量和降低交易费用技术…

写作类AI推荐(一)

本章要介绍的写作AI如下: paperpal 特点: 面向科研人员的AI写作工具。可以选择自己的专业,如本科生/教授。 链接:Paperpal-专业AI论文润色与论文检测平台 笔灵 特点: 面向专业写作领域的AI写作工具。可以选择要写的文章…

人事管理系统|基于springboot人事管理系统的设计与实现(附项目源码+论文)

基于springboot人事管理系统的设计与实现 目录 基于springboot人事管理系统的设计与实现 一、摘要 二、相关技术 三、系统设计 3.1 整体功能结构图 3.2 功能具体细节设计 四、数据库设计 五、核心代码 六、论文参考 七、源码获取: 一、摘要 传统信息…

【ripro美化】全站美化包WordPress RiPro主题二开美化版sucaihu-childV1.9(功能集成到后台)

使用介绍 1、【宝塔】删除ripro文件,上传最新ripro版本,然后上传压缩包内的ripro里面的对应文件到ripro主题对应内覆盖(找到对应路径单个文件去覆盖)。 2、然后上传ripro-chlid子主题美化包到/wp-content/themes路径下 3、注意顺…

npm卸载不掉的解决方案

不管怎么重装重启都报错 真服了,npm卸载不掉绝对是有缓存存在,用where npm查到d盘 实际上根本不在这个地方,这个是我安装的6.14.12版本的npm的地方,我说我怎么怎么重装怎么导包都不行呢,偷偷隐藏在这个目录里面&#…

GRE_MGRE综合实验

目录 1、R5为ISP,只能进行IP地址配置,其所有地址均配为公有IP地址。 IP配置 配置公网全网通 2、(1)R1和R5间使用PPP的PAP认证,R5为主认证方。 PAP认证 (2)R2与R5之间使用ppp的CHAP认证&am…

如何修改IDEA的代码样式配置+代码格式化快捷键配置

目录 问题现象: 问题分析: 温馨提示: 1、IDEA的代码样式配置 1.1、Use tab character - Smart tabs 配置: 1.2、Tab Size 配置: 1.3、Indent 配置: 1.4、Continuation Indent 配置 1.5、应用并保存 2、…

openstack 不能调度到某主机上分析

dashboard显示有足够资源创建虚拟机 创建一个1c2g20g配置的虚拟机,在过滤时把10-197-0-2这个主机过滤掉了,日志如下: 2024-03-25 17:52:14.087 26 DEBUG nova.scheduler.filters.disk_filter [req-8f2f32fb-1efe-4e5d-81fc-618210c7c76d 773…

【LeetCode: 面试题 16.05. 阶乘尾数 + 阶乘】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

俄罗斯深陷芯片自主困境,良率仅5成 |百能云芯

俄罗斯的芯片产业一直以来都面临着诸多挑战,尤其是在当前的国际形势下,这些挑战更加凸显。随着俄乌冲突的爆发,西方国家对俄罗斯实施了一系列经济制裁,导致俄罗斯科技产业受到了严重影响。据了解,俄国最大的本土芯片厂…

[Java、Android面试]_14_Retrofit的作用

本人今年参加了很多面试,也有幸拿到了一些大厂的offer,整理了众多面试资料,后续还会分享众多面试资料。 整理成了面试系列,由于时间有限,每天整理一点,后续会陆续分享出来,感兴趣的朋友可关注收…

基于Arduino IDE 野火ESP8266模块 MQTT 的开发

一、库介绍 Arduino常用的MQTT库主要有PubSubClient。  PubSubClient库是一个广泛使用的MQTT客户端库,它基于MQTT 3.1.1版本,并且支持ESP8266和ESP32等Arduino兼容的硬件平台。PubSubClient库允许Arduino设备连接到MQTT服务器,发布和订阅MQT…

electron+VUE Browserwindow与webview通信

仅做记录 前言: electronVUEVITE框架,用的是VUE3.0 主进程定义:用于接收webview发送的消息 ipcMain.on(MyWebviewMessage, (event, message) > {logger.info(收到webmsg message)//转发给渲染进程}) porelaod/webPreload.js定义 cons…

C语言编译与链接

前言 我们想一个问题,我们写的C语言代码都是文本信息,电脑能直接执行c语言代码吗?肯定不能啊,计算机能执行的是二进制指令,所以将C语言转化为二进制指令需要一段过程,这篇博客讲一下编译与链接,…

Day26 手撕各种集合底层源码(一)

Day26 手撕各种集合底层源码(一) 一、手撕ArrayList底层源码 1、概念: ArrayList的底层实现是基于数组的动态扩容结构。 2、思路: 1.研究继承关系 2.研究属性 3.理解创建集合的过程 – 构造方法的底层原理 4.研究添加元素的过程…

vue实现把Ox格式颜色值转换成rgb渐变颜色值(开箱即用)

图示: 核心代码: //将0x格式的颜色转换为Hex格式,并计算插值返回rgb颜色 Vue.prototype.$convertToHex function (colorCode1, colorCode2, amount) {// 确保输入是字符串,并检查是否以0x开头let newCode1 let newCode2 if (t…

关系型数据库mysql(5)存储引擎

目录 一.存储引擎的概念 二. MyISAM 和 InnoDB 2.1MyISAM介绍 2.2MyISAM支持的存储格式 2.2.1静态表(固定长度表) 2.2.2动态表 2.2.3压缩表 2.3场景举例 2.4.InnoDB 2.4.1场景举例 2.4.2企业选择存储引擎依据 三.查看存储引擎 3.1查看当前数…

C++中的STL简介与string类

目录 STL简介 STL的版本 STL的六大组件 string类 标准库中的string类 string类的常用接口 string类对象对容量的操作 size()函数与length()函数 capacity()函数 capacity的扩容方式 reserve()函数 resize()函数 string类对象的操作 push_back()函数 append()函数 operator()函数…

【01-20】计算机网络基础知识(非常详细)从零基础入门到精通,看完这一篇就够了

【01-20】计算机网络基础知识(非常详细)从零基础入门到精通,看完这一篇就够了 以下是本文参考的资料 欢迎大家查收原版 本版本仅作个人笔记使用1、OSI 的七层模型分别是?各自的功能是什么?2、说一下一次完整的HTTP请求…