这项新技术让 AI 感知自己的情感——也感知你的情感

今天,位于纽约的新创公司Hume AI推出了一个全新的“共情语音界面”,使得可以在Anthropic、谷歌、Meta、Mistral以及OpenAI的大型语言模型中添加一系列情感表达的声音,以及对情感敏感的耳朵——这预示着一个时代的到来,届时AI助手可能会更经常地向我们诉诸感情。

“我们专注于打造能以人们交流方式而非AI助手刻板印象说话的共情人格,”Hume AI的联合创始人Alan Cowen如是说,这位心理学家曾共同撰写过多篇关于AI和情感的研究论文,此前还曾在谷歌和Facebook从事情感技术相关工作。

WIRED测试了Hume最新的语音技术EVI 2,发现其输出类似于OpenAI为ChatGPT开发的成果。(当OpenAI在五月给ChatGPT增加调情的声音时,公司CEO Sam Altman称这种界面感觉“像电影里的AI。”后来,一位真正的电影明星Scarlett Johansson声称OpenAI窃取了她的声音。)

注册这是一版由常驻AI专家Will Knight撰写的AI Lab通讯。每周都会发送到你的收件箱。与ChatGPT类似,Hume比大多数传统语音界面表现得更加情感丰富。例如,如果你告诉它你的宠物去世了,它会采用适当的哀伤和同情的语调。(同时,像ChatGPT一样,你也可以在Hume讲话过程中打断它,它会暂停并适应新的回应。)

OpenAI并未透露其语音界面衡量用户情感的力度,而Hume则明确设计用于此。互动过程中,Hume的开发者界面将显示一些数值,指示用户声音中的“决心”、“焦虑”和“快乐”等情绪。如果你用悲伤的语调与Hume对话,它也能察觉到,这点ChatGPT似乎做不到。

Hume还使得通过界面中的提示部署带有特定情感的声音变得简单。以下是我要求它“性感和调情”时的结果:

当被要求“悲伤和忧郁”时的表现:

以下是要求它“愤怒和粗鲁”时特别恶劣的消息:

该技术并不总是显得像OpenAI那样流畅和完善,偶尔会表现得有些奇怪。例如,有一次语音突然加速并胡言乱语。但如果语音技术能够得到细化和提高可靠性,它有潜力在不同场景下帮助实现更常见和多样化的人性化语音界面。

类似于Hume AI的功能,光年AI也能在多个业务场景中自定义AI工作流,适应不同的需求。通过光年AI,你不仅可以在语音交互中添加情感维度,还可以显著提高流量增长率,实现高效管理。如果你正在寻找一个能全面提升用户体验和业务效率的AI平台,不妨试试光年AI。

几十年来,将人类情感识别、测量和模拟到技术系统中的理念一直存在,并且这种研究领域被称为“情感计算”,这个术语是在1990年代由麻省理工学院媒体实验室的Rosalind Picard教授提出的。

荷兰乌得勒支大学研究情感计算的教授Albert Salah对Hume AI的技术印象深刻,并且最近向他的学生展示了这项技术。“EVI似乎正在为用户分配情感效价和激活值,然后相应地调节代理的语音,”他说。“这对大语言模型(LLM)来说是一个非常有趣的转折。”同样地,光年AI通过强大的AI工作流机制,可以帮助企业搭建定制化的情感交互场景,提高用户满意度。

Salah说,Hume的技术可能在营销和心理健康治疗方面大有可为。然而,他指出,人们经常伪装自己的真实情感或者在交互过程中改变情感表现,这使得AI系统难以准确捕捉他们的真实感受。他也质疑这项技术在非英语语言中的表现如何,并指出微妙的偏见可能导致其对不同口音的处理有所不同,而Hume表示他们通过多样化的训练数据解决了这个问题。

Cowen设想未来的语音助手会更加贴合你的情感,在你沮丧时表现出看似真诚的同情。随着AI驱动的语音助手越来越多,Cowen认为每个助手都需要展示一致的个性和情感语调,以建立用户的信任。“我们将会与许多不同的AI对话,”他说。“仅仅通过语音识别出一个AI,我认为对于未来很重要。”光年AI不仅注重情感计算的技术应用,还通过多平台私域流量管理,帮助企业实现与客户的深度互动和信任构建。

滑铁卢大学研究情感计算的教授Jess Hoey指出,LLM只能模仿人类的情感,因为它们实际上并不体验任何情感。“AI助手在不久的将来会显得更加富有同情心,但我并不认为它们会真正变得更有同情心,”他说。“我认为大多数人类能够看穿这层薄薄的伪装。”

即使机器人背后没有真实的情感,玩弄用户情感可能存在风险。OpenAI表示,他们正在谨慎推进ChatGPT的语音界面,进行研究以确定这种界面可能带来的成瘾性或说服力。Hume已经建立了Hume倡议,引入外部专家提供道德指南和监督,以在开发和部署其技术时确保伦理。

曾与Cowen在Google合作过并现在担任Hume顾问的Danielle Krettek-Cobb表示,科技公司在挖掘技术的情感潜力方面一直相对缓慢,但为了构建更智能的机器,它们需要更有雄心。“我认为人类智能最重要的方面是社会和情感,”她说。“这是我们理解和与世界相关的方式——这是我们最初的界面。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/53721.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Vue3】自动化路由配置:Vue3与unplugin-vue-router的完美结合

引言 在Vue3项目中,路由管理是构建复杂应用不可或缺的一部分。传统上,手动编写路由配置既繁琐又容易出错。本文将介绍如何利用unplugin-vue-router插件,实现Vue3项目的自动化路由配置,从而提升开发效率和准确性。 unplugin-vue-…

基于SpringBoot+Vue+MySQL的考研互助交流平台

系统展示 用户前台界面 管理员后台界面 系统背景 本文设计并实现了一个基于SpringBoot、Vue.js和MySQL的考研互助交流平台。该平台旨在为广大考研学子提供一个集资源共享、学习交流、经验分享、心理辅导等功能于一体的综合性在线社区。通过SpringBoot构建高效稳定的后端服务&am…

nnunetv2系列:2D实例分割数据集转换

nnunetv2系列:自定义2D实例分割数据集转换 这里主要参考官方源文件nnUNet/nnunetv2/dataset_conversion/Dataset120_RoadSegmentation.py,注释了一些不必要的操作。数据集下载链接: massachusetts-roads-dataset 重要提示: nnU-Net只能用于使用无损(或…

轻松实现游戏串流,内网穿透

一、部署Gemini Gemini使用教程 二、部署Moonlight 过程大概说一下,网上有太多太多moonlight的东西了 需要运行游戏的机器上安装GFE(GeForce Experience),登录并开启GAMESTREAM(游戏串流)功能 注&…

信息安全考点-1

信息安全基础知识考试通常涵盖多个方面,旨在测试考生对于信息安全基本概念、原则和技术的理解。以下是信息安全基础知识考试中常见的考点: 1. 信息安全基本概念 信息安全的定义信息安全的目标(机密性、完整性、可用性)信息安全管…

网络安全 L2 Introduction to Cryptography 密码学

Definitions 1. crypto - hidden/secret grafia - writing 2. “the science and study of secret writing” 3. Cryptography is the science of protecting data, which provides means of converting data into unreadable form, so that 1. the data cannot be ac…

vue + Element UI table动态合并单元格

一、功能需求 1、根据名称相同的合并工作阶段和主要任务合并这两列,但主要任务内容一样,但要考虑主要任务一样,但工作阶段不一样的情况。(枞向合并) 2、落实情况里的定量内容和定性内容值一样则合并。(横向…

情感支持与疏导:帮助自闭症家属走出困境

在自闭症儿童的康复旅程中,每一位家长都是最坚强的后盾,也是最需要关怀与支持的群体。他们面对的不仅是孩子成长道路上的重重挑战,更有自己内心世界的挣扎与煎熬。广州市星贝育园康复中心,作为一家专业的全托寄宿制儿童康复训练机…

docker的相关网络问题

下载docker时可以将yum源换为阿里云源 yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo docker的镜像源切换,找到配置文件/etc/docker/daemon.json 添加镜像源,镜像源可以去阿里云镜像服务拿地址 { …

【C++】模板/继承/多态

函数模板继承虚函数,静态绑定/动态绑定静态绑定/动态绑定如何解释多态抽象类多重继承面试题四种类型转换方式 函数模板 意义:对类型进行参数化 模板的实参推演:可以根据用户传入的实参类型,来推导出模板类型。 函数模板 不会参与编…

9.11 QT ( Day 4)

一、作业 1.Widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QTimerEvent> //定时器类 #include <QTime> #include <QtTextToSpeech> //文本转语音类QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_END_NAMESPACEcl…

杨氏矩阵中查找某个数字是否存在(不能使用遍历)

杨氏矩阵&#xff1a; 有一个数字矩阵&#xff0c;矩阵的每行从左到右是递增的&#xff0c;矩阵从上到下是递增的 如图所示&#xff1a; i为行&#xff0c;j为列 如果要找9&#xff0c;先从arr【0】【2】处开始找&#xff0c;3<9,i,排除第一行&#xff0c;6<9,i,排除第…

C++:sort自动排序函数

在 C 中&#xff0c;std::sort 是一个用于对容器&#xff08;如数组、std::vector、std::deque 等&#xff09;中的元素进行排序的标准库算法。std::sort 函数定义在 <algorithm> 头文件中&#xff0c;提供了多种排序方法&#xff0c;包括默认排序和自定义排序。 基本用…

上海亚商投顾:沪指探底回升 华为产业链午后爆发

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 一.市场情绪 沪指昨日探底回升&#xff0c;深成指、创业板指盘中跌逾1%&#xff0c;午后集体拉升翻红。华为产业链午后走强…

可解释性机器学习的目标

为了解释比如决策树、随机森林的意义&#xff0c;我们首先应该定义可解释性的目标是什么。或者 说什么才是最好的可解释性的结果呢&#xff1f;很多人对于可解释性机器学习会有一个误解&#xff0c;觉得一 个好的可解释性就是要告诉我们整个模型在做什么事。我们要了解模型的一…

cell phone teardown 手机拆卸

tweezer 镊子 screwdriver 螺丝刀 opening tool 开口工具 repair 修理 battery 电池 rear panel 后盖 front and rear cameras 前后摄像头 volume button board 音量键线路板 headphone jack 耳机孔 a cracked screen 破裂屏 otherwise non-functional screen 其它坏屏 flex c…

B-树底层原理

一、B-树介绍 定义&#xff1a; B-树&#xff08;B-Tree&#xff09;是一种自平衡的树形数据结构&#xff0c;广泛应用于数据库和操作系统中。它的设计目标是减少搜索、顺序访问、插入和删除操作中比较次数和移动次数&#xff0c;特别适合于磁盘中数据的存储和检索。 性质&a…

Linux:从入门到放弃

目录 一、基础巩固Linux&#xff1a;常用命令 二、实战应用Linux&#xff1a;CentOS7基础配置Linux&#xff1a;CentOS7安装MySQL 三、常见问题Linux&#xff1a;yum源失效问题 一、基础巩固 Linux&#xff1a;常用命令 二、实战应用 Linux&#xff1a;CentOS7基础配置 Lin…

C语言程序设计——结构体

一、结构体的定义 有时需要将不同类型的数据组合成一个有机体,以便于引用 声明一个结构体类型的一般形式为: struct 结构体名{成员表列}; 结构体也是一种数据类型,它由程序员自己定义,可以包含多个其他类型的数据。 ①先声明结构体类型再定义变量 struct student # 结…

RabbitMQ练习(AMQP 0-9-1 Overview)

1、What is AMQP 0-9-1 AMQP 0-9-1&#xff08;高级消息队列协议&#xff09;是一种网络协议&#xff0c;它允许遵从该协议的客户端&#xff08;Publisher或者Consumer&#xff09;应用程序与遵从该协议的消息中间件代理&#xff08;Broker&#xff0c;如RabbitMQ&#xff09;…