OpenAI重大更新!为ChatGPT推出语音和图像交互功能

原创 | 文 BFT机器人 

图片

OpenAI旗下的ChatGPT正在迎来一次重大更新,这个聊天机器人现在能够与用户进行语音对话,并且可以通过图像进行交互,将其功能推向与苹果的Siri等受欢迎的人工智能助手更接近的水平。这标志着生成式人工智能运动的一个显著演进,OpenAI将基于语音助手与其强大的大型语言模型(LLMs)融为一体。

自从大约九个月前首次推出以来,这款广受欢迎的生成式人工智能助手一直是近年来最成功的技术之一,任何人都能通过简单的文本提示生成文章、诗歌和摘要。但现在,ChatGPT即将变得更加具有互动性,用户还可以与AI进行语音对话。

图片

这一新闻与亚马逊承诺向OpenAI竞争对手Anthropic投资多达40亿美元的消息同时传出,这是全球科技巨头之间更大规模的生成式人工智能竞争的一部分,其中包括谷歌试图通过其Bard聊天机器人迎头赶上、Meta采取坚定的开源理念来帮助其占据优势地位、以及微软与OpenAI自身紧密合作。

ChatGPT的新语音功能不仅可以朗读文本输入,还可以讲述睡前故事,解决晚餐桌上的争论等等。这项语音功能由一款新的文本转语音模型提供支持,该模型可以从文本和少量采样的语音中生成类似人类的声音。OpenAI表示,他们与知名的配音演员合作,创建了五种不同的声音,使用他们的开源Whisper语音识别系统将口头表达转录成文本。

此外,Spotify也被宣布为OpenAI的合作伙伴之一,这家音乐流媒体巨头为播客制作者引入了一个非常有趣的新功能,允许他们采样自己的声音并将他们的节目从英语翻译成西班牙语、法语或德语,同时保留他们自己的原声。然而,OpenAI似乎很谨慎,不希望招致批评,因此他们并没有将这项技术提供给所有人——而仅仅跟播客制作者合作,其中包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。

图片

这些新功能将在未来两周内逐步推出,供付费的Plus和企业订阅用户使用。要启用语音功能,用户需要前往应用程序中的“设置”菜单,然后进入“新功能”并选择加入语音对话。然后,他们需要点击右上角的耳机按钮,然后选择他们想要的声音。

最初,语音将仅限于ChatGPT Android和iOS应用程序的选择性测试版,而图像搜索将默认在所有平台上提供。这一系列更新使ChatGPT更具互动性和创造力,为用户提供了更多有趣和实用的功能。

作者 | Azukii

排版 | 小河

审核 | 猫

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/96401.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

websocket拦截

python实现websocket拦截 前言一、拦截的优缺点优点缺点二、实现方法1.环境配置2.代码三、总结现在的直播间都是走的websocket通信,想要获取websocket通信的内容就需要使用websocket拦截,大多数是使用中间人代理进行拦截,这里将会使用更简单的方式进行拦截。 前言 开发者工…

Unity2D创建帧动画片段

文章目录 概述为角色创建动画Animator组件创建动画片段状态转移 其他文章 概述 动画是游戏中一种使对象表现出运动或变换的方式。当涉及到动画时,我们通常就会用到Animator组件。它允许我们在Unity编辑器中创建、管理和控制这些动画,并将其应用于游戏对…

JTAG/SWD接口定义

目录 1. ST-Link接口定义 2. ULINK2接口定义 为方便查阅,将ST-LINK和ULINK的JTAG和SWD接口定义总结如下: 1. ST-Link接口定义 Pin no. ST-LINK/V2 connector (CN3) ST-LINK/V2 function Target connection (JTAG) Target connection (SWD) 1 VA…

移动硬盘数据恢复怎么做?盘点4种实用恢复方法!

“为了存储我的照片和视频,我特地买了一个大容量的移动硬盘。但是不知道我在导照片的时候是不是误操作了,很多照片和视频都丢失了,我应该怎么恢复移动硬盘里的数据呀?” 移动硬盘方便携带且容量比较大,逐渐成了很多朋友…

聚焦酷开科技智能大屏OS Coolita,打造智能推荐服务能力全景

2023年9月18日—22日,科学和教育计算机协会The Association for Computing Machinery(ACM)在新加坡举办了为期5天的ACM RecSys 2023,云集了各大品牌的科技巨头技术人员,还有中外各大高等学府学者参与其中,共…

机器人革命:你一定没见过这些全新的机器人技术!

原创 | 文 BFT机器人 01 通过机器人协作推进危险测绘 在危险测绘领域,研究人员开发了一种合作方案,利用地面和空中机器人对污染区域进行危险测绘。该团队通过使用异构覆盖控制技术提高了密度图的质量并降低了误差。与同质替代方案相比,该策…

【ARM】(1)架构简介

前言 ARM既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。 ARM公司是专门从事基于RISC技术芯片设计开发的公司,作为知识产权(IP)供应商,本身不直接从事芯片生产…

009:获取20日均线数据

再《005》中我们获得了K线数据,现在我们要把他的20日均线数据也获取出来。然后通过计算后,保存在新的一列中: import pandas as pd import tkinter as tk from tkinter import filedialog import ospathdef open_file():global pathpath fi…

1.5 JAVA程序运行的机制

**1.5 Java程序的运行机制** --- **简介:** Java程序的运行涉及两个主要步骤:编译和运行。这种机制确保了Java的跨平台特性。 **主要内容:** 1. **Java程序的执行过程**: - **编译**:首先,扩展名为.jav…

VMware 17pro安装流程附带密钥手把手教

VMware 17pro centos-8.5.2111-isos-x86_64安装包下载_开源镜像站-阿里云 安装VMware 17pro 下一步 勾选我接营许可协议中的条款点击下一步 更改路径后点击下一步 注意两个都要取消勾选不然会自动更新 下一步即可 最后一步为安装就行(我电脑上有VMware 16pro所以我的…

拓世AI|中秋节营销攻略,创意文案和海报一键生成

秋风意境多诗情,中秋月圆思最浓。又是一年中秋节,作为中国传统的重要节日之一,中秋节的意义早已不再仅仅是一家团圆的节日,更是一场商业盛宴。品牌方们纷纷加入其中,希望能够借助这一节日为自己的产品赢得更多的关注和…

Flexmonster Pivot Table 2.9.1 Crack

Flexmonster Pivot Table & Charts 2.9.X 是一个专门为实时可视化复杂业务数据而设计的组件。该实用程序是用JavaScript编写的,不需要额外的插件,也不受运行的服务器类型的限制。事实上,它的设计可以轻松地与当今大多数可用的开发框架集成…

lv8 嵌入式开发-网络编程开发 14

目录 1 I/O基本概念 1.1 IO概念 1.2 同步和异步 1.3 阻塞和非阻塞 2 五种I/O模型 2.1 阻塞IO 2.2 非阻塞I/O 2.3 多路复用I/O ​编辑 2.4 信号驱动式I/O ​编辑 2.5 异步I/O模型​编辑 3 五种I/O模型比较 4 练习 1 I/O基本概念 1.1 IO概念 I/O即数据的读取&#x…

探索ClickHouse——使用MaterializedView存储kafka传递的数据

在《探索ClickHouse——连接Kafka和Clickhouse》中,我们讲解了如何使用kafka engin连接kafka,并读取topic中的数据。但是遇到了一个问题,就是数据只能读取一次,即使后面还有新数据发送到该topic,该表也读不出来。 为了…

HarmonyOS/OpenHarmony原生应用-ArkTS万能卡片组件Badge

可以附加在单个组件上用于信息标记的容器组件。该组件从API Version 7开始支持。 支持单个子组件。子组件类型:系统组件和自定义组件,支持渲染控制类型(if/else、ForEach和LazyForEach)。 一、接口 方法1: Badge(value…

STM32--人体红外感应开关

本文主要介绍基于STM32F103C8T6和人体红外感应开关实现的控制算法 简介 人体红外模块选用HC-SR501人体红外传感器,人体红外感应的主要器件为人体热释电红外传感器。人体都有恒定的体温,一般在36~37度,所以会发出特定波长的红外线&#xff0…

Redis最常见应用场景

缓存(Cache) Redis的第一个应用场景是Redis作为缓存对象来加速Web应用的访问。 在该场景下,有一些存储于数据库中的数据会被频繁访问,如果频繁的访问数据库,数据库负载会升高,同时由于数据库IO比较慢&…

计算机视觉——飞桨深度学习实战-深度学习网络模型

深度学习网络模型的整体架构主要数据集、模型组网以及学习优化过程三部分,本章主要围绕着深度学习网络模型的算法架构、常见模型展开了详细介绍,从经典的深度学习网络模型以CNN、RNN为代表,到为了解决显存不足、实时性不够等问题的轻量化网络…

[Linux]线程互斥

[Linux]线程互斥 文章目录 [Linux]线程互斥线程并发访问问题线程互斥控制--加锁pthread_mutex_init函数pthread_mutex_destroy函数pthread_mutex_lock函数pthread_mutex_unlock函数锁相关函数使用示例使用锁的细节加锁解锁的实现原理 线程安全概念常见的线程不安全的情况常见的…

岩土工程监测中无线振弦采集仪的高精度高稳定性的重要性

岩土工程监测中无线振弦采集仪的高精度高稳定性的重要性 岩土工程中,无线振弦采集仪是一种用于测量结构物振动情况的关键设备。该设备主要是为了监测结构物的破坏情况、安全性能、实时振动等相关参数的变化,以便于及时掌握结构物的变化情况,…