压力给到 Google,OpenAI 发布 GPT-4o 来了

北京时间5月14日凌晨1点,OpenAI 开启了今年的第一次直播,根据官方消息,这次旨在演示 ChatGPT 和 GPT-4 的升级内容。在早些时候 Sam Altman 在 X 上已经明确,「我们一直在努力开发一些我们认为人们会喜欢的新东西,对我来说感觉就像魔法一样」。这次发布会没有GPT-5,也没有传说中的 AI 搜索引擎,据爆料猜测,可能是同时具备视觉和听觉,并拥有强大推理能力的语音助手。谜底终于揭晓了。OpenAI 发布会主要推出了新的 GPT-4o,速度非常快,语音和视频回应都可以达到实时效果。打通了文本、语音、视频、图片,不需要相互转换,实时回应。听起来,GPT-4o 的语音也太自然了,对答如流,可以唱歌,回应还可以有幽默娇羞这些情绪。而且可以通过摄像头识别人类表情来做出实时回应。实时翻译回应语言等。含“Her”量很高。a9f241c69ee4807c652c4ad8460b6e01.jpegOpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理”,穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型,可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o 则在此基础上新增了语音处理能力。GPT-4o 标志着向更自然的人类与计算机交互的转变,它能够处理文本、音频和图像的组合输入,并产生相应的多样化输出。该模型对音频输入的响应速度极快,最短仅需232毫秒,平均响应时间为320毫秒,与人类对话的自然反应时间相仿。在处理英语和编程语言文本方面,GPT-4o 与 GPT-4 Turbo 的表现不相上下,而在非英语文本处理上则有显著提升。此外,GPT-4o 在 API 调用中不仅速度更快,成本也降低了50%,尤其在视觉和音频理解方面表现出色。

模型特性

相较于之前的模型,GPT-4o在语音交互方面实现了显著进步。以往的 ChatGPT 对话模式存在较高的延迟,而 GPT-4o 通过一个统一的模型直接处理所有输入和输出,无需通过多个模型转换,从而减少了信息丢失,提升了交互的直接性和效率。

语言优化

GPT-4o 在语言标记效率上取得了显著进步,以下是20种语言的标记压缩情况示例:

  • 古吉拉特语的标记数量减少了4.4倍。
  • 泰卢固语和泰米尔语的标记分别减少了3.5倍和3.3倍。
  • 马拉地语和北印度语的标记分别减少了2.9倍。
  • 乌尔都语、阿拉伯语、波斯语、俄语、韩语和越南语的标记减少幅度在1.5倍到2.5倍之间。
  • 中文、日语、土耳其语、意大利语、德语、西班牙语、葡萄牙语、法语和英语的标记减少幅度在1.1倍到1.4倍之间。


安全性与限制

GPT-4o 在设计中融入了跨模态安全性,通过过滤训练数据和后训练行为调整等技术来增强模型的安全性。此外,GPT-4o 经过了广泛的安全评估和红队测试,以识别和减轻新模态可能引入的风险。

何时开放?

GPT-4o 将在接下来的几周时间里陆续开放。就在明天,2024年Google I/O 即将举行,Google 会发布什么呢?敬请期待!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/12632.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jar包安装成Windows服务

一、前言 很多年前写过一篇《使用java service wrapper把windows flume做成服务》的文章,也是把jar包安装成windows服务,今天介绍另外一种更简便的方案。 二、正片 这次使用的工具是 winsw,一个Windows服务包装器。下面看详细介绍 首先从g…

momentjs

Moment.js 是一个用于处理日期和时间的 JavaScript 库,它提供了许多方便的函数和方法来操作、格式化和解析日期时间。官网 常见用法 格式化日期时间:可以使用format方法将日期时间格式化为指定的字符串格式,例如YYYY-MM-DD HH:mm:ss。获取日…

中国CEO直播简史

图片|电影《教父》截图 ©自象限原创 作者丨罗辑 编辑丨程心 领导人爱对外发言这事,是中国的一个传统文化。 从乾隆爱往名画上盖章上,就可见一斑。 3Q大战时代,微博成了大佬“吵架”的战场,饭否变成了部分爱…

解释Java中的动态代理(Dynamic Proxy)及其用例

在Java中,动态代理(Dynamic Proxy)是一种在运行时动态创建代理类和对象的机制。它允许你在不改变原有类代码的前提下,通过代理类对原有类的方法增加额外的处理逻辑(如安全检查、事务处理、日志记录等)&…

在为法人主体添加平衡段值时选不到相应的平衡段值

1、在为H1038公司添加平衡段值时,值集列表中无法选到需要的平衡段值,进一步对其后台取值逻辑进行分析 SELECT *FROM (SELECT FLEXVALUES.FLEX_VALUE, FLEXVALUES.DESCRIPTIONFROM FND_FLEX_VALUES_VL FLEXVALUESWHERE FLEXVALUES.FLEX_VALUE_SET_ID :1…

Digimat在电池壳体SMC复合材料成型工艺中的应用

SMC工艺介绍及挑战 SMC(Sheet Molding Compound的缩写,即片状模塑料)是一种复合材料制造工艺。该工艺可以有效地代替金属,实现车辆轻量化目标。该工艺不仅能够显著降低车身重量,而且设计灵活,操作简单、易…

社交媒体的探索者:探寻Facebook的发展历程

在当今数字化时代,社交媒体已经成为了人们日常生活中不可或缺的一部分,而Facebook作为最具影响力的社交平台之一,其发展历程承载着无数的探索与创新。本文将深入探讨Facebook的发展历程,从其创立初期到如今的全球化影响&#xff0…

第 8 章 机器人底盘Arduino端电机驱动(自学二刷笔记)

重要参考: 课程链接:https://www.bilibili.com/video/BV1Ci4y1L7ZZ 讲义链接:Introduction Autolabor-ROS机器人入门课程《ROS理论与实践》零基础教程 8.4.4 底盘实现_03Arduino端电机驱动 自定义电机驱动的实现与上一节的编码器驱动流程类似: ROSA…

终于知道公司薪资为什么保密了!无意中拿到了部门薪资列表,自己身为小组长,只有28k,手下好几个35k左右,心态崩了

大家好,我是瑶琴呀。 一直以来,员工不能私下谈论薪资是职场公开的规定,入职的时候,HR 也会要求每个员工在保密薪资文件上签字。 记得在大学上职业规划课的时候,当时老师就给我们讲过一个案例,公司里小李和…

数据结构与算法学习笔记九---循环队列的表示和实现(C++)

目录 前言 1.为什么要使用循环队列 2.队列的顺序存储方式的实现 1.定义 2.队列初始化 3.销毁 4.清空队列 5.队列是否为空 6.队列长度 7.队头 8.入队 9.出队 10.遍历队列 11.完整代码 3.参考资料 前言 这篇文章介绍循环队列的表示和用法。 1.为什么要使用循环队…

详细分析Vue3中的defineExpose(附Demo)

目录 前言1. 基本知识2. Demo3. 实战 前言 其基本知识可参考官网&#xff1a;Vue3中的defineExpose 1. 基本知识 defineExpose 是 Vue 3 的 Composition API 中一个新的实用函数&#xff0c;用于在 <script setup> 语法下显式暴露组件的公共属性和方法 这在处理子组件…

OpenAI 重磅发布:ChatGPT Mac 桌面应用震撼上线!

OpenAI 重磅发布&#xff1a;ChatGPT Mac 桌面应用震撼上线&#xff01; 博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff0…

51单片机:点亮一个LED灯

1.新建工程 选择AT89C52&#xff0c;在Atmel下显示的是See Microchip 并不需要添加启动文件到文件夹中。 添加main.c文件&#xff0c;c比cpp效率高&#xff0c;.asm汇编即更底层 程序编写好后 nop(); 该函数在这个头文件里面 #include <INTRINS.H> #include <R…

Java JDK下载安装教程(2024年)

博主介绍&#xff1a;✌Java老徐、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&…

2024 Google I/O Android 相关内容汇总

2024 Google I/O Android 相关内容汇总 本次 Google I/O 的核心虽然是 AI &#xff0c;但是 Android 也是作为主要议题出现&#xff0c; Android 部分可以简单分为产品和开发相关内容&#xff0c;接下来主要介绍这两部分的相关更新。 重点开始开发相关&#xff0c;内容不少 产…

业务系统加固和安全设备加固

业务系统加固 业务系统包含哪些系统? 业务系统漏洞面临的风险 1web风险 2漏洞扫描&#xff0c;端口扫描 3系统漏洞 4逻辑漏洞 5 信息泄露 6拒绝服务 7口令爆破 加固方式&#xff1a; 在风险加上修复 1web漏洞&#xff1a; 包括csrf,xss&#xff0c;口令破解等等 修…

koa2 + jsonwebtoken + koa-jwt:实现node token验证

一、koa token生成、验证 koa-jwt官网 https://github.com/koajs/jwt 推荐一个koa-jwt学习文档&#xff1a; https://www.ruanyifeng.com/blog/2018/07/json_web_token-tutorial.html jsonwebtoken方法添加 const { sign, verify } require(jsonwebtoken); const secretKey …

ICode国际青少年编程竞赛- Python-4级训练场-列表综合练习

ICode国际青少年编程竞赛- Python-4级训练场-列表综合练习 1、 Flyer[3].step(1) Flyer[7].step(2) Flyer[11].step(1) for i in range(4):Flyer[i * 2].step(1) Flyer[8].step(3)for i in range(3):Dev.turnRight()Dev.step(-5)2、 for i in range(5):Flyer[i5].step(Flyer[…

JavaWeb--18 tlias-web-management 登录认证

登录认证 1 登录功能功能开发 2 登录校验2.1 问题分析2.2 会话技术CookieSession令牌技术 2.3 JWT令牌介绍生成和校验登录下发令牌 2.4 过滤器Filter拦截路径过滤器链 登录校验-Filter 2.5 拦截器InterceptorInterceptor详解执行流程 登录校验- Interceptor 3 异常处理3.1 当前…

【会议征稿】2024年机器人前沿技术与创新国际会议(FTIR 2024, 7/19-21)

2024年机器人前沿技术与创新国际会议&#xff08;FTIR 2024&#xff09;将于2024年7月19-21日在中国杭州举行。FTIR 2024聚焦前沿技术与创新&#xff0c;将把机器人领域的创新学者和专家聚集到一个共同的论坛。会议的主要目标是促进机器人的研究和开发活动&#xff0c;另一个目…