免费的GPT4终于要来了!OpenAI直播发布会详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

上周我在“重磅!5月13日下周一,OpenAI直播发布新功能!”一文中预告了OpenAI的这场被OpenAI CEO称为“magic”的直播发布会,本周一,它如约而至。

OpenAI果然没有令人失望。首先,主持人Mira Murati(OpenAI CTO)官宣了ChatGPT的桌面客户端,以及全新的web UI界面。其次,重头戏来了,Mira介绍了一款全新的模型GPT-4o,并且宣布这款GPT-4模型会对所有用户开放,当然包括免费用户!

ChatGPT桌面版客户端

根据Mira介绍,ChatGPT桌面版客户端即将公测,会最先推出macOS版本,然后会在今年晚些时候推出Windows版本。还是延续了OpenAI一贯的灰度发布的作风,目前已经开始陆续向用户推出。

我也收到了OpenAI的灰度测试,收到测试后ChatGPT会有信息提醒如下。注意,macOS版本目前仅支持Apple芯片的Macbook,系统要求macOS 14及以上。

为什么要发布桌面端?其中一大亮点就是可以直接共享电脑屏幕给ChatGPT,更加方便和ChatGPT对话。在直播后半程的demo中,OpenAI的Research lead给我们展示了这一功能。

最新的模型GPT-4o

直播发布会大概有效时长25分钟,至少有20分钟都是在介绍或者演示GPT-4o这个最新的模型。目前该模型已开始灰度发布,已经有不少小伙伴收到了这个新模型的使用资格。我也正好在今天下午就收到了体验资格。

收到灰度测试邀请的小伙伴在重新进入ChatGPT页面后会收到下面这个弹窗提醒。

在左上角模型选择处,已经多出来了一个GPT-4o的选项。

那么,为什么是GPT-4o模型?它牛在哪里?

多模态能力

GPT-4o,全名为GPT-4 omni,omni在英文里是“全能”的意思。

GPT-4o是一个本质上的多模态模型,能够深度理解和生成不同格式的内容,包括文本、语音和图像。这使得它可以在各种交互中更加灵活,例如接受语音命令或处理视觉数据。

理解能力是AI能够和我们人类进行交互的基础。而多模态级别的理解能力将会使得AI和我们交互方式更进一步。在直播发布会的后半程,OpenAI的研究人员为观众在实时对话中演示了这一最新模型的多模态能力,GPT-4o快速且正确地识别出了白纸上写的数学方程以及文字。这种多模态级别的理解能力虽然靠OCR识别实现,但它对外给人的感觉已经不再像一个应用程序,而是一个有理解能力的“智能体”!

实时语音和视频对话

注意,GPT-4o具有实时语音对话的功能!

可能有小伙伴能够联想到,之前ChatGPT以及Kimi Chat也有对话功能,也就是“语音模式”,你可以以语音的形式问问题,然后对方会针对你的问题进行回复,当然也是以语音的形式。但这种形式归根结底只能算是“对话”,而远远不是“实时对话”!比如,对于AI的语音回答,你必须从头听到尾,然后你再问,它再答。

什么是“实时对话”,就像是你和朋友打电话那样,你可以随时打断对方,表达自己的观点,而对方也能够理解你的意思,对给予回应。这就是新模型GPT-4o具有的功能,可以简单理解为由世界上最强大的LLM模型驱动的Siri,Alexa,小度和小爱同学。

在demo中,OpenAI的研究人员能够随意打断GPT-4o的讲话,就像是真正的对话那样。并且,GPT-4o的回复是实时的,而不是像以前那样,需要思考几秒钟(其实是在生成答案),然后再用语音回答,导致对话的体验很不连贯。更重磅的,GPT-4o甚至能够理解说话者的情感,具有了情感感知的能力!GPT-4o能够听到并判断出demo者在喘粗气,它会给出"slow down"的建议,并且,GPT-4o能够根据要求任意改变语调、音色等等,可以把音色加上各种从弱到强的感情色彩!

更快的响应速度

GPT-4o的响应速度是GPT-4 Turbo的两倍,这有助于更快速地应答和更有效地处理数据。同时,这也是为什么这个模型能够做到如此逼真的“实时对话”。

增加可访问性

Mira宣布,GPT-4o会在未来的几周内对所有用户免费开放,而付费用户的使用数量限制是免费用户的五倍。

支持API使用

对于开发者来说,该模型的API rate limit显著提高,是GPT-4 Turbo的五倍,允许在各种应用中更广泛地使用该模型,从简单的脚本到复杂的集成系统。

目前,GPT-4o模型的API已是可用状态,定价为GPT-4 Turbo的一半:

  • 输入:5 USD/1M Tokens

  • 输出:15 USD/1M Tokens


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/11962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker下载镜像出现“missing signature key”如何解决?

“missing signature key” 通常与 Docker 配置有关,具体是 Docker 试图验证镜像的签名但未能找到相应的密钥。这种情况可能发生在启用了 Docker Content Trust (DCT) 的环境中,DCT 是一种安全功能,要求所有镜像必须有签名才能拉取。 原因 …

刚刚OpenAI发布ChatGPT-4o模型,免费使用GPT4o并免费提供更多功能

就在今日凌晨1点,OpenAI举行了春季发布会,发布了GPT-4o 并免费提供更多功能。 亲测GPT-4o已经可以免费试用,每个人都可以使用它并从中受益,GPT4终于不再是少部分人的玩物。 点击加入ChatGPT4交流群:https://www.aijour…

微信小程序发送订阅消息sendMessage

微信小程序发送订阅消息sendMessage 请注意订阅消息一次性订阅只只能授权一次接受一条消息多次授权会累加接受次数,wx.requestSubscribeMessage调用授权 目前长期性订阅消息仅向政务民生、医疗、交通、金融、教育等线下公共服务开放 //授权弹框,只弹出…

交通地理信息系统实习教程(二)

这篇文章服务于GIS背景用户以及有志于GIS的朋友 操作源数据位置:【免费】交通地理信息系统实习二源数据资源-CSDN文库 软件安装包位置:【免费】TransCad-交通地理信息系统软件资源-CSDN文库 一、最短路径分析 1.1软件启动说明 这里需要给出一个必要的…

硬件FMEA与软件FMEA的区别——FMEA软件

​免费试用FMEA软件-免费版-SunFMEA 在产品开发和制造过程中,失效模式与影响分析(FMEA)作为一种预防性的质量工具,对于确保产品性能和质量至关重要。然而,硬件FMEA和软件FMEA在应用和实践方面存在显著的区别。本文旨在…

基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统

阿里云向量检索 Milvus 版现已无缝集成于阿里云 PAI 平台,一站式赋能用户构建高性能的检索增强生成(RAG)系统。您可以利用 Milvus 作为向量数据的实时存储与检索核心,高效结合 PAI 和 LangChain 技术栈,实现从理论到实…

java面试题:判断字符串包含字母、数字、空格、符号的数量

在Java中,你可以使用正则表达式来检查字符串中包含多少个字母、数字、空格和符号。也可以使用基础api来实现业务逻辑,方法如下: 1 使用Character类的静态方法 以下代码定义了一个countCharacters方法,它遍历字符串中的每个字符&a…

解决:微信支付 由于商家传入的H5交易参数有误,该笔交易暂时无法完成,请联系商家解决

微信支付参数配置完成后请求报这个。在网上搜索后发现是ip配置的问题,我配置的是127.0.0.1。 而微信支付的时候需要获取用户的真实ip

Mysql关键字闭坑

Mysql关键字闭坑 INTERVAL 因为需求,所以数据设计时用到了一个INTERVAL字段,程序编译及启动都没有任何问题,但是到了查询的时候,直接控制台报语法异常,这就奇怪了,用的是MP插件作为查询,为啥报出语法错误&…

求职招聘平台小程序源码系统 附带源代码以及完整的安装部署教程

系统概述 求职招聘平台小程序源码系统是一款基于微信小程序的求职招聘平台,旨在为广大求职者和招聘企业提供一个高效、便捷的线上交流平台。该系统具备以下特点: 1.功能齐全:系统包含职位发布、简历投递、在线沟通、面试安排等求职招聘全流程…

Android Saving Activity State使用说明和注意事项

1、说明 在管理activity生命周期的简单介绍中提到当一个activity被暂停或停止时,该activity的状态被保留。因为当activity对象被暂停或停止时仍然保留在内存中,所有有关成员的信息和当前的状态仍然可用。这样,用户对该activity所做的任何更改…

笔记:完善python selenium 讯飞写作的整体自动化

昨天做得不太好,今天再来一次,我发现,只要写得多,一定会有发现。 1、加入本地目录,不要一直登录。 # 定义Edge浏览器的用户数据目录edge_user_data_dir = r"C:\Users\Administrator\AppData\Local\Microsoft\Edge\User Data\Default"# 设置Edge选项edge_optio…

Spire.PDF for .NET【文档操作】演示:将多个 PDF 文件中的选定页面合并为一个

使用 Spire.PDF,您不仅可以将多个 PDF 文件合并为一个文件,还可以从源文件中选择特定页面并将它们合并为一个 PDF 文档。以下代码片段演示了相同的内容。 Spire.PDF for .NET 是一款独立 PDF 控件,用于 .NET 程序中创建、编辑和操作 PDF 文档…

腐烂的橘子 - (LeetCode)

一、概述 994. 腐烂的橘子 - 力扣(LeetCode),今天刷到这道题,开始按照自己实现的思路写了一次,通过了调试,但是提交的时候,来了一个大的数据,就没有通过测试,百思不得其…

牛顿/高斯牛顿/LM法与最小二乘

最小二乘分为线性最小二乘和非线性最小二乘 最小二乘目标函数都是min||f(x)||2 若f(x) ax b,就是线性最小二乘;若f(x) ax2 b / ax2 bx 之类的,就是非线性最小二乘; 求解线性最小二乘,【参考】 求解非线性最小二…

【多人协作】场景模拟(一)

文章目录 实现多人协作场景:操作流程1开发人员a和b克隆仓库到本地2在本地仓库建立分支并与远程分支建立链接3开发人员工作并提交代码4将合并dev分支与master分支 实现多人协作 多人协作开发是git的最核心也是最重要的操作。多人协作也就意味着同一时间里&#xff0…

游戏私域运营干货必看 | 《 2023 中国移动游戏私域运营指南》下载

在新游竞争越发激烈、买量效率持续走低、用户注意力资源紧缺等悬而未决的现实困境下,游戏企业必须在存量市场中,寻找一条可行、可复制的出路。 为了一探究竟,网易云商分别面向国内 23 家中大型研运一体化游戏公司,与 2000 位真实…

红黑树!!

文章目录 1.红黑树的概念2.红黑树的几种情况2.1 情况一:cur为红,p为红,g为黑,u存在且为红(p为parent,g为grandfather,u为uncle)2.2 情况二:cur为红,p为红,g为黑&#xff…

MATLAB支持向量机:函数或变量 ‘svmtrain‘ 无法识别解决方法

我的MATLAB版本是2020a,在运行程序时出现了一下报错 若在运行程序时出现了以下报错: 支持向量机程序在MATLAB执行代码的时候发现有错误。 试一下help,如下图所示,SVM_L和svmtrain均找不到。 打开matlab帮助文档: 可…

C# XPTable in .net6(XPTable控件使用说明八)

经过作者schoetbi、armin-pfaeffle的努力,XPTable已经可以在 winform .net6 .net8的环境下使用,版本升级到了2.0,这样就可以在winform下同时使用XPTABLE和EFcore, 这样就可以解决大部分的场景了。