GPT-4 Turbo:OpenAI发布旗舰版GPT-4模型,更便宜|更强大|128K上下文|支持多模态

一、介绍

OpenAI 在 2023 年 11 月 7 日举行首届开发者大会,此次展会的亮点无疑是 GPT-4 Turbo 的亮相,它是 OpenAI 著名的 GPT-4 模型的升级版。 GPT-4 Turbo 有两种变体:一种用于文本分析,另一种能够理解文本和图像。 GPT-4 Turbo 的上下文窗口扩展为 128,000 个标记或大约 100,000 个单词,比其前身 GPT-4 大四倍。该模型还提供对截至 2023 年 4 月的知识截止日期的最新信息的访问。

GPT-4 Turbo 的推出突显了 OpenAI 致力于快速迭代其人工智能系统并民主化对世界上最复杂的大型语言模型的访问。让我们仔细看看 GPT-4 Turbo 的特殊之处以及它将如何塑造人工智能的未来。

GPT-4 Turbo 可供所有付费开发者通过在 API 中传递“ gpt-4-1106-preview ”来尝试

二、知识更丰富、更新更及时

GPT-4 Turbo 的突出特点之一是其扩展的知识库。最初的 GPT-4 接受了截至 2021 年 9 月的数据训练,而 GPT-4 Turbo 则接受了截至 2023 年 4 月的数据训练。这意味着新模型吸收了额外 19 个月的信息,使其更了解最近的数据。事件和主题。

对于构建需要理解或讨论时事的人工智能应用程序的开发人员来说,对世界有最新的理解是非常有益的。当被问及政治、商业、技术、文化等当代主题时,GPT-4 Turbo 将能够提供更准确、更细致的答复。其及时的知识使该模型特别适合新闻聚合、智能助手、社交机器人和其他依赖及时信息的服务。

三、庞大的上下文窗口

除了扩展的知识之外,GPT-4 Turbo 还配备了显着扩展的上下文窗口。上下文窗口决定模型在制定响应时可以考虑多少文本信息。

GPT-4 Turbo 支持 128,000 个令牌的上下文窗口 - 比 GPT-4 中之前的 32,000 个令牌窗口大四倍。这相当于该模型能够同时考虑大约 300 页的文本,提供急需的上下文以确保相关性、连贯性和逻辑一致性。

增强的上下文窗口还可以实现更复杂的对话,同时降低模型丢失情节的风险,从而使应用程序面向未来。对于聊天机器人、数字助理、辅导系统和其他长时间交换用例来说,扩大的上下文窗口是一个游戏规则改变者。

from openai import OpenAI
client = OpenAI()response = client.chat.completions.create(model="gpt-4-1106-preview",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Who won the world series in 2020?"},{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},{"role": "user", "content": "Where was it played?"}]
)
response['choices'][0]['message']['content']

四、多模态能力

虽然最初的 GPT-4 仅限于文本,但 GPT-4 Turbo 配备了多模态功能,使其能够理解和生成图像。开发人员可以将图像传递给 GPT-4 Turbo,让它自动生成详细的标题、分析视觉内容,甚至读取图像中的文本。

这种视觉智能极大地拓展了开发人员构建计算机视觉应用程序的视野,通过音频描述、智能 OCR 系统等帮助视障人士。支持图像的 GPT-4 Turbo 让人工智能更接近人类体验世界和与世界互动的方式。

OpenAI 还通过新的文本转语音模型增强了 GPT-4 Turbo 的音频能力。通过从文本生成流畅、自然的语音,应用程序现在可以向用户大声说出其响应,这对于语音界面和可访问性至关重要。在文本、图像和音频之间,GPT-4 Turbo 开创了多模态 AI 的新时代。

五、更实惠的定价

除了技术实力外,GPT-4 Turbo 还因其非常实惠的定价模式而脱颖而出。尽管与前身相比,OpenAI 的功能有了显着提高,但 OpenAI 仍设法使 GPT-4 Turbo 更加经济。

GPT-4 Turbo 每 1000 个输入代币的成本为 0.01 美元,每 1000 个输出代币的成本为 0.03 美元。与原始 GPT-4 定价相比,这意味着输入代币成本降低了 3 倍,输出代币成本降低了 2 倍。

对于预算有限、希望实施人工智能的开发人员来说,较低的成本消除了巨大的进入壁垒。得益于庞大的上下文窗口和多模式功能,GPT-4 Turbo 比以前的模型具有更多的每个代币价值。较低的价格和增强的功能相结合,使该版本成为负担得起的人工智能的令人兴奋的飞跃。

六、额外的增强功能

除了上述重大升级之外,OpenAI 还引入了一系列其他改进,使 GPT-4 Turbo 更加强大、高效且对开发人员友好。这些包括:

  • 可重复的输出 - GPT-4 Turbo 现在可以对相同的输入生成一致的响应,从而实现更严格的测试。

  • 对数概率——该模型现在可以输出其生成的代币的对数概率,从而解锁高级应用程序。

  • JSON 模式 — GPT-4 Turbo 可以将其输出限制为有效的 JSON 格式,以便无缝集成到 Web 服务中。

  • 改进的指令遵循——模型更忠实地遵循“以 XML 格式响应”等格式指令。

  • GPT-3.5 Turbo 刷新 — GPT-3.5 模型还获得了 16k 上下文窗口支持等升级,使其功能更接近 GPT-4。

  • 代码执行——GPT-4 Turbo 可以通过 OpenAI 的新 Codex 模型编写并安全地执行 Python 代码,从而实现复杂的计算。

GPT-4 Turbo增强功能演示

这些增强功能共同为开发人员提供了更细粒度的控制、灵活性和功能,以便在 GPT-4 Turbo 框架上构建下一代 AI 应用程序。

七、人工智能助手的未来

可以说,OpenAI 公告中最令人兴奋的元素之一就是 Assistant API 的发布。该工具集使开发人员能够构建高级人工智能助手,这些助手可以执行长期任务、利用外部知识源、执行自定义代码等。

Assistants API 使开发人员能够在自己的应用程序和服务中创建类似代理的 AI 体验。例如,旅游服务可以有一个人工智能助手,可以与用户交互,协作计划假期、提取推荐目的地、比较航班价格、提供天气预报并主动回答问题。

可以指示这些人工智能助手追求特定目标,调用相关的机器学习模型和数据资源,并跟踪长时间对话中的上下文。其结果是辅助人工智能超越了仅仅响应,而是采取主动并推动解决方案。

助理还可以根据需要调用新工具,包括:

  • 代码解释器:在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有多种数据和格式的文件。它允许您的助手迭代运行代码来解决具有挑战性的代码和数学问题等等。

  • 检索:利用外部模型的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。这意味着您不需要计算和存储文档的嵌入,或实现分块和搜索算法。 Assistants API 根据我们在 ChatGPT 中构建知识检索的经验,优化了要使用的检索技术。

  • 函数调用:使助手能够调用您定义的函数并将函数响应合并到其消息中。

八、总结

OpenAI DevDay 是一个非常引人注目的活动,其中包含突破性公告和更新。从 GPT-4 Turbo 和用户创建的 GPT 的推出到 GPT Store 和新 API 的推出,OpenAI 不断展示着他们推动 AI 技术边界的承诺。他们专注于为开发人员和用户提供支持,并为释放人工智能全部潜力的创新应用铺平道路。

OpenAI 一直在致力于推动全球人工智能的发展。它们确保这次开发大会发布的 GPT-4 Turbo 和所有已经提供的模型都不会使用私人用户数据进行训练,并在发布新系统之前进行广泛测试,以最大程度地减少有害的偏见和缺陷。

OpenAI 的内容审核技术有助于保护 GPT-4 Turbo 等模型免受行为违规和有害刻板印象的影响。他们积极采取措施来遏制风险,这种方法增强了人们对人工智能作为正义力量的信心。

九、References

[1] New models and developer products announced at DevDay:

https://openai.com/blog/new-models-and-developer-products-announced-at-devday

[2] OpenAI DevDay:

https://www.youtube.com/watch?v=U9mJuUkhUzk

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/134869.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习之支持向量机

支持向量机: 超平面:比数据空间少一个维度,为了将数据进行切分,分为不同的类别,决策边界是超平面的一种 决策边界:就是再二分类问题中,找到一个超平面,将数据分为两类,最…

Vue中nextTick的使用及原理

在Vue.js中,nextTick方法可以让我们在DOM更新后执行一些操作。通常情况下,在数据发生变化后,Vue.js会异步地更新DOM,这样可以减少不必要的DOM操作,提高性能。但是,有时候我们需要在DOM更新后对页面进行一些…

VSCode代码调试

1. C Linux上建议用cmake编译,然后用vscode调试,所以只需修改launch.json这个文件,然后点击Run->Start Debugging进行调试 1.1. launch.json文件 打开方式:Run->Open Configurations {"version": "0.2…

安全测试,接口返回内容遍历~

最近公司被人大量爬取数据,查了一下发现,用户主页接口,没有加用户登录校验,返回了用户的敏感信息有手机号和邮箱,其实这个接口是用不到这些信息的。再加上用户id是自增长的,所以很容易被别人爬取。 既然这…

解决kubernetes集群证书过期的问题

现象: 解决办法: 1.在master节点运行: kubeadm alpha certs renew all 2.在master节点运行: rm -f /etc/kubernetes/kubelet.conf && cp /etc/kubernetes/admin.conf /etc/kubernetes/bootstrap-kubelet.conf 3.在maste…

华为fusionInsigtht集群es连接工具

华为fusionInsight为用户提供海量数据的管理及分析功能,快速从结构化和非结构化的海量数据中挖掘您所需要的价值数据。开源组件结构复杂,安装、配置、管理过程费时费力,使用华为FusionInsight Manager将为您提供企业级的集群的统一管理平台,在…

app全屏广告变现,有哪些利弊?如何发挥全屏广告的变现潜力?

全屏广告是APP变现过程中一种广泛应用的广告形式,全屏广告有哪些优势呢?开发者如何发挥全屏广告的变现潜力,最大化变现收益? https://www.shenshiads.com 01、全屏广告的优势 作为一种占据整个屏幕的广告形式,全屏广…

大语言模型(LLM)综述(六):大型语言模型的基准和评估

A Survey of Large Language Models 前言7 CAPACITY AND EVALUATION7.1 基本能力7.1.1 语言生成7.1.2 知识利用7.1.3 复杂推理 7.2 高级能力7.2.1 人类对齐7.2.2 与外部环境的交互7.2.3 工具操作 7.3 基准和评估方法7.3.1 综合评价基准7.3.2 评估方法 7.4 实证评估7.4.1 实验设…

LeetCode 面试题 16.15. 珠玑妙算

文章目录 一、题目二、C# 题解 一、题目 珠玑妙算游戏(the game of master mind)的玩法如下。 计算机有4个槽,每个槽放一个球,颜色可能是红色(R)、黄色(Y)、绿色(G&#…

AC修炼计划(AtCoder Regular Contest 163)

传送门&#xff1a;AtCoder Regular Contest 163 - AtCoder 第一题我们只需要将字符串分成两段&#xff0c;如果存在前面一段比后面一段大就成立。 #include<bits/stdc.h> #define int long long using namespace std; typedef long long ll; typedef pair<int,int&g…

安防监控系统EasyCVR平台设备通道绑定AI算法的功能设计与开发实现

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等&#xff0c;以及支持厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等。平台可拓展性强、…

Leetcode-面试题 02.02 返回倒数第 k 个节点

快慢指针&#xff1a;让快指针先移动n个节点&#xff0c;之后快慢指针一起依次向后移动一个结点&#xff0c;等到快指针移动到链表尾时&#xff0c;慢指针则移动到倒数第n个结点位置。 /*** Definition for singly-linked list.* public class ListNode {* int val;* …

你使用过哪些版本控制工具?

Git&#xff1a;Git 是目前最受欢迎和广泛使用的分布式版本控制系统。它提供了强大的分支管理、合并和版本控制功能&#xff0c;并具有高效的性能和灵活性。Subversion&#xff08;SVN&#xff09;&#xff1a;Subversion 是一个集中式版本控制系统&#xff0c;被广泛用于许多软…

Win10系统下torch.cuda.is_available()返回为False的问题解决

Q: Win10系统下torch.cuda.is_available()返回为False (l2) D:\opt\l2>pythonPython 3.10.12 | packaged by conda-forge | (main, Jun 23 2023, 22:34:57) [MSC v.1936 64 bit (AMD64)] on win32Type "help", "copyright", "credits" or &q…

[ACTF2020 新生赛]BackupFile 1

题目环境&#xff1a; 好好好&#xff0c;让找源文件是吧&#xff1f;咱们二话不说直接扫它后台 使用dirsearch工具扫描网站后台&#xff08;博主有这个工具的压缩包&#xff0c;可以私聊我领取&#xff09;python dirsearch.py -u http://0d418151-ebaf-4f26-86b2-5363ed16530…

「Verilog学习笔记」求两个数的差值

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 timescale 1ns/1ns module data_minus(input clk,input rst_n,input [7:0]a,input [7:0]b,output reg [8:0]c );always (posedge clk or negedge rst_n) begin if (~rst_…

华为防火墙基本原理工作方法总结

防火墙只会对tcp首包syn建立会话表&#xff0c;其它丢掉&#xff0c;如synack&#xff0c;ack udp直接建立会话表 icmp只对首包请求包建立会话表&#xff0c;其它包&#xff0c;如应答的不会建立直接丢掉 防火墙状态查看&#xff1a; rule name trust_untrust source-zone tru…

Spring RabbitMQ那些事(1-交换机配置消息发送订阅实操)

这里写目录标题 一、序言二、配置文件application.yml三、RabbitMQ交换机和队列配置1、定义4个队列2、定义Fanout交换机和队列绑定关系2、定义Direct交换机和队列绑定关系3、定义Topic交换机和队列绑定关系4、定义Header交换机和队列绑定关系 四、RabbitMQ消费者配置五、Rabbit…

【GEE】8、Google 地球引擎中的时间序列分析【时间序列】

1简介 在本模块中&#xff0c;我们将讨论以下概念&#xff1a; 处理海洋的遥感图像。 从图像时间序列创建视频。 GEE 中的时间序列分析。 向图形用户界面添加基本元素。 2背景 深水地平线漏油事件被认为是有史以来最大的海上意外漏油事件。该井释放了超过 490 万桶石油&am…