一、介绍
OpenAI 在 2023 年 11 月 7 日举行首届开发者大会,此次展会的亮点无疑是 GPT-4 Turbo 的亮相,它是 OpenAI 著名的 GPT-4 模型的升级版。 GPT-4 Turbo 有两种变体:一种用于文本分析,另一种能够理解文本和图像。 GPT-4 Turbo 的上下文窗口扩展为 128,000 个标记或大约 100,000 个单词,比其前身 GPT-4 大四倍。该模型还提供对截至 2023 年 4 月的知识截止日期的最新信息的访问。
GPT-4 Turbo 的推出突显了 OpenAI 致力于快速迭代其人工智能系统并民主化对世界上最复杂的大型语言模型的访问。让我们仔细看看 GPT-4 Turbo 的特殊之处以及它将如何塑造人工智能的未来。
GPT-4 Turbo 可供所有付费开发者通过在 API 中传递“ gpt-4-1106-preview
”来尝试
二、知识更丰富、更新更及时
GPT-4 Turbo 的突出特点之一是其扩展的知识库。最初的 GPT-4 接受了截至 2021 年 9 月的数据训练,而 GPT-4 Turbo 则接受了截至 2023 年 4 月的数据训练。这意味着新模型吸收了额外 19 个月的信息,使其更了解最近的数据。事件和主题。
对于构建需要理解或讨论时事的人工智能应用程序的开发人员来说,对世界有最新的理解是非常有益的。当被问及政治、商业、技术、文化等当代主题时,GPT-4 Turbo 将能够提供更准确、更细致的答复。其及时的知识使该模型特别适合新闻聚合、智能助手、社交机器人和其他依赖及时信息的服务。
三、庞大的上下文窗口
除了扩展的知识之外,GPT-4 Turbo 还配备了显着扩展的上下文窗口。上下文窗口决定模型在制定响应时可以考虑多少文本信息。
GPT-4 Turbo 支持 128,000 个令牌的上下文窗口 - 比 GPT-4 中之前的 32,000 个令牌窗口大四倍。这相当于该模型能够同时考虑大约 300 页的文本,提供急需的上下文以确保相关性、连贯性和逻辑一致性。
增强的上下文窗口还可以实现更复杂的对话,同时降低模型丢失情节的风险,从而使应用程序面向未来。对于聊天机器人、数字助理、辅导系统和其他长时间交换用例来说,扩大的上下文窗口是一个游戏规则改变者。
from openai import OpenAI
client = OpenAI()response = client.chat.completions.create(model="gpt-4-1106-preview",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Who won the world series in 2020?"},{"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},{"role": "user", "content": "Where was it played?"}]
)
response['choices'][0]['message']['content']
四、多模态能力
虽然最初的 GPT-4 仅限于文本,但 GPT-4 Turbo 配备了多模态功能,使其能够理解和生成图像。开发人员可以将图像传递给 GPT-4 Turbo,让它自动生成详细的标题、分析视觉内容,甚至读取图像中的文本。
这种视觉智能极大地拓展了开发人员构建计算机视觉应用程序的视野,通过音频描述、智能 OCR 系统等帮助视障人士。支持图像的 GPT-4 Turbo 让人工智能更接近人类体验世界和与世界互动的方式。
OpenAI 还通过新的文本转语音模型增强了 GPT-4 Turbo 的音频能力。通过从文本生成流畅、自然的语音,应用程序现在可以向用户大声说出其响应,这对于语音界面和可访问性至关重要。在文本、图像和音频之间,GPT-4 Turbo 开创了多模态 AI 的新时代。
五、更实惠的定价
除了技术实力外,GPT-4 Turbo 还因其非常实惠的定价模式而脱颖而出。尽管与前身相比,OpenAI 的功能有了显着提高,但 OpenAI 仍设法使 GPT-4 Turbo 更加经济。
GPT-4 Turbo 每 1000 个输入代币的成本为 0.01 美元,每 1000 个输出代币的成本为 0.03 美元。与原始 GPT-4 定价相比,这意味着输入代币成本降低了 3 倍,输出代币成本降低了 2 倍。
对于预算有限、希望实施人工智能的开发人员来说,较低的成本消除了巨大的进入壁垒。得益于庞大的上下文窗口和多模式功能,GPT-4 Turbo 比以前的模型具有更多的每个代币价值。较低的价格和增强的功能相结合,使该版本成为负担得起的人工智能的令人兴奋的飞跃。
六、额外的增强功能
除了上述重大升级之外,OpenAI 还引入了一系列其他改进,使 GPT-4 Turbo 更加强大、高效且对开发人员友好。这些包括:
-
可重复的输出 - GPT-4 Turbo 现在可以对相同的输入生成一致的响应,从而实现更严格的测试。
-
对数概率——该模型现在可以输出其生成的代币的对数概率,从而解锁高级应用程序。
-
JSON 模式 — GPT-4 Turbo 可以将其输出限制为有效的 JSON 格式,以便无缝集成到 Web 服务中。
-
改进的指令遵循——模型更忠实地遵循“以 XML 格式响应”等格式指令。
-
GPT-3.5 Turbo 刷新 — GPT-3.5 模型还获得了 16k 上下文窗口支持等升级,使其功能更接近 GPT-4。
-
代码执行——GPT-4 Turbo 可以通过 OpenAI 的新 Codex 模型编写并安全地执行 Python 代码,从而实现复杂的计算。
GPT-4 Turbo增强功能演示
这些增强功能共同为开发人员提供了更细粒度的控制、灵活性和功能,以便在 GPT-4 Turbo 框架上构建下一代 AI 应用程序。
七、人工智能助手的未来
可以说,OpenAI 公告中最令人兴奋的元素之一就是 Assistant API 的发布。该工具集使开发人员能够构建高级人工智能助手,这些助手可以执行长期任务、利用外部知识源、执行自定义代码等。
Assistants API 使开发人员能够在自己的应用程序和服务中创建类似代理的 AI 体验。例如,旅游服务可以有一个人工智能助手,可以与用户交互,协作计划假期、提取推荐目的地、比较航班价格、提供天气预报并主动回答问题。
可以指示这些人工智能助手追求特定目标,调用相关的机器学习模型和数据资源,并跟踪长时间对话中的上下文。其结果是辅助人工智能超越了仅仅响应,而是采取主动并推动解决方案。
助理还可以根据需要调用新工具,包括:
-
代码解释器:在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有多种数据和格式的文件。它允许您的助手迭代运行代码来解决具有挑战性的代码和数学问题等等。
-
检索:利用外部模型的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。这意味着您不需要计算和存储文档的嵌入,或实现分块和搜索算法。 Assistants API 根据我们在 ChatGPT 中构建知识检索的经验,优化了要使用的检索技术。
-
函数调用:使助手能够调用您定义的函数并将函数响应合并到其消息中。
八、总结
OpenAI DevDay 是一个非常引人注目的活动,其中包含突破性公告和更新。从 GPT-4 Turbo 和用户创建的 GPT 的推出到 GPT Store 和新 API 的推出,OpenAI 不断展示着他们推动 AI 技术边界的承诺。他们专注于为开发人员和用户提供支持,并为释放人工智能全部潜力的创新应用铺平道路。
OpenAI 一直在致力于推动全球人工智能的发展。它们确保这次开发大会发布的 GPT-4 Turbo 和所有已经提供的模型都不会使用私人用户数据进行训练,并在发布新系统之前进行广泛测试,以最大程度地减少有害的偏见和缺陷。
OpenAI 的内容审核技术有助于保护 GPT-4 Turbo 等模型免受行为违规和有害刻板印象的影响。他们积极采取措施来遏制风险,这种方法增强了人们对人工智能作为正义力量的信心。
九、References
[1] New models and developer products announced at DevDay:
https://openai.com/blog/new-models-and-developer-products-announced-at-devday
[2] OpenAI DevDay:
https://www.youtube.com/watch?v=U9mJuUkhUzk