LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

目录

相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

OpenAI o3-mini的简介

1、特点

2、性能表现

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

3、模型速度和性能

4、安全性

5、未来展望

OpenAI o3-mini的安装和使用方法

1、安装

2、使用方法

ChatGPT

API

OpenAI o3-mini的案例应用


相关文章

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读

LLMs之o3:《Deliberative Alignment: Reasoning Enables Safer Language Models》翻译与解读-CSDN博客

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略

LLMs之OpenAI o系列:OpenAI o3-mini的简介、安装和使用方法、案例应用之详细攻略-CSDN博客

OpenAI o3-mini的简介

OpenAI o3-mini是OpenAI发布的最新推理模型,也是该系列中最经济高效的模型。它于2024年12月预览,现已在ChatGPT和API中可用。o3-mini是一个强大且快速的模型,它突破了小型模型的性能限制,在科学、数学和编码等STEM领域展现出卓越的能力,同时保持了与OpenAI o1-mini相同的低成本和低延迟。

o3-mini是第一个支持函数调用结构化输出开发者消息小型推理模型,使其具备生产就绪能力。它支持流式输出,并提供低、中、高三种推理强度选项,以适应不同的使用场景。 o3-mini作为一款经济高效、功能强大的推理模型,已在多种平台和API中推出,并对不同用户群体开放,极大提升了AI技术的易用性和可及性。目前已在ChatGPT Plus、Team和Pro版本中上线,企业版将于2月上线。API方面,o3-mini已开始向API使用等级3-5的开发者推出。免费用户也可以在ChatGPT中使用o3-mini。

总而言之,OpenAI o3-mini 是一款在保持低成本低延迟的同时,拥有强大STEM能力,尤其在科学、数学和编码方面表现出色的推理模型。它支持多种开发者功能,并提供了多种推理强度选项,以适应不同的使用场景。在多个基准测试中,o3-mini 的性能超越了其前代模型,并且在安全性方面也进行了充分的考量。o3-mini 的发布标志着 OpenAI 在经济高效人工智能领域取得了重要进展,也为更广泛的 AI 应用铺平了道路。

官网文章:https://openai.com/index/openai-o3-mini/

1、特点

>> 高性价比:o3-mini在保持低成本和低延迟的同时,提供了强大的推理能力。
>> 强大的STEM能力:在科学、数学和编码方面表现出色,尤其在解决复杂问题方面能力突出。
>> 丰富的开发者功能:支持函数调用、结构化输出和开发者消息,方便开发者集成到各种应用中。
>> 可调节的推理强度:提供低、中、高三种推理强度选项,允许开发者根据具体应用场景调整模型的推理深度和速度。
>> 快速响应:平均响应时间比o1-mini快24%,首次token生成时间快2500毫秒。
>> 更高的准确性:专家测试显示,o3-mini的答案更准确、更清晰,推理能力更强,错误率降低了39%。
>> 支持搜索:可以结合搜索引擎查找最新的信息,并提供相关链接(目前为早期原型)。
>> 安全性:采用审慎对齐技术进行训练,在安全性和防越狱评估中表现优异。

2、性能表现

o3-mini在STEM领域表现出色,尤其在数学、编码和科学方面,其性能与OpenAI o1相当甚至超越,同时响应速度更快,错误率更低。o3-mini在各种STEM相关的基准测试和人类偏好测试中均表现优异,证明了其在准确性、速度和推理能力方面的优势。

在多个基准测试中,o3-mini均取得了优异的成绩,包括:

>> 竞赛数学 (AIME 2024):o3-mini (高推理强度)达到83.6%的准确率

>> 博士级科学问题 (GPQA Diamond):o3-mini (高推理强度)达到77.0%的准确率

>> FrontierMath:o3-mini (高推理强度)在首次尝试时解决了超过32%的问题。

>> 竞赛编码 (Codeforces):o3-mini在不同推理强度下均优于o1-mini。

>> 软件工程 (SWE-bench Verified):o3-mini是目前在SWEbench-verified上表现最佳的模型。

>> LiveBench 编码:o3-mini在中、高推理强度下均优于o1-high。

>> 一般知识:o3-mini在一般知识评估中优于o1-mini。

在人类偏好评估中,测试者更倾向于o3-mini的回答 (56%),并且错误率降低了39%。o3-mini的响应速度比o1-mini快24%。

3、模型速度和性能

o3-mini在保持与OpenAI o1相当的智能水平的同时,实现了更快的性能和更高的效率。o3-mini在速度和效率方面显著优于其前代模型,这使其更适合需要快速响应的应用场景。

o3-mini的平均响应时间为7.7秒,比o1-mini的10.16秒快24%。它在首次生成token的时间上也比o1-mini快2500毫秒。

4、安全性

OpenAI 采取了严格的安全措施来确保 o3-mini 的安全性和可靠性。OpenAI 使用审慎对齐技术训练 o3-mini,使其能够安全地响应用户提示。o3-mini在安全性和防越狱评估中显著优于GPT-4o。

在部署之前,OpenAI 对 o3-mini 进行了全面的安全评估,包括外部红队测试和安全评估。详细的评估结果可在 o3-mini 系统卡片中查看。

5、未来展望

OpenAI 将继续努力降低 AI 成本,并提升 AI 的性能和安全性。OpenAI 将继续致力于开发平衡智能、效率和安全性的模型。OpenAI o3-mini 的发布是 OpenAI 持续推进经济高效人工智能发展的重要一步,它使得高质量的 AI 更加易于获取。

OpenAI o3-mini的安装和使用方法

1、安装

OpenAI o3-mini 目前并未开源,不支持本地部署。用户只能通过在线方式(例如在ChatGPT中使用)或调用OpenAI提供的API来使用该模型。

2、使用方法

ChatGPT

ChatGPT Plus、Team和Pro用户可以直接在模型选择器中选择o3-mini使用。免费用户可以通过选择“Reason”或重新生成回复来使用o3-mini。

付费用户 (Plus, Team, Pro):直接在ChatGPT的模型选择器中选择 o3-mini 即可使用。

免费用户:可以通过两种方式使用:在消息输入框中选择 "Reason"。重新生成已有的回复。

API

o3-mini已开始在Chat Completions API、Assistants API和Batch API中向特定等级的开发者推出。 具体使用方法取决于你选择的 API,请参考 OpenAI 的 API 文档。开发者可以根据需求选择三种推理强度:低、中、高。 高强度推理会更准确,但响应速度较慢;低强度推理速度更快,但准确性可能略低。 中等强度则在速度和准确性之间取得平衡。
API地址:https://platform.openai.com/docs/models#current-model-aliases

from openai import OpenAI
client = OpenAI()completion = client.chat.completions.create(model="o3-mini",messages=[{"role": "developer", "content": "You are a helpful assistant."},{"role": "user","content": "Write a haiku about recursion in programming."}]
)print(completion.choices[0].message)

OpenAI o3-mini的案例应用

持续更新中……

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/894406.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI开发学习之——PyTorch框架

PyTorch 简介 PyTorch (Python torch)是由 Facebook AI 研究团队开发的开源机器学习库,广泛应用于深度学习研究和生产。它以动态计算图和易用性著称,支持 GPU 加速计算,并提供丰富的工具和模块。 PyTorch的主要特点 …

Python安居客二手小区数据爬取(2025年)

目录 2025年安居客二手小区数据爬取观察目标网页观察详情页数据准备工作:安装装备就像打游戏代码详解:每行代码都是你的小兵完整代码大放送爬取结果 2025年安居客二手小区数据爬取 这段时间需要爬取安居客二手小区数据,看了一下相关教程基本…

OpenCV:开运算

目录 1. 简述 2. 用腐蚀和膨胀实现开运算 2.1 代码示例 2.2 运行结果 3. 开运算接口 3.1 参数详解 3.2 代码示例 3.3 运行结果 4. 开运算应用场景 5. 注意事项 6. 总结 相关阅读 OpenCV:图像的腐蚀与膨胀-CSDN博客 OpenCV:闭运算-CSDN博客 …

JavaWeb入门-请求响应(Day3)

(一)请求响应概述 请求(HttpServletRequest):获取请求数据 响应(HttpServletResponse):设置响应数据 BS架构:Browser/Server,浏览器/服务器架构模式。客户端只需要浏览器就可访问,应用程序的逻辑和数据都存储在服务端(维护方便,响应速度一般) CS架构:Client/ser…

【SLAM】于AutoDL云上GPU运行GCNv2_SLAM的记录

配置GCNv2_SLAM所需环境并实现AutoDL云端运行项目的全过程记录。 本文首发于❄慕雪的寒舍 1. 引子 前几天写了一篇在本地虚拟机里面CPU运行GCNv2_SLAM项目的博客:链接,关于GCNv2_SLAM项目相关的介绍请移步此文章,本文不再重复说明。 GCNv2:…

罗格斯大学:通过输入嵌入对齐选择agent

📖标题:AgentRec: Agent Recommendation Using Sentence Embeddings Aligned to Human Feedback 🌐来源:arXiv, 2501.13333 🌟摘要 🔸多代理系统必须决定哪个代理最适合给定的任务。我们提出了一种新的架…

团体程序设计天梯赛-练习集——L1-025 正整数A+B

一年之际在于春,新年的第一天,大家敲代码了吗?哈哈 前言 这道题分值是15分,值这个分,有一小点运算,难度不大,虽然说做出来了,但是有两个小疑点。 L1-025 正整数AB 题的目标很简单…

Leetcode:598

1,题目 2,思路 脑筋急转弯,看题目一时半会还没搞懂意思。 其实不然就是说ops是个矩阵集合,集合的每个矩阵有俩个元素理解为行列边距 m和n是理解为一个主矩阵,计算ops的每个小矩阵还有这个主矩阵的交集返回面积 3&…

web前端12--表单和表格

1、表格标签 使用<table>标签来定义表格 HTML 中的表格和Excel中的表格是类似的&#xff0c;都包括行、列、单元格、表头等元素。 区别&#xff1a;HTML表格在功能方面远没有Excel表格强大&#xff0c;HTML表格不支持排序、求和、方差等数学计算&#xff0c;主要用于布…

【AI】探索自然语言处理(NLP):从基础到前沿技术及代码实践

Hi &#xff01; 云边有个稻草人-CSDN博客 必须有为成功付出代价的决心&#xff0c;然后想办法付出这个代价。 目录 引言 1. 什么是自然语言处理&#xff08;NLP&#xff09;&#xff1f; 2. NLP的基础技术 2.1 词袋模型&#xff08;Bag-of-Words&#xff0c;BoW&#xff…

第1章 量子暗网中的血色黎明

月球暗面的危机与阴谋 量子隧穿效应催生的幽蓝电弧&#xff0c;于环形山表面肆意跳跃&#xff0c;仿若无数奋力挣扎的机械蠕虫&#xff0c;将月球暗面的死寂打破&#xff0c;徒增几分诡异。艾丽伫立在被遗弃的“广寒宫”量子基站顶端&#xff0c;机械义眼之中&#xff0c;倒映着…

AI-ISP论文Learning to See in the Dark解读

论文地址&#xff1a;Learning to See in the Dark 图1. 利用卷积网络进行极微光成像。黑暗的室内环境。相机处的照度小于0.1勒克斯。索尼α7S II传感器曝光时间为1/30秒。(a) 相机在ISO 8000下拍摄的图像。(b) 相机在ISO 409600下拍摄的图像。该图像存在噪点和色彩偏差。©…

【Git】初识Git Git基本操作详解

文章目录 学习目标Ⅰ. 初始 Git&#x1f4a5;注意事项 Ⅱ. Git 安装Linux-centos安装Git Ⅲ. Git基本操作一、创建git本地仓库 -- git init二、配置 Git -- git config三、认识工作区、暂存区、版本库① 工作区② 暂存区③ 版本库④ 三者的关系 四、添加、提交更改、查看提交日…

使用 Spring JDBC 进行数据库操作:深入解析 JdbcTemplate

目录 1. Spring JDBC 简介 2. JdbcTemplate 介绍 3. 创建数据库和表 4. 配置 Spring JDBC 5. 创建实体类 6. 使用 JdbcTemplate 实现增、删、改、查操作 7. Spring JDBC 优点 8. 小结 1. Spring JDBC 简介 Spring JDBC 是 Spring 框架中的一个模块&#xff0c;旨在简化…

BUUCTF [Black Watch 入群题]PWN1 题解

1.下载文件 exeinfo checksec 32位 IDA32 看到关键函数 read两次 第一次read的变量s在bss段&#xff1b;第二次的buf到ebp距离为 24 但是第二次的read字节只能刚好填满返回地址 传不进去变量 所以想到栈迁移 将栈移动到变量s所在位置上来 同时 这题开了NX 无直接的binsh和s…

Cubemx文件系统挂载多设备

cubumx版本&#xff1a;6.13.0 芯片&#xff1a;STM32F407VET6 在上一篇文章中介绍了Cubemx的FATFS和SD卡的配置&#xff0c;由于SD卡使用的是SDIO通讯&#xff0c;因此具体驱动不需要自己实现&#xff0c;Cubemx中就可以直接配置然后生成SDIO的驱动&#xff0c;并将SD卡驱动和…

java练习(2)

回文数&#xff08;题目来自力扣&#xff09; 给你一个整数 x &#xff0c;如果 x 是一个回文整数&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 回文数 是指正序&#xff08;从左向右&#xff09;和倒序&#xff08;从右向左&#xff09;读都是一样的整…

使用 Tauri 2 + Next.js 开发跨平台桌面应用实践:Singbox GUI 实践

Singbox GUI 实践 最近用 Tauri Next.js 做了个项目 - Singbox GUI&#xff0c;是个给 sing-box 用的图形界面工具。支持 Windows、Linux 和 macOS。作为第一次接触这两个框架的新手&#xff0c;感觉收获还蛮多的&#xff0c;今天来分享下开发过程中的一些经验~ 为啥要做这个…

ComfyUI安装调用DeepSeek——DeepSeek多模态之图形模型安装问题解决(ComfyUI-Janus-Pro)

ComfyUI 的 Janus-Pro 节点&#xff0c;一个统一的多模态理解和生成框架。 试用&#xff1a; https://huggingface.co/spaces/deepseek-ai/Janus-1.3B https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B https://huggingface.co/spaces/deepseek-ai/JanusFlow-1.3B 安装…

索引的底层数据结构、B+树的结构、为什么InnoDB使用B+树而不是B树呢

索引的底层数据结构 MySQL中常用的是Hash索引和B树索引 Hash索引&#xff1a;基于哈希表实现的&#xff0c;查找速度非常快&#xff0c;但是由于哈希表的特性&#xff0c;不支持范围查找和排序&#xff0c;在MySQL中支持的哈希索引是自适应的&#xff0c;不能手动创建 B树的…