ChatGPT模型大更新!全新大、小文本嵌入模型,API价格大降价!

1月26日凌晨,OpenAI在官网对ChatGPT
Turbo模型(修复懒惰行为),免费的审核模型,并对新的GPT-3.5 Turbo模型API进行了大幅度降价。模型进行了大更新,发布了两款全新大、小文本嵌入模型,全新的GPT-4

OpenAI还将推出全新的API秘钥和可视化管理方法,帮助开发人员更简单、直观地观察API使用情况,并对API密钥设置更详细的使用权限。

值得一提的是,全新的嵌入模型可以为ChatGPT 、Assistants API中的知识检索以及很多检索增强生成式开发工具提供技术支持

全新文本嵌入模型

「AIGC开放社区」先简单介绍一下嵌入模型:嵌入是一串数字,代表了自然语言或代码等内容中的概念。嵌入也使得机器学习模型和其他算法更容易理解内容之间的关系,并执行分类、内容检索、搜索、推荐等任务

同时嵌入是GPT系列模型的核心组成部分,用于将输入的文本(单词或字符)转换为数值向量,例如,词嵌入、位置嵌入、上下文嵌入,这些向量能够表示输入数据的丰富信息,提供更深层次的语义理解。

图片

本次OpenAI发布了小文本嵌入模型text-embedding-3-small和大文本嵌入模型text-embedding-3-large,主要特色性能如下。

1)性能更强:根据OpenAI公布的性能测试,小文本嵌入模型的多语言检索(MIRACL)常用基准的平均得分从 31.4% 增加至 44.0%;英语任务(MTEB)常用基准的平均得分从 61.0% 增加到 62.3 %。

大文本嵌入模型在MIRACL上,平均得分从 31.4% 增加至54.9%,而在 MTEB 上,平均得分从 61.0% 提高到 64.6%,整体性能比小文本更强悍。

图片

2)支持缩短嵌入节省成本:与较小的嵌入式相比,开发者在使用较大的嵌入式(例如,将其存储在向量存储区以进行检索)通常会花费更多的成本,消耗更多的AI算力、内存和存储空间。

为了帮助开发者节省成本,OpenAI允许开发人员通过传递维度API参数,来缩短嵌入模型(从序列末尾删除一些数字),而不会使嵌入模型失去其表示特性

例如,在MTEB基准上,大文本嵌入模型可以缩短到256大小,但性能依然优于大小为1536的未缩短的小文本嵌入模型

3)API价格:虽然全新的嵌入文本模型性能非常强,但OpenAI对API的价格进行了大降价,小文本嵌入模型的API价格与之前模型相比降了5倍,每1000 tokens价格为0.00002美元。大文本嵌入模型是,每每1000 tokens价格为0.00013美元。

全新GPT-4 Turbo 预览模型

自 OpenAI发布GPT-4 Turbo模型以来,超过70%的GPT-4 API客户已转换为GPT-4 Turbo。这是因为GPT-4 Turbo可以提供更大的上下文以及性能。

现在,OpenAI发布了全新的GPT-4 Turbo预览模型——gpt-4-0125-preview

与之前相比,该模型能更好地完成代码生成等任务,同时修复了用户非常关注的懒惰行为,还修复了影响非英语 UTF-8 生成的错误问题

对于那些希望自动升级到最新GPT-4 Turbo 预览版模型的开发者,将始终指向OpenAI最新的 GPT-4 Turbo 预览版。

免费审核模型

为了帮助开发者降低ChatGPT的非法内容输出,提升安全性,OpenAI提供了免费的审核模型API。

此外,OpenAI还将发布一款迄今为止最强大的审核模型text-moderation-007,进一步提升模型的安全性。

API价格大降价

下周,OpenAI将推出GPT-3.5 Turbo系列的全新模型——gpt-3.5-turbo-0125,同时对API价格大降价。

新模型的输入价格大降50%,每1000 tokens价格为0.0005美元;输出价格降低25%,每1000 tokens价格为0.0015美元

同时该模型进行各种功能改进,包括,提高响应所要求格式的准确性,以及修复导致非英语语言函数调用出现文本编码错误的问题。

全新可视化API管理方法

为了帮助开发人员更高效地管理API,OpenAI提供了两种全新管理方法。

1)开发人员现在可以从API密钥页面,为API密钥分配详细权限。例如,可以为密钥分配只读访问权限以支持内部跟踪仪表板,或限制为只能访问某些特定端点。

2)在开启跟踪功能后,使用详情、导出功能现在可以显示API密钥级别的指标。因此,开发者只需为每个功能、团队、产品或项目设置单独的 API 密钥,就能轻松查看每个功能、团队、产品或项目级别的详细使用情况。

在未来几个月内,OpenAI将进一步提升开发人员对API的使用、观察和控制能力,这对于大型企业来说非常重要。

本文素材来源OpenAI官网,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/648245.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

申万宏源基于 StarRocks 构建实时数仓

作者 :申万宏源证券 实时数仓项目组 小编导读: 申万宏源证券有限公司是由新中国第一家股份制证券公司——申银万国证券股份有限公司与国内资本市场第一家上市证券公司——宏源证券股份有限公司,于 2015 年 1 月 16 日合并组建而成&#xff0c…

设计模式_装饰器模式_Decorator

生活案例 咖啡厅 咖啡定制案例 在咖啡厅中,有多种不同类型的咖啡,客户在预定了咖啡之后,还可以选择添加不同的调料来调整咖啡的口味,当客户点了咖啡添加了不同的调料,咖啡的价格需要做出相应的改变。 要求&#xff…

机器学习_常见算法比较模型效果(LR、KNN、SVM、NB、DT、RF、XGB、LGB、CAT)

文章目录 KNNSVM朴素贝叶斯决策树随机森林 KNN “近朱者赤,近墨者黑”可以说是 KNN 的工作原理。 整个计算过程分为三步: 计算待分类物体与其他物体之间的距离;统计距离最近的 K 个邻居;对于 K 个最近的邻居,它们属于…

Qt编写linux系统onvif工具(支持预览/云台/预置位/录像等)

一、功能特点 广播搜索设备,支持IPC和NVR,依次返回。可选择不同的网卡IP进行对应网段设备的搜索。依次获取Onvif地址、Media地址、Profile文件、Rtsp地址。可对指定的Profile获取视频流Rtsp地址,比如主码流地址、子码流地址。可对每个设备设…

单元测试——题目十二

目录 题目要求: 定义类 测试类 题目要求: 根据下列流程图编写程序实现相应处理,执行j=10*x-y返回文字“j1=:”和计算值,执行j=(x-y)*(10⁵%7)返回文字“j2=:”和计算值,执行j=y*log(x+10)返回文字“j3=:”和计算值。 编写程序代码,使用JUnit框架编写测试类对编写的…

idea中使用带provide修饰的依赖,导致ClassNotFound

1、provide修饰的依赖作用: 编译时起作用,而运行及打包时不起作用。程序打包到Linux上运行时,若Linux上也有这些依赖,为了在Linux上运行时避免依赖冲突,可以使用provide修饰,使依赖不打包进入jar中 2、可能…

Map集合(二)

HashMap HashMap集合的底层原理 HashMap跟HashSet的底层原理是一模一样的,都是基于哈希表实现的。 实际上:原来学的Set集合的底层就是基于Map实现的,只是Set集合中的元素只要键数据,不要值数据而已。 哈希表 哈希表是一种增删…

Python Flask与APScheduler构建简易任务监控

1. Flask Web Flask诞生于2010年,是用Python语言,基于Werkzeug工具箱编写的轻量级、灵活的Web开发框架,非常适合初学者或小型到中型的 Web 项目。 Flask本身相当于一个内核,其他几乎所有的功能都要用到扩展(邮件扩展…

代码随想录算法训练营31期day4,力扣24+19+02.07+142

24,动指针 class Solution { public:ListNode* swapPairs(ListNode* head) {//建立虚拟头结点auto dummynew ListNode(-1);dummy->nexthead;for(auto pdummy;p->next&&p->next->next;){auto ap->next;auto ba->next;p->nextb;a->n…

tee漏洞学习-翻译-1:从任何上下文中获取 TrustZone 内核中的任意代码执行

原文:http://bits-please.blogspot.com/2015/03/getting-arbitrary-code-execution-in.html 目标是什么? 这将是一系列博客文章,详细介绍我发现的一系列漏洞,这些漏洞将使我们能够将任何用户的权限提升到所有用户的最高权限 - 在…

POLYGON Military - Low Poly 3D Art by Synty

这是一个非常全面的资产包,可满足您的所有军事需求。一个绝对庞大的低多边形资产包,用于构建您的梦想游戏! 模块化部分易于以各种组合方式拼接在一起。 此包中包含 1500 多个详细的预制件。 主要特征 - 完全模块化武器系统 - 超级可定制的角色 -沙漠主题建筑和环境 - 建筑物…

day16打卡

day16打卡 104. 二叉树的最大深度 递归法时间复杂度:O(N),空间复杂度:O(N) class Solution { public:int maxDepth(TreeNode* root) {if(root nullptr) return 0;return 1 max(maxDepth(root->left), maxDepth(root->right));} };…

springboot-mybatis项目

一、后端开发环境搭建 1、File->New->Projet 2选择 Spring Initializr ,然后选择默认的 url 点击next 3勾选Spring Web、SQL模板,next 4点击finish,搭建完成 二 数据库 1 新建数据库 2 执行sql建表 SET NAMES utf8mb4; SET FOREIGN…

C语言练习题110例(十)

91.杨辉三角 题目描述: KK知道什么叫杨辉三角之后对杨辉三角产生了浓厚的兴趣,他想知道杨辉三角的前n行,请编程帮他 解答。杨辉三角,本质上是二项式(ab)的n次方展开后各项的系数排成的三角形。其性质包括:每行的端点数为1&…

安利一款抢票软件堪称“业界良心”,全网好评!

马上就到了春运了,有不少网友反映12306买票太难了。 有粉丝在后台留言问有没有抢票软件? 知名公司开发的抢票软件,需要助力、需要用钱买加速包,这对于需要白嫖的朋友来说无疑是“雪上加霜”! 这里从解决实际问题的角度…

[漏洞复现]Redis 沙盒逃逸漏洞(CVE-2022-0543)

一、漏洞情况分析 Redis 存在代码注入漏洞,攻击者可利用该漏洞远程执行代码。 二、漏洞复现 春秋云境.com 进入靶场 开始复现 三、漏洞处置建议 把靶场关了,跟漏洞说“白白吧

星环科技基于第五代英特尔®至强®可扩展处理器的分布式向量数据库解决方案重磅发布

12月15日,2023 英特尔新品发布会暨 AI 技术创新派对上,星环科技基于第五代英特尔至强可扩展处理器的Transwarp Hippo分布式向量数据库解决方案重磅发布。该方案利用第五代英特尔至强可扩展处理器带来的强大算力,实现了约 2 倍的代际性能提升&…

如何在外远程访问家中本地威联通QNAP NAS

文章目录 前言1. 威联通安装cpolar内网穿透2. 内网穿透2.1 创建隧道2.2 测试公网远程访问 3. 配置固定二级子域名3.1 保留二级子域名3.2 配置二级子域名 4. 使用固定二级子域名远程访问 前言 购入威联通NAS后,很多用户对于如何在外在公网环境下的远程访问威联通NAS…

【Python爬虫入门到精通】小白也能看懂的知识要点与学习路线

文章目录 1. 写在前面2. 爬虫行业情况3. 学习路线 【作者主页】:吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作! 【作者推荐】:对JS逆向感兴趣的朋友可以关…

记一次 .NET某工控自动化系统 崩溃分析

一:背景 1. 讲故事 前些天微信上有位朋友找到我,说他的程序偶发崩溃,分析了个把星期也没找到问题,耗费了不少人力物力,让我能不能帮他看一下,给我申请了经费,哈哈,遇到这样的朋友就…