OPENAI开放微调功能

2023年8月23日,OpenAI宣布推出基于GPT-3.5 Turbo的微调功能并更新API,让企业、开发人员能够使用自身数据定制ChatGPT。

微调(Fine-tuning)是一种利用已有通用语言模型(如GPT-3.5)来训练一个特定模型的方法。通用语言模型虽然具有很强的语言理解和生成能力,但是它们并不针对特定的领域或任务。通过在自己数据上对通用模型进行微调优化,训练一个专属模型,可以更好地适应特定的使用场景。在保留通用语言模型强大能力的同时,进一步提高模型的准确度等效果和效率。

这就相当于在一个已经建好的房子上进行装修,使其更符合自己的需求和喜好,而不是从头开始建造一个新房子。因此,可以节省大量时间和资源,也可以避免一些技术难题。

OpenAI此次推出的微调功能,使更多开发者能参与到GPT模型应用当中,并借此实现更多个性化和创新的应用场景,提高用户体验和粘性,这对开发者生态的建立也起到了积极的助推作用。同时也极大拓展了通用模型的应用范围和潜力,加快了各行各业部署AI技术的步伐。

对于此次公告中提到的GPT-3.5 Turbo微调的安全性、使用效果、价格、未来更新、部署步骤等方面,重点说明如下。

安全性:从微调API发送的数据归客户所有,OpenAI或任何其他组织不会使用数据来训练模型。同时,为了保障模型部署的安全,OpenAI通过审核API和GPT-4驱动的审核系统,检测与安全标准冲突的有害数据。(微调有利于为用户提供更具个性化的服务,但也降低了技术门槛,可能导致不负责任的使用)

微调效果:在实际测试过程中,GPT-3.5 Turbo的微调版本在某些任务上,与基本型号的GPT-4能力相当甚至要更好。微调客户能够提高常见用例的模型性能,并缩短提示时间。通过对模型本身的指令进行微调,还可加快API调用并降低成本,提示词数量减少了90%。

价格和Token:GPT-3.5 Turbo的微调成本分为初始训练成本和使用成本两部分。一个包含100K tokens训练文件的微调工作,预计成本为2.4美元。具体来说,训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。可处理的上下文为4K tokens,是之前微调模型的两倍。

微调步骤:只需经过准备数据、上传文件、创建微调作业、使用微调模型四步。一旦模型完成微调过程,就可以立即在生产中使用。

未来更新:GPT-4 的微调将于今年秋天推出,而在秋季晚些时候会推出对GPT-3.5函数调用和16k上下文的微调支持。不久的将来还会推出微调UI,可更容易访问正在进行的微调作业等有关信息。

GPT-3迭代:OpenAI现在正在提供babbage-002和davinci-002型号作为GPT-3基础模型或微调模型。最初的GPT-3基础型号(ada、babbage、curie、davinci)将于2024年1月4日关闭。

总结来说,通过开放先进大模型的微调功能,OpenAI能吸引更多企业和开发者使用其平台和模型,从而扩大影响力和增加营收缓解亏损压力。这有助于AI产品得到更广泛应用,推动大模型加速落地。

同时,此次功能更新,也可看作是对Meta开源模型并允许商用等外部竞争的一个应对举措。通过允许微调模型,OpenAI可以进一步扩大和巩固用户基础,确保自身在行业的引领地位。这或许也会促使其他企业加快商业化步伐,行业竞争进一步加剧。

以下为OpenAI公告全文:

GPT-3.5 Turbo 的微调现已推出,GPT-4 的微调将于今年秋天推出。此更新使开发人员能够自定义更适合其用例的模型,并大规模运行这些自定义模型。早期的测试表明,GPT-3.5 Turbo的微调版本可以在某些垂直的任务上与基础的GPT-4功能相当,甚至要更好。与我们所有的API一样,从微调API发送的数据归客户所有,并且未被 OpenAI 使用或任何其他组织来训练其他模型。

微调用例

自 GPT-3.5 Turbo 发布以来,开发人员和企业要求能够自定义模型,以便为其用户创造独特且差异化的体验。通过此次发布,开发人员现在可以运行监督微调,以使该模型在其用例中表现更好。

在我们的私人测试版中,微调客户已经能够有效地提高常见用例的模型性能,举例来说:

改进的可操纵性:微调允许企业使模型更好地遵循指令,例如使输出简洁或始终以给定语言响应。例如,开发人员可以使用微调来确保模型始终按要求以德语响应。

可靠的输出格式:微调可提高模型一致格式化响应的能力,这对于需要特定响应格式(例如代码完成或撰写 API 调用)的应用程序来说至关重要。开发人员可以使用微调来更可靠地将用户提示转换为可与自己的系统一起使用的高质量 JSON 代码段。

自定义风格:微调是磨练模型输出定性感觉的好方法,具有可识别品牌风格的企业可以使用微调来使模型与其基调更加一致。

除了提高性能外,微调还使企业能够缩短提示时间,同时确保类似的性能。使用 GPT-3.5-Turbo 进行微调也可以处理 4K tokens——是我们之前微调模型的两倍。早期的测试人员通过将指令微调到模型本身,加快了每次 API 调用并降低成本,将提示大小减少了多达 90%。

当与其他技术如提示工程、信息检索和函数调用相结合时,微调的效果是最强大的。对这方面若想了解更多可查看我们的微调指南。另外,对函数调用和GPT-3.5-turbo-16k的微调支持将在今年秋季晚些时候进行。

微调步骤

我们还将在不久的将来推出微调 UI,这将使开发人员更容易访问正在进行的微调作业、已完成的模型快照等有关信息。

安全

对我们来说,安全地部署微调是非常重要的。为了在微调过程中保留默认模型的安全功能,微调训练数据将通过我们的审核API和GPT-4支持的审核系统,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两类:初始训练成本和使用成本。训练:$0.008 / 1K tokens;使用输入:$0.012 / 1K tokens;使用输出:$0.016 / 1K tokens。例如,用100,000个tokens进行微调工作,预计成本为2.40美元。

更新的 GPT-3 型号

今年7月,我们宣布原始 GPT-3 基本型号将于2024年1月4日关闭。今天,我们正在制造这些模型的替代品,无论是作为基本模型还是微调模型。这些模型可以使用我们新的 API 端点进行微调。基本和微调的 GPT-3 型号的定价如下:

新的端点提供了分页和更多的可扩展性,以支持微调 API 的未来发展,过渡到更新的端点也非常简单,更多详细信息可参见我们的微调指南。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/52727.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【freeDiameter】服务端和客户端的连接流程

连接流程详解 进程启动时,先使用main_cmdline解析命令行参数,比如使用-c就会使用指定路径的配置文件,使用-d就会启用后台进程。 之后使用fd_core_initialize初始化核心库。具体会先使用fd_conf_init初始化配置,比如设置各项的默…

最长的一帧学习 part3

文章目录 八、osgUtil:: SceneView::cull ()part1 初始化必要的SceneView类成员变量part2 立体显示的处理part3 执行SceneView::cullStage函数,它也是场景视图筛选工作的核心函数part3.1 首先统计场景中的遮挡节点(OccluderNode),…

缺失ffmpeg.dll要用什么修复方法?快速恢复丢失的ffmpeg.dll文件

多媒体软件用户常常会遭遇一个提示:系统无法找到ffmpeg.dll文件。这类情况经常在启动视频编辑软件、流媒体播放应用或其他音视频处理工具时出现,导致相关程序无法正确加载和执行。ffmpeg.dll是一种关键的动态链接库文件,负责处理复杂的视频和…

ssrf+redis未授权访问漏洞复现

ssrfredis未授权访问漏洞复现 一,pikachu靶场练习 docker拉取环境: docker run -d -p 8765:80 8023/pikachu-expect:latest国内很多加速源都用不成,配置代理拉取即可,配置方式如下: 1,新建目录 mkdir -…

Spring Boot如何解决跨域问题?

1.什么是跨域? 跨域请求,就是说浏览器在执行脚本文件的ajax请求时,脚本文件所在的服务地址和请求的服务地址不一样。说白了就是ip、网络协议、端口都一样的时候,就是同一个域,否则就是跨域。这是由于Netscape提出一个…

数据结构与算法的代码实现(C++版)

数据结构与算法的代码实现(C版) 1. 线性表的顺序表示和实现1.1 线性表的初始化1.2 线性表的销毁1.3 线性表的清空1.4 线性表的长度1.5 判断线性表是否为空1.6 线性表的线性表取值1.7 线性表的顺序查找1.8 线性表的插入1.9 线性表的删除总结 2. 线性表的链…

JavaScript ES6+ 新特性

JavaScript ES6 新特性 引言 随着前端技术的不断发展,JavaScript 语言也在不断演进。自 ES6(ES2015)发布以来,JavaScript 引入了许多新的特性和语法,极大地提升了开发者的编程体验和代码的可维护性。本篇文章将详细探…

真话有危险,测评需谨慎!一个家最大的内耗:谁都在抱怨,没人肯改变——早读(逆天打工人爬取热门微信文章解读)

现在都这么完了吗? 引言Python 代码第一篇 洞见 一个家最大的内耗:谁都在抱怨,没人肯改变第二篇 故事风云录结尾 引言 慢慢调整时间 一是现在有点忙 做那个传播声音的研究实验实在是有点没有头绪 没有头绪的事情你就不知道怎么安排时间 也就…

3144. 分割字符频率相等的最少子字符串(24.8.28)

题目 题目: 给你一个字符串 s ,你需要将它分割成一个或者更多的平衡子字符串。 比方说,s "ababcc" 那么 ("abab","c","c") ,("ab","abc","c") 和 (&quo…

数学建模比赛(国赛)水奖攻略

之前很多同学私聊问我,学校要求参加数模比赛,但是不擅长建模编程,但又不想浪费这个时间该怎么办呢,今天就来给大家讲一下大家都非常感兴趣的内容——数学建模水奖攻略。分享一下博主直接参加比赛时候的经验。 一、选题技巧 有一句…

HarmonyOs如何获取rawfile目录下的所有文件列表

最近在做一个功能,需要使用获取rawfile下目录的所有文件 参考连接为: zRawfile-模块-C API-Localization Kit(本地化开发服务)-应用框架 - 华为HarmonyOS开发者 (huawei.com) 需要使用到native实现,实现步骤&#…

2008-2020年 中国健康与养老追踪调查CHARLS数据合集

中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS)是一项由北京大学国家发展研究院主持的大型跨学科调查项目。该项目始于2011年,每两到三年对样本进行一次追踪调查,旨在收集代表中国45岁及以上中…

在CentOS 7上安装MongoDB的方法

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 简介 MongoDB 是一个免费、开源的面向文档的数据库。它被归类为 NoSQL 数据库,因为它不依赖于传统的基于表的关系数据库结构…

C++_CH13_面向对象编程

C_CH13_面向对象编程 1.1 类 类&#xff08;class&#xff09;是数据和操作的组合。 我们以游戏角色为例&#xff0c;创建一个类 #include<iostream>class player//player这个类是我们自定义的一个类型 {int x;int y;//二维坐标int speed;//速度int power;//力量};int…

重载与重写:Java中方法的多态性

重载与重写&#xff1a;Java中方法的多态性 引言 在Java编程语言中&#xff0c;多态性是一个核心概念&#xff0c;它允许我们以统一的方式处理不同类型的对象。Java提供了两种实现多态性的方法&#xff1a;重载&#xff08;Overloading&#xff09;和重写&#xff08;Overrid…

面试经典算法150题系列-反转字符串中的单词

反转字符串中的单词 给你一个字符串 s &#xff0c;请你反转字符串中 单词 的顺序。 单词 是由非空格字符组成的字符串。s 中使用至少一个空格将字符串中的 单词 分隔开。 返回 单词 顺序颠倒且 单词 之间用单个空格连接的结果字符串。 注意&#xff1a;输入字符串 s中可能…

react 中的useState useEffect

下面的这些hook我们常用的一些 useState useEffect useCallback、useMemo、useRef 和 useContex 下一个文章中讲述&#xff08;useCallback、useMemo、useRef 和 useContex&#xff09; 下面我将讲解什么时候使用是最好的 首先我们需要明确的一点是&#xff0c;这些hook都…

转-600条最强linux命令

一、基本命令 uname -m 显示机器的处理器架构 uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作系统信息 arch 显示机器的处理器架构 uname -…

关于告警,要想做好,从这些方面着手

各类监控系统都会产生告警事件&#xff0c;于是&#xff0c;就产生了 FlashDuty、PagerDuty、Opsgenie 这类产品&#xff0c;做告警事件的收敛降噪、排班认领升级等。如果你想增强自己公司的告警事件处理能力&#xff0c;参考&#xff08;chao xi&#xff09;这些产品的功能就可…

使用统计方法在AMD GPU上使用JAX Profiler可靠地比较大型生成AI模型中的算法性能

Using statistical methods to reliably compare algorithm performance in large generative AI models with JAX Profiler on AMD GPUs — ROCm Blogs 摘要 本文提供了一份详细的指南&#xff0c;介绍如何在JAX实现的生成AI模型中测量和比较各种算法的性能。利用JAX Profiler…