LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

LLMs:OpenAI官方重磅更新——新增GPT-3.5Turbo调和API更新功能

导读:2023年8月22日,OpenAI官方发布,开发者现在可以使用自己的数据定制适用于其用例的GPT-3.5 Turbo模型。GPT-3.5 Turbo的微调现在已经可用,GPT-4的微调将在今年秋季推出。此更新使开发者能够定制模型,以便为其用例提供更好的性能,并在规模上运行这些定制模型。初步测试显示,经过微调的GPT-3.5 Turbo版本在某些狭窄任务上可以与基础GPT-4水平的能力相匹配,甚至表现更好。与我们所有的API一样,发送到微调API的数据由客户拥有,不会被OpenAI或任何其他组织用于训练其他模型。

目录

微调用例

微调步骤

步骤1,准备您的数据

步骤2,上传文件

步骤3,创建微调作业

步骤4,使用经过微调的模型

安全性

定价

更新后的GPT-3模型


博客文章地址:GPT-3.5 Turbo fine-tuning and API updates

微调指南地址:https://platform.openai.com/docs/guides/fine-tuning

微调用例

自GPT-3.5 Turbo发布以来,开发者和企业一直在寻求将模型定制为为其用户创建独特和差异化的体验的能力。通过此发布,开发者现在可以运行监督式微调,以使该模型在其用例中表现更佳。

在我们的私人测试版中,微调客户已经能够在常见用例中显著提高模型性能,例如:
>> 改进的可控性:微调使企业能够更好地遵循指示,例如使输出更简洁或始终以给定语言回复。例如,开发者可以使用微调来确保模型在使用德语提示时始终以德语回复。
>> 可靠的输出格式:微调提高了模型一致格式化响应的能力 - 这对于需要特定响应格式的应用程序(如代码补全或组合API调用)来说是至关重要的。开发者可以使用微调来更可靠地将用户提示转换为可与其自己的系统一起使用的高质量JSON片段。
>> 定制音调:微调是磨练模型输出的定性感觉(如其音调)的好方法,使其更符合企业品牌的声音。具有可辨识品牌声音的企业可以使用微调使模型更符合其音调的一致性。

除了提高性能外,微调还使企业能够在确保类似性能的情况下缩短提示。使用GPT-3.5 Turbo进行微调还可以处理4k个标记 - 是我们先前微调模型的两倍。早期测试者通过将指令微调为模型本身,将提示大小缩小了高达90%,加快了每个API调用的速度并降低了成本。

当与提示工程,信息检索和函数调用等其他技术结合使用时,微调效果最佳。请查看我们的微调指南以了解更多信息。对于使用函数调用和gpt-3.5-turbo-16k进行微调的支持将在今年秋季后期推出。

微调步骤

步骤1,准备您的数据

{"messages": [{ "role": "system", "content": "You are an assistant that occasionally misspells words" },{ "role": "user", "content": "Tell me a story." },{ "role": "assistant", "content": "One day a student went to schoool." }]
}

步骤2,上传文件

curl https://api.openai.com/v1/files \-H "Authorization: Bearer $OPENAI_API_KEY" \-F "purpose=fine-tune" \-F "file=@path_to_your_file" 

步骤3,创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"training_file": "TRAINING_FILE_ID","model": "gpt-3.5-turbo-0613"
}'

一旦模型完成微调过程,它就可以立即在生产中使用,并具有与基础模型相同的共享速率限制。

步骤4,使用经过微调的模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{"model": "ft:gpt-3.5-turbo:org_id","messages": [{"role": "system","content": "You are an assistant that occasionally misspells words"},{"role": "user","content": "Hello! What is fine-tuning?"}]
}'

我们还将在不久的将来推出微调用户界面,开发者可以更轻松地访问有关进行中的微调作业,已完成的模型快照等信息。

安全性

对我们来说,微调的部署非常重要。为了通过微调过程保留默认模型的安全功能,微调训练数据会通过我们的Moderation API和由GPT-4提供支持的调节系统进行传递,以检测与我们的安全标准冲突的不安全训练数据。

定价

微调成本分为两部分:初始培训成本和使用成本:
>> 训练:$0.008 / 1K个标记
>> 使用输入:$0.012 / 1K个标记
>> 使用输出:$0.016 / 1K个标记

例如,对于一个训练文件为100,000个标记的gpt-3.5-turbo微调作业,经过3轮训练,预期成本为$2.40

更新后的GPT-3模型

在7月份,我们宣布原始的GPT-3基础模型(ada,babbage,curie和davinci)将于2024年1月4日关闭。今天,我们将babbage-002和davinci-002作为这些模型的替代品提供,可以作为基础模型或微调模型。客户可以通过查询Completions API来访问这些模型。

这些模型可以使用我们的新API端点/v1/fine_tuning/jobs进行微调。此新端点提供分页和更多的可扩展性,以支持微调API的未来发展。从/v1/fine-tunes转换为更新的端点非常简单,更多详细信息可以在我们的新微调指南中找到。这会停用旧的/v1/fine-tunes端点,将在2024年1月4日关闭。

基础模型和微调GPT-3模型的定价如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/63924.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统架构设计师考试论文:论NoSQL 数据库技术在现代软件项目中的应用与效果

随着互联网 web2.0 网站的兴起,传统关系数据库在应对 web2.0 网站,特别是超大规模和高并发的 web2.0 纯动态 SNS 网站上已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。N…

Self-supervised 3D Human Pose Estimation from a Single Image

基于单幅图像的自监督三维人体姿态估计 主页: https://josesosajs.github.io/ imagepose/ 源码:未开源 摘要 我们提出了一种新的自我监督的方法预测三维人体姿势从一个单一的图像。预测网络是从描绘处于典型姿势的人的未标记图像的数据集和一组未配对…

【K8S系列】深入解析k8s网络插件—Cilium

序言 做一件事并不难,难的是在于坚持。坚持一下也不难,难的是坚持到底。 文章标记颜色说明: 黄色:重要标题红色:用来标记结论绿色:用来标记论点蓝色:用来标记论点 在现代容器化应用程序的世界中…

简易虚拟培训系统-UI控件的应用2

目录 Text组件-文字显示 Text组件-文字动态显示 ScrollView组件 使用文件流动态读取硬盘文件 本篇介绍Text和ScrollView的简单应用,以及读取硬盘中.txt文本的内容 Text组件-文字显示 1. 加入Text:在mainCanvas上点右键->UI->选择Text和TextMe…

蓝桥杯 2240. 买钢笔和铅笔的方案数c++解法

最近才回学校。在家学习的计划不翼而飞。但是回到学校了,还是没有找回状态。 现在是大三了,之前和同学聊天,说才大三无论是干什么,考研,找工作,考公,考证书 还都是来的及的。 但是心里面…

C++学习6

C学习6 基础知识std::thread 实战boost domain socket server 基础知识 std::thread std::thread是C11标准库中的一个类&#xff0c;用于创建并发执行的线程。它的详细用法如下&#xff1a; 头文件 #include <thread>创建线程 std::thread t(func, args...);其中&am…

linux C编程 获取系统时间

1.clock_gettime #include<time.h> int clock_gettime(clockid_t clk_id,struct timespec *tp); struct timespec {time_t tv_sec; /* 秒*/long tv_nsec; /* 纳秒*/ }clk_id : CLOCK_BOOTTIME&#xff0c;以系统启动时间为时间原点的时间体系&#xff0c;不受其它因素的…

云计算在大数据分析中的应用与优势

文章目录 云计算在大数据分析中的应用云计算在大数据分析中的优势云计算在大数据分析中的示例未来发展和拓展结论 &#x1f389;欢迎来到AIGC人工智能专栏~云计算在大数据分析中的应用与优势 ☆* o(≧▽≦)o *☆嗨~我是IT陈寒&#x1f379;✨博客主页&#xff1a;IT陈寒的博客&…

JAVA - PO DTO 生成器

PO DTO 生成器 假设你是一个Java 高级程序员&#xff0c;我会提供一些信息&#xff0c;你需要帮我自动生成Java的PO、DTO 对象。 这些信息有着固定的形式&#xff0c;第一行是对象的类名&#xff0c;其后的每一行都是该对象的属性(简称“属性”)。 对于我属性&#xff0c;格式…

mysql的binlog參數詳解

mysql的binlog參數詳解 1. expire_logs_days expire_logs_days&#xff1a;這個參數用於設置binlog日誌文件的過期時間。默認情況下&#xff0c;binlog文件永不過期。如果將其設置為一個正整數值&#xff0c;則表示binlog文件在指定天數後會被自動刪除。 max_binlog_size m…

设计模式-6--装饰者模式(Decorator Pattern)

一、什么是装饰者模式&#xff08;Decorator Pattern&#xff09; 装饰者模式&#xff08;Decorator Pattern&#xff09;是一种结构型设计模式&#xff0c;它允许你在不修改现有对象的情况下&#xff0c;动态地将新功能附加到对象上。这种模式通过创建一个包装类&#xff0c;…

系统部署到不同云的比较与选择(SaaS平台、公有云、私有云、混合云)

选择正确的云部署策略对于企业的成功至关重要。关于系统部署到SaaS平台、公有云、私有云以及混合云的各种理由。通过详细分析各种策略的优势和劣势&#xff0c;帮助企业在复杂的决策中作出明智的选择。无论是追求成本效益、灵活性、安全性还是多样化&#xff0c;为企业提供全面…

网络端口安全问题解析:常见端口、安全隐患及推荐工具

导语&#xff1a; 网络安全是当今信息社会中至关重要的一个问题。随着互联网的普及和应用的广泛&#xff0c;各种网络服务也相继出现。然而&#xff0c;这些网络服务往往存在着各种潜在的安全隐患&#xff0c;如果不加以妥善管理和保护&#xff0c;就会给企业和个人带来极大的风…

Unity编辑器扩展 | 编辑器扩展基础入门

前言 Unity编辑器扩展 | 编辑器扩展基础一、基本概念二、核心知识点 简述三、相关API 总结 前言 当谈到游戏开发工具&#xff0c;Unity编辑器是一个备受赞誉的平台。它为开发者提供了一个强大且灵活的环境&#xff0c;使他们能够创建令人惊叹的游戏和交互式体验。然而&#xf…

MusicBrainz Picard for Mac :音乐文件ID3编辑器

MusicBrainz Picard for Mac是一款macOS平台的音乐文件ID3编辑器&#xff0c;能够帮助我们在Mac电脑上编辑音乐文件的ID3标签信息&#xff0c;包括艺人、专辑等信息&#xff0c;非常快速和简单方便。Picard是下一代MusicBrainz标记应用程序。 这个新的标签概念是面向专辑的&…

会计--出纳实操实务小白入门

文章目录 P1、出纳基础一、出纳与会计区别二、出纳的具体工作三、出纳的工作流程&#xff08;日、月、年工作安排&#xff09; P2、出纳技能1&#xff1a;大小写金额以及日期书写规范一、数字书写要求二、小写金额“封头”与“封尾”三、大写金额“封头”与“封尾”四、日期大写…

kafka配置SASL/PLAIN 安全认证

1 zookeeper配置启动 1.1 zookeeper添加SASL支持 为zookeeper添加SASL支持&#xff0c;在配置文件zoo.cfg添加 authProvider.1org.apache.zookeeper.server.auth.SASLAuthenticationProvider requireClientAuthSchemesasl jaasLoginRenew36000001.2 zk_server_jaas.conf文件…

微信小程序活动报名管理系统设计与实现

摘 要 随着当下的移动互联网技术的不断发展壮大&#xff0c;现在人们对于手机的应用已经非常的成熟&#xff0c;当下的时代基本上达到了人手一部手机&#xff0c;数字化、信息化已经成为了人们的主流生活。有数据统计&#xff0c;截止到2020年末我国的手机网民人数已经接近10亿…

sql:SQL优化知识点记录(五)

&#xff08;1&#xff09;explain之例子 &#xff08;2&#xff09;索引单表优化案例 上面的功能已经实现&#xff0c;但是分析功能&#xff0c; 使用explain分析这条sql&#xff1a; 发现type为All Extra&#xff1a;有Using filesort &#xff08;文件内排序&#xff09; 这…

stable diffusion实践操作-宽高设置以及高清修复

系列文章目录 stable diffusion实践操作 文章目录 系列文章目录前言一、SD宽高怎么设置&#xff1f;1.1 宽高历史 二、高清修复总结 前言 主要介绍SD的宽高设置以及高清修复 一、SD宽高怎么设置&#xff1f; 1.1 宽高历史 SD生成256256图片效果最好。512512是SD一直使用的画…