模型蒸馏（ChatGPT文档）

模型蒸馏（ChatGPT文档）

diannao/2025/2/4 10:05:44/文章来源:https://blog.csdn.net/qq273766764/article/details/145431732

文章来源： https://chatgpt.cadn.net.cn/docs/guides_distillation

模型蒸馏

使用蒸馏技术改进较小的模型。

模型蒸馏允许您利用大型模型的输出来微调较小的模型，使其能够在特定任务上实现类似的性能。此过程可以显著降低成本和延迟，因为较小的模型通常效率更高。

以下是它的工作原理：

使用聊天补全 API 中的 store 参数存储大型模型的高质量输出以存储它们。
使用大型和小型模型评估存储的完成项，以建立基线。
选择要用于蒸馏的 stored completions，并使用它们来微调较小的模型。
评估微调模型的性能，以查看它与大型模型的比较情况。

让我们通过这些步骤来了解它是如何完成的。

存储大型模型的高质量输出

蒸馏过程的第一步是使用像 OR 符合您的标准的大型模型产生良好的结果。生成这些结果时，您可以使用 Chat Completions API 中的选项存储它们。我们还建议您使用 metadata 属性来标记这些完成，以便以后轻松筛选。o1-previewgpt-4ostore: true

然后，可以在 dashboard 中查看和筛选这些存储的完成。

存储大型模型的高质量输出

JavaScript （英语）

import OpenAI from "openai";
const openai = new OpenAI();const response = await openai.chat.completions.create({model: "gpt-4o",messages: [{ role: "system", content: "You are a corporate IT support expert." },{ role: "user", content: "How can I hide the dock on my Mac?"},],store: true,metadata: {role: "manager",department: "accounting",source: "homepage"}
});console.log(response.choices[0]);

使用该选项时，完成将存储 30 天。您的完成项可能包含敏感信息，因此，您可能需要考虑创建一个具有有限访问权限的新项目来存储这些完成项。store: true

评估以建立基线

您可以使用存储的完成来评估较大模型和较小模型在任务中的性能，以建立基线。这可以使用 evals 产品来完成。

通常，大型模型在评估中的表现会优于小型模型。建立此基线可以让您衡量通过蒸馏/微调过程获得的改进。

创建训练数据集以微调较小的模型

接下来，您可以选择存储的补全子集作为训练数据，以微调较小的模型，例如 .将存储的补全过滤到你想用来训练小模型的补全，然后点击 “Distill” 按钮。几百个样本可能就足够了，但有时数千个样本的更多样化范围可以产生更好的结果。gpt-4o-mini

distill results

此操作将打开一个对话框以开始微调作业，并将您选择的完成项作为训练数据集。根据需要配置参数，选择要微调的基本模型。在此示例中，我们将选择 GPT-4o-mini 的最新快照。

fine tune job

配置完成后，点击 “Run” 开始微调作业。该过程可能需要 15 分钟或更长时间，具体取决于训练数据集的大小。

评估微调的小模型

微调工作完成后，您可以对其运行 evals 以查看它与基本小型和大型模型的叠加情况。您可以在 Evals 产品中选择微调模型，以使用微调的小模型生成新的完成。

eval using ft model

或者，您还可以存储微调模型生成的新聊天补全，并使用它们来评估性能。通过不断调整和改进：

训练数据的多样性
大型模型的提示和输出
评估分级机的准确性

对于特定的任务子集，您可以将较小模型的性能提升到与大型模型相同的级别。

文章来源：模型蒸馏 -- ChatGPT中文版|ChatGPT开发文档|ChatGPT教程|ChatGPT官方文档

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/68912.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

deepseek本地部署+结合思路

deepseek本地部署+结合思路

deepseek本地部署配置： 建议配置运行内存16GB 显卡：4060 操作系统：win11/win10 存储：512GB 一、安装Python 3.11环境（参见） 超详细的Python安装和环境搭建教程_python安装教程-CSDN博客二、安装…

阅读更多...

加载数据，并切分

加载数据，并切分

# Step 3 . WebBaseLoader 配置为专门从 Lilian Weng 的博客文章中抓取和加载内容。它仅针对网页的相关部分（例如帖子内容、标题和标头）进行处理。加载信息 from langchain_community.document_loaders import WebBaseLoader loader WebBaseLoader(w…

阅读更多...

解锁豆瓣高清海报(二) 使用 OpenCV 拼接和压缩

解锁豆瓣高清海报(二) 使用 OpenCV 拼接和压缩

解锁豆瓣高清海报(二): 使用 OpenCV 拼接和压缩脚本地址: 项目地址: Gazer PixelWeaver.py pixel_squeezer_cv2.py 前瞻继上一篇“解锁豆瓣高清海报(一) 深度爬虫与requests进阶之路”成功爬取豆瓣电影海报之后，本文将介绍如何使用 OpenCV 对这些海报进行智…

阅读更多...

OSCP - Proving Grounds - Roquefort

OSCP - Proving Grounds - Roquefort

主要知识点 githook 注入Linux path覆盖具体步骤依旧是nmap扫描开始，3000端口不是很熟悉，先看一下 Nmap scan report for 192.168.54.67 Host is up (0.00083s latency). Not shown: 65530 filtered tcp ports (no-response) PORT STATE SERV…

阅读更多...

最新功能发布！AllData数据中台核心菜单汇总

最新功能发布！AllData数据中台核心菜单汇总

🔥🔥 AllData大数据产品是可定义数据中台，以数据平台为底座，以数据中台为桥梁，以机器学习平台为中层框架，以大模型应用为上游产品，提供全链路数字化解决方案。 ✨奥零数据科技官网：http://www.aolingdata.com ✨AllData开源项目：https://github.com/alldatacenter/…

阅读更多...

TensorFlow 简单的二分类神经网络的训练和应用流程

TensorFlow 简单的二分类神经网络的训练和应用流程

展示了一个简单的二分类神经网络的训练和应用流程。主要步骤包括： 1. 数据准备与预处理 2. 构建模型 3. 编译模型 4. 训练模型 5. 评估模型 6. 模型应用与部署加载和应用已训练的模型 1. 数据准备与预处理在本例中，数据准备是通过两个 Numpy 数…

阅读更多...

无人机PX4飞控 | PX4源码添加自定义uORB消息并保存到日志

无人机PX4飞控 | PX4源码添加自定义uORB消息并保存到日志

PX4源码添加自定义uORB消息并保存到日志 0 前言 PX4的内部通信机制主要依赖于uORB（Micro Object Request Broker），这是一种跨进程的通信机制，一种轻量级的中间件，用于在PX4飞控系统的各个模块之间进行高效的数据交换…

阅读更多...

XCCL、NCCL、HCCL通信库

XCCL、NCCL、HCCL通信库

XCCL提供的基本能力 XCCL提供的基本能力不同的XCCL 针对不同的网络拓扑，实现的是不同的优化算法的（不同CCL库最大的区别就是这） 不同CCL库还会根据自己的硬件、系统，在底层上面对一些相对应的改动； 但是对上的API接口…

阅读更多...

Docker快速部署高效照片管理系统LibrePhotos搭建私有云相册

Docker快速部署高效照片管理系统LibrePhotos搭建私有云相册

文章目录前言1.关于LibrePhotos2.本地部署LibrePhotos3.LibrePhotos简单使用4. 安装内网穿透5.配置LibrePhotos公网地址6. 配置固定公网地址前言想象一下这样的场景：你有一大堆珍贵的回忆照片，但又不想使用各种网盘来管理。怎么办？别担心…

阅读更多...

【Java计算机毕业设计】基于Springboot的物业信息管理系统【源代码+数据库+LW文档+开题报告+答辩稿+部署教程+代码讲解】

【Java计算机毕业设计】基于Springboot的物业信息管理系统【源代码+数据库+LW文档+开题报告+答辩稿+部署教程+代码讲解】

源代码数据库LW文档（1万字以上）开题报告答辩稿部署教程代码讲解代码时间修改教程一、开发工具、运行环境、开发技术开发工具 1、操作系统：Window操作系统 2、开发工具：IntelliJ IDEA或者Eclipse 3、数据库存储&#xff1a…

阅读更多...

深入解析Python机器学习库Scikit-Learn的应用实例

深入解析Python机器学习库Scikit-Learn的应用实例

深入解析Python机器学习库Scikit-Learn的应用实例随着人工智能和数据科学领域的迅速发展，机器学习成为了当下最炙手可热的技术之一。而在机器学习领域，Python作为一种功能强大且易于上手的编程语言，拥有庞大的生态系统和丰富的机器学习库。其…

阅读更多...

高斯光束介绍及光斑处理

高斯光束介绍及光斑处理

常规激光器的光斑为高斯光斑，即中心能量集中，边缘能量较低。一般定义光强的处为高斯光束的半径。高斯光斑的传输由光斑半径、远场发散角、波长等决定。其中为位置z处的光斑半径，w(z), k2pi/λ为波矢，λ为光波长，R为高…

阅读更多...

C++哈希（链地址法）（二）详解

C++哈希（链地址法）（二）详解

文章目录 1.开放地址法1.1key不能取模的问题1.1.1将字符串转为整型1.1.2将日期类转为整型 2.哈希函数2.1乘法散列法（了解）2.2全域散列法（了解） 3.处理哈希冲突3.1线性探测（挨着找）3.2二次探测（跳…

阅读更多...

【Redis】List 类型的介绍和常用命令

【Redis】List 类型的介绍和常用命令

1. 介绍 Redis 中的 list 相当于顺序表，并且内部更接近于“双端队列”，所以也支持头插和尾插的操作，可以当做队列或者栈来使用，同时也存在下标的概念，不过和 Java 中的下标不同，Redis 支持负数下标&#x…

阅读更多...

携程Java开发面试题及参考答案（200道-上）

携程Java开发面试题及参考答案（200道-上）

说说四层模型、七层模型。七层模型（OSI 参考模型）七层模型，即 OSI（Open System Interconnection）参考模型，是一种概念模型，用于描述网络通信的架构。它将计算机网络从下到上分为七层，各层的功能和作用如下：物理层：物理层是计算机网络的最底层，主要负责传输比特流…

阅读更多...

IM 即时通讯系统-51-MPush开源实时消息推送系统

IM 即时通讯系统-51-MPush开源实时消息推送系统

IM 开源系列 IM 即时通讯系统-41-开源野火IM 专注于即时通讯实时音视频技术，提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…

阅读更多...

AlexNet论文代码阅读

AlexNet论文代码阅读

论文标题： ImageNet Classification with Deep Convolutional Neural Networks 论文链接： https://volctracer.com/w/BX18q92F 代码链接： https://github.com/dansuh17/alexnet-pytorch 内容概述训练了一个大型的深度卷积神经网络&#xf…

阅读更多...

扩散模型（三）

扩散模型（三）

相关阅读： 扩散模型（一） 扩散模型（二） Latent Variable Space 潜在扩散模型（LDM；龙巴赫、布拉特曼等人，2022 年）在潜在空间而非像素空间中运行扩散过程，这…

阅读更多...

git基础使用--4---git分支和使用

git基础使用--4---git分支和使用

文章目录 git基础使用--4---git分支和使用1. 按顺序看2. 什么是分支3. 分支的基本操作4. 分支的基本操作4.1 查看分支4.2 创建分支4.3 切换分支4.4 合并冲突 git基础使用–4—git分支和使用 1. 按顺序看 -git基础使用–1–版本控制的基本概念 -git基础使用–2–gti的基本概念…

阅读更多...

8.攻防世界Web_php_wrong_nginx_config

8.攻防世界Web_php_wrong_nginx_config

进入题目页面如下尝试弱口令密码登录一直显示网站建设中，尝试无果，查看源码也没有什么特别漏洞存在用Kali中的dirsearch扫描根目录试试命令： dirsearch -u http://61.147.171.105:53736/ -e* 登录文件便是刚才登录的界面打开robots.txt…

阅读更多...

推荐文章

最新文章