ChatGLM3微调遇到的坑

ChatGLM3微调遇到的坑

news/2025/11/3 13:50:18/文章来源:https://blog.csdn.net/chaishen10000/article/details/136073225

问题：微调的各种问题 · THUDM/ChatGLM3 · Discussion #253 · GitHubshi

Traceback (most recent call last):File "/opt/projects/chatglm3-test/scripts/finetune.py", line 171, in <module>main()File "/opt/projects/chatglm3-test/scripts/finetune.py", line 137, in mainprint(train_dataset[0]['input_ids'])File "/opt/projects/chatglm3-test/scripts/preprocess_utils.py", line 127, in __getitem__a_ids = self.tokenizer.encode(text=data_item['prompt'], add_special_tokens=True, truncation=True,
KeyError: 'prompt'

实际上看看preprocess_utils.py对应行数的代码就知道了，单纯的对话模型，数据格式不是按照官方给定的如下格式：

```json
[
{
"conversations": [
{
"role": "system",
"content": "<system prompt text>"
},
{
"role": "user",
"content": "<user prompt text>"
},
{
"role": "assistant",
"content": "<assistant response text>"
},
// ... Muti Turn
{
"role": "user",
"content": "<user prompt text>"
},
{
"role": "assistant",
"content": "<assistant response text>"
}
]
}
// ...
]
```

“prompt”键名并不存在，最新的官方微调脚本已于，改天尝试一下。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/673110.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

C++判断回文字符串的两种方法

C++判断回文字符串的两种方法

解法1：遍历一半字符串若字符串个数为奇数遍历到n/2 若为偶数则遍历到n/2-1中间最后只剩一个字符不需判断 （int是向下取整的） 假设字符串长度为len，字符下标从0~len-1 先看第0个和第len-1字符是否相同， 在看第1和第…

阅读更多...

20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理

20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理

20240203在WIN10下使用GTX1080配置stable-diffusion-webui.git不支持float16精度出错的处理 2024/2/3 21:23 缘起：最近学习stable-diffusion-webui.git，在Ubuntu20.04.6下配置SD成功。不搞精简版本：Miniconda了。直接上Anacoda！ …

阅读更多...

IT行业针对大数据的安全文件传输的重要性

IT行业针对大数据的安全文件传输的重要性

在数字化浪潮的推动下，数据已成为现代社会的宝贵资源。特别是大数据，以其海量、多样化、高速增长和低价值密度的特性，对信息技术（IT）行业产生了深远影响。大数据的应用不仅推动了云计算、物联网和人工智能等领域的发展…

阅读更多...

【Docker】Docker Image(镜像)

【Docker】Docker Image(镜像)

文章目录一、Docker镜像是什么？二、镜像生活案例三、为什么需要镜像四、镜像命令详解docker rmidocker savedocker loaddocker historydocker image prune 五、镜像操作案例六、镜像综合实战实战一、离线迁移镜像实战二、镜像存储的压缩与共享一、Docker镜像是什么…

阅读更多...

【SQL高频基础题】619.只出现一次的最大数字

【SQL高频基础题】619.只出现一次的最大数字

题目： MyNumbers 表： ------------------- | Column Name | Type | ------------------- | num | int | ------------------- 该表可能包含重复项（换句话说，在SQL中，该表没有主键）。这张表的每…

阅读更多...

面试官都爱看的作品集，你做对了吗？

面试官都爱看的作品集，你做对了吗？

经常有朋友在群里问作品集的相关问题:设计师不知道从哪里开始作品集，觉得自己拿不到作品，作品集没有亮点，真的不知道怎么改进，作品集投递后没有回应，很受打击。针对这些问题，我们将向您展示如何调整和改进…

阅读更多...

正点原子--STM32基本定时器学习笔记(2)

正点原子--STM32基本定时器学习笔记(2)

目录 1. 相关寄存器介绍 1.1 控制寄存器 1(TIMx_CR1)编辑 1.2 DMA/中断使能寄存器(TIMx_DIER) 1.3 状态寄存器(TIMx_SR) 1.4 计数器(TIMx_CNT) 1.5 预分频器(TIMx_PSC) 1.6 自动重装载寄存器(TIMx_ARR) 2. 工程建立 3. 导入tim.c文件 4. 相关HAL库函数介绍 4.1 H…

阅读更多...

[linux]-总线，设备，驱动，dts

[linux]-总线，设备，驱动，dts

1. 总线BUS 在物理层面上，代表不同的工作时序和电平特性： 总线代表着同类设备需要共同遵守的工作时序，不同的总线对于物理电平的要求是不一样的，对于每个比特的电平维持宽度也是不一样，而总线上传递的命令也会有自己…

阅读更多...

动态扩缩容下的全局流水号设计

动态扩缩容下的全局流水号设计

关于全局流水号，业内用的比较多的就是雪花算法，一直没理解在动态扩缩容下其中的workId和 datacenterId如何设置，查到了几个方法：reidis中取，待后期实践下。先简单的介绍一下雪花算法，雪花算法生成的Id由…

阅读更多...

计算结构化数据集范围内给定位置的单元格 ID

计算结构化数据集范围内给定位置的单元格 ID

开发环境： Windows 11 家庭中文版Microsoft Visual Studio Community 2019VTK-9.3.0.rc0vtk-example demo解决问题：计算结构化数据集范围内给定位置的单元格 ID 关键点： vtkImageData对象，表示一个三维的像素网格。grid->Set…

阅读更多...

零代码3D可视化快速开发平台

零代码3D可视化快速开发平台

老子云平台老子云3D可视化快速开发平台，集云压缩、云烘焙、云存储云展示于一体，使3D模型资源自动输出至移动端PC端、Web端，能在多设备、全平台进行展示和交互，是全球领先、自主可控的自动化3D云引擎。此技术已经在全球申请了专利…

阅读更多...

6.0 Zookeeper session 基本原理详解教程

6.0 Zookeeper session 基本原理详解教程

客户端与服务端之间的连接是基于 TCP 长连接，client 端连接 server 端默认的 2181 端口，也就是 session 会话。从第一次连接建立开始，客户端开始会话的生命周期，客户端向服务端的ping包请求，每个会话都可以设置一个…

阅读更多...

MySQL 表的增删查改(练习)

MySQL 表的增删查改(练习)

简单增删查改 1.创建的商品表中插入一条数据：名称为“学生书包”、价格18.91、库存101、描述为空 insert into product(name,price,storage) values(学生书包,18.91,101); insert into product values (学生书包,18.91,101,null); 2.在图书表中新增一条记录&…

阅读更多...

飞天使-k8s知识点13-kubernetes散装知识点2-statefulsetdaemonset

飞天使-k8s知识点13-kubernetes散装知识点2-statefulsetdaemonset

文章目录 RC RS DeploymentStatefulSet有状态服务控制器DaemonSet守护进程与任务job cronjob RC RS Deployment StatefulSet有状态服务控制器 statefulset StatefulSet 是 Kubernetes 1.9 版本引入的一个新的 API 对象，主要用于处理有状态的服务。StatefulSet 与 De…

阅读更多...

spring.jpa.hibernate 配置和源码解析

spring.jpa.hibernate 配置和源码解析

版本 spring-boot:3.2.2 hibernate:6.4.1.Final 配置项目 DDL模式生成定义语句修改表结构配置路径：spring.jpa.hibernate.ddl-auto配置值：org.hibernate.tool.schema.Action枚举类型值可选值： 可选值说明none默认值。不操作create-…

阅读更多...

12.JavaScript(WebAPI) - JS api文献精解

12.JavaScript(WebAPI) - JS api文献精解

文章目录 1.WebAPI 背景知识1.1什么是 WebAPI1.2什么是 API1.3API 参考文档 2.DOM 基本概念2.1什么是 DOM2.2DOM 树 3.获取元素3.1querySelector3.2querySelectorAll 4.事件初识4.1基本概念4.2事件三要素4.3简单示例 5.操作元素5.1获取/修改元素内容5.1.1innerText5.1.2innerHT…

阅读更多...

代码随想录算法训练营|day29

代码随想录算法训练营|day29

第七章回溯算法 491.递增子序列46.全排列47.全排列II代码随想录文章详解总结 491.递增子序列同层去重，只需保证当前层元素不重复即可【前仆后继的感觉】 func findSubsequences(nums []int) [][]int {res, path : [][]int{}, []int{}var help func(nums []int, …

阅读更多...

EMC学习笔记（二十一）降低EMI的PCB设计指南（一）

EMC学习笔记（二十一）降低EMI的PCB设计指南（一）

降低EMI的PCB设计指南（一） 1.概述2.射频3.连接器与过孔元件4.静态引脚和动态引脚和输入5.基本回路6.差模与共模 tips：资料主要来自网络，仅供学习使用。 1.概述印刷电路板(PCB)的一般布局准则，基本上都有相对的文件进…

阅读更多...

C++重新入门-C++变量作用域

C++重新入门-C++变量作用域

目录 1.C变量定义 2.C作用域 3.局部变量 4.全局变量 5.块作用域变量 6.初始化局部变量和全局变量 1.C变量定义一般来说有三个地方可以定义变量： 在函数或一个代码块内部声明的变量，称为局部变量。在函数参数的定义中声明的变量，称为…

阅读更多...

Acwing---835. Trie字符串统计

Acwing---835. Trie字符串统计

Trie字符串统计 1.题目2.基本思想3.代码实现 1.题目维护一个字符串集合，支持两种操作： I x 向集合中插入一个字符串 x；Q x 询问一个字符串在集合中出现了多少次。共有 N个操作，所有输入的字符串总长度不超过 1 0 5 10^5 105…

阅读更多...

最新文章