视频链接:https://www.bilibili.com/video/BV1yK4y1B75J/?spm_id_from=333.788&vd_source=3bbd0d74033e31cbca9ee35e111ed3d1
课程笔记:
1.Finetune简介
指令微调:
开始的大模型可能不知道问的是问题
这三种角色的划分只有在微调训练阶段有,在预测阶段其实只有用户一个角色,系统角色是模版默认写好的(也可以修改)
指令跟随微调是一问一答的数据,输入是一问一答,只对答案进行损失计算,而增量预训练微调的训练数据只需要答案。
二、 Xtuner
三、8GB显存玩转LLM
动手实践