预训练对齐：数学理论到工程实践的桥梁

在人工智能和机器学习领域，预训练模型的对齐是一个至关重要的概念。本篇博客源自听了一场黄民烈老师关于大模型对齐的分享，整理内容如下，供大家参考。
在这里插入图片描述

数学理论中的预训练对齐

数学理论上，预训练对齐是什么？
在这里插入图片描述

序列到序列的转换

在2014年，序列到序列（Seq2Seq）的转换是自然语言处理（NLP）中的一个突破性进展。这种模型通过编码器-解码器架构，将输入序列转换为输出序列，广泛应用于机器翻译、文本摘要等任务。编码器负责将输入序列映射到一个固定长度的向量，而解码器则将这个向量逐步转换为输出序列。
在这里插入图片描述

有监督的微调

到了2022年，有监督的微调成为了预训练模型对齐的主流方法。这种方法通过在特定任务上对预训练模型进行进一步的训练，使得模型能够更好地适应任务的需求。微调过程中，模型的参数会根据任务特定的数据进行调整，从而提高模型在特定任务上的表现。

在这里插入图片描述

超级对准研究问题：

弱到强的泛化。如何利用深度学习的泛化特性来控制具有弱监督器的强模型
可扩展的监督。如何利用AI系统人工标签来协助监管其他强大的AI系统
评价。如何自动搜索有问题的行为及其内部因素来验证系统的一致性，如何对整个管道进行对抗性测试

Learn task decomposition from human feedback

对齐优化方法

在这里插入图片描述

线性加权求和

线性加权求和是一种直观的对齐方法，它通过为预训练模型和任务特定模型分配不同的权重，然后将两者的输出进行加权求和，以实现对齐。这种方法简单易行，但可能无法捕捉到模型间的复杂关系。
在这里插入图片描述

DPO最大似然对齐

DPO（Differentiable Pointwise Optimisation）最大似然对齐是一种更为精确的对齐方法。它通过优化模型参数，使得模型输出的分布尽可能接近真实数据的分布，从而实现对齐。这种方法可以更精确地调整模型参数，以适应新任务的需求。
在这里插入图片描述
理论上DPO的方法为何更优

语言学习的复杂性

语言学习是一个高度复杂的任务，它涉及到词汇、语法、语义等多个层面的知识。在进行语言模型的预训练对齐时，需要考虑到语言的多样性和复杂性。这意味着对齐过程不能简单地依赖于平均分布，而应该深入理解语言的结构和使用环境。

Existing Challenges
◆Efficiency: lt is cost consuming to train LLMs.
◆Accessibility: AP|-based models are not publicly available.
◆Interpretability: The modeling and improvements of human preferenceis uninterpretable.

在这里插入图片描述

工程实践中的应用

将预训练对齐的理论应用于工程实践，可以采用以下几种思路进行优化：
在这里插入图片描述

数据集的精细划分：根据任务的需求，对数据集进行精细的划分和处理。例如，在机器翻译任务中，可以根据语言对和领域进行数据集的划分，以确保模型能够更好地学习和适应特定的语言和领域。
模型参数的动态调整：在训练过程中，动态调整模型参数，以实现对不同任务的适应性。例如，可以使用学习率调度器来调整学习率，或者使用正则化技术来防止模型过拟合。
多任务学习：通过多任务学习，使模型能够在处理一个任务的同时，学习到其他任务的知识。这种方法可以提高模型的泛化能力，使其在面对新任务时能够更快地适应。