LSTM+CRF序列标注
序列标注:对序列进行标注,实际上是对序列中每个Token进行标签预测,可以直接视作简单的多分类问题。但是序列标注不仅仅需要对单个Token进行分类预测,同时相邻Token直接有关联关系,需要引入一种能够学习到此种关联关系的算法来保证预测结果的正确性。
条件随机场 (CRF)
CRF 是一种用于建模序列数据和预测序列标签的统计建模方法。它在序列标注任务中特别有用,因为它不仅预测单独的标签,还考虑了标签之间的依赖性。
Viterbi算法
Viterbi 算法是一种动态规划算法,用于寻找最可能的标签序列,这在解码阶段非常关键。
CRF层的实现
实现 CRF 层是构建序列标注模型的关键步骤。如何通过序列的真实长度来调整模型的输入,以及如何生成和应用遮罩矩阵以忽略填充项是重点。