本文讨论的内容参考自《神经网络与深度学习》https://nndl.github.io/ 第15章 序列生成模型,习题还没做先存在这里。
序列生成模型
序列概率模型
序列生成
N元统计模型
深度序列模型
模型结构
嵌入层
特征层
输出层
参数学习
评价方法
困惑度
BLEU算法
ROUGE算法
序列生成模型中的学习问题
曝光偏差模型
训练目标不一致问题
计算效率问题
层次化Softmax
重要性采样
噪声对比估计
序列到序列模型
基于循环神经网络的序列到序列模型
基于注意力的序列到序列模型
基于自注意力的序列到序列模型
自注意力
多头自注意力
基于自注意力模型的序列编码
Transformer模型
总结和深入阅读