目录 2.Working with text data2.1 Understanding word embeddings2.2 Tokenizing text通过一个简单的实验来理解文本的词元化概念关键概念 2.3 Converting tokens into token IDs实现分词器类(Tokenizer Class)应用分词器测试文本的编码与解码通过分词器…
优化问题的背景
给出的优化目标是一个多变量的函数,形式如下: min W , b , Y ∈ I n d , Z ∥ X T W 1 b T − Y ∥ F 2 γ ∥ W ∥ F 2 λ t r ( Z T 1 1 T Z ) μ 2 ∥ Y − Z 1 μ Λ ∥ F 2 \min_{W,b,Y\in Ind,Z}\left\|X^TW\mathbf{1}b^T…