- 各种标签的向量,做 加权计算后得到一个综合向量,计算余弦相似度之前,
- 可选的,做一个归一化:
aggregated_vector /= np.linalg.norm(aggregated_vector)
- 这段代码实现的是 归一化 操作,具体来说,它使用了 L2 范数 来归一化 aggregated_vector 向量。
归一化的目的
-
归一化是为了将一个向量的长度(或模)调整为 1,从而使其单位长度为 1。这样做可以帮助消除不同向量之间由于长度差异而引入的误差,使得向量的方向(或者说,特征)成为主要的比较标准。常见的归一化方式有 L2 范数归一化、L1 范数归一化 等。
-
在机器学习和自然语言处理等领域,归一化常用于计算两个向