【持续学习系列(四)】《Lifelong-RL》

一、论文信息

1 标题

Lifelong-RL: Lifelong Relaxation Labeling for Separating Entities and Aspects in Opinion Targets

2 作者

Lei Shu, Bing Liu, Hu Xu, and Annice Kim

3 研究机构

Department of Computer Science, University of Illinois at Chicago, USA
Center for Health Policy Science and Tobacco Research, RTI International, USA

二、主要内容

这篇论文旨在解决意见挖掘中的一个重要问题：将意见目标（opinion targets）分为实体（entities）和方面（aspects）。意见目标可以是实体（如产品或服务的整体）或实体的某个方面（如产品的特性或属性）。为了有效地进行意见挖掘，需要区分这些目标，因为它们代表了关于意见的不同方面。论文提出了一种新的算法Lifelong-RL，该算法基于终身机器学习和松弛标签（relaxation labeling）来解决这个问题。

三、相关研究

相关研究包括目标提取方法、情感分类、转移学习、多任务学习以及终身机器学习。这些研究为本文提供了理论基础和方法论支持。

四、解决方案

松弛标签算法（Relaxation Labeling, RL）

输入:

图 $G = (V, E)$ ，其中 $V$ 是节点集合， $E$ 是边集合。
每个节点 $t_i ∈ V$ 与一个多项式分布 $P(L(t_i))$ 相关联，表示标签 $L(t_i)$ 的概率。
每条边 $t_i, t_j) ∈ E$ 与两个条件概率分布 $P(L(t_i)|L(t_j))$ 和 $P(L(t_j)|L(t_i))$ 相关联，表示标签 $L(t_j)$ 对标签 $L(t_i)$ 的影响以及反之。

计算过程:

初始化每个节点的标签分布 $P_0(L(t_i))$ 。
对于每个迭代 $r$ ，计算每个节点的标签分布的变化量 $ΔP_{r+1}(L(t_i))$ ，根据邻居节点的标签和条件概率分布。
更新每个节点的标签分布 $P_{r+1}(L(t_i))$ ，直到收敛。

输出:

每个节点的最终标签 $L(t_i)$ ，即其最高概率的标签。

数学公式:

$ΔP_{r+1}(L(t_i))$ 的计算公式：
$\Delta P_{r+1}(L(t_i)) = \sum_{t_j \in Ne(t_i)} w(t_j|t_i) \cdot \sum_{y \in Y} (P(L(t_i) = y, L(t_j) = y) \cdot P_r(L(t_j) = y))$
更新后的标签分布 $P_{r+1}(L(t_i))$ 的计算公式：
$P_{r+1}(L(t_i)) = \frac{P_r(L(t_i))(1 + \Delta P_{r+1}(L(t_i)))}{\sum_{y \in Y} P_r(L(t_i) = y)(1 + \Delta P_{r+1}(L(ti) = y))}$
最终标签 $L(t_i)$ 的选择：
$L(t_i) = \argmax_{y \in Y} P(L(t_i) = y)$

终身机器学习（Lifelong Machine Learning, LML）

输入:

知识库（Knowledge Base, KB），包含过去任务中提取的图和分类结果。
当前任务的图 $G^{'} = (V^{'}, E^{'})$ 和节点的初始标签分布。

计算过程:

使用过去任务中的知识来帮助当前任务的标签分布初始化。
利用过去任务中的目标标签来调整当前任务的初始标签概率分布。
结合松弛标签算法进行迭代更新，直到收敛。

输出:

当前任务中每个节点的最终标签。

数学公式:

初始化概率分布 $P_0(L(t_i))$ 的更新：
$P_{LL1,0}(L(t)) = P_{du+1,0}(L(t)) + \lambda \cdot \frac{CDs_{L(t)}}{D + \lambda D}$
条件概率分布 $P(LL1)(L(t_i)|L(t_j))$ 的更新：
$P_{LL2}(L(t_i)|L(t_j)) = P_{LL1}(L(t_i)|L(t_j)) + \lambda \cdot \frac{CDs_{L(t_i), L(t_j)}}{D + \lambda D}$

这里， $\lambda$ 是一个控制参数，用于调整过去知识对当前任务影响的强度。 $CDs_{L(t)}$ 和 $CDs_{L(ti), L(tj)}$ 分别表示过去任务中目标 $t$ 被标记为 $L (t)$ 和目标 $t_i$ 和 $t_j$ 同时被标记为 $L(t_i)$ 和 $L(t_j)$ 的领域数量。 $D$ 是过去任务的总数。