文章目录
- 1.本文问题
- 2.方法
- 3.用于
- 4. 结论
1.本文问题
解决问题:
- 去噪
- shifted label distribution
- 普遍存在此问题,但大家都不解决,只着重于抛弃噪声实例
- 远程监督标记的噪声数据(KB)和人类标注的测试集分布不同
- shifted label distribution
- pipeline
- pipeline会增加噪声的传递–传递错误
2.方法
本文方法:多智能体合作重新标注噪声实例的联合模型
- 细粒度地处理
- 原来:舍弃或留下,二选一,仅对FP
- 本文:分配置信度,重新标记
- 选择目标:噪声实例
- 输入
- KG embedding: transE–type embedding
- extractor:
- PCNN(仅有关系抽取,实体部分使用CoType)
- CoType(比PCNN好,因为PCNN是pipeline的
- 多智能体MRL
- 每个智能体从自己的角度单独计算一个连续的置信度
- 相互独立–分散的
- 利用实体和关系之间的关联性,
- curriculum +PPO:
- reward大于threshold,或者队列满了–使用PPO学习agent策略
- curriculum learnin:
- 队列和采样的目的:加强任务之间的交互信息和加强agent的探索
- 每个智能体从自己的角度单独计算一个连续的置信度
- confident consensus module:聚合多智能体的智慧
- 置信度:
- 连续
- 使用置信度重新分布noisy training data 用于调整loss
- 使用RL去探索合适的标签分布,通过使用置信标签重分布训练集
- 这个方法实用,并且是robust的
- 并不使用真实世界应用的测试集的信息:不引入真实世界的额外的知识
3.用于
本文方法可作为post-processing plugin:DS,WS
4. 结论
- joint>pipeline
- MRL>joint:
- MRL可以重新标记实例