在线主动学习算法评估策略:prequential evaluation procedure
在在线主动学习领域(Online Active Learning),对在线主动学习算法的评估策略有多种方法,而现如今常用的方法是prequential evaluation procedure(出自论文《High density-focused uncertainty sampling for active learning over evolving stream data》)
文章中具体的描述为:
具体的评估方法策略为:
- 由于大部分算法都需要初始化阶段,因此将每个流数据集的前500个样本点作为初始化数据集提供给算法进行初始化。
- 从第501个数据点开始,数据按照流的形式到达,每次到达一个数据点,首先在该数据上测试算法(即让算法做出标签预测,然后根据该预测标签的正确与否,添加到整体正确率的计算之中),然后再根据主动学习方法来决定是否请求该数据的标签,若请求则利用该标签去更新模型。
当然此处的正确率也可以换成其他的评估函数。