所谓召回,无非就是用一段不规则文本模拟用户query查询,而要召回的是标准的title+key,这些是要构建索引库的,所有相似文本对的第二个文本必须要在索引库里存在,不然就没法评估,因为标记都是0,还有召回1,召回5等,并不是什么狗屁的查全率,说的子虚乌有的,更精确的是像图像分类中的top1,top5这样的,就是精确率,召回5就是5次召回有一次召回到,就设置标记为1,这其实就是top5精确率,依次类推,其他事top10,top20。要相更好的搜索系统,还可以排序。我上面的相当于从25万个文本中召回,召回1精度达到了92%,说明这个模型相当不错,还有别总用什么准确率指标保存模型,损失低,准确率一定高。但是准确率高,损失未必低,知道这意味 着啥吗?损失高,模型准确率也高意味着泛化能力差。