<PivoTAL: Prior-Driven Supervision for Weakly-Supervised Temporal Action Localization>
论文:PivoTAL: Prior-Driven Supervision for Weakly-Supervised Temporal Action Localization (thecvf.com)
创新点:
- 定位驱动的监督框架:
定位视角:文章提出的PivoTAL方法从“定位驱动”的角度出发,而不是传统的“分类驱动”视角。传统方法主要是对每一帧进行分类,然后通过手动设计的后处理步骤将这些帧级别的预测聚合成动作片段。这种方法容易导致对动作边界理解不足,并且容易聚焦于视频中最具辨识度的部分,从而导致动作定位不完整。PivoTAL则直接学习定位动作片段,从而更好地理解动作边界。
- 利用先验信息进行监督:
1)场景先验:利用视频中的动作特定