论文:
Fourier Contour Embedding for Arbitrary-Shaped Text Detection Yiqin Zhu and Jianyong Chen and Lingyu Liang and Zhanghui Kuang and Lianwen Jin and Wayne Zhang CVPR, 2021
1 动机
2021年金连文团队提出了一个FCENet,方法比较新颖,使用傅里叶变换来得到文本的包围框,该方法在弯曲文本数据集(ctw1500、total-text)上可以达到SOTA的效果,但非弯曲文本的检测上还是DBNet更为优秀,目前FCENet在mmocr和paddleocr上均有实现。
2021年旷视团队也提出了PAN++和FAST,后者是通过NAS搜索而来,论文里面给出的速度非常惊人,同等精度下,是DBNet的近两倍多。不过代码还没有开源,只开源了PAN++。下面两个图是截取至FAST,可以看到相比DBNet速度快了不止一点点。