我们将创建一个具有CTC损失的卷积循环神经网络来实现我们的OCR识别模型。
一、数据集
我们将使用 Visual Geometry Group 提供的数据。
Visual Geometry Group - University of OxfordComputer Vision group from the University of Oxfordhttps://www.robots.ox.ac.uk/~vgg/data/text/#sec-synth 这是一个总共 10 GB 图像的巨大数据集。在这里,我仅使用 135000 张图像作为训练集,使用 15000 张图像作为验证数据集。该数据包含文本图像片段,如下图所示: