CN2018100727300
2018-01-25
发明专利
基于二维递归网络的自然场景图像中中文文本识别方法
华南理工大学
已授权
本发明公开了一种基于二维递归网络的自然场景图像中中文文本识别方法,首先获取训练样本集,对深度卷积网络、编码用二维递归网络、解码用二维递归网络以及CTC模型依次连接构成的神经网络进行训练;将测试样本输入训练后的深度卷积网络中,获取到测试样本的特征图;然后将测试样本的特征图输入到训练后的编码用二维递归网络中,得到测试样本的编码特征图;再将测试样本的编码特征图输入训练后的解码用二维递归网络中,得到测试样本各帧图像中每个常用汉字的概率结果;最后进行集束搜索处理,最终识别出测试样本中整体中文文本。本发明方法充分利用了文本图像的空间时间信息与上下文信息,能够避免文本图像预分割问题,提高了识别准确率。