文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和...文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和中英文字符混杂形似等诸多问题,设计出具有文字区域提取与校正、图像增强、文本检测和文本识别的光学字符识别(Optical Character Recognition,OCR)算法框架。设计了基于双注意力机制和内容感知上采样的DBNet文本检测模块增强网络的特征提取选择能力,提高内容感知能力,设计了融入中心损失CRNN+CTC的文本识别模块增大字符之间的特征间距。实验结果表明,改进的文本检测网络在ICDAR2015数据集上准确率提升了5.09%,召回率提高2.12%,F评分提高了3.46%。在中英文文本识别数据集中,改进的文本识别网络对中英文字符识别准确率提高了1.2%。展开更多
文摘文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和中英文字符混杂形似等诸多问题,设计出具有文字区域提取与校正、图像增强、文本检测和文本识别的光学字符识别(Optical Character Recognition,OCR)算法框架。设计了基于双注意力机制和内容感知上采样的DBNet文本检测模块增强网络的特征提取选择能力,提高内容感知能力,设计了融入中心损失CRNN+CTC的文本识别模块增大字符之间的特征间距。实验结果表明,改进的文本检测网络在ICDAR2015数据集上准确率提升了5.09%,召回率提高2.12%,F评分提高了3.46%。在中英文文本识别数据集中,改进的文本识别网络对中英文字符识别准确率提高了1.2%。