注意力机制在自然场景文字检测中的应用被引量：8

Using of Attention for Scene Text Detection

下载PDF

导出

摘要针对目前主流的基于分割的文字检测方法中由于需要复杂的后处理过程保证检测精度,通常难以实现高检测速度的问题,提出一种应用位置注意力模块和金字塔注意力网络2种注意力机制的方法.首先用金字塔注意力网络对图像进行特征提取及语义分割;同时将位置注意力模块应用于高层特征,通过加强图像中相似物体的权重加强对文字的检测效果;最后进行简单有效的后处理,在实现较高检测准确度的前提下提高检测速度.实验结果表明,在Total-text数据集中,采用更轻量化的骨干网络时,所提方法在检测速度上优势明显;采用更深层的骨干网络时,所提方法的检测准确度领先2.0%. In view of the issue that current mainstream segmentation-based text detection methods is difficult to achieve high detection speed due to complex post-processing to ensure detection accuracy,a scene text detec-tion method is proposed which applies pyramid attention network and position attention module.First,it adopts pyramid attention network to perform feature extraction and semantic segmentation.Meanwhile,it adopts po-sition attention module in high-level features,which strengthens the weights of similar objects in the image to enhance the effect of text detection.Finally,it adopts a simple and effective post-processing algorithm to in-crease detection speed under the premise of high detection accuracy.Experimental results show that in To-tal-text datasets,using light-weight backbone network,the method has great advantages on detection speed,and while using deeper backbone network,the method achieves the state of the art result and has a 2.0%lead on detection accuracy.

作者王延昭顾晓东 Wang Yanzhao;Gu Xiaodong(Department of Electronic Engineering,School of Information Science and Technology,Fudan University,Shanghai 200438)

机构地区复旦大学信息科学与工程学院电子工程系

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第12期1908-1915,共8页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金面上项目(61771145).

关键词自然场景文字检测神经网络金字塔注意力网络位置注意力机制 scene text detection neural network pyramid attention network position attention module

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献84

1王浩宇.软件需求工程技术综述[J].计算机科学,2022,49(S02):766-779. 被引量：4
2尹光花,刘小明,张露,杨俊峰.基于LSTM特征模板的短文本情感要素分析与研究[J].电子科技,2018,31(11):38-41. 被引量：11
3魏然,舒赛,余宏亮,骆汉宾.自然语言建筑设计规范条文的规则表达式自动提取方法[J].土木工程与管理学报,2019,36(1):109-114. 被引量：8
4费宁,张浩然.TensorFlow架构与实现机制的研究[J].计算机技术与发展,2019,29(9):31-34. 被引量：21
5谷舒豪,单勇,谢婉莹,郭登级,王树根,邵晨泽,薛海洋,张良,冯洋.基于数据增强及领域适应的神经机器翻译技术[J].江西师范大学学报（自然科学版）,2019,43(6):643-648. 被引量：5
6王腾,焦学伟,高阳.一种基于Attention-GRU和iForest的周期性时间序列异常检测算法[J].计算机工程与科学,2019,41(12):2217-2222. 被引量：10
7曾鸣,王雨晴,刘英新,闫彤,武赓,孙辰军.基于SA算法的主动配电网网损优化模型研究[J].可再生能源,2020,38(1):64-69. 被引量：1
8马震环,高洪举,雷涛.基于增强特征融合解码器的语义分割算法[J].计算机工程,2020,46(5):254-258. 被引量：9
9刘建伟,丁熙浩,罗雄麟.多模态深度学习综述[J].计算机应用研究,2020,37(6):1601-1614. 被引量：40
10韩晓辉,高远,颜丽,米阳.基于模拟退火算法的电源规划[J].上海电力大学学报,2020,36(3):245-250. 被引量：5

引证文献8

1马廷淮,彭可兴,周宏豪,荣欢.具有实时注意力的多智能体强化学习通信模型[J].计算机仿真,2023,40(8):445-450. 被引量：1
2洪蕾,谢锐.基于图卷积和LSTM的软件需求高精度分类仿真[J].计算机仿真,2023,40(11):341-345.
3师玲萍.基于循环神经网络的工程专业语义智能分析方法研究[J].电子设计工程,2024,32(2):36-40.
4周燕,廖俊玮,刘翔宇,周月霞,曾凡智.改进FCENet的自然场景文本检测算法[J].计算机工程与应用,2024,60(3):228-236.
5牛洁.基于改进GRU与MVC设计模式的数据智能分析算法[J].电子设计工程,2024,32(10):25-29.
6刘彦希,吴浩,蔡源,唐丹,宋弘.基于改进EAST算法的电气设备铭牌文字检测[J].四川轻化工大学学报（自然科学版）,2024,37(3):42-50.
7张可抒,吴丹,沈蕾.基于融合注意力机制的电力工程数据特征提取算法设计[J].电子设计工程,2024,32(17):141-145.
8蓝桂军,李民.基于改进注意力机制的自然语言特征提取仿真[J].计算机仿真,2024,41(8):234-237.

二级引证文献1

1杨正权.基于强化学习的大规模无线传感器数据语义关联聚合方法[J].信息技术与信息化,2024(10):119-122.

1葛伟杰.发动机气缸盖数控加工工艺研究[J].内燃机与配件,2021(22):98-99. 被引量：3
2张楠,高超,雷霄,刘智,王子奡.地质装备的物联网技术分析与应用[J].资源环境与工程,2021,35(6):935-939.
3宫綦,张东辉.基于ARP 4754A的民用飞机研制过程符合性应用实施研究[J].航空科学技术,2021,32(11):45-49. 被引量：3
4张炳炎,闫召爱,郭文杰,胡雄.基于CO_(2)测量数据的大气辐射传输模型LBLRTM优化[J].空间科学学报,2021,41(6):905-910. 被引量：1

计算机辅助设计与图形学学报

2021年第12期

浏览历史

内容加载中请稍等...

注意力机制在自然场景文字检测中的应用被引量：8

同被引文献84

引证文献8

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

注意力机制在自然场景文字检测中的应用 被引量：8

同被引文献84

引证文献8

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

注意力机制在自然场景文字检测中的应用被引量：8