用于文本区域提取的边缘像素聚类方法被引量：6

Edge-Pixels Clustering for Text Area Extraction

下载PDF

导出

摘要根据边缘点的位置和颜色信息采取逐步松弛的聚类方法将图像分割成像素子集,应用文本区域边缘的分布特征提取初始文本区,并进行边界扩展得到完整的文本区域;同时给出了一种文本区域二值化方法,减少了在文本颜色极性未知时的二值图像个数,可提高字符分割等后续处理的计算效率.实验结果表明,该方法对文本区域提取是有效的,提取完整率达99%. An approach based on edge-pixels clustering to extract Chinese and English text areas from an image is proposed. The image is segmented into pixel-subclasses based on the colors and positions of edgepixels. And then the initial text areas are extracted according to the features of edges in text area. The boundaries of the initial text areas are expanded for the entire text areas. Furthermore, an algorithm of text area binarization is presented to improve the efficiency of post-processing by reducing the number of binary images when the text color polarity is unknown. The experimental results show that the proposed approach is effective with integrality up to 99 %.

作者付慧刘峡壁贾云得

机构地区北京理工大学计算机科学与工程系

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第5期729-734,共6页 Journal of Computer-Aided Design & Computer Graphics

关键词文本区域提取图像检索光学字符识别聚类图像二值化 text area extraction image retrieval optical character recognition （OCR） clustering image binary

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Jung Keechul,Kim Kwang In,Jain Anil K.Text information extraction in images and video:a survey[J].Pattern Recognition,2004,37(5):977-997
2Jain A K,Yu B.Automatic text location in images and video frames[J].Pattern Recognition,1998,31(12):2055-2076
3Sato T,Kanade T,Hughes E K,et al.Video OCR for digital news archive[C] //Proceedings of IEEE Workshop on Content based Access of Image and Video Databases,Bombay,India,1998:52-60
4Wu V,Manmatha R,Riseman E M.TextFinder:an automatic system to detect and recognize text in images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,21(11):1224-1229
5Sin B,Kim S,Cho B.Locating characters in scene images using frequency features[C] //Proceedings of International Conference on Pattern Recognition,Quebec,2002,3:489-492
6Mao W,Chung F,Lanm K,Siu W.Hybrid Chinese/English text detection in images and video frames[C] //Proceedings of International Conference on Pattern Recognition,Quebec,2002,3:1015-1018
7Cheng Zhiguo,Liu Yuncai.Caption location and extraction in digital video based on SVM[C] //Proceedings of the 3rd International Conference on Machine Learning and Cybernetics,Shanghai,2004:3515-3519
8Wang Rongrong,Jin Wanjun,Wu Lide.A novel video caption detection approach using multi-frame integration[C]//Proceedings of the 17th International Conference on Pattern Recognition,Cambridge,United Kingdom,2004:449-452
9王涛,沈谦,冯焕清.一种改进的模糊聚类算法[J].电路与系统学报,1999,4(1):64-69. 被引量：15
10Tang Yuan Y,Lee Seong-Whan,Suen Ching Y.Automatic document processing:a survey[J].Pattern Recognition,1996,29(12):1931-1952

共引文献14

1魏令勇,白润才.城市用水量预测模型及其应用[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):288-289. 被引量：5
2张新波.两阶段模糊C-均值聚类算法[J].电路与系统学报,2005,10(2):117-120. 被引量：21
3易正明,周孑民,刘志明,吕子剑.回转窑筒体温度红外扫描与状态预报系统研究[J].湖南科技大学学报（自然科学版）,2006,21(2):9-12. 被引量：1
4丁亚明,王树忠,张志红,胡学钢.基于改进神经网络的模糊聚类算法[J].合肥工业大学学报（自然科学版）,2007,30(8):934-938. 被引量：4
5刘晓刚,李玉景,代晓燕,矫媛.一种新的RBF神经网络学习算法[J].科技信息,2007(31):72-72.
6管国权,王红艳.HCM聚类算法的改进-MHCM聚类算法[J].科技创新导报,2008,5(17):24-24.
7李曜良,杨君顺.直方图与色调均衡化算法对图像像素的影响研究[J].榆林学院学报,2008,18(4):103-106.
8焦远锋,李万龙,郑山红,刘帅.一种新的两阶段FCM聚类算法[J].微电子学与计算机,2009,26(4):40-42. 被引量：4
9张慧哲,王坚.基于初始聚类中心选取的改进FCM聚类算法[J].计算机科学,2009,36(6):206-209. 被引量：68
10张峰,吴钦章,任国强.一种模糊聚类的快速算法[J].贵州大学学报（自然科学版）,2009,26(3):57-59.

同被引文献48

1王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
2郭丽,孙兴华,黄元元,杨静宇.视频文本的自动提取方法[J].小型微型计算机系统,2004,25(6):1086-1088. 被引量：5
3王建,周源华.一种基于纹理能量的JPEG图像文本定位算法[J].上海交通大学学报,2004,38(9):1492-1495. 被引量：4
4刘洋,薛向阳,路红,郭跃飞.一种基于边缘检测和线条特征的视频字符检测算法[J].计算机学报,2005,28(3):427-432. 被引量：20
5孙广玲,刘家锋,唐降龙,石大明,赵巍.基于主动判别函数的手写体识别(英文)[J].软件学报,2005,16(4):523-532. 被引量：2
6于浩,高剑峰,步丰林.一种新的语言模型判别训练方法[J].计算机学报,2005,28(10):1708-1715. 被引量：2
7胡小锋,周勇,叶庆泰.复杂背景彩色图像中的文字分割[J].光学技术,2006,32(1):141-143. 被引量：12
8李闯,丁晓青,吴佑寿.一种基于直方图特征和AdaBoost的图像中的文字定位算法[J].中国图象图形学报,2006,11(3):325-331. 被引量：16
9密聪杰,刘洋,薛向阳.基于多帧图像的视频文字跟踪和分割算法[J].计算机研究与发展,2006,43(9):1523-1529. 被引量：11
10孙红星,赵楠楠,徐心和.基于小波变换和SVM的文本区域定位[J].东北大学学报（自然科学版）,2007,28(2):165-168. 被引量：7

引证文献6

1付慧,刘峡壁,贾云得.图像中多语种文本提取的高斯混合建模方法[J].计算机研究与发展,2007,44(11):1920-1926. 被引量：2
2付慧,刘峡壁,贾云得.基于最大-最小相似度学习方法的文本提取[J].软件学报,2008,19(3):621-629. 被引量：1
3江延湖,白似雪.复杂背景图像文本信息提取技术研究[J].江西教育学院学报,2008(3):18-21.
4刘毅,毛震东,张冬明,张勇东,林守勋.低质量汉字的分块搜索两级识别法[J].计算机辅助设计与图形学学报,2012,24(2):170-175. 被引量：2
5余庆丰,余庆儿,曾辉,温美玲.一种图像识别震荡优化算法[J].温州职业技术学院学报,2016,16(1):56-58.
6胡威,汪春梅,张见.基于卷积神经网络的细胞图像分割与类型判别[J].上海师范大学学报（自然科学版）,2019,48(1):106-112. 被引量：3

二级引证文献8

1黄百钢,李俊山,胡双演.基于颜色和笔画特征的文本分割算法[J].计算机科学,2009,36(7):292-294.
2向剑平,王悦,胡剑.基于道路网络的受限优化路径搜索算法[J].计算机工程,2011,37(12):53-55. 被引量：3
3罗辉武,唐远炎,蓝利君,王翊.融合特征和先验知识的车牌字符图像检测算法[J].计算机工程与应用,2012,48(18):187-192. 被引量：4
4尚雪莲,梁传君.一种手写体识别误差与用户花费平衡算法[J].计算机与现代化,2015(9):50-56.
5向忠,张建峰,钱淼,吴震宇,胡旭东.多方向照明下金属冲压字符图像融合算法[J].计算机辅助设计与图形学学报,2018,30(9):1637-1642. 被引量：4
6邓竹琴,俞永伟.改进型深度学习模型在乳腺肿瘤良恶性鉴别中的应用[J].中国医学物理学杂志,2020,37(11):1469-1473. 被引量：4
7俞永伟.改进型YOLOv5s网络在胆囊超声图像检测中的应用[J].中国医疗设备,2023,38(5):99-104. 被引量：1
8罗静,萧晓栩.基于神经网络和多特征的船舶图像自动分割算法[J].舰船科学技术,2019,41(14):139-141.

1郝慎学.地表模型上的最短路径算法研究[J].山东交通学院学报,2007,15(4):71-76. 被引量：1
2李雪妍,郭树旭,郜峰利.基于小波模极大值的视频文本区域的提取[J].计算机工程,2007,33(5):26-28. 被引量：4
3张引,潘云鹤.复杂背景下文本提取的彩色边缘检测算子设计[J].软件学报,2001,12(8):1129-1135. 被引量：20
4孙红星,赵楠楠,王蓉,徐心和.文本区域字符颜色极性判断方法[J].东北大学学报（自然科学版）,2007,28(3):316-319. 被引量：1
5王益艳,王晅.基于2级噪声检测的改进中值滤波算法[J].计算机工程与设计,2008,29(11):2841-2843. 被引量：4
6程红蓉,秦志光,万明成,王灿,靳京,傅翀.图像垃圾邮件中文本区域的自动提取方法[J].解放军理工大学学报（自然科学版）,2009,10(3):258-261. 被引量：1
7范林林.MCP—在CAD中快速添加文本的方法[J].机械工人（冷加工）,2000(8):33-34.
8徐飞,刘家锋,张博宇,吴锐,赵巍.基于随机投影的场景文本图像聚类方法研究[J].计算机应用研究,2011,28(12):4730-4733. 被引量：2
9刘杰,王生进.基于边界扩展的图像显著区域检测[J].清华大学学报（自然科学版）,2017,57(1):72-78. 被引量：3
10郑强,刘齐军,王正华,朱云平.生物医学命名实体识别的研究与进展[J].计算机应用研究,2010,27(3):811-815. 被引量：25

计算机辅助设计与图形学学报

2006年第5期

浏览历史

内容加载中请稍等...

用于文本区域提取的边缘像素聚类方法被引量：6

参考文献10

共引文献14

同被引文献48

引证文献6

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

用于文本区域提取的边缘像素聚类方法 被引量：6

参考文献10

共引文献14

同被引文献48

引证文献6

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

用于文本区域提取的边缘像素聚类方法被引量：6