-
题名改进Harris特征的印刷体图像检索
被引量:6
- 1
-
-
作者
高亭
艾斯卡尔·艾木都拉
阿布都萨拉木·达吾提
-
机构
新疆大学信息科学与工程学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2020年第2期294-302,共9页
-
基金
国家自然科学基金项目(61662076).
-
文摘
目的文档图像检索过程中,传统的光学字符识别(OCR)技术因易受文档图像质量和字体等相关因素的影响,难以达到有效检索的目的。关键词识别技术作为OCR技术的替代方案,不需经过繁琐的OCR识别,可直接对关键词进行检索。本文针对Harris算法聚簇现象严重和运算速度慢等问题,在关键词识别技术的框架下提出了改进Harris的图像匹配算法。方法基于Fast进行特征点检测,利用Harris进行特征描述,并采用非极大值抑制的方法,最后利用暴力匹配中的汉明距离进行特征的相似性度量,输出最终的匹配结果。结果实验结果表明本文算法在特征提取上的时间为0.101 s,相对于原始Harris算法的0.664 s和SIFT算法的1.066 s,实时性方面有了明显提高,改善了原始算法的聚簇现象,并且在无噪声的情况下,准确率达到98%,高于Sift算法的90%,召回率达到87.5%,而且在固定均值,不断提高方差的高斯噪声条件下,与Sift算法相比,准确率也高于后者,取得了较好的实验效果。结论本文提出的方法满足了快速、精确的查找需求,在印刷体图像的文档图像检索中有效提高了检索率,具有较好的实验效果。
-
关键词
Fast+Harris
特征提取
暴力匹配
角点检测
关键词识别技术
印刷体文档图像
-
Keywords
Fast+Harris
feature extraction
brute force
corner detection
word spotting
print document image
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-