期刊文献+

基于Tesseract-ocr的藏文脱机识别 被引量:2

下载PDF
导出
摘要 主要介绍了基于Tesseract-ocr的藏文脱机识别训练的方法,从box文件生成、文字校正、文字特征文件生成、定义字体特征、聚集字体特征、生成训练字库特征库文件这六个方面详细介绍了具体的训练方法,然后通过训练之后的字库特征文件成功识别了图片上的藏文,实现了藏文的脱机识别。
出处 《科技创业月刊》 2016年第21期130-131,共2页 Journal of Entrepreneurship in Science & Technology
基金 西藏大学自治区级大学生创新性实验训练计划项目"基于tesseract-ocr的藏文自动识别翻译的设计与实现"(项目编号:2015QCX084)
  • 相关文献

参考文献3

二级参考文献25

  • 1杨永崇.地形图变形的分块纠正法[J].测绘通报,2001(10):25-26. 被引量:13
  • 2刘彦花,叶国华.基于扫描地形图的几何纠正算法研究[J].地矿测绘,2001,17(3):1-3. 被引量:5
  • 3王华,丁晓青.一种多字体印刷藏文字符识别方法[J].计算机工程,2004,30(13):18-20. 被引量:10
  • 4高定国,龚育昌.现代藏字全集的属性统计研究[J].中文信息学报,2005,19(1):71-75. 被引量:32
  • 5严海林,江荻.一种基于三级分类器的藏文识别方法[C]//第十届全国少数民族语言文字信息处理学术研讨会论文集,2005.
  • 6刘汇丹,芮建武,吴健.藏文网页的编码识别与转换[C]∥中文信息处理前沿进展--中国中文信息学会二十五周年学术会议论文集,2006.
  • 7吴刚,德熙嘉措,黄鹤鸣.印刷体藏文识别技术[C]//第十届全国少数民族语言文字信息处理学术研讨会论文集,2005.
  • 8Danial Md Nor, Mohd Helmy Abd Wahab, Mohammad Zarar Mohd jenu, et al. a new visual signature for content-based indexing of low resolution documents [J]. Journal of Information Retrieval and Knowledge Management. 2012, 12 (2): 88-95.
  • 9Patel C, Patel A, Patel D. Optical character recognition by open source OCR tool tesseract: A case study [J]. International Journal of Computer Applications. 2012, 55 (10): 50-56.
  • 10Mane MJ, Chavan MS. Design and implementation of median filter for image denoising [J]. International Journal of Electrical and Electronic Engineering &. Telecommunication. 2013, 2 (2): 42-48.

共引文献31

同被引文献10

引证文献2

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部