摘要
主要介绍了基于Tesseract-ocr的藏文脱机识别训练的方法,从box文件生成、文字校正、文字特征文件生成、定义字体特征、聚集字体特征、生成训练字库特征库文件这六个方面详细介绍了具体的训练方法,然后通过训练之后的字库特征文件成功识别了图片上的藏文,实现了藏文的脱机识别。
出处
《科技创业月刊》
2016年第21期130-131,共2页
Journal of Entrepreneurship in Science & Technology
基金
西藏大学自治区级大学生创新性实验训练计划项目"基于tesseract-ocr的藏文自动识别翻译的设计与实现"(项目编号:2015QCX084)