期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于模板与内容分离的票据识别方法
1
作者 时瑞 蒋三新 《电子测量技术》 北大核心 2023年第6期122-128,共7页
票据的自动识别是票据数据化以及提高票据信息处理能力的重要手段之一。考虑到相同类型票据的规格统一,结构相同以及存在大量重复信息,提出了一种基于模版与内容分离的票据识别方法。该方法通过颜色分割将票据的结构及固有文字提取为模... 票据的自动识别是票据数据化以及提高票据信息处理能力的重要手段之一。考虑到相同类型票据的规格统一,结构相同以及存在大量重复信息,提出了一种基于模版与内容分离的票据识别方法。该方法通过颜色分割将票据的结构及固有文字提取为模版,剩余部分作为票据内容。结合改进的孪生神经网络和模板对齐将待测票据模版与模版数据库中已有票据匹配然后重建新的票据。结果表明,与原方法百度OCR相比,该方法在文字检测时间、识别时间分别降低了68%、91.13%,整体预测时间降低了88.62%,达到3.45 s/张。 展开更多
关键词 票据识别 孪生神经网络 模板匹配 模板对齐 OCR
原文传递
对齐模板在标准短语统计机器翻译模型中的应用 被引量:2
2
作者 张步峰 孙越恒 赵青 《电子测量技术》 2007年第7期146-149,161,共5页
在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够... 在统计机器翻译领域,基于短语的翻译模型性能上优于基于词的翻译模型。基于对齐模板的短语翻译模型和标准短语翻译模型是短语翻译模型中的典型代表,二者在翻译过程中分别使用对齐模板和短语对。对齐模板和短语对各有优势,对齐模板能够较好处理数据稀疏的问题,短语对可以使翻译更加精确。本文提出在基于最大熵的标准短语翻译模型下模拟对齐模板,模拟的对齐模板被作为一个单独的特征函数加入到此翻译模型中。实验在中英翻译和法英翻译上进行,实验结果证明,本文方法明显改善了标准短语翻译模型的翻译效果。 展开更多
关键词 统计机器翻译 标准短语翻译模型 对齐模板 最大熵模型
下载PDF
基于信息熵的双语词聚类算法
3
作者 张振昌 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第6期804-809,共6页
基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上... 基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进. 展开更多
关键词 双语词聚类 对齐模板 信息熵
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部