期刊文献+

距离加权统计语言模型及其应用 被引量:8

Application Of A Distance-weighted Statistical Language Model
下载PDF
导出
摘要 本文在统计语言模型构造中 ,提出了将词间距离信息结合到N gram统计语言模型中的思路 ,并称之为距离加权的关联词统计语言模型。该模型可以考虑一个句子中非相邻词之间的关系 ,基于“词距越近关系越密切”的原则 ,通过距离加权函数来引入距离信息 ,提高模型的预测能力。本文还将其应用到一个中文整句拼音输入法系统中。实验表明 ,该模型与传统的N gram统计语言模型相比 ,汉字误识率有所降低 。 Proposed in this paper is a novel language model based on the traditional N gram model,where the inter word distance information is integrated,and therefore the model is referred to as the distance weighted statistical language model.In this model,the relationship between disconnected words is taken into consideration.Based on the principle that closer words(in distance)have a closer relation.A distance weighted function has been used to integrate the information so as to improve the model's prediction ability.Compared with the original n gram model,the experiments results show that the proposed language model will reduce the Chinese whole sentence IME system's word error rate.
出处 《中文信息学报》 CSCD 北大核心 2001年第6期47-52,共6页 Journal of Chinese Information Processing
关键词 N-gram关联词模型 距离加权 数据平滑 统计语言模型 距离信息 语音识别 N gram word related language model distance weighted model smooth
  • 相关文献

参考文献4

  • 1Jin Ling,Int Symposium on Chinese Spoken Language Processing,2000年,247页
  • 2Zheng Fang,J Comput Sci Technol,2000年,5卷,461页
  • 3Zhang Shuwu,Euro Speech'97 Proceedings.5,1997年,2699页
  • 4Chen S F,Proceedings of the 34th Annual Meeting of the Association for Computational Linguistics,1996年,310页

同被引文献124

引证文献8

二级引证文献99

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部