摘要
匹配是信息集成的核心技术之一。论述基于编辑距离、基于标记以及N元文法等为代表的字符串匹配技术的研究现状,指出其存在的不足并提出改进思路。
Matching is one of the most important techniques of information integration. In this paper, string - based matching algorithms, mainly distance - based, token - based and the N - gram are elucidated. The deficiencies and research directions are also outlined.
出处
《现代图书情报技术》
CSSCI
北大核心
2007年第7期22-26,共5页
New Technology of Library and Information Service
基金
南京大学人文社会科学项目"网络环境下异构信息检索标准体系研究"的研究成果之一
关键词
匹配
信息集成
字符串匹配
Matching Information integration String - based matching