期刊文献+

文本相似度计算在企业信息检索中的应用

The Application of Text Similarity Computing in the Enterprise Information Retrieval System
下载PDF
导出
摘要 企业信息检索系统所要解决的核心问题就是:提高检索关键字集合的规范性与完备性,通过对文本相似度计算及相关分类算法,达到检索关键字集合规范性及完备性提高的目的。给出了线性序列相似度的定义,讨论了匹配矩阵的性质,给出了一种计算线性序列相似度的算法,并对算法作出了优化。 The key problem that an intelligent enterprise information retrieval system needs to solve is to improve the normative and completeness of searching Key words,which can be achieved with the use of text similarity computing and relative classification algorithm.A definition of similarity degree of linear sequence is presented.The characteristics of match matrix is discussed.And finally an algorithm of calculating similarity degree of linear sequence and its optimization are introduced.
作者 黄炜
出处 《科学技术与工程》 2011年第15期3571-3575,3584,共6页 Science Technology and Engineering
关键词 信息检索 文本相似度算法 全局优化 状态空间 information retrieval text similarity computing algorithm overall optimization state space
  • 相关文献

参考文献3

二级参考文献9

  • 1李强.创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J].甘肃科学学报,2006,18(4):84-87. 被引量:51
  • 2唐策善.数据结构[M].北京:高等教育出版社,1997..
  • 3Faloutsos C. FastMap: A Fast Algorithm for indexing, Data-Min ing and Visualization of Traditional and Multimedia Datasets. In:Proc. of ACM SIGMOD, 1995. 163~174
  • 4Jagadish H V. A retrieval technique for similar shapes. In:Proc. ACM SIGMOD Conf, May 1990. 208~217
  • 5Torgerson S. Multidimensional scaling: I. theory and method. Psychometrika, 1952,17: 401~419
  • 6Kruskal J B, Wish M. Multidimensional scaling. SAGE publications, Beverly Hills, 1978
  • 7Ding C. Cluster merging and splitting in hierarchical clustering al gorithms. In:IEEE Intl. Conf. on Data Mining (ICDM'02), Dec. 2002. 139~146
  • 8陈恩红,塔建庆,张振亚,王煦法.基于神经网络的增量式数据索引机制研究[J].小型微型计算机系统,2003,24(10):1783-1786. 被引量:1
  • 9马秀红,宋建社,董晟飞.数据挖掘中决策树的探讨[J].计算机工程与应用,2004,40(1):185-185. 被引量:50

共引文献105

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部