期刊文献+

基于数据压缩的文本相似性计算 被引量:1

Text similarity computing based on Data Compression
下载PDF
导出
摘要 利用数据压缩原理,对文本文档进行压缩,由压缩比公式得到相似值.与基于统计的传统方法相比,它具有简便快速的特点. In the process of information retrieval, the traditional method is to compute similarity between texts. The coefficient similitude figures the degree of compatibility. There are two main methods: Correlation coefficient and Cosine. We base on the theory of Data Compression and use the compression ratio to (express) the similarity between texts. It has some advantages over the others.
作者 廉雄杰
出处 《延边大学学报(自然科学版)》 CAS 2004年第2期143-146,共4页 Journal of Yanbian University(Natural Science Edition)
关键词 信息检索 数据压缩 相似度 Information retrieval Data Compression Similarity
  • 相关文献

参考文献3

  • 1[2]Marcos Andre Goncalves, Edward A Fox, Layne T Watson, et al. Streams, Structures, Spaces, Scenarios, Societies (5S) :A Formal Model for Digial Libraries[J ]. ACM Transactions on Information Systems, 2004,22(2) :270 -312.
  • 2[3]David Sakimon.数据压缩原理与应用[M].吴东南,等译.北京:电子工业出版社,2003.9.
  • 3[4]Huffman D A. A method for the construction of minimum-redundancy codes[J ]. In Proc IRE, 1952,40:1098- 1101.

同被引文献8

引证文献1

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部