摘要
提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。
An improved vector space model is proposed in this paper. The model partitions a document into many text paragraphs, the text weight is defined according to the text paragraphs position, and the calculation method of the similarity is defined. The experimental results show that the model has higher precision and faster computation speed for web information retrieval.
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第1期14-16,共3页
Computer Engineering
基金
海南省教育厅资助项目[Hjkj200407]
关键词
向量空间模型
信息检索
相似度
Vector space model
Information retrieval
Similarity