基于改进向量空间模型的Web信息检索技术研究被引量：21

Study of Web Information Retrieval Technology Based on Improved Vector Space Model

下载PDF

导出

摘要提出了一种改进的向量空间模型。该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重,并给出了该模型的相似度计算方法。实验表明,将该模型应用于Web信息检索中,具有对输出结果的排序能力强、查询速度快等优点。 An improved vector space model is proposed in this paper. The model partitions a document into many text paragraphs, the text weight is defined according to the text paragraphs position, and the calculation method of the similarity is defined. The experimental results show that the model has higher precision and faster computation speed for web information retrieval.

作者雷景生林冬雪符浅浅

机构地区海南大学信息学院

出处《计算机工程》 EI CAS CSCD 北大核心 2005年第1期14-16,共3页 Computer Engineering

基金海南省教育厅资助项目[Hjkj200407]

关键词向量空间模型信息检索相似度 Vector space model Information retrieval Similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1Salton G, Wong A. On the Specification of Term Value in Automatic Indexing. Journal of Documentation, 1973, 29(4):351-372
2Wong S K M, Ziarko W. Generalized Vector Space Model in Information Retrieval. In:Proc the 8th Annual ACM SIGIR International Conference on Research and Development in Information Retrieval, 1985:18-25
3丁璇,侯汉清,章成志.中文网页标引源主题表达能力的调查统计[J].大学图书馆学报,2002,20(6):70-72. 被引量：29

二级参考文献2

1薛鹏军.基于知识库的中文网络检索工具－－经济信息智搜索引擎研究.南京农业大学硕士论文[M].,2001..
2赵云志.统计分析法自动标引的改进[J].情报学报,2000,19(4):333-337. 被引量：18

共引文献28

1刘海峰,姚泽清,汪泽焱,张学仁.基于位置的文本特征加权方法研究[J].微电子学与计算机,2009,26(2):188-192. 被引量：9
2熊化宇.谈搜索引擎中Web页面标引关键词的确定[J].图书情报工作,2004,48(9):80-82. 被引量：2
3雷景生,伍庆清,王平.一种基于混合神经网络的Web文档聚类算法[J].计算机工程,2005,31(1):12-13. 被引量：1
4彭寿清.人才埋没的文化根源——浅析儒家文化对人才成长的负效应[J].衡阳师范学院学报,2005,26(2):97-100. 被引量：1
5曹毅,贺卫红.基于向量空间模型的信息安全过滤系统[J].计算机工程与设计,2006,27(2):224-227. 被引量：15
6刘华.关键词自动标引系统实现[J].现代图书情报技术,2006(2):88-90. 被引量：3
7顾燕萍,侯汉清,王晓红.中文图书自动标引与分类加权设计研究[J].中国图书馆学报,2006,32(6):69-72. 被引量：6
8刘海峰,王元元,张学仁.基于潜在语义空间的文本检索问题研究[J].情报科学,2007,25(5):748-753. 被引量：9
9王煜,张浩斌.面向主题的网页采集系统的设计与研究[J].计算机与数字工程,2008,36(4):78-80. 被引量：3
10羊晶璟,鞠时光,王秀红.基于Web的个性化搜索引擎的研究[J].计算机工程与设计,2008,29(20):5206-5208. 被引量：3

同被引文献103

1徐海涛,杨森,柴乔林.基于统计分词的中文邮件智能分类系统[J].华中科技大学学报（自然科学版）,2003,31(S1):325-328. 被引量：1
2徐妙君,顾沈明.面向Web的文本挖掘技术研究[J].控制工程,2003,10(z1):44-46. 被引量：4
3何晓聪.元搜索引擎的理论与实践[J].现代情报,2004,24(8):34-37. 被引量：9
4蒋萍,崔志明.智能搜索引擎中用户兴趣模型分析与研究[J].微电子学与计算机,2004,21(11):24-26. 被引量：32
5刘志为,何丕廉,孙越恒,郑小慎.N层向量空间模型在Web信息检索中的应用[J].微型机与应用,2004,23(12):60-62. 被引量：5
6费洪晓,康松林,朱小娟,谢文彪.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,41(7):67-68. 被引量：68
7薛梅,熊江,杨德仁,顾海,顾君忠.分布式系统中信息内容安全的通用模型研究[J].计算机应用研究,2005,22(5):118-120. 被引量：2
8包金龙.基于向量空间模型的信息检索系统的设计[J].情报杂志,2005,24(7):44-45. 被引量：16
9刘维群,李元臣.Web信息的语义概念检索[J].现代情报,2005,25(7):74-76. 被引量：5
10万国根,秦志光.面向信息内容安全的文本过滤和分类系统研究与实现[J].计算机科学,2005,32(7):159-161. 被引量：2

引证文献21

1白晓梅,张福利.校园网中文搜索引擎系统的设计[J].鞍山师范学院学报,2006,8(6):52-54. 被引量：1
2栾静,李军锋.基于Lucene全文检索引擎的应用研究[J].计算机与数字工程,2010,38(12):184-186. 被引量：5
3黄春毅,邓红军.一种自适应搜索引擎的构建研究[J].情报杂志,2006,25(2):118-120. 被引量：4
4钟哲辉.信息行为选择的向量空间优化研究[J].情报杂志,2006,25(9):127-128.
5席生长,胡宏涛.信息检索技术在中石油勘探与生产分公司门户内的应用研究[J].福建电脑,2008,24(1):102-103. 被引量：1
6廖玲,文敦伟.基于内容粘合性的邮件分类[J].计算机仿真,2008,25(2):121-123. 被引量：1
7徐衍,蒋运韫.信息管理中的中文信息检索[J].商场现代化,2008(12):100-101.
8张映海.基于概念语义同义扩展的文本检索研究[J].计算机与数字工程,2008,36(4):68-71.
9张林,郭兵,张传武,沈艳.基于短信的移动搜索二次排序算法[J].计算机工程,2008,34(10):43-45. 被引量：1
10羊晶璟,鞠时光,王秀红.基于Web的个性化搜索引擎的研究[J].计算机工程与设计,2008,29(20):5206-5208. 被引量：3

二级引证文献34

1车久菊.动态自适应检索在电子商务网站设计的应用[J].科技广场,2008(3):163-164.
2李广健,周浩.用户建模算法的适应性及多算法用户建模研究[J].情报科学,2009,27(4):481-484. 被引量：1
3王平,江华丽.嵌入式网络终端的神经网络邮件过滤技术[J].福建师范大学学报（自然科学版）,2009,25(5):45-49. 被引量：1
4周彩兰,王鹏.基于空间向量模型的用户建模算法改进[J].计算机与数字工程,2010,38(2):15-17. 被引量：6
5王剑,周国民,丘耘,王健.国家农业科学数据中心站内搜索引擎技术研究[J].中国农学通报,2011,27(30):270-274. 被引量：2
6胡泉,胡金柱,谢芳.基于GAE的专业服务网信息获取技术研究[J].电信科学,2011,27(12):21-25. 被引量：1
7丁莉,刘景亮.从文献分析看我国对搜索引擎研究的现状和热点[J].长春师范学院学报（自然科学版）,2011,30(6):179-183. 被引量：1
8何小牧.让中专生在计算机实验课中学会辩证认识网络[J].鞍山师范学院学报,2011,13(6):54-56.
9邹嵩,赵诗阳,周新志.垂直搜索引擎中分词技术的算法研究[J].计算机技术与发展,2012,22(2):131-133. 被引量：3
10毕洪宇.利用NoSQL构建高性能全文检索系统[J].计算机与现代化,2012(3):122-124. 被引量：6

1雷景生.基于多层向量空间模型的Web信息检索方法[J].计算机应用,2004,24(4):26-27. 被引量：4
2张泉.信息检索中索引项权重的研究[J].科技广场,2008(1):38-39. 被引量：1
3陈治纲,何丕廉,孙越恒,郑小慎.基于向量空间模型的文本分类方法的研究与实现[J].计算机应用,2004,24(S1):277-279. 被引量：19
4晋峰,康慕宁,刘健.基于社区网络的搜索引擎的研究[J].科学技术与工程,2011,11(6):1246-1250.
5郑诚,李清,刘福君.改进的VSM算法及其在FAQ中的应用[J].计算机工程,2012,38(17):201-204. 被引量：9
6郑铁然,韩纪庆.汉语语音文档检索中后验概率的索引方法[J].哈尔滨工业大学学报,2009,41(8):97-102.
7王海鹃,韩立新,甄志龙.基于索引项权重的文本特征选择方法[J].计算机工程与设计,2010,31(5):1149-1151. 被引量：4
8王书达,李俊华,杨磊.基于语义本体的信息检索的研究[J].中国科技投资,2014(A10):515-516.
9郭颂,姚建峰,周鹏.基于聚类树的多类标文本分类算法研究[J].信阳师范学院学报（自然科学版）,2017,30(1):140-145. 被引量：1
10任美睿,郭龙江,李金宝.基于改进的向量空间模型的自动文本分类[J].哈尔滨商业大学学报（自然科学版）,2006,22(1):77-80. 被引量：2

计算机工程

2005年第1期

浏览历史

内容加载中请稍等...

基于改进向量空间模型的Web信息检索技术研究被引量：21

参考文献3

二级参考文献2

共引文献28

同被引文献103

引证文献21

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于改进向量空间模型的Web信息检索技术研究 被引量：21

参考文献3

二级参考文献2

共引文献28

同被引文献103

引证文献21

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于改进向量空间模型的Web信息检索技术研究被引量：21