期刊文献+

基于Coreseek+Python的分布式全文检索方法

Distributed Full-text Retrieval Method Based on Coreseek and Python
下载PDF
导出
摘要 将Coreseek全文检索引擎应用到分布式数据检索引擎的构建中,利用Python数据源程序接口对多种类型的数据库进行连接,使检索引擎能够同时对不同类型的数据库进行检索。该方法较好地解决了海量数据查询系统中,单极查询性能有限、数据融合复杂问题,提高了系统的数据检索速度和对不同数据库服务器的兼容性。 This paper uses the Coreseek full-text retrieval engine to buile the distributed search engine and uses the Python data- base API to make connections to nearly all kind of database servers so that the search engine can search different database servers at the same time. This method solves the problem of performance limit for single server and involutes data merging in massive data search system, improves the search speed and the compatibility for different database servers of system.
出处 《计算机与现代化》 2014年第6期7-11,共5页 Computer and Modernization
关键词 搜索引擎 Coreseek全文检索 分布式 Python数据源程序接口 search engine Coreseek ftdl-text retrieval distribute Python database API
  • 相关文献

参考文献16

  • 1蒋建洪.主要分布式搜索引擎技术的研究[J].科学技术与工程,2007,7(10):2418-2424. 被引量:10
  • 2Beijing Choice Software Technology Inc. Coreseek 开源中文检索引擎功能和特性[DB/OL].http://www.coleseek.cn/products/ft_feature,2013-01-06.
  • 3周程远,朱敏,杨云.基于词典的中文分词算法研究[J].计算机与数字工程,2009,37(3):68-71. 被引量:22
  • 4Jain A K, Dubes R C. Algorithms for Clustering Data [M]. Prentice-Hall, 1988.
  • 5Inderjit Dhillon, Jacob Kogan, Charles Nicholas. 4 Feature Selection and Document Clustering [DB/OL]. http://callisto, nsu. ru/documentation/CSIR/selected/doc_ cluste- ringr/kogan, pdf, 2014-03-20.
  • 6Sebastiani F. Text Categorization [DB/OL]. http://nmis, is- ti. cnr. it/sebastiani/Publications/TM05, pdf, 2014-03-20.
  • 7Zobel J, Moffat A. Inverted files for text search engines [J]. ACM Computing Surveys, 2006,38 (2) : 1-56.
  • 8Guyon I, Elisseeff A. An introduction to variable and fea- ture selection [J]. The Journal of Machine Learning Re- search, 2003,3(3/1 ) :1157-1182.
  • 9祈延莉,赵丹群.信息检索概论[M].北京:北京大学出版社,2006.
  • 10吴栋,滕育平.中文信息检索引擎中的分词与检索技术[J].计算机应用,2004,24(7):128-131. 被引量:48

二级参考文献48

  • 1雷葆华,杨明川.P2P技术的组网模式与业务模式探讨[J].电信技术,2004(11):54-57. 被引量:16
  • 2肖红,许少华,李欣.具有三级索引词库结构的中文分词方法研究[J].计算机应用研究,2006,23(8):49-51. 被引量:16
  • 3[1]Ross K W,Rubenstein D.Tutorial on P2P systems.Presented at Infocorn 2003,San Francisco,California,USA,2003
  • 4[5]Breokshier D,Govoni D,Krishnan N,et al.JXTA-JAVA P2P progrmnnfing.Sams Publishing,2002
  • 5[6]Waterhouse S.JXTA search:distributed search for distributed networks.Sun Mierosystems,Inc.http://search.jxta.org
  • 6[7]Dean J,Ghemawat S.Map reduce:Simplified data processing on large clusters.OSDI04:Sixth Symposium on Operating System Design and Implementation,San Francisco,CA,December,2004
  • 7Brin S, Page L. The Anatomy of a Large- Scale Hypertextual Web Search Engine. Proc 7^th World Wide Web Conference, Elsevier Science, Amsterdam, 1998: 107-117.
  • 8赖茂生,科技文献检索,1994年
  • 9搜索引擎面面观.http://www.computer-world.com.cn/98/week/9809/98092803- html
  • 10图象搜索引擎·http://www.chavigator.com.cn/Int-Serv/navigate/topic/tto I/tIo/tIo.htm

共引文献225

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部