一种基于语义理解的元搜索引擎的研究被引量：8

Research on Meta-search Engine Based on Semantic Comprehension

下载PDF

导出

摘要通过对查询短语的结构分析,发现查询短语通常由关键词和特征词构成。特征词是对网页内容的概括,它预示着网页中包含一组特定的特征词条。基于该思想建立了面向Web网页内容的特征库。以元搜索引擎为研究对象,研究了以Web网页内容特征库为基础实现对查询短语进行语义理解的方法,提出了相关度级别的算法,对库中已收入的特征词进行了查询测试,查准率为86.7%。实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果。 By analysis of query phrase structure, the author finds that the query phrase is generally composed of both keyword and the feature word, The feature word generalizes Web page feature, it implies that the Web page consists of some special feature lemma. With this thought the feature base that face to Web page content is built. In the paper, META search engine is studied. The paper discusses how to realize the semantic comprehension on query phrase, which is based on the feature base of Web page content. Meanwhile, it brings forward an algorithm of relativity level. The feature words, which are collected in the feature base, are tested, and the precision ratio is about 86.7%, The test result indicates that the module can realize the semantic comprehension to query phrase, and it has an evident effect to improve the precision of search engine.

作者曹二堂刘玉林

机构地区河北经贸大学计算机中心

出处《计算机工程》 EI CAS CSCD 北大核心 2006年第7期210-211,共2页 Computer Engineering

关键词语义理解网页特征库元搜索引擎 Semantic comprehension Web page feature base Meta search engine

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1中国互联网信息中心.2003年中国互联网络信息资源数量调查报告[R].http://www.cnnic.net.cn/ download/ manual/report20030330.doc:60.
2中国互联网信息中心.第14次中国互联网络发展状况调查统计报告[R].http://www.cnnic.net.cn/ download/2004/2004072002.pdf,2004-07.
3杜阿宁,方滨兴,胡铭曾,云晓春.中文交互式网络搜索引擎及其自学习能力[J].计算机工程与应用,2003,39(10):148-150. 被引量：14
4尤昉,李涓子,王作英.基于《知网》的中文信息结构抽取研究[J].计算机工程与应用,2002,38(18):56-58. 被引量：4
5周强,冯松岩.构建知网关系的网状表示[J].中文信息学报,2000,14(6):21-27. 被引量：11

二级参考文献5

1董振东.语义关系的表达和知识系统的建造[J].语言文字应用,1998(3):79-85. 被引量：59
2李涓子.基于语义依存关系的汉语理解语言模型研究：博士后出站报告[M].北京:清华大学电子工程系,2001..
3张建平.大词汇量连续语音识别中的语言模型和理解算法的研究：博士学位论文[M].北京:清华大学电子工程系,1999..
4王忠,周士波.Internet英文搜索引擎评析[J].图书情报工作,1999,43(4):33-37. 被引量：28
5邹海山,吴勇,吴月珠,陈阵.中文搜索引擎中的中文信息处理技术[J].计算机应用研究,2000,17(12):21-24. 被引量：35

共引文献24

1孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,0(2):21-33. 被引量：22
2李良富,樊孝忠,李宏乔,顾益军.知识是如何驱动Q/A系统的[J].计算机工程与应用,2004,40(20):70-73. 被引量：8
3张辉,吴辉.用户协作式智能搜索模型的研究[J].计算机工程与应用,2005,41(11):155-157. 被引量：3
4曹二堂,刘玉林.基于语义理解的智能搜索引擎的研究[J].情报杂志,2005,24(6):58-59. 被引量：7
5王彤宇,李兴福.应用于学生知识拓展的智能Web检索系统[J].济南职业学院学报,2005(2):57-61.
6许云,樊孝忠,张锋.基于《知网》信息结构模式的词汇化树邻接文法消歧[J].计算机工程,2005,31(13):4-6. 被引量：1
7石晶,戴国忠.基于知网的文本推理[J].中文信息学报,2006,20(1):76-84. 被引量：8
8郑鑫,秦建军,陈汉辉,李伟宏.基于可拓学的自然语言处理与系统建模研究[J].哈尔滨工业大学学报,2006,38(7):1209-1212. 被引量：5
9陈蓉芳,郑晓波,王占朝,王海滨,董秀成.基于“会诊式”推理控制策略的智能型搜索引擎的研究[J].安装,2007(1):43-46. 被引量：1
10刘金媛,张静妙.企业网站制作的几点注意事项[J].商场现代化,2007(06X):47-48.

同被引文献34

1唐培和,杨新伦,刘浩.Google搜索引擎及其实现技术[J].广西工学院学报,2004,15(2):29-33. 被引量：4
2陈伟雄,马少平,步建华.基于元搜索引擎的多关键词检索技术[J].计算机工程与应用,2004,40(24):83-87. 被引量：12
3屈长青,李艳芳.元搜索引擎的关键技术[J].现代计算机,2004,10(5):17-20. 被引量：11
4郭少友.元搜索引擎的原理与设计[J].情报科学,2005,23(2):245-248. 被引量：18
5陈大平.集成搜索引擎与元搜索引擎比较研究[J].大学图书情报学刊,2005,23(1):42-43. 被引量：8
6陈伟斌,张鑫.一种基于校园网的元搜索引擎的研究与设计[J].现代计算机,2005,11(3):44-47. 被引量：2
7庄育飞.搜索引擎的搜索技巧[J].津图学刊,1999(3):37-43. 被引量：4
8陈晶.元搜索引擎实现技术[J].情报杂志,2005,24(5):79-81. 被引量：7
9张莲梅,陈世鸿,陈红梅,许继红,杨璃.基于分布式电力资源库的搜索引擎框架[J].高电压技术,2005,31(8):66-68. 被引量：9
10邱均平,余以胜.基于知识库系统的智能搜索引擎研究[J].情报科学,2006,24(3):413-416. 被引量：12

引证文献8

1王春云,秦杰,胡双双.基于本体的元搜索引擎技术研究[J].计算机系统应用,2008,17(10):96-98.
2陈蓉芳,郑晓波,王占朝,王海滨,董秀成.基于“会诊式”推理控制策略的智能型搜索引擎的研究[J].安装,2007(1):43-46. 被引量：1
3孙卫喜.搜索引擎分析[J].高校实验室工作研究,2007(3):49-52. 被引量：1
4种梅,刘方爱.元搜索引擎中的成员选择和结果合并策略研究[J].计算机工程与设计,2007,28(21):5125-5127. 被引量：5
5王春云,秦杰,胡双双.基于本体的元搜索引擎技术研究[J].微型电脑应用,2008,24(9):8-9. 被引量：1
6李爱军,王海滨,郑晓波.基于推理控制策略的智能型电力搜索引擎的研究[J].西华大学学报（自然科学版）,2008,27(6):34-37. 被引量：2
7潘海霞.基于“会诊式”推理控制策略的智能型搜索引擎的研究[J].价值工程,2011,30(21):147-148.
8王亚辉.基于遗传算法的语义搜索结果排序算法[J].晋城职业技术学院学报,2013,6(1):55-58.

二级引证文献9

1代金晶,纪希禹.基于语义网的智能搜索引擎在数字图书馆中的应用[J].图书馆学研究,2008(9):52-54. 被引量：5
2姜晓刚.农村图书馆检索系统研究[J].安徽农业科学,2010,38(13):7122-7123. 被引量：1
3朝乐门,张勇,邢春晓.面向跨领域海量信息资源的元搜索引擎研究[J].中国图书馆学报,2011,37(2):19-29. 被引量：9
4岳剑文.搜索引擎查询推荐机制的研究[J].时代教育,2012(11):98-98. 被引量：3
5潘志舟,赵靖.基于多中文搜索引擎的可扩展网络混合爬虫[J].安徽科技学院学报,2012,26(6):70-75. 被引量：1
6周莉,王珏,周勇.云计算环境下可视化探索式搜索引擎的研究[J].江西师范大学学报（自然科学版）,2015,39(6):637-641.
7楼凤丹,裴旭斌,王志强,纪德良.基于云计算及大数据技术的电力搜索引擎技术研究[J].电网与清洁能源,2016,32(12):86-92. 被引量：28
8徐昊,曾驰.搜索引擎检索结果网页组织技术与优化策略研究[J].太原城市职业技术学院学报,2016(12):173-175. 被引量：3
9孟椿智,叶耿,谢瑞浩.基于Kafka集群的数据搜索及共享机制在电力企业的应用研究[J].数字技术与应用,2018,36(3):71-72. 被引量：2

1曹二堂,刘玉林.基于语义理解的智能搜索引擎的研究[J].情报杂志,2005,24(6):58-59. 被引量：7
2钟楚玲,朱丹.Web网页内容特征库的构建及应用[J].情报探索,2009(4):88-90.
3严尚维,田绪红,孙爱东,王洁桦.基于关系数据库的XML查询效率测试方法[J].计算机工程与应用,2004,40(2):180-181. 被引量：1
4陈林,杨丹,赵俊芹.基于语义理解的智能搜索引擎研究[J].计算机科学,2008,35(6):152-154. 被引量：13
5陈国松,黄大荣.基于信息熵的TFIDF文本分类特征选择算法研究[J].湖北民族学院学报（自然科学版）,2008,26(4):401-404. 被引量：5
6连远锋,侯锟,张沛露,许建潮.演化计算在特征词条优化中的应用[J].长春工业大学学报,2004,25(1):32-35.
7许高建,路遥,胡学钢,涂立静.一种改进的文本特征选择方法的研究与设计[J].苏州大学学报（工科版）,2008,28(2):18-22. 被引量：4
8许高建,胡学钢,路遥,涂立静.一种改进的文本特征选择方法的研究与设计[J].微型电脑应用,2008,24(5):21-23. 被引量：1
9宋志辉.一种改进的特征选择方法[J].贵州教育学院学报,2009,25(6):54-56. 被引量：1
10张晓伟.网页指纹查重技术的研究[J].价值工程,2014,33(15):225-226.

计算机工程

2006年第7期

浏览历史

内容加载中请稍等...

一种基于语义理解的元搜索引擎的研究被引量：8

参考文献5

二级参考文献5

共引文献24

同被引文献34

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种基于语义理解的元搜索引擎的研究 被引量：8

参考文献5

二级参考文献5

共引文献24

同被引文献34

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

一种基于语义理解的元搜索引擎的研究被引量：8