期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Stability-mutation feature identification of Web search keywords based on keyword concentration change ratio
1
作者 Hongtao LU Guanghui YE Gang LI 《Chinese Journal of Library and Information Science》 2014年第3期33-44,共12页
Purpose: The aim of this paper is to discuss how the keyword concentration change ratio(KCCR) is used while identifying the stability-mutation feature of Web search keywords during information analyses and predictions... Purpose: The aim of this paper is to discuss how the keyword concentration change ratio(KCCR) is used while identifying the stability-mutation feature of Web search keywords during information analyses and predictions.Design/methodology/approach: By introducing the stability-mutation feature of keywords and its significance, the paper describes the function of the KCCR in identifying keyword stability-mutation features. By using Ginsberg's influenza keywords, the paper shows how the KCCR can be used to identify the keyword stability-mutation feature effectively.Findings: Keyword concentration ratio has close positive correlation with the change rate of research objects retrieved by users, so from the characteristic of the 'stability-mutation' of keywords, we can understand the relationship between these keywords and certain information. In general, keywords representing for mutation fit for the objects changing in short-term, while those representing for stability are suitable for long-term changing objects. Research limitations: It is difficult to acquire the frequency of keywords, so indexes or parameters which are closely related to the true search volume are chosen for this study.Practical implications: The stability-mutation feature identification of Web search keywords can be applied to predict and analyze the information of unknown public events through observing trends of keyword concentration ratio.Originality/value: The stability-mutation feature of Web search could be quantitatively described by the keyword concentration change ratio(KCCR). Through KCCR, the authors took advantage of Ginsberg's influenza epidemic data accordingly and demonstrated how accurate and effective the method proposed in this paper was while it was used in information analyses and predictions. 展开更多
关键词 web search web search keyword Information analysis and prediction Concentration change ratio Feature identification Influenza epidemic
原文传递
An Efficient Multi-Keyword Query Processing Strategy on P2P Based Web Search 被引量:2
2
作者 SHEN Derong LI Meifang +1 位作者 ZHU Hongkai YU Ge 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期881-886,共6页
The paper presents a novel benefit based query processing strategy for efficient query routing. Based on DHT as the overlay network, it first applies Nash equilibrium to construct the optimal peer group based on the c... The paper presents a novel benefit based query processing strategy for efficient query routing. Based on DHT as the overlay network, it first applies Nash equilibrium to construct the optimal peer group based on the correlations of keywords and coverage and overlap of the peers to decrease the time cost, and then presents a two-layered architecture for query processing that utilizes Bloom filter as compact representation to reduce the bandwidth consumption. Extensive experiments conducted on a real world dataset have demonstrated that our approach obviously decreases the processing time, while improves the precision and recall as well. 展开更多
关键词 multi-keyword P2P web search CORRELATION coverage and overlap Nash equilibrium
下载PDF
新一代Web搜索引擎中数据的抽取 被引量:3
3
作者 刘向辉 尚振宏 胡建华 《昆明理工大学学报(理工版)》 2000年第3期22-24,共3页
Internet上日新月异的大量信息资源充斥 ,这对搜索引擎提出更高要求 .为提高搜索引擎中Spider的智能化 ,引入一种新的数据模型和文档自动检索模型 ,其中文档自动检索主要由关键字提取和抽取文摘两部分组成 .在此模型基础之上构造全新的... Internet上日新月异的大量信息资源充斥 ,这对搜索引擎提出更高要求 .为提高搜索引擎中Spider的智能化 ,引入一种新的数据模型和文档自动检索模型 ,其中文档自动检索主要由关键字提取和抽取文摘两部分组成 .在此模型基础之上构造全新的数据检索方法 ,用模型匹配的方法搜索网页为此模型提供带权值的信息资源 ,为精确描述WEB信息提供了依据 .这种检索方法同时增强了Spider的适应性 ,简化了编程维护工作量 . 展开更多
关键词 搜索引擎 模型匹配 关键宇提取 检索
下载PDF
P2P Web搜索中一种有效的查询路由策略
4
作者 王振华 李妹芳 +1 位作者 申德荣 于戈 《计算机与数字工程》 2011年第10期13-15,179,共4页
有效的多关键字查询路由是P2PWeb搜索中的一个关键问题。文章提出一种基于收益代价比的查询处理方法。该方法基于DHT的P2P覆盖网,挖掘关键字的关联性和节点间覆盖度和重叠度。利用最小独立置换进行重叠检测,因此避免了对相同记录的冗余... 有效的多关键字查询路由是P2PWeb搜索中的一个关键问题。文章提出一种基于收益代价比的查询处理方法。该方法基于DHT的P2P覆盖网,挖掘关键字的关联性和节点间覆盖度和重叠度。利用最小独立置换进行重叠检测,因此避免了对相同记录的冗余路由。实验证明了该方法显著减少了查询时间,同时提高了查全率和查准率。 展开更多
关键词 P2Pweb搜索 多关键字查询处理 最小独立置换
下载PDF
网络搜索关键词时序变化特征研究——以H7N9禽流感关键词实验为例 被引量:10
5
作者 卢洪涛 李纲 《情报杂志》 CSSCI 北大核心 2014年第11期175-180,共6页
利用网络搜索关键词的搜索量变化来分析和预测相关事物发展趋势是一种逐渐被广泛关注的研究领域。提出网络搜索关键词时序变化特征包括领先、同步和滞后三种特征。通过采集搜索网站关键词的搜索量数据,针对分析预测对象进行时差相关分析... 利用网络搜索关键词的搜索量变化来分析和预测相关事物发展趋势是一种逐渐被广泛关注的研究领域。提出网络搜索关键词时序变化特征包括领先、同步和滞后三种特征。通过采集搜索网站关键词的搜索量数据,针对分析预测对象进行时差相关分析,可以识别出相关关键词时序变化特征。通过H7N9禽流感关键词时序变化特征识别实验,说明该方法的可行性。 展开更多
关键词 网络搜索 关键词 时序变化 H7N9
下载PDF
数据网格中信息服务技术的研究与实现 被引量:4
6
作者 杨辉 南凯 +1 位作者 马永征 阎保平 《计算机应用研究》 CSCD 北大核心 2007年第7期246-248,257,共4页
针对传统数据网格信息服务的不足之处,在分析Web搜索引擎技术和基于关键词的数据库索引技术基础之上,结合这两种信息获取技术,设计了数据网格中结构化数据资源发现技术的体系结构。在科学数据网格信息服务系统中,利用开源Lucene全文检... 针对传统数据网格信息服务的不足之处,在分析Web搜索引擎技术和基于关键词的数据库索引技术基础之上,结合这两种信息获取技术,设计了数据网格中结构化数据资源发现技术的体系结构。在科学数据网格信息服务系统中,利用开源Lucene全文检索软件包,实现了结构化数据资源发现的关键技术。 展开更多
关键词 网格信息服务 web搜索引擎 关键词查询 资源发现
下载PDF
基于数据分析的关键词类网络爬虫设计 被引量:7
7
作者 田晓玲 方园 +1 位作者 贾民政 赵熙雅 《北京工业职业技术学院学报》 2018年第4期36-43,共8页
随着互联网的飞速发展,互联网用户人数和互联网信息飞速增长,使得人们越来越依赖搜索引擎。网络爬虫为搜索引擎中的一个重要的组成部分,是用户获取有效网络资源的强大工具。通过对网络爬虫基本结构、基本工作流程进行分析,利用Python实... 随着互联网的飞速发展,互联网用户人数和互联网信息飞速增长,使得人们越来越依赖搜索引擎。网络爬虫为搜索引擎中的一个重要的组成部分,是用户获取有效网络资源的强大工具。通过对网络爬虫基本结构、基本工作流程进行分析,利用Python实现1个利用关键词进行爬取资源的爬虫,对资料类、资讯类、问题疑难类、新技术类4大类资源进行爬取,并按照需要对数据及数据类别进行分析,具有一定的实用性。 展开更多
关键词 网络爬虫 搜索关键词 PYTHON
下载PDF
基于关键词的深度万维网数据库选择 被引量:11
8
作者 范举 周立柱 《计算机学报》 EI CSCD 北大核心 2011年第10期1797-1804,共8页
该文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库.这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库... 该文提出一种基于关键词的深度万维网查询方法:用户用关键词的方式提交查询,该方法在线地选择能够反映查询意图并且提供高质量结果的万维网数据库.这种方法既避免了深度万维网数据抓取这一代价高、难度大的操作,又可支持多领域的数据库上的关键词查询,从而能够与现有的搜索引擎实现无缝集成.文中侧重于讨论基于关键词的数据库选择,从以下两个方面解决这一问题所涉及的挑战:(1)提出了一种度量关键词-领域属性关联的相关性模型,并设计了基于随机游动的算法从查询日志中发现潜在的关键词-属性关联;(2)给出了一种新的数据采样方法,并用于基于采样的数据库-查询的相关性模型中,最终解决深度万维网的数据库选择问题.在中文深度万维网真实数据集上的实验表明:提出的方法能够有效地选择与关键词查询相关的数据库,提供高质量的结果. 展开更多
关键词 深度万维网 万维网数据库 关键词查询 领域选择 数据库选择
下载PDF
网络搜索关键词“稳定—突变”特征的识别——基于关键词集中度变化率的分析 被引量:3
9
作者 卢洪涛 李纲 《图书情报知识》 CSSCI 北大核心 2014年第3期80-86,共7页
本文主要讨论了关键词集中度变化率对面向信息分析与预测的网络搜索关键词的"稳定—突变"特征的有效识别效果。文章首先介绍什么是关键词"稳定—突变"特征及其意义;其次介绍了关键词集中度变化率的定义以及在关键... 本文主要讨论了关键词集中度变化率对面向信息分析与预测的网络搜索关键词的"稳定—突变"特征的有效识别效果。文章首先介绍什么是关键词"稳定—突变"特征及其意义;其次介绍了关键词集中度变化率的定义以及在关键词选择中的作用;最后通过Ginsberg的流感流行监测关键词的实例分析,说明了关键词集中度变化率对识别关键词"稳定—突变"特征的有效性。 展开更多
关键词 网络搜索 关键词 集中度变化率
下载PDF
一种WWW搜索引擎的设计与实现 被引量:4
10
作者 陈敏 曹阳 刘翀 《计算机工程与应用》 CSCD 北大核心 2002年第7期148-150,共3页
随着Internet在我国的迅速发展和WWW信息的不断增长,迫切需要开发中英文兼容的WWW搜索引擎来获得所需的信息。该文在分析WWW搜索引擎主要功能模块:信息采集模块、信息预处理模块和信息查询模块的基础上,提出采用人工智能搜索算法来遍历... 随着Internet在我国的迅速发展和WWW信息的不断增长,迫切需要开发中英文兼容的WWW搜索引擎来获得所需的信息。该文在分析WWW搜索引擎主要功能模块:信息采集模块、信息预处理模块和信息查询模块的基础上,提出采用人工智能搜索算法来遍历网页,对中英文网页进行自动的索引,并用向量空间的表示方法来表示网页内容和用户输入的查询表达式。实践证明,使用该搜索引擎,可以快速准确地搜索到用户所需的信息。 展开更多
关键词 搜索引擎 网页 索引 关键词 信息采集 人工智能 WWW INTERNET
下载PDF
基于关键词的语义网数据查询研究综述 被引量:7
11
作者 李慧颖 瞿裕忠 《计算机科学》 CSCD 北大核心 2011年第7期18-23,50,共7页
语义网数据的关键词查询是语义网研究的一个重要问题。首先给出语义网数据关键词查询的相关定义。根据研究目标不同,将已有解决方案分为混合型和非混合型的语义网数据关键词查询,后者又分为K-A和K-Q-A两种查询方法。调研了上述分类中当... 语义网数据的关键词查询是语义网研究的一个重要问题。首先给出语义网数据关键词查询的相关定义。根据研究目标不同,将已有解决方案分为混合型和非混合型的语义网数据关键词查询,后者又分为K-A和K-Q-A两种查询方法。调研了上述分类中当前常用的解决方案和研究进展。在此基础上,进一步介绍并比较了8个具有代表性的语义网数据关键词查询工作。最后讨论存在的挑战,并指出未来可能的研究方向。 展开更多
关键词 关键词查询 RDF数据 TOP-K 语义网
下载PDF
基于关键词相关度的搜索引擎设计——以天津电大远程教育资源库为例 被引量:1
12
作者 周莹 《天津电大学报》 2011年第3期43-46,共4页
基于语义Web的关键词相关度的搜索模型,是通过计算搜索关键词在各类教学资源网页主要内容文档块中出现的条件概率,来描述该网页与搜索关键词的相关度,同时利用教学资源网页与资源库课程的归属关系,修正计算的相关度结果。该智能搜索系... 基于语义Web的关键词相关度的搜索模型,是通过计算搜索关键词在各类教学资源网页主要内容文档块中出现的条件概率,来描述该网页与搜索关键词的相关度,同时利用教学资源网页与资源库课程的归属关系,修正计算的相关度结果。该智能搜索系统能够有效地解决用户搜索资源库时返回过多不相关页面的现状,同时根据媒体、课程与关键词的相关度进行排序,使用户能够从系统返回的近似媒体簇中迅速得到有用信息,从而提高检索准确率。 展开更多
关键词 语义web 关键词 相关度 搜索模型 快速检索
下载PDF
一种基于语义网的相似度计算模型 被引量:1
13
作者 王宏生 张敏 《微计算机信息》 2011年第7期227-228,43,共3页
在检索信息时我们经常简单的依靠关键词匹配,往往导致检索结果不全或者不准。随着语义网概念的提出,为我们提供了新的研究方向。本文在传统的计算句子相似度的基础上,提出了把语义网和改进的相似度计算方法相结合,并把该计算模型应用在... 在检索信息时我们经常简单的依靠关键词匹配,往往导致检索结果不全或者不准。随着语义网概念的提出,为我们提供了新的研究方向。本文在传统的计算句子相似度的基础上,提出了把语义网和改进的相似度计算方法相结合,并把该计算模型应用在依靠论文摘要来检索相关论文上。由于语义网的引入,使得搜索变得智能化,从简单的依靠关键词匹配提高到语义层面,从而提高了查全率和查准率。 展开更多
关键词 语义网 相似度计算 搜索引擎
下载PDF
Searching Databases with Keywords 被引量:16
14
作者 ShanWang Kun-LongZhang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2005年第1期55-62,共8页
Traditionally, SQL query language is used to search the data in databases. However, it is inappropriate for end-users, since it is complex and hard to learn. It is the need of end-user, searching in databases with key... Traditionally, SQL query language is used to search the data in databases. However, it is inappropriate for end-users, since it is complex and hard to learn. It is the need of end-user, searching in databases with keywords, like in web search engines. This paper presents a survey of work on keyword search in databases. It also includes a brief introduction to the SEEKER system which has been developed. 展开更多
关键词 relational databases keyword search hidden web information system integration
原文传递
基于搜索引擎工作原理的网站优化分析 被引量:1
15
作者 梁柱 《电脑知识与技术》 2018年第6期37-38,共2页
随着互联网技术发展,企业营销战场从实体店面转移到互联网上的平台,于是有很多企业开始委托他人或自建的方式搭建自己的企业网站,但是并没有太多去思考如何让网站能被更多用户搜寻到。文章介绍如何通过对搜索引擎友好性去优化网站,提高... 随着互联网技术发展,企业营销战场从实体店面转移到互联网上的平台,于是有很多企业开始委托他人或自建的方式搭建自己的企业网站,但是并没有太多去思考如何让网站能被更多用户搜寻到。文章介绍如何通过对搜索引擎友好性去优化网站,提高网站对用户的友好体验,获得搜索引擎的友好收录。进而思考如何改进网站设计,提出优化思路和方法。 展开更多
关键词 搜索引擎 网站优化 关键字 URL优化 网页结构 网站结构
下载PDF
基于多语料库关键词搜索的英汉自动翻译方法 被引量:1
16
作者 贺婧 《自动化与仪器仪表》 2023年第2期170-175,180,共7页
针对当前英汉自动翻译搜索引擎存在关键词提取准确率低,导致英汉翻译效果不佳的问题,设计一个基于多语料库关键词搜索的英汉自动在线翻译系统。通过网络爬虫采集中英文数据并建立一个数据库;然后采用基于词共现+位置信息+相似度的文本... 针对当前英汉自动翻译搜索引擎存在关键词提取准确率低,导致英汉翻译效果不佳的问题,设计一个基于多语料库关键词搜索的英汉自动在线翻译系统。通过网络爬虫采集中英文数据并建立一个数据库;然后采用基于词共现+位置信息+相似度的文本关键词提取算法进行关键词提取,并通过特征词加权计算关键词相似度阀值方法进行英文检索和文本分类;由此实现英汉在线自动翻译。结果表明,对比于传统的TF-IDF算法和基于共现词的关键提取算法,提出的关键词提取算法的查准率、查全率和综合指标均为最高,关键词提取效果更好。提出的改进相似度阀值计算方法的查全率和查准率分别为91.5%和98.2%,相较于现有的编辑距离相似度算法、余弦相似度算法明显更高。且本算法的时间损耗仅为60 s,比另外两种算法分别低了180 s和390 s。由此可知,提出的算法可实现关键词特征准确检索和文本分类,英汉在线翻译效果显著提升,设计的系统具备可行性。 展开更多
关键词 关键词搜索 英汉自动翻译 网络爬虫 词共现 相似度阀值
原文传递
一种在无标注图像库中进行的基于关键词的检索方法 被引量:2
17
作者 焦隽 姜远 +1 位作者 黎铭 周志华 《模式识别与人工智能》 EI CSCD 北大核心 2009年第3期422-426,共5页
提出一种在无标注图像库中进行的基于关键词的检索方法.该方法在用户输入关键词后,首先利用图像周围的文字信息从网页中过滤一部分与检索主题无关的图像.然后利用图像的视觉特征在之前的基础上筛选出与检索词具有高度相关性的图像.最后... 提出一种在无标注图像库中进行的基于关键词的检索方法.该方法在用户输入关键词后,首先利用图像周围的文字信息从网页中过滤一部分与检索主题无关的图像.然后利用图像的视觉特征在之前的基础上筛选出与检索词具有高度相关性的图像.最后利用数据审计技术对筛选出的图像进行进一步精化,并利用精化后的图像对图像库进行检索.实验结果表明,借助数据审计技术,该方法可有效提高对无标注图像库进行基于关键词的检索性能. 展开更多
关键词 图像检索 图像标注 基于关键词的检索 web搜索 数据审计
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部