期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于Softmax回归分类模型的网页搜索排序算法
1
作者 党米花 《吉林大学学报(信息科学版)》 CAS 2024年第5期985-990,共6页
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页... 针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。 展开更多
关键词 Softmax回归分类模型 网页搜索排序 文本预处理 TF-IDF算法 Okapi BM25算法
下载PDF
基于Elasticsearch的京津冀水环境搜索引擎的设计与实现 被引量:5
2
作者 张会清 张乐 《自动化技术与应用》 2020年第11期29-36,共8页
针对京津冀水环境信息资源出口不一、范围不同,且不能得到精确检索的问题,本文采用Elasticsearch分布式索引检索技术,将京津冀水环境数据资源进行融合共享,构建了京津冀水环境搜索引擎系统。该系统包括数据采集、数据索引、数据检索、... 针对京津冀水环境信息资源出口不一、范围不同,且不能得到精确检索的问题,本文采用Elasticsearch分布式索引检索技术,将京津冀水环境数据资源进行融合共享,构建了京津冀水环境搜索引擎系统。该系统包括数据采集、数据索引、数据检索、界面展示四个模块。重点对搜索的评分机制做了改进并对检索内容进行重排序。通过实验表明,与通用搜索引擎以及传统数据库相比,所实现的搜索引擎系统可以更加准确、快速地实现用户的检索需求。 展开更多
关键词 搜索引擎 Elasticsearch 排序算法 网络爬虫
下载PDF
基于用户兴趣模型两段式排序的隐私保护方法 被引量:1
3
作者 皮俊波 陈珂 +1 位作者 陈刚 董金祥 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第9期1659-1665,共7页
针对现今个性化搜索中用户兴趣模型隐私的保护需要,提出一种基于服务器和客户端协作的用户兴趣模型两段式排序方法.利用基于上下层次结构的树状用户兴趣模型,对其分段在服务器与客户端对搜索结果进行排序,不仅提高了个性化搜索服务质量... 针对现今个性化搜索中用户兴趣模型隐私的保护需要,提出一种基于服务器和客户端协作的用户兴趣模型两段式排序方法.利用基于上下层次结构的树状用户兴趣模型,对其分段在服务器与客户端对搜索结果进行排序,不仅提高了个性化搜索服务质量,而且通过用户可控的开放隐私程度调节,有效地达到了隐私保护的目的;此外,该模型采用动态目录结构,实现了用户兴趣数据的反馈更新,从而使得用户兴趣模型的信息更加精确.实验结果表明:该模型的个性化搜索质量优于Google原始排序结果,这种差距随着用户隐私开放控制程度的提升逐渐变小;在服务器两段排序对中间排序结果的裁剪过程中,只要恰当地选择数据的范围,不仅不会影响个性化搜索服务质量,而且能提高系统运行效率. 展开更多
关键词 用户兴趣模型 动态目录结构 个性化搜索 隐私保护 两段式排序
下载PDF
基于链接结构的PageRank排序算法研究 被引量:1
4
作者 肖铮 庄建 庄重 《电脑知识与技术(过刊)》 2009年第7X期5509-5511,共3页
Web挖掘是知识时代人们对于从海量信息中获取知识的需要。基于链接结构的搜索排序算法是Web结构挖掘技术的产物。搜索引擎将PageRank值与网页搜索结果相似度共同作为搜索结果的排序依据。该值仅依赖于网络的链接结构,而与具体的检索内... Web挖掘是知识时代人们对于从海量信息中获取知识的需要。基于链接结构的搜索排序算法是Web结构挖掘技术的产物。搜索引擎将PageRank值与网页搜索结果相似度共同作为搜索结果的排序依据。该值仅依赖于网络的链接结构,而与具体的检索内容无关。无论得到多少的检索语句,PageRank也是一定的、文件固有的评分量。 展开更多
关键词 web挖掘 搜索排序算法 链接结构 PAGERANK 相似度
下载PDF
一种统一开放的互联网信息搜索排序公式的研究
5
作者 单爱民 《现代计算机》 2005年第3期15-18,共4页
当前的互联网已经达到数十亿网页的规模,因此,在解决搜索速度和查全率的基础上,如何提高查准率,并且把最恰当的、最可信的链接放在返回结果的最前面,成为互联网搜索的关键问题。本文提出了统一开放的排序公式,该公式把不同的排序算法整... 当前的互联网已经达到数十亿网页的规模,因此,在解决搜索速度和查全率的基础上,如何提高查准率,并且把最恰当的、最可信的链接放在返回结果的最前面,成为互联网搜索的关键问题。本文提出了统一开放的排序公式,该公式把不同的排序算法整合在一起,用户可以根据不同的搜索要求动态地调整排序法。最后,给出了该公式一个简单的应用实例。 展开更多
关键词 互联网 信息搜索 排序公式 排序算法 网页集合
下载PDF
基于主题相关性和链接权重的PageRank算法 被引量:4
6
作者 杨格兰 涂立 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第S1期300-303,共4页
在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、... 在基于链接分析的排序算法PageRank分析基础上,提出了一种基于主题相关性和链接权重的Page-Rank改进算法.该方法首先随机选取任一链出页面,通过主题相关性评价算法获得改进的PageRank值,并重新排序.实验结果显示该算法提高了查询速度、查询准确率,并且算法具有良好的稳定性和可扩展性. 展开更多
关键词 万维网 web信息搜索 主题权重 PAGERANK算法 链接权重 排序
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部