期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于Softmax回归分类模型的网页搜索排序算法
1
作者 党米花 《吉林大学学报(信息科学版)》 CAS 2024年第5期985-990,共6页
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页... 针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。 展开更多
关键词 Softmax回归分类模型 网页搜索排序 文本预处理 TF-IDF算法 okapi BM25算法
下载PDF
基于传统文本检索系统的XML索引实现研究 被引量:6
2
作者 陆伟 《情报学报》 CSSCI 北大核心 2006年第6期679-685,共7页
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在... 作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构。在此基础上,深入探讨了XML索引的存储结构及实现。并对索引的性能进行了评价。 展开更多
关键词 文本检索系统 okapi XML索引实现
下载PDF
基于VSM的中文信息检索 被引量:1
3
作者 张新华 骆昌日 曹浪舟 《高等函授学报(自然科学版)》 2006年第4期48-50,共3页
本文介绍了在向量空间模型下,使用Cosine-Measure和OKAPI-Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过针对10字以内的短查询的实验分析,作者发现在相同召回率的情况下,使用OKAPI法来计算相似度得到的检索结果... 本文介绍了在向量空间模型下,使用Cosine-Measure和OKAPI-Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过针对10字以内的短查询的实验分析,作者发现在相同召回率的情况下,使用OKAPI法来计算相似度得到的检索结果,准确率要比Cosine法的高。 展开更多
关键词 VSM 中文信息检索 Cosine—Measure okapi—Measure
下载PDF
新一代图书馆开放服务平台FOLIO应用实践研究 被引量:21
4
作者 叶仁杰 吴元业 《新世纪图书馆》 CSSCI 2020年第2期41-47,共7页
FOLIO是一个具有发展前景的新一代图书馆服务平台。本文以深圳大学图书馆对FOLIO的应用实践为例,介绍FOLIO平台架构、核心网关OKAPI架构及运作流程、FOLIO应用程式开发实践,致力于为其他高校图书馆提供相关FOLIO的研究及实践经验。
关键词 图书馆开放平台 FOLIO okapi 微服务
下载PDF
采用内容挖掘的缅甸文字相似文档检索 被引量:2
5
作者 寸待杰 刘韶涛 《华侨大学学报(自然科学版)》 CAS 北大核心 2013年第5期521-524,共4页
对缅甸文字进行文本挖掘,提出一种新的缅甸文字单字分割算法和词干提取算法.在向量空间模型下,使用Okapi相似度评测方法,评测缅甸文字文档与查询关键字之间的相关性,实现一个基于以上算法的缅甸文字文献检索系统.实验结果证明:所提出来... 对缅甸文字进行文本挖掘,提出一种新的缅甸文字单字分割算法和词干提取算法.在向量空间模型下,使用Okapi相似度评测方法,评测缅甸文字文档与查询关键字之间的相关性,实现一个基于以上算法的缅甸文字文献检索系统.实验结果证明:所提出来的算法能够快速、有效地挖掘Web上的Html文档. 展开更多
关键词 缅甸文字 文本挖掘 向量空间模型 信息检索 okapi相似度
下载PDF
加密文档排序中保序加密算法的最优化选取 被引量:1
6
作者 张久岭 黄道超 沈时军 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第2期266-272,共7页
对需要存储在服务器端的用户文档进行加密是对用户隐私保护的根本方法。采用不同的保序加密算法对加密文档排序结果有着不同的影响,寻找排序结果最优的保序加密算法是亟待解决的问题。提出了基于鉴别信息的保序加密算法选择的标准,比较... 对需要存储在服务器端的用户文档进行加密是对用户隐私保护的根本方法。采用不同的保序加密算法对加密文档排序结果有着不同的影响,寻找排序结果最优的保序加密算法是亟待解决的问题。提出了基于鉴别信息的保序加密算法选择的标准,比较了2种保序加密算法下对加密文档排序的性能。在通过保序加密算法得到的密文分布接近明文分布的情况下,排序得到的结果更接近明文检索的情况。所提出的选择标准具有理论上的意义,同时也可以指导在相同安全条件下保序加密算法的选择,以达到最优的检索结果。 展开更多
关键词 保序加密 okapi BM25模型 鉴别信息 加密信息检索 用户隐私保护
原文传递
基于动态匹配的主题相关度判定算法 被引量:1
7
作者 郑敏 《微电子学与计算机》 CSCD 北大核心 2012年第1期105-108,共4页
本文在基于元数据的判定方法和基于网页内容的语义判定方法的基础上,借鉴哈弗曼编码的思想,提出了一种基于动态匹配的主题相关度算法.该算法通过分析输入数据的类型来采用相适应的判定方法.实验结果表明,从准确率和速度相统一的角度看,... 本文在基于元数据的判定方法和基于网页内容的语义判定方法的基础上,借鉴哈弗曼编码的思想,提出了一种基于动态匹配的主题相关度算法.该算法通过分析输入数据的类型来采用相适应的判定方法.实验结果表明,从准确率和速度相统一的角度看,本文提出的主题相关度算法要优于现有算法. 展开更多
关键词 主题相关度 主题型搜索引擎 okapi公式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部