-
题名基于Softmax回归分类模型的网页搜索排序算法
- 1
-
-
作者
党米花
-
机构
西安交通工程学院人文与管理学院
-
出处
《吉林大学学报(信息科学版)》
CAS
2024年第5期985-990,共6页
-
基金
西安交通工程学院校级中青年基金资助项目(2023KY-17)。
-
文摘
针对网页搜索结果存在返回的网页与搜索的关键词领域不相关的领域漂移现象,导致用户无法搜索到需求信息的问题,提出基于Softmax回归分类模型的网页搜索排序算法。选择网页搜索文本特征,得到相应的特征项,利用向量表示模型,将选择的网页搜索文本特征项转换为格式化数据,对网页搜索文本数据进行均衡处理,获取网页搜索文本数据集。采用Softmax回归分类模型,分类处理网页搜索文本数据集,预测网页搜索文本类别,通过Okapi BM25算法,对网页搜索文本进行排序操作,实现网页搜索排序。实验结果表明,所提算法具有较好的网页搜索排序,提升了网页搜索排序精度,避免网页搜索排序过程中的领域漂移现象。
-
关键词
Softmax回归分类模型
网页搜索排序
文本预处理
TF-IDF算法
Okapi
BM25算法
-
Keywords
softmax regression classification model
sort web search
text preprocessing
term-frequency-inverse document frequency(TF-IDF)algorithm
okapibm25 algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-