期刊文献+
共找到7,145篇文章
< 1 2 250 >
每页显示 20 50 100
递归型数据中心网络上g-额外连通度及容错单播算法研究
1
作者 伊雯雯 王喜 张书奎 《计算机应用与软件》 北大核心 2024年第1期261-268,290,共9页
数据中心网络的研究是近几年兴起的热点。与传统的树型数据中心网络相比,递归型数据中心网络具有更好的容错性和可扩展性。部署于n-口交换机上的k-维递归型完全图网络可以表示为Xk,n,σ表示图中任意顶点与同维度其他子图相连接的边数。... 数据中心网络的研究是近几年兴起的热点。与传统的树型数据中心网络相比,递归型数据中心网络具有更好的容错性和可扩展性。部署于n-口交换机上的k-维递归型完全图网络可以表示为Xk,n,σ表示图中任意顶点与同维度其他子图相连接的边数。在实际情况中,网络的额外连通度相较于传统的连通度能够更准确地衡量一个网络的容错性。证明当k≥3,n≥3,σ∈{1,n-1}且0≤g≤2时,Xk,n的g-额外连通度为(g+1)(kσ-1)+n,这一结果接近于其连通度的g+1倍。进一步,提出基于该情形下的容错单播算法,并证明了该算法的时间复杂度和在最坏情况下Xk,n中任意两点间构造出路径长度的上界。通过模拟仿真实验,验证了该算法在执行效率上优于广度优先和深度优先搜索算法,且算法具有较好的容错性。 展开更多
关键词 递归型数据中心网络 容错性 额外连通度 容错单播算法 算法分析
下载PDF
融合注意力机制的自编码器推荐算法
2
作者 王永 刘岽 +1 位作者 杜锡为 肖玲 《运筹与管理》 CSCD 北大核心 2024年第2期57-63,共7页
为充分获取用户的个性化信息,提高推荐算法的准确性,提出了一种融合注意力机制的自编码器推荐算法。所提算法首先针对数据中蕴含的低阶特征和高阶特征,专门设计了相应的特征提取模块,增强传统编码器的泛化能力和记忆能力,然后利用注意... 为充分获取用户的个性化信息,提高推荐算法的准确性,提出了一种融合注意力机制的自编码器推荐算法。所提算法首先针对数据中蕴含的低阶特征和高阶特征,专门设计了相应的特征提取模块,增强传统编码器的泛化能力和记忆能力,然后利用注意力机制对特征进行融合,得到关于用户偏好信息的向量表示,并通过解码器预测用户对物品的购买意愿,最终实现个性化推荐任务。在ML-100K,ML-1M和Yahoo Music三个数据集上进行实验,并与主流个性化推荐算法进行对比,本文算法在Precision,Recall,F1值和归一化折损累计增益(NDCG)四个指标上均有较大的提升。在互联网推荐场景下,本文算法能够充分挖掘出用户的偏好信息,为用户提供高质量的推荐结果即给出合理的物品购买决策建议,从而最大化满足用户需求。 展开更多
关键词 推荐算法 自编码器 注意力机制 协同过滤
下载PDF
基于知识图谱的中药材新闻推荐方法研究
3
作者 郭崇慧 朱墟 吴吴卓青 《工程管理科技前沿》 北大核心 2024年第2期38-47,共10页
中药材新闻推荐是典型的垂直领域新闻推荐问题。为了有效运用领域知识,本文提出一种基于知识图谱的中药材新闻推荐方法。首先,从中药典籍中抽取实体和关系,构建中药材知识图谱;其次,从新闻标题中匹配实体,结合词嵌入和实体嵌入,通过基... 中药材新闻推荐是典型的垂直领域新闻推荐问题。为了有效运用领域知识,本文提出一种基于知识图谱的中药材新闻推荐方法。首先,从中药典籍中抽取实体和关系,构建中药材知识图谱;其次,从新闻标题中匹配实体,结合词嵌入和实体嵌入,通过基于注意力机制的知识感知卷积神经网络得到新闻嵌入表示;再次,基于用户历史点击新闻及侧面信息,运用基于知识图谱和注意力网络的中药材新闻推荐模型,生成Top-K推荐列表。在2个真实数据集上的实验表明,本文方法的HR@10指标(0.750、0.788)和MAP@10指标(0.468、0.471)均优于基线方法。本文将知识图谱引入中药材新闻推荐,提升了推荐质量,且具有一定的可解释性。 展开更多
关键词 新闻推荐 知识图谱 注意力机制 中药材
下载PDF
基于决策树的图书馆文献资源智能检索方法
4
作者 宋亭 《自动化技术与应用》 2024年第4期63-66,共4页
当前图书馆文献资源类型存在差异,检索过程中排序效果差,提出一种基于决策树的图书馆文献资源智能检索方法。智能检索中需要图书馆文献资源库去除噪声,获取有效数据,使用Skip-gram模型进行文字类资源特征提取,利用卷积神经网络作为图像... 当前图书馆文献资源类型存在差异,检索过程中排序效果差,提出一种基于决策树的图书馆文献资源智能检索方法。智能检索中需要图书馆文献资源库去除噪声,获取有效数据,使用Skip-gram模型进行文字类资源特征提取,利用卷积神经网络作为图像文献资源的特征提取工具,提取过程采用Dropout机制随机断开部分网络连接,利用决策树从无规则次序数据库中推理出分类规则,计算属性与图书馆文献类型之间相关性,完成智能检索。测试结果表明:所提方法在不同数据集下的资源排序质量均优于传统检索方法。 展开更多
关键词 决策树 资源智能检索 并行计算 文献资源 资源数据库
下载PDF
基于知识图谱的个性化音乐推荐系统设计与实现
5
作者 李津 《科学技术创新》 2024年第2期127-130,共4页
本文基于知识图谱技术设计了个性化音乐推荐系统。该系统由用户端、管理端、服务端以及数据库组成。用户完成注册并登录系统后,可以通过输入关键词等方式检索对应的歌曲和歌单,并将其添加收藏,管理员可查看并编辑用户信息。当用户再次... 本文基于知识图谱技术设计了个性化音乐推荐系统。该系统由用户端、管理端、服务端以及数据库组成。用户完成注册并登录系统后,可以通过输入关键词等方式检索对应的歌曲和歌单,并将其添加收藏,管理员可查看并编辑用户信息。当用户再次登录该系统时,系统会根据之前用户的操作行为向用户精准推送个性化的歌曲和歌单,并在网站主页上显示。从测试情况来看,该系统的音乐推荐、歌曲搜索、歌曲收藏等基本功能可以实现,系统各项操作的平均响应时间均在1 s以内,使用体验较好。 展开更多
关键词 知识图谱 个性化音乐推荐系统 数据库 响应时间
下载PDF
多域物联网中基于区块链技术的网络安全控制研究
6
作者 朱婧 《贵阳学院学报(自然科学版)》 2024年第1期47-52,共6页
物联网应用越来越广泛,但具有网络安全性差、易受到网络攻击的隐患,为保证多域物联网的安全,基于区块链技术对多域物联网的网络安全控制系统进行了设计。该物联网安全系统采用区块链技术建立,主要包括用户和设备层、身份认证层和服务层... 物联网应用越来越广泛,但具有网络安全性差、易受到网络攻击的隐患,为保证多域物联网的安全,基于区块链技术对多域物联网的网络安全控制系统进行了设计。该物联网安全系统采用区块链技术建立,主要包括用户和设备层、身份认证层和服务层。对指纹感知语音的身份认证方式进行了设计,采用哈希算法进行指纹图像的特征识别、提取哈希值,为了提高安全性,将指纹图像采用数字水印的方式嵌入语音中。对明文的加密和解密方式进行了设计,采用SM2算法(椭圆曲线公钥密码算法)分别进行随机数生成、密钥派生函数和杂凑算法的计算。为验证物联网安全系统的性能,对其进行指纹图像身份认证的安全性和明文加密性能测试。试验结果表明:该系统人员身份的识别正确率可以达到90%以上,保证身份认证的安全;系统可以对文件进行加密,与RSA算法(非对称加密算法)相比运算速度提高23%、吞吐率提高4.7%。 展开更多
关键词 多域物联网 区块链技术 网络安全控制系统
下载PDF
基于机器学习算法的在线推荐系统设计与性能优化研究
7
作者 魏芬 《信息与电脑》 2024年第3期89-91,共3页
传统运营方式已经难以应对日益复杂的业务场景。特别是电商领域,采用个性化推荐系统对于改善用户体验、促进商品销售、提高广告点击率具有重要意义。文章以电商场景为例,设计了基于机器学习算法的在线推荐系统,并对该系统进行了性能优化。
关键词 机器学习算法 在线推荐系统 性能优化
下载PDF
基于多模态融合的图神经网络推荐算法
8
作者 吴志强 解庆 +1 位作者 李琳 刘永坚 《计算机工程》 CSCD 北大核心 2024年第1期91-100,共10页
已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加... 已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,不能区分用户对不同模态信息的偏好。针对上述问题,提出多模态融合的GNN推荐模型。首先针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;然后利用GAT聚合邻居信息,丰富本节点表示,同时根据门控循环单元决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明:多模态信息、注意力融合机制能有效提升推荐的准确度,算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升;当评估指标K值选取10时,Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。 展开更多
关键词 多模态推荐 多模态融合 注意力机制 图神经网络 推荐系统 门控图神经网络
下载PDF
基于特征增强和语义相关性匹配的图像文本检索方法
9
作者 陈佳 张鸿 《计算机应用》 CSCD 北大核心 2024年第1期16-23,共8页
为实现图像文本检索中图像与文本的精确语义连接,提出一种基于特征增强和语义相关性匹配(FESCM)的图像文本检索方法。首先,通过特征增强表示模块,引入多头自注意力机制增强图像区域特征和文本单词特征,以减少冗余信息对图像区域和文本... 为实现图像文本检索中图像与文本的精确语义连接,提出一种基于特征增强和语义相关性匹配(FESCM)的图像文本检索方法。首先,通过特征增强表示模块,引入多头自注意力机制增强图像区域特征和文本单词特征,以减少冗余信息对图像区域和文本单词对齐的干扰;其次,通过语义相关性匹配模块,不仅利用局部匹配捕获局部显著对象之间的对应相关性,还把图像背景信息融入图像全局特征,利用全局匹配实现精确的全局语义相关性;最后,通过局部匹配分数和全局匹配分数获取图像和文本的最终匹配分数。实验结果表明,基于FESCM的图像文本检索方法在Flickr8k和Flickr30k基准数据集上的召回率总值比扩展的视觉语义嵌入方法分别提升了5.7和7.5个百分点,在MS-COCO数据集比双流层次相似度推理方法提升了3.7个百分点。因此该方法可以有效提高图像文本检索的准确度,实现图像与文本的语义连接。 展开更多
关键词 图像文本检索 特征增强表示 多头自注意力机制 语义相关性匹配
下载PDF
在线学习个性化推荐中多维度学习者模型研究
10
作者 刘芳 田枫 +3 位作者 李欣 刘宗堡 黄美晨 赵玲 《信息技术》 2024年第1期44-51,共8页
随着在线学习平台的广泛使用,在线学习资源快速增长,“信息迷航”问题亟待解决。针对在线学习个性化推荐中以单一特征为主,多维度学习者模型研究较少的问题,文中以CELTS-11学习者模型规范为基础,以教育学相关理论为指导,对学习者的学习... 随着在线学习平台的广泛使用,在线学习资源快速增长,“信息迷航”问题亟待解决。针对在线学习个性化推荐中以单一特征为主,多维度学习者模型研究较少的问题,文中以CELTS-11学习者模型规范为基础,以教育学相关理论为指导,对学习者的学习风格、知识状态、认知能力、兴趣偏好等多维度的个性化特征进行细化分类研究。利用教育数据挖掘等技术获得学习者特征项,进而构建出个性化的多维度学习者模型。该模型为后续在线学习个性化的推送服务提供有力的依据。 展开更多
关键词 个性化推荐 多维度学习者模型 学习风格 认知能力 知识状态
下载PDF
基于无监督语义哈希的高效相似题检索模型
11
作者 佟威 何理扬 +3 位作者 李锐 黄威 黄振亚 刘淇 《计算机应用》 CSCD 北大核心 2024年第1期206-216,共11页
相似题检索旨在从数据库中找到与给定查询试题考查目标相似的试题。随着在线教育的不断发展,试题数据库日益庞大,且由于试题数据的专业属性使标注相关性非常困难,因此需要一种高效且无需标注的相似题检索模型。无监督语义哈希能在无监... 相似题检索旨在从数据库中找到与给定查询试题考查目标相似的试题。随着在线教育的不断发展,试题数据库日益庞大,且由于试题数据的专业属性使标注相关性非常困难,因此需要一种高效且无需标注的相似题检索模型。无监督语义哈希能在无监督信号的前提下将高维数据映射为低维且高效的二值表征。但不能简单地将语义哈希模型应用在相似题检索模型中,因为试题数据具有丰富的语义信息,而二值向量的表征空间有限。为此,提出一个能获取、保留关键信息的相似题检索模型。首先,设计了一个关键信息获取模块获取试题数据的关键信息,并引入去冗余目标损失去除冗余信息;其次,在编码过程中引入随时间变化的激活函数,减少编码信息损失;再次,为了最大化利用汉明空间,在优化过程中引入比特平衡目标和比特无关目标以优化二值表征的分布。在MATH和HISTORY数据集上的实验结果表明,相较于表现最好的文本语义哈希模型DHIM(Deep Hash InfoMax),所提模型在2个数据集的3个召回率设置上分别平均提升约54%和23%;在检索效率方面,所提模型比最优的相似题检索模型QuesCo具有明显的优势。 展开更多
关键词 相似题检索 无监督语义哈希 表征学习 对比学习
下载PDF
基于多特征融合神经网络的遥感影像推荐方法
12
作者 王梅瑞 楚博策 +4 位作者 孔二旦 陈金勇 朱进 李峰 王士成 《无线电工程》 2024年第2期378-389,共12页
针对目前遥感用户获取遥感影像时采用的人工查询和订购方式较为低效的问题,提出了一种基于多特征融合神经网络的遥感影像个性化推荐框架。设计遥感影像语义体系实现影像语义提取,结合用户操作记录与职责描述文本构建遥感领域知识图谱。... 针对目前遥感用户获取遥感影像时采用的人工查询和订购方式较为低效的问题,提出了一种基于多特征融合神经网络的遥感影像个性化推荐框架。设计遥感影像语义体系实现影像语义提取,结合用户操作记录与职责描述文本构建遥感领域知识图谱。通过嵌入表征方法提取用户与影像的多维度属性特征。设计了一种基于协同过滤的多特征融合神经网络模型,借助神经网络的高维度空间建模能力实现用户与影像多维属性特征的有效融合,达到较好的配对推荐效果。实验结果显示,相较于先前的推荐方法,所提方法的性能获得显著提高,有效提升了遥感数据服务的精准度与时效性。 展开更多
关键词 主动推荐 遥感影像 特征融合 神经网络
下载PDF
面向多源异构数据的个性化搜索和推荐算法综述
13
作者 暴琳 朱志宇 +1 位作者 孙晓燕 徐标 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第2期189-209,共21页
高效精准的个性化搜索、推荐等服务可为人们生产生活带来极大便利,而随着互联网技术的迅猛发展,面向多源异构数据的个性化搜索和推荐任务逐渐变得日趋复杂,也是当前大数据分析及个性化服务领域的研究热点和难点.个性化搜索和推荐算法广... 高效精准的个性化搜索、推荐等服务可为人们生产生活带来极大便利,而随着互联网技术的迅猛发展,面向多源异构数据的个性化搜索和推荐任务逐渐变得日趋复杂,也是当前大数据分析及个性化服务领域的研究热点和难点.个性化搜索和推荐算法广泛收集多源异构数据,获取用户偏好信息,利用各类机器学习、深度学习等技术,构建用户兴趣偏好模型,预测用户偏好,推荐满足用户个性化需求和偏好的项目或内容,提升用户的使用体验和网站平台的商业利益.本文介绍面向多源异构数据的个性化搜索问题的数学描述,综述面向多源异构数据的个性化搜索和推荐算法的相关研究工作,包括:传统个性化搜索和推荐算法、融合多源异构数据的个性化搜索和推荐算法以及动态个性化搜索和推荐算法等相关研究现状,整理了算法常用数据集、性能评价指标及评估体系,进一步阐明了目前面向多源异构数据的个性化搜索和推荐方法的实际应用场景及今后研究的发展方向,并讨论了存在的不足及所面临的严峻挑战,期望为相关领域的研究人员提供有益帮助. 展开更多
关键词 个性化搜索 多源异构数据 用户兴趣模型 深度学习
下载PDF
深度双模态源域对称迁移学习的跨模态检索
14
作者 刘秋杰 万源 吴杰 《计算机应用》 CSCD 北大核心 2024年第1期24-31,共8页
基于深度网络的跨模态检索经常面临交叉训练数据不足的挑战,这限制了训练效果并容易导致过拟合。迁移学习在源域中训练数据的知识迁移学习到目标域中,能有效解决训练数据不足的问题。然而,现有的大部分迁移学习方法致力于将知识从单模态... 基于深度网络的跨模态检索经常面临交叉训练数据不足的挑战,这限制了训练效果并容易导致过拟合。迁移学习在源域中训练数据的知识迁移学习到目标域中,能有效解决训练数据不足的问题。然而,现有的大部分迁移学习方法致力于将知识从单模态(如图像)源域迁移到多模态(如图像和文本)目标域,而如果源域中已存在多种模态信息,这样的非对称迁移会忽略源域中包含的潜在的模态间语义信息;同时这些方法不能很好地提取源域与目标域中相同模态的相似性,进而减小域差异。因此,提出一种深度双模态源域对称迁移学习的跨模态检索(DBSTL)方法。该方法旨在实现从双模态源域到跨模态目标域的知识迁移,并获得跨模态数据的公共表示。DBSTL由模态对称迁移子网和语义一致性学习子网构成。模态对称迁移子网采用混合对称结构,在知识迁移过程中,使模态间信息具有更高的一致性,并能减小源域与目标域间的差异;而语义一致性学习子网中,所有模态共享相同的公共表示层,并在目标域的监督信息指导下保证跨模态语义的一致性。实验结果表明,在Pascal、NUS-WIDE-10k和Wikipedia数据集上,所提方法的平均精度均值(mAP)较对比方法得到的最好结果分别提升了大约8.4、0.4和1.2个百分点。DBSTL充分利用了双模态源域的潜在信息进行对称迁移学习,在监督信息的指导下保证了模态间语义的一致性,并提高了公共表示空间中图像文本分布的相似性。 展开更多
关键词 跨模态检索 迁移学习 双模态源域 语义一致性
下载PDF
基于边缘计算的融合多因素的个性化推荐算法
15
作者 金焕章 朱容波 +1 位作者 刘浩 陈慧敏 《中南民族大学学报(自然科学版)》 CAS 2024年第2期217-225,共9页
针对传统推荐算法使用单一上下文信息不能有效地解决信息过载、数据稀疏、冷启动的问题,提出了一种基于边缘计算的融合多因素的个性化推荐算法F-SVD和新的用户相似度计算方法F-PEARSON(改进后的PEARSON相关系数).在边缘服务器处理个性... 针对传统推荐算法使用单一上下文信息不能有效地解决信息过载、数据稀疏、冷启动的问题,提出了一种基于边缘计算的融合多因素的个性化推荐算法F-SVD和新的用户相似度计算方法F-PEARSON(改进后的PEARSON相关系数).在边缘服务器处理个性化用户数据以分散云服务器的压力,目前大多采用的集中式处理方式无法在爆炸性式增长的数据下提供准确的推荐,在云服务器融合多因素挖掘用户之间的潜在关系,从而构建预测F-SVD算法.实验结果表明:在公开数据集MovieLens上,与传统算法相比,所提出的算法在RMSE和MAE上的误差更小,精确度提升了2.2%. 展开更多
关键词 边缘计算 个性化推荐 多因素 数据稀疏 冷启动
下载PDF
基于数据挖掘的智慧图书馆信息自动化检索系统设计
16
作者 吴小凤 《自动化技术与应用》 2024年第4期155-158,168,共5页
由于检索系统信息种类检索准确性低,提出基于数据挖掘的智慧图书馆信息自动化检索系统。优化中央控制器的开发板和芯片,选定NAND Flash芯片构建系统数据存储器。采用MAX232芯片完成信息传输电路。通过数据挖掘算法计算图书信息中的关键... 由于检索系统信息种类检索准确性低,提出基于数据挖掘的智慧图书馆信息自动化检索系统。优化中央控制器的开发板和芯片,选定NAND Flash芯片构建系统数据存储器。采用MAX232芯片完成信息传输电路。通过数据挖掘算法计算图书信息中的关键词相似性并进行滤波处理,使用数据挖掘算法中的关联规则算法优化信息分类模块,实现图书馆信息自动化检索系统。实验表明,系统信息检索精确度较高,有效提高了信息种类检索准确性。 展开更多
关键词 智慧图书馆 数据挖掘 信息检索
下载PDF
联合对比学习的图神经网络会话推荐
17
作者 刘乾 孙英娟 +1 位作者 邢晶淇 车志敏 《长春师范大学学报》 2024年第2期68-72,共5页
基于会话的推荐(SBR)是一项具有挑战性的任务,其目的是根据匿名行为序列推荐项目。本文提出了一种新的方法,称为联合对比学习的图神经网络会话推荐(CLGNN),在图注意力机制的基础上,用对比学习辅助训练,以获得更好的推荐结果。具体来说,C... 基于会话的推荐(SBR)是一项具有挑战性的任务,其目的是根据匿名行为序列推荐项目。本文提出了一种新的方法,称为联合对比学习的图神经网络会话推荐(CLGNN),在图注意力机制的基础上,用对比学习辅助训练,以获得更好的推荐结果。具体来说,CLGNN首先在会话图上采用注意力机制学习项目嵌入,然后聚合会话内的项目生成会话嵌入,最后使用会话嵌入和候选项目嵌入计算分数生成推荐,同时使用对比学习优化项目嵌入空间。以几种常见的评价指标为依据,在真实的两个数据集上进行实验,结果表明本文模型推荐性能良好。 展开更多
关键词 会话推荐 图神经网络 对比学习 图注意力机制
下载PDF
融合电影流行性与观影时间的协同过滤算法
18
作者 钱泽俊 刘润然 《网络安全与数据治理》 2024年第2期54-63,共10页
相似度评估作为协同过滤推荐算法的核心,尽管研究人员对其不断改进,却仍难以在各个维度上充分利用评价数据。针对这一挑战,首先以用户与电影之间的相互影响方式作为切入点,对二者间可能存在的自洽逻辑进行探究,提出了电影流行度计算公... 相似度评估作为协同过滤推荐算法的核心,尽管研究人员对其不断改进,却仍难以在各个维度上充分利用评价数据。针对这一挑战,首先以用户与电影之间的相互影响方式作为切入点,对二者间可能存在的自洽逻辑进行探究,提出了电影流行度计算公式用于对电影进行加权;接着以用户观影时间作为研究对象,探究用户观影喜好的转变与观影时间顺序之间的联系,并结合肯德尔相关系数提出了观影顺序一致性度量公式;最后将以上研究内容与传统相似度算法融合,并基于Netflix Prize数据集与豆瓣电影评价数据集对改进后的相似度算法进行验证。实验结果表明改进后的相似度算法拥有更高的推荐准确度。 展开更多
关键词 推荐算法 协同过滤 相似度算法 电影流行度 观影时间
下载PDF
一种新型高效全文检索引擎的设计
19
作者 董宗然 闻柏智 朱毅 《软件工程》 2024年第2期44-48,共5页
为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中... 为了改善常规存储方式模糊查询性能较低的问题,提出一种针对大文本文档数据的高效模糊查询方法。通过对文档建立倒排索引,将索引以及部分文档信息提取到内存中以降低磁盘输入和输出(Input/Output,I/O)。根据内存中的倒排索引和数据库中主键形成的映射查询数据,然后通过相关度算法对这些数据进行排序,并以字典树作为搜索提示,实现高效的全文检索。实验结果表明:与ElasticSearch使用相同词集时,随着测试数据量的变化,所设计的全文检索引擎的查询效率是ElasticSearch效率的80~1200倍,其效率优势随着数据量增加呈现反比例关系变化,并且在17919条文档数据下,其内存占用不超过2.5 GB,适合用于海量文档数据检索。 展开更多
关键词 倒排索引 全文检索 检索引擎 模糊查询 字典树
下载PDF
基于知识图谱的区域创新系统研究热点与趋势分析
20
作者 刘勇 郭文巧 《电脑与信息技术》 2024年第2期90-94,共5页
在知识经济时代的背景下,区域创新系统得到学术界的广泛关注并积累了海量数据。文章基于中国知网(CNKI)数据库检索与区域创新系统领域的期刊论文,运用可视化文献分析工具CiteSpace进行知识图谱分析,研究分析国内区域创新系统的研究热点... 在知识经济时代的背景下,区域创新系统得到学术界的广泛关注并积累了海量数据。文章基于中国知网(CNKI)数据库检索与区域创新系统领域的期刊论文,运用可视化文献分析工具CiteSpace进行知识图谱分析,研究分析国内区域创新系统的研究热点及发展趋势。研究结果表明,区域创新系统领域的主要内容包括科技创新、产业集群、技术创新、创新主体、创新系统、创新政策等。区域创新系统领域最新研究的前沿集中在协同创新和科技创新等方面。 展开更多
关键词 区域创新系统 CITESPACE 知识图谱
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部