期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
Similar physical entity matching strategy for mobile edge search 被引量:1
1
作者 Puning Zhang Xuyuan Kang 《Digital Communications and Networks》 SCIE 2020年第2期203-209,共7页
In recent years,a large number of intelligent sensing devices have been deployed in the physical world,which brings great difficulties to the existing entity search.With the increase of the number of intelligent sensi... In recent years,a large number of intelligent sensing devices have been deployed in the physical world,which brings great difficulties to the existing entity search.With the increase of the number of intelligent sensing devices,the accuracy of the search system in querying the entities to match the user’s request is reduced,and the delay of entity search is increased.We use the mobile edge technology to alleviate this problem by processing user requests on the edge side and propose a similar physical entity matching strategy for the mobile edge search.First,the raw data collected by the sensor is lightly weighted and expressed to reduce the storage overhead of the observed data.Furthermore,a physical entity matching degree estimation method is proposed,in which the similarity between the sensor and the given sensor in the network is estimated,and the matching search of the user request is performed according to the similarity.Simulation results show that the proposed method can effectively reduce the data storage overhead and improve the precision of the sensor search system. 展开更多
关键词 Mobile edge computing Internet of things search Entity matching similarity calculation
下载PDF
Efficient secure and verifiable KNN set similarity search over outsourced clouds
2
作者 Xufeng Jiang Lu Li 《High-Confidence Computing》 2023年第1期38-46,共9页
KNN set similarity search is a foundational operation in various realistic applications in cloud computing.However,for security consideration,sensitive data will always be encrypted before uploading to the cloud serve... KNN set similarity search is a foundational operation in various realistic applications in cloud computing.However,for security consideration,sensitive data will always be encrypted before uploading to the cloud servers,which makes the search processing a challenging task.In this paper,we focus on the problem of KNN set similarity search over the encrypted datasets.We use Yao’s garbled circuits and secret sharing as underlying tools.To achieve better querying efficiency,we construct a secure R-Tree index structure based on a novel secure grouping protocol,which enables grouping appropriate private values in an oblivious way.Along with several elaborately designed secure arithmetic subroutines,we propose an efficient secure and verifiable KNN set similarity search framework over outsourced clouds.Theoretically,we analyze the complexity of our schemes in detail,and prove the security in the presence of semi-honest adversaries.Finally,we evaluate the performance and feasibility of our proposed methods by extensive experiments. 展开更多
关键词 Privacy preservation KNN set similarity search Yao’s garbled circuits Cloud computing
下载PDF
基于相似查询树的快速密文检索方法 被引量:7
3
作者 田雪 朱晓杰 +2 位作者 申培松 陈驰 邹洪 《软件学报》 EI CSCD 北大核心 2016年第6期1566-1576,共11页
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查... 随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强. 展开更多
关键词 云计算 密文检索 多关键字排序检索 相似查询树 云安全
下载PDF
含有丰富结构化数据的Web页面分类技术的研究 被引量:5
4
作者 赵志滨 贾岩峰 +1 位作者 姚兰 鲍玉斌 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期53-60,共8页
Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分... Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分类方法.针对含有丰富结构化数据的Web页面,提出了复用结构化数据抽取模板来进行Web页面主题识别的分类框架.该框架首先解析Web页面的组织结构,通过属性探测算法,获得Web页面所包含的主题关键词.进一步通过计算主题关键词与结构化抽取模板的相似性来判定Web页面的主题并按照领域进行分类.该方法避免了主题爬虫对URL格式严重依赖的问题,分类准确率也高于传统的文本分类方法.通过实验证明了框架在含有丰富结构化数据的Web页面分类方面的有效性. 展开更多
关键词 垂直搜索 结构化数据 网页分类 模板 相似性计算
下载PDF
云计算中加密数据的模糊关键字搜索方法 被引量:9
5
作者 杜军强 杨波 《计算机工程与应用》 CSCD 北大核心 2015年第5期146-152,227,共8页
传统的可搜索加密方案仅支持精确匹配的搜索,在效率和性能上都不能适应云计算环境。用支持多种字符串相似性操作的R+树构建索引,实现了云计算中对加密数据的模糊关键字搜索;用编辑距离来量化关键字的相似度,提出了一种可以返回与关键字... 传统的可搜索加密方案仅支持精确匹配的搜索,在效率和性能上都不能适应云计算环境。用支持多种字符串相似性操作的R+树构建索引,实现了云计算中对加密数据的模糊关键字搜索;用编辑距离来量化关键字的相似度,提出了一种可以返回与关键字更接近的文件检索方法。通过字符串聚类提高了模糊关键字搜索的效率。 展开更多
关键词 模糊搜索 相似性操作 R+树 编辑距离 云计算
下载PDF
结构化对等计算系统中的高维相似搜索 被引量:6
6
作者 徐林昊 周傲英 《计算机学报》 EI CSCD 北大核心 2006年第11期1982-1994,共13页
对等计算数据管理中的一个重要问题是如何有效地支持高维空间中的相似性搜索.文章采用了一种有效的空间划分策略,提出了一种基于Chord系统的相似搜索方法.首先,利用预先选定的代表点对整个数据空间进行划分,使得每个代表点对应唯一的一... 对等计算数据管理中的一个重要问题是如何有效地支持高维空间中的相似性搜索.文章采用了一种有效的空间划分策略,提出了一种基于Chord系统的相似搜索方法.首先,利用预先选定的代表点对整个数据空间进行划分,使得每个代表点对应唯一的一个子空间且所有子空间的体积之和等于整个数据空间的体积.然后,将这些代表点映射到一维区间,使得每个代表点被赋予一个唯一的标识.将代表点的标识作为Chord系统中的节点散列值,就构造出一种改进的Chord系统.最后,利用Chord系统的路由协议,以代表点的标识为查找键就可以访问到所有与搜索区域相交的子空间对应的节点.仿真实验表明,在查询处理代价和调节负载均衡方面,与现有的方法相比(如MUCK),文中提出的方法更加有效. 展开更多
关键词 对等计算 相似搜索 代表点 空间划分
下载PDF
基于向量距离的词序相似度算法 被引量:11
7
作者 董刊生 方金云 《中文信息学报》 CSCD 北大核心 2009年第3期45-50,共6页
手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向... 手机POI搜索已经成为手机搜索的主要应用之一。该文结合手机搜索的特点以及POI数据的结构性特征采用简拼进行POI搜索。由于词序相似度是影响简拼搜索排序结果的主要因素,该文提出了基于向量距离计算词序相似度的算法。该算法采用空间向量模型作为简拼的表示方法,将提取的公共简拼映射为位置向量,进而利用位置向量间的距离计算词序相似度。通过理论分析,该算法相比基于逆序数的词序相似度算法,将时间复杂度由O(nlogn)降为O(n),空间复杂度由O(n)降为O(1)。实验结果表明,基于向量距离的词序相似度算法有效地保证了准确性,可以满足手机POI简拼搜索的应用需求,并在性能上将词序相似度的计算效率提高16.88%。 展开更多
关键词 计算机应用 中文信息处理 手机POI搜索 简拼搜索 词序相似度 向量距离
下载PDF
基于知识图谱与语义计算的智能信息搜索技术研究 被引量:23
8
作者 高龙 张涵初 杨亮 《情报理论与实践》 CSSCI 北大核心 2018年第7期42-47,共6页
面向信息搜索的智能需求,分析智能信息搜索的特征,研究面向应用领域表征的知识图谱构建,提出一种带约束的语义相似模型和隐性反馈修正机制,探索特定条件下智能信息搜索的实现途径。通过地理环境应用领域的原型实验数据分析,发现基于知... 面向信息搜索的智能需求,分析智能信息搜索的特征,研究面向应用领域表征的知识图谱构建,提出一种带约束的语义相似模型和隐性反馈修正机制,探索特定条件下智能信息搜索的实现途径。通过地理环境应用领域的原型实验数据分析,发现基于知识图谱与语义计算的信息搜索准确率可达85%,具有较强的实用性,可为垂直搜索应用领域的技术优化提供参考思路。 展开更多
关键词 知识图谱 语义相似 隐性反馈 信息搜索 语义计算 智能信息搜索
原文传递
基于宽度优先搜索的K-medoids聚类算法 被引量:5
9
作者 颜宏文 周雅梅 潘楚 《计算机应用》 CSCD 北大核心 2015年第5期1302-1305,共4页
针对传统K-medoids聚类算法对初始值敏感、中心点随机选择以及聚类精度不够高等缺点,在粒计算有效初始化的基础上,提出中心点宽度优先搜索策略。首先,利用粒计算初始化获取K个有效粒子,遴选该K个粒子所对应的K个中心点作为K个初始中心点... 针对传统K-medoids聚类算法对初始值敏感、中心点随机选择以及聚类精度不够高等缺点,在粒计算有效初始化的基础上,提出中心点宽度优先搜索策略。首先,利用粒计算初始化获取K个有效粒子,遴选该K个粒子所对应的K个中心点作为K个初始中心点;然后,根据对象间的相似性分别对K个粒子中的对象建立以中心点为根节点的相似对象二叉树,通过宽度优先搜索遍历二叉树迭代出最优中心点,同时采用簇间距离和簇内距离优化准则函数。实验结果表明,所提算法在UCI中Iris和Wine标准数据集中测试,在有效缩短迭代次数的同时保证了算法聚类准确率。 展开更多
关键词 K-medoids聚类算法 粒计算 相似对象二叉树 宽度优先搜索 适应度函数
下载PDF
领域对抗自适应的短任务负载预测模型 被引量:1
10
作者 刘春红 焦洁 +2 位作者 王敬雄 李为丽 张俊娜 《计算机工程与应用》 CSCD 北大核心 2023年第24期289-297,共9页
负载预测的精度是影响云平台弹性资源管理的主要因素之一。而云平台中存在着大量的短任务负载序列,其历史信息不足和不平滑的特性导致难以选择合适的模型进行精准预测。对此提出了一种领域对抗自适应的短任务负载预测模型。该模型采用... 负载预测的精度是影响云平台弹性资源管理的主要因素之一。而云平台中存在着大量的短任务负载序列,其历史信息不足和不平滑的特性导致难以选择合适的模型进行精准预测。对此提出了一种领域对抗自适应的短任务负载预测模型。该模型采用奇异谱分析(singular spectrum analysis,SSA)对样本进行平滑处理;联合第四版本的Mueen相似度搜索算法(the fourth version of Mueen’s algorithm for similarity search,MASS_V4)与时间特征进行域间相似性计算,获得合适的源域数据来辅助迁移预测;将门控循环单元(gated recurrent unit,GRU)作为基准器构建网络,并利用Y差异定义新的损失函数,通过对抗过程建立出表征能力强的短任务负载预测模型。将所提方法在两个真实的云平台数据集上与其他常用的云负载预测算法对比,均表现出较高的预测精度。 展开更多
关键词 云计算 负载预测 域对抗迁移学习 MASS_V4
下载PDF
基于典型工艺的相似工艺路线检索方法 被引量:1
11
作者 罗年猛 李雄 《机械工程与自动化》 2014年第5期101-103,共3页
为了解决从工艺数据中获取工艺知识的问题,提出了基于典型工艺路线检索相似工艺路线的方法。在该方法中,采用了更细致的工序编码方案,提出了多维工艺路线最长公共子序列检索算法,以更准确地度量工艺路线间的相似性。在典型工艺路线聚类... 为了解决从工艺数据中获取工艺知识的问题,提出了基于典型工艺路线检索相似工艺路线的方法。在该方法中,采用了更细致的工序编码方案,提出了多维工艺路线最长公共子序列检索算法,以更准确地度量工艺路线间的相似性。在典型工艺路线聚类分组的基础上,过滤不相关工艺路线,然后检索出相似工艺路线。最后通过实例验证了该方法的有效性。 展开更多
关键词 计算机辅助工艺 工艺路线检索 工艺相似度
下载PDF
一种多维向量并行查询算法
12
作者 黄海 侯颖 朱圣平 《微电子学与计算机》 CSCD 北大核心 2010年第8期17-19,共3页
为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该... 为了解决多维向量数据快速查询问题,在查询范围上限已知的条件下,通过对数据集合采用最近邻准则进行空间划分,构造一种多叉扩展平衡索引树,并设计了索引树的串行和并行查询算法.最后,对并行查询算法的性能进行了分析,测试结果验证了该方法的有效性. 展开更多
关键词 多维索引结构 并行计算 相似查询
下载PDF
云环境下基于字形相似度的密文模糊检索方案 被引量:3
13
作者 黄保华 袁鸿 +1 位作者 黄丕荣 程琪 《网络空间安全》 2020年第10期85-92,共8页
中文关键词的模糊检索可以基于字形、字音、字义等不同方面,针对目前相关研究主要基于拼音相似度进行的局限性,文章提出了云环境下基于汉字字形相似度的密文模糊检索方案。方案基于汉字字形相似性,通过欧几里得距离来计算汉字的相似度,... 中文关键词的模糊检索可以基于字形、字音、字义等不同方面,针对目前相关研究主要基于拼音相似度进行的局限性,文章提出了云环境下基于汉字字形相似度的密文模糊检索方案。方案基于汉字字形相似性,通过欧几里得距离来计算汉字的相似度,基于布隆过滤器和p-稳定分布的局部敏感哈希函数构建索引,通过安全陷门和安全索引内积的方式,实现了汉字多关键字的密文模糊检索。实验证明,方案在保证密文模糊检索安全性的同时,具有较低的时间代价和空间代价。 展开更多
关键词 字形相似度 云环境 局部敏感哈希 可搜索加密 模糊检索
下载PDF
一种Omni-顺序扫描的补充算法
14
作者 梁晔 须德 许宏丽 《北方交通大学学报》 CSCD 北大核心 2003年第5期38-41,共4页
提出了一种Omni_顺序扫描的补充算法,修改了原Omni_坐标的结构,使新的索引文件在完成利用三角不等式进行过滤的原有功能之外,对剩余的对象进行了第二级过滤,再次减少了所需进一步比较对象的数目,有效减少了I/O次数,提高了索引算法的效... 提出了一种Omni_顺序扫描的补充算法,修改了原Omni_坐标的结构,使新的索引文件在完成利用三角不等式进行过滤的原有功能之外,对剩余的对象进行了第二级过滤,再次减少了所需进一步比较对象的数目,有效减少了I/O次数,提高了索引算法的效率.文中对500幅RGB位图进行了6组实验,分别对应不同的焦点数和查询半径,新算法较原算法的检索效率的提高率分别为:21.9%,30.3%,19.2%,23.2%,17.3%,18.4%.实验数据验证了算法的有效性.此外,并对实验数据进行了比较分析. 展开更多
关键词 计算机应用 视频数据库 图像检索 高维访问方法 顺序扫描 范围查询 相似检索
下载PDF
用EDA和禁忌搜索算法进行文本聚类
15
作者 郭莉莉 左先亮 高尚 《信息技术》 2014年第4期55-59,共5页
基于VSM的文本聚类忽略了文本关键词稀疏带来的相似度漂移问题和关键词之间的语义信息和各维度之间的关系,致使文本的相似度计算不精确,文中对相似度计算方法 TF-IDF进行了改进,并提出一种新的聚类方法,利用分布式估计算法和禁忌搜索算... 基于VSM的文本聚类忽略了文本关键词稀疏带来的相似度漂移问题和关键词之间的语义信息和各维度之间的关系,致使文本的相似度计算不精确,文中对相似度计算方法 TF-IDF进行了改进,并提出一种新的聚类方法,利用分布式估计算法和禁忌搜索算法进行聚类,融合分布式估计算法的收敛速度快和禁忌搜索算法能跳出局部搜索的优点,首先对文本进行预处理,然后用分布式估计算法和禁忌搜索算法聚类,既能快速聚类又能防止聚类收敛到局部最优。测试结果表明这种算法行之有效。 展开更多
关键词 文本聚类 相似度计算 分布式估计算法 禁忌搜索算法
下载PDF
物联网中基于相似性计算的传感器搜索 被引量:7
16
作者 刘素艳 刘元安 +1 位作者 吴帆 范文浩 《电子与信息学报》 EI CSCD 北大核心 2018年第12期3020-3027,共8页
物联网逐渐成为学术界研究的热点领域,无处不在的传感器设备促进了传感器搜索服务的产生。物联网中搜索的强时空性、海量数据的异构性与传感器节点的资源受限性,给物联网搜索引擎高效地查询传感器提出了挑战。该文提出基于传感器定量数... 物联网逐渐成为学术界研究的热点领域,无处不在的传感器设备促进了传感器搜索服务的产生。物联网中搜索的强时空性、海量数据的异构性与传感器节点的资源受限性,给物联网搜索引擎高效地查询传感器提出了挑战。该文提出基于传感器定量数值的线性分段拟合相似性(PLSS)搜索算法。PLSS算法通过分段和线性拟合的方法,构建传感器定量数值的相似性计算模型,从而计算传感器的相似度,根据相似度查找最相似的传感器集群。与模糊集(FUZZY)算法和最小二乘法相比,PLSS算法平均查询精度和查询效率较高。与原数据相比,PLSS算法的存储开销至少降低了两个数量级。 展开更多
关键词 物联网 搜索服务 传感器搜索 传感器相似性计算 线性分段拟合
下载PDF
基于同义实体识别的Web信息集成 被引量:3
17
作者 徐喆昊 吴共庆 胡学钢 《计算机系统应用》 2015年第9期35-42,共8页
准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识... 准确有效地集成海量Web信息,是Web信息动态聚合、市场情报分析、舆情分析、商业智能等分析型应用的重要基础.针对数据集成过程中不同实体指代同一实体的问题,利用搜索引擎返回的页面摘要信息,设计并实现了一种基于搜索引擎的同义实体识别算法FSE,并提出了一种基于同义实体识别的Web信息集成框架.在医院信息集成测试数据集上的实验结果表明,FSE算法效果优于基于Varient Dice、Varient Cosine、Varient Jaccard、Varient Overlap相似度计算的同义实体识别算法. 展开更多
关键词 WEB信息集成 同义实体识别 相似度计算 搜索引擎
下载PDF
搜索引擎研究与发展 被引量:2
18
作者 谷萌萌 高茂庭 《计算机与数字工程》 2008年第7期74-77,共4页
介绍搜索引擎的主要工作流程,并对其理论依据进行了描述。对向量空间模型的发展作详细介绍。最后对搜索引擎的发展趋势进行展望。
关键词 搜索引擎 相似度计算 VSM
下载PDF
基于优化粒计算下微粒子动态搜索的K-medoids聚类算法 被引量:5
19
作者 宋红海 颜宏文 《智能计算机与应用》 2016年第2期9-13,共5页
K-medoids算法具有对初始聚类中心敏感,聚类准确度不高及时间复杂度大的缺点。基于此,文中提出一种优化的K-medoids算法;该算法在已有的粒计算初始化基础上进行了改进,以对象之间的相似性作为判断依据,结合最大最小法初始化聚类中心,能... K-medoids算法具有对初始聚类中心敏感,聚类准确度不高及时间复杂度大的缺点。基于此,文中提出一种优化的K-medoids算法;该算法在已有的粒计算初始化基础上进行了改进,以对象之间的相似性作为判断依据,结合最大最小法初始化聚类中心,能有效地获取最佳或近似最佳的聚类中心;在优化的粒计算前提下,提出了基于微粒子动态搜索策略,以初始中心点作为基点,粒子内所有对象到其中心的平均距离为半径,形成一个微粒子;在微粒子内部,采用离中心点先近后远的原则进行搜索,能有效地缩小搜索范围,提高聚类准确率。实验结果表明:在UCI多个标准数据集中测试,且与其他改进的K-medoids算法比较分析,该算法在有效缩短收敛时间的同时保证了算法聚类准确率。 展开更多
关键词 聚类 K-medoids算法 粒计算 相似性 微粒子动态搜索
下载PDF
面向图相似性搜索的高效图编辑距离算法 被引量:2
20
作者 邱珍 郑朝晖 《计算机应用研究》 CSCD 北大核心 2023年第2期371-377,共7页
在图相似性搜索问题中,图编辑距离是较为普遍的度量方法,其计算性能很大程度上决定了图相似性搜索算法的性能。针对传统图编辑距离算法中存在的因大量冗余映射和较大搜索空间导致的性能低下问题,提出了一种改进的图编辑距离算法。该算... 在图相似性搜索问题中,图编辑距离是较为普遍的度量方法,其计算性能很大程度上决定了图相似性搜索算法的性能。针对传统图编辑距离算法中存在的因大量冗余映射和较大搜索空间导致的性能低下问题,提出了一种改进的图编辑距离算法。该算法首先对图中顶点进行等价划分,以此计算映射编码来判断等价映射;然后定义映射完整性更新等价映射优先级,选出主映射参与扩展;其次,设计高效的启发式函数,提出基于映射编码的下界计算方法,快速得到最优映射。最后,将改进的图编辑距离算法扩展应用于图相似性搜索。在不同数据集上的实验结果表明,该算法具有更好的搜索性能,在搜索空间上最大可降低49%,速度提升了约29%。 展开更多
关键词 图编辑距离 等价映射 映射编码 下界计算 图相似性搜索
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部