期刊文献+
共找到1,080篇文章
< 1 2 54 >
每页显示 20 50 100
基于三维空间面积划分的轨迹相似性度量算法 被引量:1
1
作者 徐凯 高琦凯 +1 位作者 殷明 谭京京 《计算机应用》 CSCD 北大核心 2024年第1期318-323,共6页
针对大部分轨迹相似性度量算法无法区分方向相反轨迹的问题,提出了一种基于三维空间面积划分的三维三角分割(3TD)算法。首先,按照3TD算法的时间转换规则将轨迹集的绝对时间序列转变为相对时间序列;然后,在由经度、纬度以及时间三要素构... 针对大部分轨迹相似性度量算法无法区分方向相反轨迹的问题,提出了一种基于三维空间面积划分的三维三角分割(3TD)算法。首先,按照3TD算法的时间转换规则将轨迹集的绝对时间序列转变为相对时间序列;然后,在由经度、纬度以及时间三要素构成的三维空间坐标系中,通过划分规则将轨迹间面积分割成若干互不重叠的三角形,累加三角形面积并计算轨迹相似度;最后,在从船舶自动识别系统(AIS)收集的随机采样轨迹数据集上,与最长公共子序列(LCSS)算法和三角分割(TD)算法等进行了对比实验。实验结果表明:3TD算法对实验数据集中异向轨迹识别精确度达到100%;同时该算法面对海量数据集以及轨迹点部分缺失的数据集时,也能维持准确的度量结果以及较高的运算效率,能更好地适应异向轨迹相似度量工作。 展开更多
关键词 时空轨迹 三维空间 面积划分 相似性度量 轨迹方向
下载PDF
融合相似性度量加权核偏最小二乘的烷烃气体定量分析方法 被引量:1
2
作者 李忠兵 刘雅杰 +2 位作者 梁海波 倪朋勃 闫碧 《电子测量与仪器学报》 CSCD 北大核心 2024年第5期210-218,共9页
烃类气体含量的有效监测是油气勘探开采过程中安全保障的重要环节。红外光谱法作为一种安全高效的检测方法,受到现场工程师的关注,但主要采用离线模型进行测量,无法较好应对现场复杂的工况及变化多样的非线性影响因素,导致离线模型不更... 烃类气体含量的有效监测是油气勘探开采过程中安全保障的重要环节。红外光谱法作为一种安全高效的检测方法,受到现场工程师的关注,但主要采用离线模型进行测量,无法较好应对现场复杂的工况及变化多样的非线性影响因素,导致离线模型不更新而难以维持较高的预测精度。为此,提出了一种融合相似性度量加权核偏最小二乘的即时学习建模策略。首先设计了一种多相似性度量准则融合的样本相似性判别依据,有效筛选历史样本用于在线建模,其次在局部PLS模型中引入非线性核函数,实现非线性特征的有效提取,弥补线性偏最小二乘模型的非线性处理能力。在构建的多组分混合气体红外光谱数据上的实验结果验证了该方法的有效性,拟合优度R2达到0.994 1,RMSE和MRE相比PLS模型分别提升了43.6%和85.8%,可有效用于烃类气体红外光谱定量分析模型的在线更新与高精度预测。 展开更多
关键词 烷烃气体 红外光谱 即时学习 相似性度量 非线性核函数
原文传递
考虑综合相似性度量的光伏典型出力场景聚类方法
3
作者 程雄 戴鹏 +2 位作者 钟浩 李咸善 李文武 《中国电机工程学报》 EI CSCD 北大核心 2024年第21期8462-8474,I0011,共14页
场景聚类是描述不确定性光伏典型出力特性的有效途径之一,如何度量波动繁杂的光伏发电曲线相似性以及生成具有代表性的光伏出力场景是目前亟需解决的问题。为此,提出一种考虑综合相似性度量的光伏典型出力场景聚类方法,其基本思路是首... 场景聚类是描述不确定性光伏典型出力特性的有效途径之一,如何度量波动繁杂的光伏发电曲线相似性以及生成具有代表性的光伏出力场景是目前亟需解决的问题。为此,提出一种考虑综合相似性度量的光伏典型出力场景聚类方法,其基本思路是首先考虑光伏发电的电量大小、形态趋势、波动位置相似性,得到适用于光伏发电曲线的综合相似性度量距离;其次将形态质心作为优化问题求解,再用同倍比放大法得到兼顾电量和形态的实际质心,针对传统聚类算法在初始中心确定等方面的不足,以二十四节气为区间提出基于改进K-means算法的光伏典型场景集生成模型;最后构建光伏发电场景集指标评价体系,以熵权Topsis法对典型出力场景集进行综合评价。云南某地装机50MW的光伏电站2018—2020年算例结果表明:该文算法能准确划分和提取典型光伏出力场景,且以节气为区间生成的典型场景集在波动和电量指标上都有较好的表现,证明算法的有效性。 展开更多
关键词 相似性度量 聚类质心提取 光伏场景生成 典型场景集评价 K-MEANS算法
原文传递
局部特征与点云配准引导下的神经元相似性度量方法
4
作者 甄昊天 常令琛 +3 位作者 祝继华 朱恩涛 樊夏玥 李钟毓 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第9期1480-1490,共11页
针对现有神经元形态学匹配与相似性度量方法难以有效处理大规模且结构复杂神经元数据的问题,提出一种由局部特征与点云配准引导下的神经元相似性度量方法.首先,利用全局特征进行大规模检索完成神经元相似数据的初筛;其次,基于深度卷积... 针对现有神经元形态学匹配与相似性度量方法难以有效处理大规模且结构复杂神经元数据的问题,提出一种由局部特征与点云配准引导下的神经元相似性度量方法.首先,利用全局特征进行大规模检索完成神经元相似数据的初筛;其次,基于深度卷积自编码器,对筛选后的神经元数据进行无监督的局部特征提取,实现两两神经元之间的粗配准,并借助迭代最近点算法,将具有空间树型结构的神经元匹配问题转换为点云的三维配准问题;最后,通过与全局特征下的检索结果进行融合,实现神经元形态数据的相似性度量.在NeuroMorpho公开数据集上抽取了19286个神经元,并与其他6种相似性度量方法进行对比实验,文中方法的Top-1和Top-50精度分别为0.981和0.721,均优于现有对比方法,验证了其在大规模数据集上的有效性与精确性. 展开更多
关键词 神经元形态学 深度神经网络 相似性度量 点云配准
下载PDF
相似性度量方法在动态荷载识别中的应用
5
作者 张皓宇 魏丹丹 +1 位作者 李振鹏 陈钦隆 《科技与创新》 2024年第20期105-107,共3页
动态荷载识别方法有助于维护设备运行中的载荷组件,但在工程实际中,动态荷载反求是一个难度较高且较复杂的问题,格林核函数法是识别工程问题中动态载荷最流行的时域方法之一。为了确定相似性度量方法在动态荷载识别中的作用,在不同正则... 动态荷载识别方法有助于维护设备运行中的载荷组件,但在工程实际中,动态荷载反求是一个难度较高且较复杂的问题,格林核函数法是识别工程问题中动态载荷最流行的时域方法之一。为了确定相似性度量方法在动态荷载识别中的作用,在不同正则化方法下求解出反求荷载,并运用欧几里得距离和余弦距离对不同正则化方法反求出的荷载和真实荷载进行比较,得出欧几里得距离和余弦距离在判断反求荷载准确度中比最大相对误差更为有效。 展开更多
关键词 动态荷载识别 反问题 正则化 相似性度量
下载PDF
混合相似性度量的仪表询价电子表格结构识别
6
作者 徐传运 马莹丽 +2 位作者 李刚 舒涛 李星光 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第1期150-159,共10页
对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义。但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解。构建无人化询价系... 对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义。但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解。构建无人化询价系统的关键是准确地自动提取仪表参数,而提取参数的前提是正确理解表格结构。因此,以构建无人化询价系统为目标,研究仪表询价电子表格的结构识别,提出混合相似性度量表格结构识别方法(hybrid similarity metrics for table structure recognition, HSMTSR)。所提方法结合Levenshtein距离、Dice系数和单元格类型相似度(cell type similarity, TySim),根据单元格和行数据的相似度解析识别表格结构。同时,建立流量仪表电子表格数据集(flowmeter spreadsheet dataset, FSDS)研究分析仪表询价电子表格的结构,包括714个电子表格,8 574行数据。实际应用表明,所提方法可准确高效地自动识别多种复杂结构的仪表询价电子表格,并在多个评价指标上均取得较好效果。 展开更多
关键词 电子表格 结构识别 相似性度量 类型相似 仪表询价
下载PDF
基于相似性度量的PPI网络链接预测算法相关性分析
7
作者 陈宇 蔡荣彦 《湖南理工学院学报(自然科学版)》 CAS 2024年第3期20-24,共5页
针对基于相似性度量的蛋白质相互作用网络(PPI网络)链接预测算法Sim,证明Sim指标是基于3-跳路径的指标,分析Sim矩阵和PPI网络邻接矩阵具有较强相关性,为基于相似性度量的PPI网络链接预测算法提供理论依据.
关键词 PPI网络 链接预测 相似性度量 相关性分析
下载PDF
基于场地相似性度量的区域洪水频率分析模型研究
8
作者 高小雲(编译) 李慧(编译) 《水利水电快报》 2024年第9期5-5,共1页
研究应用了一种将流域建模与传统区域洪水频率分析相结合的新方法,提出基于水文模拟的场地相似性度量指标,并考虑洼地对径流的影响。以加拿大大草原为研究对象,通过与洪水频率分析的其他传统度量指标进行对比,对所提出的度量值进行验证... 研究应用了一种将流域建模与传统区域洪水频率分析相结合的新方法,提出基于水文模拟的场地相似性度量指标,并考虑洼地对径流的影响。以加拿大大草原为研究对象,通过与洪水频率分析的其他传统度量指标进行对比,对所提出的度量值进行验证。为严谨验证新度量指标的合理性,经仔细比选实例,将该指标与传统场地相似性度量指标组合得到30种应用场景,对109处场地进行分析,评估聚类结果的均一性. 展开更多
关键词 相似性度量 度量指标 度量 洪水频率分析 水文模拟 应用场景 均一性 指标组合
下载PDF
基于Hausdorff距离的轨迹相似性度量的航迹复原方法
9
作者 李祖湘 李福林 秦萌毅 《电子信息对抗技术》 2024年第2期57-63,共7页
面对有源和无源探测时存在的大量杂波等干扰,导致探测的重点目标航迹存在缺失的问题,采用基于Hausdorff距离的轨迹相似性度量方法,计算重点目标与探测数据中所有批次在距离-时间、方位-时间2个维度的双重Hausdorff距离。以加权Hausdorf... 面对有源和无源探测时存在的大量杂波等干扰,导致探测的重点目标航迹存在缺失的问题,采用基于Hausdorff距离的轨迹相似性度量方法,计算重点目标与探测数据中所有批次在距离-时间、方位-时间2个维度的双重Hausdorff距离。以加权Hausdorff距离为相似性度量排序,从探测数据中辨识出与重点目标航迹相似度最高的目标,实现在探测数据中准确辨识重点目标以及复原目标缺失航迹。实测数据验证表明,该方法简单高效,具有工程应用价值。 展开更多
关键词 目标探测 HAUSDORFF距离 轨迹相似性度量 航迹复原
下载PDF
基于GPU的加速船舶轨迹相似性度量与聚类
10
作者 刘奕 李湘 +3 位作者 李之琛 周备 许鹏 刘敬贤 《中国航海》 CSCD 北大核心 2023年第2期33-39,45,共8页
针对使用中央处理器(Central Processing Unit, CPU)硬件实现密度聚类、相似性度量等算法提取船舶习惯航迹的过程中存在复杂度高、计算时间长等方面的不足,提出使用图形处理器(Graphics Processing Unit, GPU)高性能计算及GPU优化算法... 针对使用中央处理器(Central Processing Unit, CPU)硬件实现密度聚类、相似性度量等算法提取船舶习惯航迹的过程中存在复杂度高、计算时间长等方面的不足,提出使用图形处理器(Graphics Processing Unit, GPU)高性能计算及GPU优化算法以提升船舶轨迹相似性度量与聚类的速度性能,大幅缩短船舶轨迹特征提取过程中的时间开销。利用长江南槽交汇水域船舶自动识别系统(Automatic Identification System, AIS)动态船舶轨迹信息进行方法验证,通过对比传统基于CPU的方法验证了所提出的基于GPU的船舶轨迹相似性度量及聚类算法存在较优的速度性能,为快速提取研究水域中的船舶特征提供新的理论依据。 展开更多
关键词 水路运输 船舶自动识别系统 中央处理器 图形处理器 加速相似性度量 加速聚类
下载PDF
一种基于权重自适应相似性度量改进的InSAR-BM3D算法
11
作者 李兴 王志勇 +1 位作者 王子豪 吴斌 《遥感信息》 CSCD 北大核心 2023年第2期71-78,共8页
针对InSAR-BM3D算法在三维成像雷达高度计干涉图近距端纹理密集区域、远距端低信噪比区域干涉条纹细节保持及去噪能力不足的问题,提出了一种基于权重自适应相似性度量改进的InSAR-BM3D算法。以皮尔森相关系数和余弦相异性为基础,构建了... 针对InSAR-BM3D算法在三维成像雷达高度计干涉图近距端纹理密集区域、远距端低信噪比区域干涉条纹细节保持及去噪能力不足的问题,提出了一种基于权重自适应相似性度量改进的InSAR-BM3D算法。以皮尔森相关系数和余弦相异性为基础,构建了一种根据干涉条纹密集程度和噪声水平变化而对皮尔森相关系数和余弦相异性进行权重分配的相似性度量,进一步保证了相似块搜索过程的准确性;在最终估计阶段,对基础估计图像中噪声残留区域进行了进一步滤波处理,提高了算法的去噪能力。利用模拟数据和机载三维成像雷达高度计影像数据进行了实验,并与均值滤波、Goldstein滤波、NL-Means滤波以及各向异性扩散滤波等算法进行了比较,结果证明该算法能够在有效滤除噪声的同时进一步保留干涉条纹的细节。 展开更多
关键词 干涉相位去噪 InSAR-BM3D 相似性度量 三维成像雷达高度计 非局部滤波
下载PDF
相似性度量与牛顿插值融合的架空输电线弧垂测量方法 被引量:2
12
作者 周孝法 张越港 +5 位作者 方宇 杨皓 夏严峰 武欣 范狄庆 孙博洋 《电子测量与仪器学报》 CSCD 北大核心 2023年第7期221-229,共9页
架空输电线路导地线弧垂是架线施工质量和线路安全运行的关键指标之一,针对目前弧垂测量方法在准确性、便捷性等方面存在的不足,提出了一种基于激光测距与光栅测角技术的输电线路弧垂测量数学模型,并在该模型的基础上,针对单根导线测量... 架空输电线路导地线弧垂是架线施工质量和线路安全运行的关键指标之一,针对目前弧垂测量方法在准确性、便捷性等方面存在的不足,提出了一种基于激光测距与光栅测角技术的输电线路弧垂测量数学模型,并在该模型的基础上,针对单根导线测量鲁棒性不足的情况,提出一种基于相似性度量与牛顿插值法相融合的多分裂导线弧垂测量数据质量评估优化算法,实现对数据集的补偿与弧垂计算。与点云提取电力线方法相比,该测量方法只需通过少量测量数据即可拟合出导线模型并计算出弧垂值。以220 kV双分裂导线为测量对象,进行试验验证,并与现有测量方法弧垂测量值作比较,试验结果表明数据优化后的弧垂误差率最大为1.47%,证明了该方法的准确性,能够满足工程现场测量精度要求,并提高了架空输电线路弧垂测量工作的安全与效率。 展开更多
关键词 相似性度量 牛顿插值法 激光测距 架空输电线路 导地线弧垂
原文传递
稀土元素配分曲线的相似性度量算法及其在黄海沉积物物源判别中的应用 被引量:3
13
作者 李辉 韩宗珠 +2 位作者 闫天浩 赵可心 杨叶飘 《海洋地质前沿》 CSCD 北大核心 2023年第12期88-97,共10页
稀土元素配分曲线常被用于判别沉积物物源,相同物源沉积物的稀土元素配分曲线往往具有相似的形态特征。然而,当前稀土元素配分曲线相似性判别仍然采用人眼目视判别,主观性较强且无法实现定量判别,因此需要一种统一的度量手段实现稀土元... 稀土元素配分曲线常被用于判别沉积物物源,相同物源沉积物的稀土元素配分曲线往往具有相似的形态特征。然而,当前稀土元素配分曲线相似性判别仍然采用人眼目视判别,主观性较强且无法实现定量判别,因此需要一种统一的度量手段实现稀土元素配分曲线的定量相似度计算,进而在此基础上开展聚类、分类等统计分析操作,充分挖掘稀土元素数据中的物源信息。本研究提出一种稀土元素配分曲线相似性度量算法,该算法不受稀土元素绝对丰度的影响,能够有效甄别稀土元素配分曲线之间形态上的差异。该算法的聚类结果显示,黄河和长江是南黄海中部泥质区的主要物质来源,黄河黏土粒级物质可以由沿岸流输运至黄海33°N处,长江黏土粒级物质被黄海暖流携带北上最远至黄海36°N附近,西朝鲜海洋锋面将朝鲜半岛河流的影响范围限制在了其东侧;东南黄海泥质区除了接收朝鲜半岛河流的供给外,其南部还接收了中国河流的细粒物质供应。 展开更多
关键词 稀土元素 稀土元素配分曲线 物源 相似性度量 聚类
下载PDF
基于Hellinger距离的正态云相似性度量方法及应用研究 被引量:1
14
作者 许昌林 徐浩 《智能系统学报》 CSCD 北大核心 2023年第6期1312-1321,共10页
针对现有正态云相似性度量计算复杂度较高且区分度不强等问题,本文首先从正态云的特征曲线出发,利用Hellinger距离刻画两个概率分布相似性的特点,提出一种基于Hellinger距离的正态云相似性度量方法,该方法不仅考虑了云概念的数字特征且... 针对现有正态云相似性度量计算复杂度较高且区分度不强等问题,本文首先从正态云的特征曲线出发,利用Hellinger距离刻画两个概率分布相似性的特点,提出一种基于Hellinger距离的正态云相似性度量方法,该方法不仅考虑了云概念的数字特征且兼顾了其分布特性,并对相似度量具有的数学性质进行了研究。其次,根据给出的相似度量方法,设计了两种正态云概念的相似度算法。最后,通过数值模拟仿真实验和时间序列数据分类实验对所提出算法的性能进行对比分析,结果表明该算法具有较好的相似度区分能力且分类错误率和CPU时间代价都较低。同时,将本文方法应用于协同过滤推荐系统中,并在MovieLens100k影评数据集上进行了实验,实验结果表明本文方法在用户评分数据极端稀疏的情况下,仍能取得较理想的推荐质量。 展开更多
关键词 知识表示 正态云 不确定性 Hellinger距离 特征曲线 相似性度量 协同过滤 推荐系统
下载PDF
保护隐私的集合相似性度量协同计算协议 被引量:1
15
作者 逯绍锋 胡玉龙 逯跃锋 《计算机技术与发展》 2023年第1期137-143,共7页
集合相似性度量是机器学习领域的基本问题之一,研究如何在保护数据隐私的前提下计算两个集合间的相似性问题,在保护数据隐私的机器学习、图形识别、生物信息学等方面有着重要的理论意义与应用价值。在机器学习中估算不同样本集合之间的... 集合相似性度量是机器学习领域的基本问题之一,研究如何在保护数据隐私的前提下计算两个集合间的相似性问题,在保护数据隐私的机器学习、图形识别、生物信息学等方面有着重要的理论意义与应用价值。在机器学习中估算不同样本集合之间的相似性时,通常通过计算集合相似度来对样本之间的相似程度进行估算,这一类集合之间的相似度统称为集合距离。其中,最常用到的集合距离就是杰卡德距离。文中从集合间杰卡德距离入手,首先通过设计一种新的编码方法,对参与计算的数据进行位置数字编码,将相似性度量问题转化为求两集合间相同数字个数问题,进而结合异或思想,借助同态加密体制具体设计了可以保护隐私的集合杰卡德距离协同计算协议,从而解决了集合间相似性度量的隐私保护问题。模拟器证明该协议是安全的,结果分析表明协议可以高效安全地判定出两对象间集合数据的相似性,在保护隐私的集合相似性度量方面,该方法具备一定的普适性。 展开更多
关键词 隐私保护 安全多方计算 杰卡德距离 集合相似性度量 机器学习
下载PDF
基于Wasserstein散度的t-SNE相似性度量方法研究
16
作者 刘鑫鹏 孙祥洪 +2 位作者 秦玉华 张敏 宫会丽 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第12期3806-3812,共7页
近红外光谱具有高维、高冗余、非线性的特性,严重影响了样本之间的相似性度量的精准,故而提出了一种基于Wasserstein散度的t分布随机近邻嵌入算法(Wt-SNE)。基于流形学习算法思想,利用高斯分布将高维数据的距离转换为概率分布,使用更加... 近红外光谱具有高维、高冗余、非线性的特性,严重影响了样本之间的相似性度量的精准,故而提出了一种基于Wasserstein散度的t分布随机近邻嵌入算法(Wt-SNE)。基于流形学习算法思想,利用高斯分布将高维数据的距离转换为概率分布,使用更加偏重长尾分布的方式t分布表示低维空间中对应数据点的概率分布。将高维数据的概率分布嵌入映射至低维度空间,重构低维流形结构,引入Wasserstein散度度量两个空间内概率分布的差异,通过降低散度值来提高两个分布的相似度,以此来实现高维数据降维处理。为验证Wt-SNE算法的有效性,首先对烟叶近红外光谱数据进行降维投影,并与PCA、 LPP、 t-SNE算法比较,结果表明Wt-SNE算法降维后的数据,在低维空间内样本类别边界更加明显。其次,采用KNN、 SVM和PLS-DA分类器对降维后的数据进行烟叶产地预测,准确率分别为93.8%、 91.5%、 92.7%,表明降维后的数据不仅重构了原始光谱的空间结构而且保留了样本间的相似度关系。最后,选取某一卷烟叶组配方中的烟叶进行单料目标烟叶的替换,根据备选样本与目标样本之间的马氏距离选取替换样本。实验表明,Wt-SNE选取的替换烟叶与目标烟叶相似度最高,烟碱、总糖等化学成分含量与目标烟叶差异较小,香气、烟气、口感得分表现出较高的一致性。该方法能够有效度量烟叶近红外光谱之间的相似性,为卷烟叶组配方的维护提供有力的依据。 展开更多
关键词 近红外光谱 数据降维 t-SNE算法 Wasserstein散度 相似性度量
下载PDF
基于多信号流图和相似性度量的故障可诊断性评价方法 被引量:4
17
作者 秦玉峰 史贤俊 《系统工程与电子技术》 EI CSCD 北大核心 2023年第1期302-312,共11页
针对目前基于定性模型无法对电子系统故障可诊断性进行定量评价的问题,将定性模型与数据驱动方法相结合,提出一种基于多信号流图和相似性度量的故障可诊断性评价方法。首先,根据系统的组成结构建立多信号流图模型并得到故障-测试相关性... 针对目前基于定性模型无法对电子系统故障可诊断性进行定量评价的问题,将定性模型与数据驱动方法相结合,提出一种基于多信号流图和相似性度量的故障可诊断性评价方法。首先,根据系统的组成结构建立多信号流图模型并得到故障-测试相关性矩阵,基于故障-测试相关性矩阵提出了故障可诊断性评价准则。其次,提取测试信号的小波包Shannon熵作为特征向量,以欧式距离作为相似性度量指标,将故障可诊断性定量评价问题转换为不同故障模式下测试信号特征向量的相似性度量问题。然后,构建故障可诊断性评价矩阵,依据故障可诊断性评价矩阵提出了系统可诊断性指标。最后,通过仿真分析验证了所提方法的有效性。结果表明,所提方法在不构建数学模型的前提下,能够实现电子系统的故障可诊断性的定量评价。 展开更多
关键词 故障可诊断性 可诊断性评价 多信号流图 相似性度量 欧氏距离
下载PDF
基于异质信息网络的文本相似性度量方法
18
作者 马秋微 赵书良 赵妍 《中文信息学报》 CSCD 北大核心 2023年第9期108-120,共13页
文本相似性度量对基于文本的分类,聚类以及排序等有着广泛的影响。现有的大部分文本相似性度量方法不仅文本特征粒度单一化,而且忽略了非结构化文本数据中的结构化信息。该文将文本相似性度量问题转化为加权异质信息网络中的节点相似性... 文本相似性度量对基于文本的分类,聚类以及排序等有着广泛的影响。现有的大部分文本相似性度量方法不仅文本特征粒度单一化,而且忽略了非结构化文本数据中的结构化信息。该文将文本相似性度量问题转化为加权异质信息网络中的节点相似性度量问题,利用元路径的结构特性和语义特性度量文本的显式语义相似性,使其度量结果更准确并且更具有可解释性。首先,结合世界知识库,扩大文本特征粒度,构建加权文本异质信息网络,将非结构化文本类型数据表示为结构化的异质信息网络的形式。其次,挖掘元路径,并提出基于元路径的ω-PageRank-Nibble子图划分算法,得到包含给定文本节点集的局部图。根据局部图,计算并存储特定元路径的交换矩阵,为后续相似性度量降低时间及空间成本。最后,提出AllPathSim耦合相似性度量方法,度量文本类型节点的相似性。在图剪枝方面,利用基于元路径的ω-PageRank-Nibble算法划分子图,与处理整张图相比,时间成本和空间成本降低效果显著。在相似性度量方面,与同期最优的相同类型节点度量方法相比,AllPathSim耦合相似性度量方法与度量结果的相关系数在20NG和GCAT数据集上分别提高了6.1%和6.9%。 展开更多
关键词 相似性度量 加权异质信息网络 元路径 文本挖掘
下载PDF
一种基于DTW算法的磁场相似性度量方法
19
作者 胡家文 刘忠乐 +1 位作者 文无敌 张志强 《水下无人系统学报》 2023年第3期430-435,共6页
在舰船磁场模拟及磁探测系统的目标识别中,需要对模拟或探测磁场与真实目标磁场分布的相似程度进行评估。文中针对以往评估方法存在的问题,提出利用动态时间规整(DTW)算法计算磁场的相似度,解决了目标速度不同和起止点不一致情况下的磁... 在舰船磁场模拟及磁探测系统的目标识别中,需要对模拟或探测磁场与真实目标磁场分布的相似程度进行评估。文中针对以往评估方法存在的问题,提出利用动态时间规整(DTW)算法计算磁场的相似度,解决了目标速度不同和起止点不一致情况下的磁场曲线相似度评估问题;为降低磁场曲线局部扰动带来的影响,利用最长公共子串对DTW算法进行了优化,提高了相似度计算精度;最后以模型试验验证了算法的正确性。与传统评估方法相比,该方法无需人工预先设置参数,能直接给出相似度评价结果,可应用于舰船磁场模拟效果评估及磁探测系统的目标识别。 展开更多
关键词 舰船 磁探测 动态时间规整 相似性度量 磁场曲线 最长公共子串
下载PDF
基于混合机器学习模型的短文本语义相似性度量算法 被引量:2
20
作者 韩开旭 袁淑芳 《吉林大学学报(理学版)》 CAS 北大核心 2023年第4期909-914,共6页
为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特... 为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高. 展开更多
关键词 混合机器学习模型 短文本 文本分词 语义相似性 卡方检验 相似性度量
下载PDF
上一页 1 2 54 下一页 到第
使用帮助 返回顶部