期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于TWE-NMF主题模型的Mashup服务聚类方法 被引量:1
1
作者 陆佳炜 赵伟 +2 位作者 张元鸣 梁倩卉 肖刚 《软件学报》 EI CSCD 北大核心 2023年第6期2727-2748,共22页
随着互联网和面向服务技术的发展,一种新型的Web应用——Mashup服务,开始在互联网上流行并快速增长.如何在众多Mashup服务中找到高质量的服务,已经成为一个大家关注的热点问题.寻找功能相似的服务并进行聚类,能有效提升服务发现的精度... 随着互联网和面向服务技术的发展,一种新型的Web应用——Mashup服务,开始在互联网上流行并快速增长.如何在众多Mashup服务中找到高质量的服务,已经成为一个大家关注的热点问题.寻找功能相似的服务并进行聚类,能有效提升服务发现的精度与效率.目前国内外主流方法为挖掘Mashup服务中隐含的功能信息,进一步采用特定聚类算法如K-means等进行聚类.然而Mashup服务文档通常为短文本,基于传统的挖掘算法如LDA无法有效处理短文本,导致聚类效果并不理想.针对这一问题,提出一种基于非负矩阵分解的TWE-NMF(nonnegative matrix factorization combining tags and word embedding)模型对Mashup服务进行主题建模.所提方法首先对Mashup服务规范化处理,其次采用一种基于改进的Gibbs采样的狄利克雷过程混合模型,自动估算主题的数量,随后将词嵌入和服务标签等信息与非负矩阵分解相结合,求解Mashup服务主题特征,并通过谱聚类算法将服务聚类.最后,对所提方法的性能进行了综合评价,实验结果表明,与现有的服务聚类方法相比,所提方法在准确率、召回率、F-measure、纯度和熵等评价指标方面都有显著提高. 展开更多
关键词 Mashup服务 非负矩阵分解 主题模型 词嵌入 服务聚类
下载PDF
融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法 被引量:9
2
作者 陆佳炜 吴涵 +2 位作者 张元鸣 梁倩卉 肖刚 《计算机学报》 EI CAS CSCD 北大核心 2021年第7期1501-1515,共15页
随着互联网上Mashup服务数量及种类的急剧增长,如何从这些海量的服务集合中快速、精准地发现满足用户需求的Mashup服务,成为一个具有挑战性的问题.针对这一问题,本文提出一种融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法,... 随着互联网上Mashup服务数量及种类的急剧增长,如何从这些海量的服务集合中快速、精准地发现满足用户需求的Mashup服务,成为一个具有挑战性的问题.针对这一问题,本文提出一种融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法,用于缩小服务的搜索空间,提升服务发现的精度与效率.首先,该方法对Mashup服务进行元信息提取和描述文本内容整理,并根据Web API组合的标签对相应Mashup服务标签进行扩充.然后,用基于功能语义关联计算方法(Functional Semantic Association Calculation Method,FSAC)提取出各服务描述的功能名词集合,并通过功能名词的语义权重来构造Mashup语义特征向量.最后,通过基于密度信息的聚类中心检测方法(Clustering Center Detection Method based on Density Information,CCD-DI)检测出最为合适的K个Mashup语义特征向量作为K-means算法的初始中心,进行聚类划分.基于ProgrammableWeb的真实数据实验表明,本文所提聚类方法在纯度、精准率、召回率、熵等指标上均有良好表现. 展开更多
关键词 功能语义 Mashup服务 密度峰值 聚类 Web API
下载PDF
一种用于CBIR系统的主色提取及表示方法 被引量:27
3
作者 徐旭 朱淼良 梁倩卉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 1999年第5期385-388,共4页
颜色是彩色图像最重要的视觉特征之一,在基于内容的图像检索(CBIR)系统中,都将颜色信息作为重要内容参与匹配和检索.针对图像中起主要视觉作用的是图像的主色这一问题,提出一种基于聚类分析的提取和表示图像主色的方法,给出... 颜色是彩色图像最重要的视觉特征之一,在基于内容的图像检索(CBIR)系统中,都将颜色信息作为重要内容参与匹配和检索.针对图像中起主要视觉作用的是图像的主色这一问题,提出一种基于聚类分析的提取和表示图像主色的方法,给出一种用于聚类算法的停止准则.和等量量化方法相比,用本方法提取的颜色信息,具有特征维数低、颜色表示准的优点. 展开更多
关键词 图像检索 颜色聚类 主色提取 CBIR 图像处理
下载PDF
一种基于动态拓扑的流计算性能优化方法及其在Storm中的实现 被引量:7
4
作者 陆佳炜 吴涵 +3 位作者 陈烘 张元鸣 梁倩卉 肖刚 《电子学报》 EI CAS CSCD 北大核心 2020年第5期878-890,共13页
响应性和稳定性一直是流式计算中两个至关重要的问题,而流计算系统在过载时常常表现出数据计算延迟增加和拓扑不稳定的现象,无法适应数据负载的动态变化.针对这一问题本文研究提出了一种基于动态拓扑的流计算性能优化方法,主要包括:(1)... 响应性和稳定性一直是流式计算中两个至关重要的问题,而流计算系统在过载时常常表现出数据计算延迟增加和拓扑不稳定的现象,无法适应数据负载的动态变化.针对这一问题本文研究提出了一种基于动态拓扑的流计算性能优化方法,主要包括:(1)动态逐级反压:拓扑中的任务可以根据当前自身负载情况,动态调整上游向其发送数据的速率.(2)无状态拓扑数据重放:拓扑不维持数据的计算状态,尽可能地实现数据容错.(3)自适应拓扑替换:在拓扑不暂停的情况下对任务并发度进行自发调整.(4)延迟持久化队列:拓扑中对磁盘的IO读写被延迟到数据处理之外,减缓IO高频阻塞对流计算系统的影响.本文在Apache Storm中实现了以上四种方案,性能测试结果表明优化后的流计算系统与Storm默认实现相比,不仅增强了大数据动态匹配能力,而且在最优情况下改善了17%的吞吐量,并提升了约20%的数据处理速度. 展开更多
关键词 数据流拓扑 流计算 大数据 流计算系统 性能优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部