面向异构架构的传递闭包并行算法被引量：3

Parallel Transitive Closure Algorithm for Heterogeneous Architecture

下载PDF

导出

摘要传统求图传递闭包的方法存在计算量大与计算时间长的问题。为加快处理大数据量的传递闭包算法的计算速度,结合算法密集计算和开放式计算语言(OpenCL)框架的特征,采用本地存储器优化的并行子矩阵乘和分块的矩阵乘并行计算,提出一种基于OpenCL的传递闭包并行算法。利用本地存储器优化的并行子矩阵乘算法来优化计算步骤,提高图形处理器(GPU)的存储器利用率,降低数据获取延迟。通过分块矩阵乘并行计算算法实现大数据量的矩阵乘,提高GPU计算核心的利用率。数据结果表明,与CPU串行算法、基于开放多处理的并行算法和基于统一设备计算架构的并行算法相比,传递闭包并行算法在OpenCL架构下NVIDIA GeForce GTX 1070计算平台上分别获得了593.14倍、208.62倍和1.05倍的加速比。 The traditional method for obtaining the transitive closure of the graphs faces the large amount of calculation and long calculation time.In order to improve the computing speed of the transitive closure algorithm for dealing with large amounts of data,an Open Computing Language(OpenCL)-based parallel algorithm for transitive closure is proposed.The algorithm combines the characteristics of algorithm-intensive computation and OpenCL architecture,and uses the parallel submatrix multiplication and block matrix multiplication optimized by local memory for parallel computing.The parallel submatrix multiplication algorithm is used to optimize the computational steps,improves the memory utilization of the Graphic Processing Unit(GPU),and reduces the data acquisition delay.The parallel block matrix multiplication algorithm is used to implement matrix multiplication involving large amounts of data,and improve the utilization of the GPU computing cores.The experimental results show that compared with the sequential CPU-based algorithm,parallel algorithm based on Open Multi-Processing,and parallel algorithm based on Compute Unified Device Architecture(CUDA),the proposed parallel transitive closure algorithm provides a 593.14 times,208.62 times and 1.05 times speedup respectively on the NVIDIA GeForce GTX 1070 computing platform with OpenCL architecture.

作者肖汉郭宝云李彩林周清雷 XIAO Han;GUO Baoyun;LI Cailin;ZHOU Qinglei(School of Information Science and Technology,Zhengzhou Normal University,Zhengzhou 450044,China;School of Civil and Architectural Engineering,Shandong University of Technology,Zibo,Shandong 255000,China;School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China)

机构地区郑州师范学院信息科学与技术学院山东理工大学建筑工程学院郑州大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第8期131-139,共9页 Computer Engineering

基金国家自然科学基金(41601496,41701525,61572444) 山东省自然科学基金(ZR2017LD002) 山东省重点研发计划项目(2018GGX106002)。

关键词矩阵乘传递闭包图形处理器开放式计算语言并行算法 matrix multiplication transitive closure Graphic Processing Unit(GPU) Open Computing Language(OpenCL) parallel algorithm

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1Xiaofang QI,Zhenliang JIANG.Precise slicing of interprocedural concurrent programs[J].Frontiers of Computer Science,2017,11(6):971-986. 被引量：1
2范艳焕,耿生玲,李永明.Pebble模糊有穷自动机和传递闭包逻辑[J].模糊系统与数学,2015,29(4):38-44. 被引量：4
3舒虎,崇志宏,倪巍伟,卢山,徐立臻.X-Hop:传递闭包的多跳数压缩存储和快速可达性查询[J].计算机科学,2012,39(3):144-148. 被引量：4
4汪小燕,杨思春,叶红,周建平.传递闭包的增量式更新研究[J].苏州科技学院学报（自然科学版）,2015,32(1):45-48. 被引量：2
5马军,高冈忠雄.图的最短路径和传递闭包的并行算法[J].计算机学报,1990,13(9):706-708. 被引量：3
6陈绪斌,曹嘉麟,陈赟,曾晓洋.高性能并行Turbo译码器的VLSI设计[J].计算机工程,2012,38(23):255-258. 被引量：1

二级参考文献44

1陈显强.二元关系的传递性和传递闭包探讨[J].数学的实践与认识,2004,34(9):135-137. 被引量：13
2何小亚,王洪山.利用关系矩阵求传递闭包的一种方法[J].数学的实践与认识,2005,35(3):172-175. 被引量：23
3翟璐璐,谢维奇.关系传递闭包的计算[J].河南教育学院学报（自然科学版）,2005,14(1):25-26. 被引量：7
4戚晓芳,徐宝文,周晓宇.一种基于程序可达图的并发程序依赖性分析方法[J].电子学报,2007,35(2):287-291. 被引量：14
5Agrawal R, Borgida A,Jagadish H V. Efficient management of transitive relationships in large data and knowledge bases[C]// SIGMOD. 1989 : 253-262.
6Jin Ruo-ming, Xiang Yang, Ruan Ning, et al. Efficiently answering reachability queries on very large directed graphs[C]///SIGMOD Conference. 2008 : 595-608.
7Wang Hai-xun, He Hao, Yang Jun, et al. Dual Labeling: Answering graph teachability queries in constant time[C] //ICDE' 06. 2006:75.
8Cohen E, Halperin E, Kaplan H. Reachability and distance queries via 2-Hop labels[C]//Proceedings of the 13th annual ACM- SIAM Symposium on Discrete algorithms. 2002 : 937-946.
9Jagadish H V. A compression technique to materialize transitive closure[J]. ACM Trans. Database Syst. , 1990,15(4):558-598.
10Kapoor S, Ramesh H. Algorithms for generating all spanning trees of undirected and weighted graphs[J]. SIAM J. Comput. , 1995,24(2).

共引文献9

1范时平,潘淑琴,罗启涵.一种新的基于递归分解的图可达性查询算法[J].计算机应用研究,2014,31(12):3591-3595. 被引量：2
2黄宏涛,吴忠良,万庆生,黄少滨.基于限界传递相似度图的FCA概念相似度计算方法[J].计算机科学,2015,42(1):285-289.
3尹树祥,靳婷.图数据隐私保护可达性查询算法研究[J].计算机工程,2015,41(2):167-172. 被引量：2
4马军,马绍汉.Efficient Parallel Algorithms for Some Graph Theory Problems[J].Journal of Computer Science & Technology,1993,8(4):362-366.
5付欣.网络图的计算机算法和显示方法的研究[J].电脑知识与技术（过刊）,2013,19(12X):7946-7947. 被引量：11
6张振宇,朱培栋,王可,胡慧俐.拓扑结构与节点属性综合分析的社区发现算法[J].计算机技术与发展,2018,28(4):1-5. 被引量：3
7彭家寅.基于完备剩余格值逻辑的下推自动机与上下文无关文法[J].山东大学学报（理学版）,2019,54(5):112-126. 被引量：1
8谷云东,王斌,赵峰.强反传递模糊矩阵及其性质[J].模糊系统与数学,2019,33(4):94-100. 被引量：1
9张从文.二元关系传递闭包的实现算法[J].电脑编程技巧与维护,2020(3):50-52. 被引量：1

同被引文献17

1董凤娇,陈桂林,王精明.“离散数学”中关系传递闭包的几种方法探讨[J].滁州学院学报,2021,23(2):132-136. 被引量：2
2何小亚,王洪山.利用关系矩阵求传递闭包的一种方法[J].数学的实践与认识,2005,35(3):172-175. 被引量：23
3刘龙章,杨志辉.Fuzzy关系矩阵传递闭包的截矩阵-Warshall算法[J].模糊系统与数学,2008,22(1):50-53. 被引量：1
4黄友澎,周永丰,李琳,张海波.基于传递闭包聚类的多传感器航迹关联算法[J].武汉理工大学学报（交通科学与工程版）,2008,32(5):834-837. 被引量：7
5赵峰,谷云东.一种求模糊矩阵传递闭包的基于幂序列单增矩阵构造的新算法[J].模糊系统与数学,2008,22(6):66-71. 被引量：3
6王忠义.二元关系的传递闭包运算及可视化实现[J].电子科技,2010,23(5):105-106. 被引量：1
7杨渊,高柳滨.基于传递闭包方法的非相关文献知识发现探索——以癌药物靶点为例[J].现代图书情报技术,2010(12):52-57. 被引量：2
8汪小燕.一种新的传递闭包算法研究[J].苏州科技学院学报（自然科学版）,2011,28(4):72-74. 被引量：7
9余胜春.关系矩阵传递性的一个递归算法[J].高等函授学报（自然科学版）,2013,26(2):11-12. 被引量：1
10汪小燕.基于设置复合位置的传递闭包算法[J].苏州科技学院学报（自然科学版）,2014,31(3):43-45. 被引量：1

引证文献3

1郭福洲.基于MPI并行计算方法的实践[J].科技资讯,2021,19(28):7-9.
2郭丽君.基于关系矩阵的传递闭包求解方法[J].计算机时代,2022(11):43-45.
3李博,黄东强,贾金芳,吴利,王晓英,黄建强.基于CPU与GPU的异构模板计算优化研究[J].计算机工程,2023,49(4):131-137. 被引量：4

二级引证文献4

1黄斌,柳安军,潘景山,田敏,张煜,朱光慧.基于GPU的LBM迁移模块算法优化[J].计算机工程,2024,50(2):232-238.
2刘金硕,文尧.模板运算代码的自动生成与调优框架[J].计算机工程,2024,50(6):35-47.
3吴静,谢晓霞,艾小锋,赵锋,徐振海.基于OpenMP的航迹融合并行优化方法[J].太赫兹科学与电子信息学报,2024,22(9):1021-1028.
4刘大兴,顾乃杰,黄章进,苏俊杰,齐东升.一种用于软件预取的访存轨迹采样算法[J].计算机工程,2024,50(10):362-369.

1汪争贤,吴建琳,陈胡嵘,夏禹晨.基于数据中台的财务大数据可视化分析的实现[J].经济研究导刊,2021(20):128-130. 被引量：6
2田野.长城汽车发布全车冗余L3级自动驾驶[J].智能网联汽车,2021(1):86-88.
3吕钊凤,田野,原诚寅.原诚寅:一定会有自主汽车芯片脱颖而出[J].智能网联汽车,2021(1):36-40.
4刘春雅.基于SoC FPGA的FPGA to HPS数据通信系统设计[J].甘肃科技,2021,37(13):16-19.
5田在荣,李强,聂宁明,全婷.并发L-BFGS异构率定算法设计与实现[J].青岛大学学报（自然科学版）,2021,34(3):43-50. 被引量：1
6顾懿德.基于.NET的基层图书馆使用预约管理系统设计[J].电脑知识与技术,2021,17(21):73-75.
7李兴康,钟旭凯,韦绍干,崔亮伟,范朋飞,管振华,马长勇.群体大小和觅食环境变化对东黑冠长臂猿日移动距离的影响[J].兽类学报,2021,41(4):388-397. 被引量：1
8金额尔都木吐,王春光,李斯琴高娃,杜海峰.结合显著性与Otsu法的紫花苜蓿茎显微图像分割[J].黑龙江畜牧兽医,2021(14):89-93. 被引量：1

计算机工程

2021年第8期

浏览历史

内容加载中请稍等...

面向异构架构的传递闭包并行算法被引量：3

参考文献6

二级参考文献44

共引文献9

同被引文献17

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

面向异构架构的传递闭包并行算法 被引量：3

参考文献6

二级参考文献44

共引文献9

同被引文献17

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

面向异构架构的传递闭包并行算法被引量：3