CUDA下单源最短路径算法并行优化被引量：3

Parallel optimization of single source shortest path algorithm under CUDA

下载PDF

导出

摘要为设计基于固定序的Bellman-Ford算法在CUDA平台下并行优化方案,结合算法计算密集和数据密集的特点。从核函数计算层面,提出访存优化方法和基于固定序优化线程发散;从CPU-GPU传输层面,提出基于CUDA流优化数据传输开销方法。对不同显卡进行测试,参照共享内存容量划分线程块、缩减迭代后向量维度并使用CUDA流缩短首次计算时延,相比传统算法,改进后并行算法加速比在200倍左右。该并行优化方案验证了固定序在CUDA平台具有可行性和可移植性,可作为多平台研究参照。 To design a parallel optimization scheme based on the fixed-order Bellman-Ford algorithm on the CUDA platform,the algorithm was computationally intensive and data-intensive.From the computational level of kernel function,the memory access optimization method and the fixed-order optimization thread divergence were proposed.From the CPU-GPU transmission level,the data transmission overhead method based on CUDA stream was proposed.After testing different graphics cards,the thread block was divided with reference to the shared memory capacity,the vector dimension was reduced after iteration,and the first calculation delay was shortened using the CUDA stream.The improved parallel algorithm has an acceleration ratio of about 200 times compared with the conventional algorithm.The parallel optimization scheme verifies that the fixed order is feasible and portable on the CUDA platform and can be used as a reference for multi-platform research.

作者张晗钱育蓉王跃飞陈人和田宸玮 ZHANG Han;QIAN Yu-rong;WANG Yue-fei;CHEN Ren-he;TIAN Chen-wei(School of Software,Xinjiang University,Urumqi 830008,China)

机构地区新疆大学软件学院

出处《计算机工程与设计》北大核心 2019年第8期2181-2189,共9页 Computer Engineering and Design

基金国家自然科学基金项目(61562086、61462079) 新疆维吾尔自治区创新团队基金项目(XJEDU2017T002)

关键词固定序改进算法 Bellman-Ford算法并行计算性能可移植性图形处理器统一计算设备架构 improved fixed order algorithm Bellman-Ford algorithm parallel computing performance portability GPU CUDA

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1韩伟一.固定序Bellman-Ford算法的一个改进[J].哈尔滨工业大学学报,2014,46(11):58-62. 被引量：7
2康文雄,许耀钊.节点约束型最短路径的分层Dijkstra算法[J].华南理工大学学报（自然科学版）,2017,45(1):66-73. 被引量：33
3韩伟一.基于固定序的Bellman-Ford算法的改进[J].运筹与管理,2015,24(4):111-115. 被引量：3
4刘磊,王燕燕,申春,李玉祥,刘雷.Bellman-Ford算法性能可移植的GPU并行优化[J].吉林大学学报（工学版）,2015,45(5):1559-1564. 被引量：7

二级参考文献52

1段凡丁.关于最短路径的SPFA快速算法[J].西南交通大学学报,1994,29(2):207-212. 被引量：57
2韩伟一,王铮.负权最短路问题的新算法[J].运筹学学报,2007,11(1):111-120. 被引量：13
3颜深根,张云泉,龙国平,等.基于OpenCL的归约算法优化[J].软件学报,2011,22(S2):163-171.
4BELLMAN R E. On a routing problem[ J ]. Quarterly of Applied Mathematics, 1958,16(1) : 87-90.
5CHERKASSKY B V, GEORGIADIS L, GOLDBERG A V, et al. Shortest-path feasibility algorithm : an experimental evaluation [ J ]. ACM Journal of Experimental Algorithmics, 2009,14(2) : 1-37.
6HUNG M S, DIVOKY J J. A computational study of efficient shortest path algorithms [ J ]. Computer & Operations Research, 1988,15 (6) : 567-576.
7LEWANDDOWSKI S. Shortest paths and negative cycle detection in graphs with negative weights [ R]. Stuttgart: Technical Report, Stuttgart University, 2010.
8CHERKASSKY B V, GOLDBERG A V. Negative-cycle detection algorithm [ J ]. Mathematical Programming, 1999,85 (2): 277-311.
9CHERKASSKY B V, GOLDBERG A V. Shortest paths algorithms: theory and experimental evaluation [ J ]. Mathematical Programming, 1996,73 (2) : 129-174.
10YEN J Y. An algorithm for finding shortest routes from all source nodes to a given destination in general networks [J]. Quarterly of Applied Mathematics, 1970, 27 : 526-530.

共引文献44

1陈豪,李勇,罗靖迪.基于改进A*算法优化的移动机器人路径规划研究[J].自动化与仪器仪表,2018,0(12):1-4. 被引量：25
2周啸,李胜辉,高奎亮,刘成龙,王含巢,胡家玮.一种多约束指标改进的动态旅游路线规划算法[J].中北大学学报（自然科学版）,2019,40(1):57-62. 被引量：3
3何建军.结点数受限的最短路径计数问题[J].软件导刊,2016,15(4):28-31.
4李邦云.基于Bellman-Ford算法的配电网节能控制研究[J].舰船电子工程,2018,38(8):37-41. 被引量：1
5张引发,刘乾,王鲸鱼.必经节点约束下的光网络最短路径算法[J].光通信技术,2018,42(10):30-32. 被引量：3
6李学鋆.基于UTMD的汽车自动驾驶的路径规划寻优算法[J].汽车安全与节能学报,2018,9(4):449-455. 被引量：2
7赵卫绩,巩占宇,王雯,樊守芳.几种经典的最短路径算法比较分析[J].赤峰学院学报（自然科学版）,2018,34(12):47-49. 被引量：14
8徐文星,梁菁菁,边卫斌,戴波,陶冠良,刘才.基于类决策树剪枝法的危化品运输实时路径规划[J].化工学报,2018,69(A02):324-329. 被引量：3
9袁师召,李军.无人驾驶汽车路径规划研究综述[J].汽车工程师,2019(5):11-13. 被引量：17
10王灵矫,梁雅媚,郭华.基于距离估计的无线传感网络移动节点定位研究[J].云南大学学报（自然科学版）,2019,41(3):476-483. 被引量：5

同被引文献13

1国九英,周兴元,杨慧珠.三维f-x,y域随机噪音衰减[J].石油地球物理勘探,1995,30(2):207-215. 被引量：37
2胡鏐,孙祥娥.多道地震记录的预测反褶积算子提取的实现方法及应用[J].石油仪器,2009,23(5):55-57. 被引量：5
3邴萍萍,曹思远,胡言防,路交通.改进的F-X域EMD去噪技术及分布式并行实现[J].石油天然气学报,2012,34(6):61-64. 被引量：4
4喻勤,程冰洁,孔选林.基于CUDA的转换波Kirchhoff叠前时间偏移算法研究及实现[J].石油地球物理勘探,2013,48(1):58-63. 被引量：4
5马召贵,赵改善,武港山,岳承琪,何恺,王鹏.Kirchhoff叠前时间偏移的GPU移植与性能优化技术[J].石油学报,2014,35(4):700-705. 被引量：5
6高铁军,赵明,毛亚纯.供水管网全网关阀预案与关键阀门分析[J].哈尔滨工业大学学报,2018,50(2):94-99. 被引量：7
7吴吉忠,左虎.叠前衰减补偿时间偏移及GPU实现[J].石油地球物理勘探,2019,54(1):84-92. 被引量：8
8曹祥红,李欣妍,魏晓鸽,李森,黄梦溪,李栋禄.基于Dijkstra-ACO混合算法的应急疏散路径动态规划[J].电子与信息学报,2020,42(6):1502-1509. 被引量：29
9郝晋瑶,牛保宁,康家兴.大规模路网图下关键词覆盖最优路径查询优化[J].软件学报,2020,31(8):2543-2556. 被引量：5
10邓军勇,赵一迪.图计算中压缩格式对单源最短路径算法影响的特性化分析[J].计算机应用与软件,2022,39(6):246-251. 被引量：2

引证文献3

1杨先凤,贵红军,傅春常.统一计算设备架构下的F-X域预测滤波并行算法[J].计算机应用,2021,41(2):486-491. 被引量：2
2刘蒙蒙,牛保宁,杨茸.关键词最优路径查询的分段拓展算法[J].计算机工程,2022,48(6):79-88. 被引量：1
3太梅婷,贾睿,杜坤,魏云飞,宋志刚.考虑最小隔离单元的古城镇消火栓维修策略分析[J].中国给水排水,2024,40(9):116-122.

二级引证文献3

1李梓杨,陈鹏程,于炯,蒲勇霖,何贞贞,李雪,郑世杰.面向大规模图数据的关键词覆盖最优路径规划方法[J].通信学报,2023,44(9):205-217. 被引量：1
2杨波,陈洋广,徐胜超.基于Spark云计算的生物基因多序列比对方法[J].计算机测量与控制,2024,32(7):274-279.
3梁昊,周辉,王洪松,刘长春.高分辨率单道地震数据处理关键技术研究[J].海洋技术学报,2024,43(5):28-35.

1虞谦,高岳毅,李俊.最短路径算法在事故应急救援中的应用[J].安全,2018,39(9):15-17. 被引量：2
2许昌,陈丹丹,韩星星,Wenzhong Shen,王长宝,石磊.复杂地形风电场一体化优化设计研究[J].太阳能学报,2017,38(12):3368-3375. 被引量：8
3赵卫绩,巩占宇,王雯,樊守芳.几种经典的最短路径算法比较分析[J].赤峰学院学报（自然科学版）,2018,34(12):47-49. 被引量：14
4刘雪敏,常勇强,管坚,张松松,王中伟,于吉明,齐国利.工业锅炉定型产品能效数据统计与分析[J].西部特种设备,2018,2(2):65-69. 被引量：2
5胡越,陈晓丽,张安录,朱兰兰,蔡银莺.农民对农田生态系统服务价值认知的二重偏差及影响因素[J].土地经济研究,2014(2):64-78. 被引量：3
6李卓,李引珍,李文霞.考虑有限理性的震后应急路径选择模型[J].中国安全科学学报,2019,29(2):184-190. 被引量：4
7梁勇东,彭宇,林深和,黎志滔,梁淞铭.无人机与无人车协作导航系统设计[J].机电信息,2019(5):60-61.
8唐勇,何东林,朱新平.基于多智能体系统仿真的最短路径规划[J].成都大学学报（自然科学版）,2019,38(2):159-162. 被引量：2
9冯维,杨凯通,徐永鑫,吴端坡,刘晴.无线多跳网络安全路由算法[J].控制与决策,2019,34(5):1043-1048. 被引量：4
10杨楠,周峥,陈道君,王璇,李宏圣,黎索亚.基于非参数核密度估计的风功率波动性概率密度建模方法[J].太阳能学报,2019,40(7):2028-2035. 被引量：22

计算机工程与设计

2019年第8期

浏览历史

内容加载中请稍等...

CUDA下单源最短路径算法并行优化被引量：3

参考文献4

二级参考文献52

共引文献44

同被引文献13

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

CUDA下单源最短路径算法并行优化 被引量：3

参考文献4

二级参考文献52

共引文献44

同被引文献13

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

CUDA下单源最短路径算法并行优化被引量：3