期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
任务并行编程模型下排列熵算法的并行实现
1
作者 李维权 《软件工程》 2024年第2期40-43,共4页
排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度... 排列熵算法随着嵌入维数的增大,运算规模将会呈平方级数增大,计算时效性问题突出,亟待解决。为此,提出一种基于任务并行编程模型的线程级并行方法,通过任务并行运行系统(StarPU)将密集型计算划分为多个独立的任务,再由调度器将任务调度到不同的CPU上执行,实现排列熵算法的并行化。基于StarPU的排列熵并行算法与串行程序相比较,加速比为23.79倍,相较于OpenMP(一种用于共享内存并行系统的并行计算方案),在分配28个线程时,加速比为1.17倍,结果表明该方法能够有效实现排列熵算法的加速执行。 展开更多
关键词 排列熵算法 任务并行编程模型 OPENMP StarPU
下载PDF
ParM:基于国产处理器的异构并行编程模型
2
作者 朱文龙 江嘉治 +1 位作者 黄聃 肖侬 《计算机工程与科学》 CSCD 北大核心 2023年第9期1521-1531,共11页
随着算力需求的增长,各种国产异构计算设备不断出现,这些设备都有其专用的编程模型,开发者需要根据不同设备的架构特点在专用的编程模型上进行开发,导致开发出的代码在设备间不具有可移植性。近年来国外已经出现了支持多种计算设备的统... 随着算力需求的增长,各种国产异构计算设备不断出现,这些设备都有其专用的编程模型,开发者需要根据不同设备的架构特点在专用的编程模型上进行开发,导致开发出的代码在设备间不具有可移植性。近年来国外已经出现了支持多种计算设备的统一异构并行编程模型,但针对国产设备的异构编程模型的研究和实现还比较少。针对该问题,开发了一套性能可移植的异构编程模型ParM。该编程模型以C++库的形式提供,屏蔽了大量的底层实现细节,降低了并行编程难度。该编程框架目前支持的后端设备有x86 CPU、NVIDIA GPU、华为鲲鹏处理器和华为昇腾AI处理器,并且对各种后端设备进行了性能优化。在各种设备上的性能测试表明,ParM编程模型的性能可以达到原始代码的90%以上。 展开更多
关键词 性能可移植 并行编程模型 高性能计算 异构计算 国产处理器
下载PDF
MapReduce并行编程模型研究综述 被引量:187
3
作者 李建江 崔健 +2 位作者 王聃 严林 黄义双 《电子学报》 EI CAS CSCD 北大核心 2011年第11期2635-2642,共8页
MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成... MapReduce并行编程模型通过定义良好的接口和运行时支持库,能够自动并行执行大规模计算任务,隐藏底层实现细节,降低并行编程的难度.本文对MapReduce的国内外相关研究现状进行了综述,阐述和分析了当前国内外与MapReduce相关的典型研究成果的特点和不足,重点对MapReduce涉及的关键技术(包括:模型改进、模型针对不同平台的实现、任务调度、负载均衡和容错)的研究现状进行了深入的分析.本文最后还对MapReduce未来的发展趋势进行了展望. 展开更多
关键词 MAPREDUCE 并行编程模型 运行时支持库 海量数据处理
下载PDF
任务并行编程模型研究与进展 被引量:29
4
作者 王蕾 崔慧敏 +1 位作者 陈莉 冯晓兵 《软件学报》 EI CSCD 北大核心 2013年第1期77-90,共14页
任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型... 任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,旨在简化并行编程和提高多核利用率.首先,介绍了任务并行编程模型的基本编程接口和支持机制;然后,从3个角度,即并行性表达、数据管理和任务调度介绍任务并行编程模型的研究问题、困难和最新研究成果;最后展望了任务并行未来的研究方向. 展开更多
关键词 任务并行 并行编程模型 任务窃取调度 并行性表达
下载PDF
异构并行编程模型研究与进展 被引量:13
5
作者 刘颖 吕方 +3 位作者 王蕾 陈莉 崔慧敏 冯晓兵 《软件学报》 EI CSCD 北大核心 2014年第7期1459-1475,共17页
近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑... 近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑战提供了相应的解决方案.最后,结合目前的研究现状以及异构系统的发展,提出了异构并行编程模型的未来方向. 展开更多
关键词 异构并行编程模型 异构系统 GPU 编程接口 编译 运行时系统
下载PDF
MapReduce并行编程模型研究综述 被引量:24
6
作者 杜江 张铮 +1 位作者 张杰鑫 邰铭 《计算机科学》 CSCD 北大核心 2015年第S1期537-541 564,564,共6页
MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集... MapReduce并行编程模型的出现简化了并行编程的复杂度。通过调用方便的接口和运行时支持库,MapReduce并行编程模型可令大规模并行计算任务自动并发地执行而不必关心底层的具体实现细节,从而令MapReduce并行编程模型在大规模中低性能集群中发挥出色的计算能力,且可节约成本。对国内外关于MapReduce并行编程模型的研究现状进行了综述,分析了目前国内外相关研究成果的优缺点,并对MapReduce并行编程模型的未来发展进行了展望。 展开更多
关键词 MAPREDUCE 并行编程模型 并行计算 海量数据处理
下载PDF
一种支持多种访存技术的CBEA片上多核MPI并行编程模型 被引量:6
7
作者 冯国富 董小社 +2 位作者 胡冰 王旭昊 王恩东 《计算机学报》 EI CSCD 北大核心 2008年第11期1965-1974,共10页
现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI... 现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI并行编程模型,将通信分解在PPE(PowerPC Processing Element)上,拓宽模型的适用范围;在统一访存接口下,通过运行时访存剖分信息指导选择和优化访存以提高计算效率.实验结果表明,文中提出的编程模型支持多种访存模式并具有很好的并行加速比,可获得较同类相关技术30%-50%左右的性能提升. 展开更多
关键词 异构多核 CBE架构 并行编程模型 MPI 访存技术 剖分优化
下载PDF
基于多核机群的事务内存并行编程模型的研究 被引量:3
8
作者 李文敬 李双 +1 位作者 元昌安 廖伟志 《小型微型计算机系统》 CSCD 北大核心 2014年第8期1732-1737,共6页
为了解决多核机群并行程序中共享数据所使用的锁机制存在的不足,提出多核机群软件事务内存(STM,Software Transactional Memory)并行编程模型.首先分析MPI+OpenMP并行编程模型的优缺点,然后根据软件事务内存的优势,对多核节点内的多线... 为了解决多核机群并行程序中共享数据所使用的锁机制存在的不足,提出多核机群软件事务内存(STM,Software Transactional Memory)并行编程模型.首先分析MPI+OpenMP并行编程模型的优缺点,然后根据软件事务内存的优势,对多核节点内的多线程共享存储采用乐观检测冲突及优先数优先的竞争管理策略设计事务内存替代锁机制,在多核机群平台中构建新的MPI+OpenMP+STM三级并行编程模型,并将模型应用于随机摄动人工蜂群并行算法的设计与实现,运用MPI+TBB平台对人工蜂群并行算法进行对比实验.实验结果表明,该模型是解决多核机群数据共享锁机制问题的一种有效的编程模式. 展开更多
关键词 多核机群 锁机制 消息传递 软事务内存 检测冲突 并行编程模型
下载PDF
多核处理器并行编程模型的研究与设计 被引量:17
9
作者 曹折波 李青 《计算机工程与设计》 CSCD 北大核心 2010年第13期2999-3002,3056,共5页
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并... 为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略。用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比。 展开更多
关键词 多核处理器 并行程序 并行编程模型 cache块技术 任务密取
下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
10
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建块
下载PDF
基于多核集群系统的并行编程模型的研究 被引量:6
11
作者 胡晨骏 王晓蔚 《计算机技术与发展》 2008年第4期70-73,共4页
并行计算技术是计算机技术发展的重要方向之一。当前并行程序模型主要有消息传递模型和共享存储模型两种。随着处理器多核技术的发展,在一枚多核处理器中集成两个或多个完整的计算引擎(内核),并充分利用多核计算机的特性,发挥多核计算... 并行计算技术是计算机技术发展的重要方向之一。当前并行程序模型主要有消息传递模型和共享存储模型两种。随着处理器多核技术的发展,在一枚多核处理器中集成两个或多个完整的计算引擎(内核),并充分利用多核计算机的特性,发挥多核计算机的性能成为一个很重要的研究方向。介绍一种新的MPI实现机制,这种机制集成了共享存储模型和消息通信模型的优点,在节点内使用共享存储模型,在节点间使用消息传递模型,并且通过自动生成线程级的任务来获得更好的性能。 展开更多
关键词 并行编程模型 消息传递模型 共享存储模型 MPI 线程
下载PDF
基于多核与众核结构的并行编程模型研究 被引量:1
12
作者 王文义 王晗 《中原工学院学报》 CAS 2014年第3期52-56,共5页
针对并行计算机不同的数据存储方式,分析对比了基于多核和众核体系结构的共享存储并行编程模型和分布式存储并行编程模型,以CUDA和OpenCL为例介绍了基于异构计算机系统的并行编程模型,指出基于异构平台的混合编程在今后的大规模并行应... 针对并行计算机不同的数据存储方式,分析对比了基于多核和众核体系结构的共享存储并行编程模型和分布式存储并行编程模型,以CUDA和OpenCL为例介绍了基于异构计算机系统的并行编程模型,指出基于异构平台的混合编程在今后的大规模并行应用中必将成为主流。 展开更多
关键词 多核 众核 并行编程模型 混合编程 异构编程
下载PDF
分布式并行编程模型MapReduce及其应用研究 被引量:2
13
作者 郑瑛 《西南民族大学学报(自然科学版)》 CAS 2017年第2期161-166,共6页
在传统的并行编程模型中,对大量数据如何进行并行计算、如何为每个任务分发数据、如何处理单点故障等问题,都需要大量的程序分析和设计,这些问题的有效处理都需要程序员显式地使用有关技术来解决.对于程序员来说,这是一项具有极大困难... 在传统的并行编程模型中,对大量数据如何进行并行计算、如何为每个任务分发数据、如何处理单点故障等问题,都需要大量的程序分析和设计,这些问题的有效处理都需要程序员显式地使用有关技术来解决.对于程序员来说,这是一项具有极大困难的工作,使得原本简单的运算反而变得非常复杂,这些问题的存在也在一定程度上制约了并行程序的普及.而MapReduce计算模型能有效地解决上述问题,阐述了Google的MapReduce计算模型的实现机制,并通过实例描述了该模型的执行过程. 展开更多
关键词 分布式并行编程模型 MAPREDUCE 函数式编程语言
下载PDF
MPI+OpenMP混合并行编程模型在分子动力学中的应用
14
作者 张坤峰 张苏 《周口师范学院学报》 CAS 2022年第5期71-75,共5页
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构... 针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。 展开更多
关键词 分子动力学 MPI+OPENMP 并行编程模型 LAMMPS
下载PDF
任务并行编程模型研究与进展
15
作者 赵世韬 《电子技术与软件工程》 2016年第12期165-165,共1页
近些年来,任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,其作用是在于简便并行编程和提高多核利用率。处理器从单核升级到多核,芯片的并行计算能力得到了显著增强,性能也得到了明显提高。但是,由于组成结构非常复杂... 近些年来,任务并行编程模型是近年来多核平台上广泛研究和使用的并行编程模型,其作用是在于简便并行编程和提高多核利用率。处理器从单核升级到多核,芯片的并行计算能力得到了显著增强,性能也得到了明显提高。但是,由于组成结构非常复杂,传统的处理器有着巨大发能源消耗的问题,不能通过增加核的数量来达到提升性能的效果。于是现在有了CPU和一个或者多个加速设备在主板或者片互相连接组成的异构系统,可以从根本提升计算机的性能和计算能力。并行编程模型和框架不能有效利用和发挥并行系统的特点,应用开发和性能优化难度大。面向GPU异构并行系统的多任务流编程模式,消息通信和任务内数据共享的通信方式运行时实现了一个系统原型。 展开更多
关键词 任务并行 并行编程模型 处理器研究与进展
下载PDF
数值模拟领域并行编程模型的要素与实例研究 被引量:6
16
作者 莫则尧 张爱清 +1 位作者 刘青凯 曹小林 《中国科学:信息科学》 CSCD 北大核心 2015年第3期385-397,共13页
本文面向高性能数值模拟,分析了通用并行编程模型的薄弱环节,凝练形成了通用并行编程模型栈.在此基础上,提出领域并行编程模型,讨论了模型的数据结构、计算模式、构件模型、编程框架等构成要素和要素间的内在关联,并以JASMIN(J’s Adapt... 本文面向高性能数值模拟,分析了通用并行编程模型的薄弱环节,凝练形成了通用并行编程模型栈.在此基础上,提出领域并行编程模型,讨论了模型的数据结构、计算模式、构件模型、编程框架等构成要素和要素间的内在关联,并以JASMIN(J’s Adaptive Structured Mesh application INfrastructure)框架为例,验证了模型的技术可行性和有效性.领域并行编程模型将显著提升高效并行应用软件的研发效率,具有重要意义. 展开更多
关键词 数值模拟 应用软件 领域并行编程模型 并行计算模型 JASMIN框架
原文传递
面向国产高性能众核处理器的编程模型
17
作者 陈虎 周鹏灵 《计算机应用》 CSCD 北大核心 2023年第11期3517-3526,共10页
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一... 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。 展开更多
关键词 国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型
下载PDF
多核多线程并行编程模型研究及应用 被引量:1
18
作者 于方 《阴山学刊(自然科学版)》 2012年第2期30-33,共4页
首先介绍目前基于多核平台的并行计算技术和方法,本文主要研究OpenMP+Microsoft VisualStudio 2005的多核多线程并行编程模型;以求解三角网格模型上最短路径问题为应用实例,验证了多核平台下利用该模型实现多核多线程并行编程的正确性... 首先介绍目前基于多核平台的并行计算技术和方法,本文主要研究OpenMP+Microsoft VisualStudio 2005的多核多线程并行编程模型;以求解三角网格模型上最短路径问题为应用实例,验证了多核平台下利用该模型实现多核多线程并行编程的正确性和高效性,为解决其他应用领域的复杂计算提供了一种易实现、大众化的多核并行编程模式。 展开更多
关键词 多核 多线程 并行编程模型 OPENMP MicrosoftVisualStudio2005
原文传递
面向大图子图匹配的多GPU编程模型 被引量:2
19
作者 李岑浩 崔鹏杰 +1 位作者 袁野 王国仁 《计算机科学与探索》 CSCD 北大核心 2023年第7期1576-1585,共10页
子图匹配是复杂网络中进行数据挖掘的重要手段。近年来,基于图形处理器(GPU)的子图匹配算法已展现明显的速度优势。然而,由于大图数据的规模宏大以及子图匹配的大量中间结果,单块GPU的内存容量很快成为了处理大图子图匹配算法的主要瓶... 子图匹配是复杂网络中进行数据挖掘的重要手段。近年来,基于图形处理器(GPU)的子图匹配算法已展现明显的速度优势。然而,由于大图数据的规模宏大以及子图匹配的大量中间结果,单块GPU的内存容量很快成为了处理大图子图匹配算法的主要瓶颈。因此,提出了一种面向大图子图匹配的多GPU编程模型。首先,提出了基于多GPU的子图匹配算法框架,实现了子图匹配算法在多GPU上的协同操作,解决了GPU大图子图匹配的图规模问题。其次,采用了一种基于查询图的动态调节技术来处理跨分区子图集,解决了图划分导致的跨分区子图匹配难题。最后,结合GPU单指令多线程(SIMT)架构特性,提出一种优先级调度策略保证GPU的内部负载均衡,并设计了共享内存的流水线机制优化多核并发的缓存争用。实验表明,多GPU编程模型能够在数十亿级别的数据集上得到正确的匹配结果,与最新的基于GPU的解决方案相比,该算法框架能够获得1.2~2.6倍的加速比。 展开更多
关键词 图分析 多GPU 大图子图匹配 优先级调度 并行编程模型
下载PDF
用数据驱动的编程模型并行多重网格应用 被引量:1
20
作者 郭杰 高希然 +2 位作者 陈莉 傅游 刘颖 《计算机科学》 CSCD 北大核心 2020年第8期32-40,共9页
多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植... 多重网格是数值计算领域中一种加速迭代收敛的重要技术,被广泛应用。近年来,大规模并行计算系统向多核化、异构众核化发展,多重网格应用也亟须适应新的并行计算平台。文中采用一种数据驱动的任务并行语言AceMesh将遗产的NAS MG程序移植到“天河二号”和“神威·太湖之光”两种不同架构的国产超算平台上,展示了使用该语言对计算循环、通信代码的任务并行方法,验证了AceMesh语言的跨平台性能可移植性。文中定性地分析了该应用的任务图特征和计算-通信重叠的特点,并分别在两个并行计算平台上将其与现有编程模型MPI/OpenMP和MPI/OpenACC进行性能对比,分析了AceMesh任务图并行程序对访存性能和通信-计算重叠的优化效果。实验数据表明,相比传统的并行编程方法,AceMesh在“神威·太湖之光”和“天河二号”平台上分别最高获得了1.19X和1.85X的性能加速。最后,针对该应用在不同网格层的通信特点以及通信序列化导致大量通信不能隐藏的问题,提出了未来的研究方向。 展开更多
关键词 多重网格 MPI遗产应用 数据驱动的任务并行编程模型 异构众核 计算-通信重叠
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部