期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
A Hybrid Parallel Strategy for Isogeometric Topology Optimization via CPU/GPU Heterogeneous Computing
1
作者 Zhaohui Xia Baichuan Gao +3 位作者 Chen Yu Haotian Han Haobo Zhang Shuting Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第2期1103-1137,共35页
This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstr... This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstrategy of CPU/GPU is proposed, while the hybrid parallel strategies for stiffness matrix assembly, equationsolving, sensitivity analysis, and design variable update are discussed in detail. To ensure the high efficiency ofCPU/GPU computing, a workload balancing strategy is presented for optimally distributing the workload betweenCPU and GPU. To illustrate the advantages of the proposedmethod, three benchmark examples are tested to verifythe hybrid parallel strategy in this paper. The results show that the efficiency of the hybrid method is faster thanserial CPU and parallel GPU, while the speedups can be up to two orders of magnitude. 展开更多
关键词 Topology optimization high-efficiency isogeometric analysis cpu/gpu parallel computing hybrid OpenMPCUDA
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
2
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 gpu/cpu协同计算 随机速度边界
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
3
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
基于CPU-GPU协同并行内点算法求解结构化非线性规划 被引量:2
4
作者 杨林峰 胡桂莉 +1 位作者 张晨 张振荣 《电子学报》 EI CAS CSCD 北大核心 2019年第2期382-389,共8页
大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit... 大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit commitment,UC)为稀疏系数矩阵的结构化非线性规划,本文根据PD-IPM原理,对UC模型进行连续松弛预处理,结合快速解耦技术解耦牛顿修正方程并设计CPU-GPU协同并行算法求解子问题,最后将结果与带稠密型子问题的结构化非线性规划的求解结果进行比较和分析.实验结果显示,本文所设计的算法对于两种不同类型的结构化非线性规划求解均能获得较好的加速比. 展开更多
关键词 非线性规划 内点法 机组组合 cpu-gpu协同 并行计算
下载PDF
基于CPU与GPU/CUDA的数字图像处理程序的性能比较 被引量:4
5
作者 岳俊 邹进贵 何豫航 《地理空间信息》 2012年第4期45-47,180,共3页
测绘系统通常有大量图像处理工作,而户外图像采集系统更需要极高的实时性。通过对GPU与CPU分别进行数字图像处理性能测试,结果表明GPU并行计算可以大幅提高图像处理性能:可优化图像预处理、后处理速度,使测绘系统更加实时高效。
关键词 cpu gpu CUDA 并行计算 数字图像处理
下载PDF
基于多核CPU+GPU运算的电磁场高效体绘制算法研究 被引量:1
6
作者 陈宇峰 张铂 李林 《计算机工程与应用》 CSCD 北大核心 2018年第18期218-222,共5页
雷达探测范围作为电磁场的一个典型代表,由于其在军事决策时扮演着重要的作用,所以对探测范围可视化的准确性和实时性的要求很严格。传统的面绘制三维数据场信息会造成大量的空间信息丢失。因此,采用体绘制技术来获取电磁场中的三维数... 雷达探测范围作为电磁场的一个典型代表,由于其在军事决策时扮演着重要的作用,所以对探测范围可视化的准确性和实时性的要求很严格。传统的面绘制三维数据场信息会造成大量的空间信息丢失。因此,采用体绘制技术来获取电磁场中的三维数据场信息。针对传统体绘制技术算法执行效率较低的问题,提出使用多核CPU+GPU的架构来加速体绘制,从而实现实时处理。实验表明,采用提出的方法可以大幅减少体绘制中光线绘制的时间,充分利用CPU的空闲存储资源和计算资源。 展开更多
关键词 电磁场 体绘制 多核cpu+gpu 并行计算
下载PDF
基于CPU-GPU混合编程的显微镜图像实时拼接
7
作者 吴为民 刘新 +2 位作者 李伙钦 江先伟 杨华 《重庆科技学院学报(自然科学版)》 CAS 2023年第3期67-74,共8页
随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CP... 随着电子显微镜图像的分辨率越来越高,图像拼接的计算量也越来越大,实时拼接的流畅效果对计算速度提出了很高的要求。利用NVIDIA的GPU并行编程框架CUDA,将拼接过程中耗时较长的图像特征点检测和图像拷贝部分迁移到GPU上进行并行计算,CPU则负责逻辑控制部分的计算,提高了整体的运算效率。实验结果表明,CPU-GPU混合编程模式有效地缩短了显微镜图像拼接时间,提高了拼接的流畅度和实时性。 展开更多
关键词 电子显微镜 实时拼接 并行计算 cpu-gpu混合编程
下载PDF
基于GPU-CPU协同的遥感影像坐标转换研究与实现
8
作者 侯飞 《测绘与空间地理信息》 2020年第11期29-31,共3页
2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的... 2000国家大地坐标系(CGCS 2000)于2018年正式启用,自然资源、空间规划、水利、交通等行业也逐步过渡到CGCS 2000。目前仍存在较多非CGCS 2000的历史影像数据需要进行坐标转换,另外,同一坐标系下也存在坐标换带等坐标转换的需求。传统的影像坐标转换方法效率较低,且大数据量影像难以转换,鉴于此,本文将GPU-CPU协同处理技术引入到影像坐标转换过程,建立GPU-CPU协同的影像并行转换流程,通过分块处理策略和GPU处理优化加速整个处理过程。经过系统数据实验,本文方法较普通坐标转换方法有极大的效率提升,在国土资源数据2000国家大地坐标系转换工作中得到了良好的推广应用。 展开更多
关键词 gpu-cpu协同 遥感影像 坐标转换 并行计算
下载PDF
CPU和GPU协同并行加速多生物序列比对 被引量:5
9
作者 杨春燕 钟诚 《小型微型计算机系统》 CSCD 北大核心 2016年第12期2780-2784,共5页
将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,... 将主库构建阶段的输入序列分成多个分主库、将主库扩展阶段的主库元素划分成多个计算窗口,使之符合GPU并行计算的线程结构特性,GPU以计算窗口为单位并行计算比对矩阵、并行约减主库及并行扩展比对矩阵,结合库优化思想优化主库构建过程,利用阈值cutoff控制主库约减程度,设计实现CPU和多个GPU协同计算并行比对多生物序列的高效可扩展算法OGM SA.实验结果表明,当cutoff≤0.20时,算法OGM SA的比对结果质量与算法G-M SA相同,计算速度是G-M SA算法的近4倍,内存容量需求比G-MSA算法也有所降低. 展开更多
关键词 多生物序列 并行比对 计算窗口 cpugpu协同计算 主库约减
下载PDF
全局基因调控网络构建CPU/GPU并行算法
10
作者 陈绪伟 钟诚 《小型微型计算机系统》 CSCD 北大核心 2015年第2期234-239,共6页
对基因表达谱分块,使之符合GPU并行计算的线程结构特性,根据GPU线程结构特性设计双层并行模式,并利用纹理缓存实现访存高效;依据CPU二级缓存容量对基本块进一步细分成子块以提高缓存命中率,利用数据预取技术减少访存次数,利用线程绑定... 对基因表达谱分块,使之符合GPU并行计算的线程结构特性,根据GPU线程结构特性设计双层并行模式,并利用纹理缓存实现访存高效;依据CPU二级缓存容量对基本块进一步细分成子块以提高缓存命中率,利用数据预取技术减少访存次数,利用线程绑定技术减少线程在核心之间的迁移;依据多核CPU和GPU的计算能力分配CPU和GPU的基因互信息计算任务以平衡CPU与GPU的计算负载;在设计新的阈值计算算法基础上,设计实现了访存高效的构建全局基因调控网络CPU/GPU并行算法.实验结果表明,与已有算法相比,本文算法加速更明显,并且能够构建更大规模的全局基因调控网络. 展开更多
关键词 全局基因调控网络 cpugpu协同计算 访存高效 并行算法
下载PDF
一种基于CPU-GPU混合系统的并行同态加密算法 被引量:1
11
作者 郑志蓉 《舰船电子工程》 2019年第8期121-123,131,共4页
随着云计算服务模式的推广,用户数据的私密性逐渐成为云安全体系需要重点关注的焦点。在信息安全领域,数据加密是避免信息遭受非法访问的有效途径。同态加密是一种可直接对密文进行运算的加密算法,在给云服务提供商省去解密的复杂操作同... 随着云计算服务模式的推广,用户数据的私密性逐渐成为云安全体系需要重点关注的焦点。在信息安全领域,数据加密是避免信息遭受非法访问的有效途径。同态加密是一种可直接对密文进行运算的加密算法,在给云服务提供商省去解密的复杂操作同时,也很好地保护了数据的私密性。但是,由于同态加密算法的计算复杂度特别高,导致给计算资源增加了繁重的负担。该研究针对上述问题设计了一种快速的并行计算框架,提出一种基于CPU-GPU混合系统的并行同态加密算法。文章提出的同态加密并行计算框架,主要致力于利用GPU来加速同态加密算法的运行,从而缩短同态加密算法的运行时间,保证云计算环境用户数据的安全。另外,论文设计了一种数据处理的流水线模式,从而进一步提高并行同态加密算法的并行度。实验也表明,论文提出的并行同态加密算法相比串行同态加密算法,在执行同态乘法和同态加法操作时,在运算时间上分别提高了70%和91%。 展开更多
关键词 同态加密 云计算 cpu gpu 数据私密性 并行计算
下载PDF
CPU+GPU异构体系混合编程模式研究 被引量:2
12
作者 翟金亭 高希然 《信息记录材料》 2016年第4期31-32,共2页
近年来,使用CPU单一模式进行并行计算已不适用,随着GPU其超高的计算性能和性能功耗比,CPU+GPU协同异构体系下的并行计算模式广泛应用。在并行计算领域、高性能计算领域、超级计算领域都有非常重要的作用。文章提出了使用CPU+GPU异构体系... 近年来,使用CPU单一模式进行并行计算已不适用,随着GPU其超高的计算性能和性能功耗比,CPU+GPU协同异构体系下的并行计算模式广泛应用。在并行计算领域、高性能计算领域、超级计算领域都有非常重要的作用。文章提出了使用CPU+GPU异构体系,在该体系结构下进行设计并行程序,使用一种并行编程模型,来提高程序的性能。 展开更多
关键词 cpu+gpu 异构体系结构 混合编程模型 并行计算
下载PDF
CPU-OpenMP和GPU-CUDA并行计算技术对矩阵乘法运算的加速效果分析 被引量:1
13
作者 张岩 《科技视界》 2017年第26期45-47,共3页
本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,... 本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差。结果表明,GPUCUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算。 展开更多
关键词 矩阵乘法 并行计算 cpu-OpenMP gpu-CUDA
下载PDF
基于GPU的矩阵求逆性能测试和分析 被引量:10
14
作者 刘丽 沈杰 李洪林 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期812-817,共6页
在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并... 在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并行运算,从而获得了较大的加速比。同时,根据程序的执行结果,分析了GPU的单精度与双精度的浮点运算能力及其优、劣势。最后,通过分析数据传输时间对GPU性能的影响,总结出适合GPU的算法特征。 展开更多
关键词 图形处理器(gpu) 计算统一设备架构(CUDA) cpu 并行运算 矩阵求逆
下载PDF
基于GPU的遥感图像前期处理算法研究与应用 被引量:5
15
作者 王化喆 魏先勇 《现代电子技术》 北大核心 2016年第3期47-50,54,共5页
针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可... 针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。 展开更多
关键词 遥感图像 几何校正 SIFT特征提取 cpu+gpu 并行计算
下载PDF
一种非线性显式分层壳单元及其GPU并行计算实现 被引量:2
16
作者 曹胜涛 李志山 杨志勇 《振动与冲击》 EI CSCD 北大核心 2019年第22期60-69,84,共11页
通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效... 通用有限元程序ABAQUS的钢筋混凝土显式分层壳单元被广泛应用于剪力墙抗震性能分析,但存在两个缺陷:①只能得到混凝土受压损伤和受拉损伤,无法反映混凝土剪切损坏,因此不易根据损伤类型对结构进行优化;②基于CPU并行计算,大规模计算效率较低。基于平面应力条件下的混凝土弹塑性损伤本构模型,根据混凝土损伤发展时的受力状态和工程实践需要将损伤分为受拉损伤、受压损伤和受剪损伤。结合可损伤分类的塑性损伤模型,给出了非线性壳元物理沙漏力和面内旋转力的构造方法,进而得到一种含面内旋转自由度的4节点24自由度四边形非线性显式分层壳单元。将该研究壳元在自主研发的基于CPU+GPU异构并行计算的非线性分析软件中完成开发实现;通过与ABAQUS benchmark算例结果对比,验证了开发内容的正确性;通过与剪力墙单调加载试验对比,验证了该研究壳元的合理性。分别采用自主研发软件和ABAQUS对上海地区某框架核心筒体系的超高层结构进行了罕遇地震非线性时程分析,结果表明:①自主研发软件与ABAQUS结果基本一致,而计算效率为ABAQUS计算效率的5.69倍;②自主研发软件得到的受拉损伤、受压损伤和受剪损伤损伤可更清晰地揭示核心筒在罕遇地震作用下的损坏演化规律和破坏模式。 展开更多
关键词 弹塑性损伤模型 混凝土损伤类型 非线性显式分层壳单元 剪力墙损坏模式 cpu+gpu并行计算
下载PDF
基于GPU的可扩展哈希方法
17
作者 胡学萱 奚建清 林妙 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第1期111-117,共7页
为了使用可扩展哈希表进行快速的数据访问,需要高效地更新索引以维护哈希表.文中提出了一种基于GPU的可扩展哈希算法g EHT.该算法充分利用GPU的并行计算能力,并采用表重用、预分裂技术,无锁地扩展和收缩表、插入和删除数据,实现了高并... 为了使用可扩展哈希表进行快速的数据访问,需要高效地更新索引以维护哈希表.文中提出了一种基于GPU的可扩展哈希算法g EHT.该算法充分利用GPU的并行计算能力,并采用表重用、预分裂技术,无锁地扩展和收缩表、插入和删除数据,实现了高并发地创建哈希表、更新索引和检索数据.实验结果表明,该算法的查询数据、维护哈希表和更新索引性能优于其他多核CPU的线性哈希及可扩展哈希算法,尤其是在高负载的情况下. 展开更多
关键词 可扩展哈希 并行计算 gpu 算法 多核cpu
下载PDF
基于移动多核GPU的并行二维DCT变换实现方法 被引量:2
18
作者 龚若皓 杨斌 《成都信息工程学院学报》 2015年第1期22-26,共5页
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处... 传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。 展开更多
关键词 计算机应用技术 异构计算 二维DCT变换 移动多核gpu GPgpu OPENCL 并行化
下载PDF
GPU在活塞销尺寸快速检测中的应用研究
19
作者 周叶江 郑彬 赵永廷 《计算机应用与软件》 2017年第1期198-203,共6页
近年来,工业上对工业标准件尺寸检测的研究重点逐渐转移到关注其"高速性"策略的研究,其中边缘信息的检测是最为重要且最耗时的过程。为此,针对活塞销尺寸检测提出一种基于GPU技术的方法。选用提取稳定、精度高的Hough算法作... 近年来,工业上对工业标准件尺寸检测的研究重点逐渐转移到关注其"高速性"策略的研究,其中边缘信息的检测是最为重要且最耗时的过程。为此,针对活塞销尺寸检测提出一种基于GPU技术的方法。选用提取稳定、精度高的Hough算法作为检测直线的策略,结合现有边缘检测算法,对其主要步骤(高斯滤波、梯度计算、方向角计算及Otsu阈值化)的计算流程进行并行优化。使用相同实验样本,该方法能够在更短的时间内检测出活塞销的尺寸,与传统CPU实现方法对比,其平均效率有近15倍的提升。利用GPU实现活塞销尺寸快速检测的方法,为工业上实现检测的高速性提供一个高效可靠的解决途径,且有效地控制生产成本。 展开更多
关键词 尺寸检测 直线检测 边缘提取 gpu技术 并行计算
下载PDF
基于GPU的杆系离散元并行算法在大型工程结构中的应用 被引量:3
20
作者 叶继红 王佳 《工程力学》 EI CSCD 北大核心 2021年第2期1-7,共7页
杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-... 杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-GPU异构平台,建构了杆系DEM并行计算框架,编制了相应的几何非线性计算程序,实现了杆系DEM的GPU多线程并行计算。对杆系DEM并行算法的设计主要包括数据存储方式、GPU线程计算模式、节点物理量集成方式以及数据传输优化。最后采用大型三维框架、球壳结构模型分别验证了杆系DEM并行算法的计算精度,并对杆系DEM并行算法进行了计算性能测试,测试结果表明杆系DEM并行算法加速比最高可达12.7倍。 展开更多
关键词 离散单元法 杆系结构 几何非线性 gpu并行计算 cpu-gpu异构平台
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部