期刊文献+
共找到149篇文章
< 1 2 8 >
每页显示 20 50 100
基于Multi-GPU平台的大规模图数据处理 被引量:7
1
作者 张珩 张立波 武延军 《计算机研究与发展》 EI CSCD 北大核心 2018年第2期273-288,共16页
在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐... 在GPU高性能节点上构建高效的大规模图数据的算法和系统已经日益成为研究热点,以GPU协处理器为计算核心不仅能够提供大规模线程的并行环境,也能提供高吞吐的内存和缓存访问机制.随着图的规模增大,相对大小局限的GPU的设备访存空间逐渐不能满足缓存整个图数据的应用需求,也催生了大量以单节点上外存I/O优化(out-of-core graph)为主要研究方向的大规模图数据处理系统.为了应对这一瓶颈,现有的算法和系统研究采用对图切分的压缩数据形式(即shards)用以数据传输和迭代计算.然而,这类研究扩展到Multi-GPU平台上往往性能的局限性表现在对PCI-E带宽的高依赖性,同时也由于Multi-GPU上任务负载不均衡而缺乏一定的可扩展性.为了应对上述挑战,提出并设计了基于Multi-GPU平台的支持高效、可扩展的大规模图数据处理系统GFlow.GFlow提出了全新的适用于Multi-GPU下的图数据Grid切分策略和双层滑动窗口算法,在将图的属性数据(点的状态集合、点/边权重值)缓存于各GPU设备之后,顺序加载图的拓扑结构数据(点/边集合)值各GPU中.通过双层滑动窗口,GFlow动态地加载数据分块从SSD存储至GPU设备内存,并顺序化聚合并应用处理过程中各GPU所生成的Updates.通过在9个现实图数据集上的实验结果可以看出,GFlow在Multi-GPU平台下相比其他支持外存图(out-of-core graph)处理的相关系统性能表现更为优异,对比CPU下的GraphChi和X-Stream分别提升25.6X和20.3X,对比GPU下支持外存图数据处理的GraphReduce系统单GPU提升1.3~2.5X.同时GFlow可扩展性在Multi-GPU上也表现良好. 展开更多
关键词 大规模图数据 multi-gpu 图分块 双层滑动窗口 数据传输
下载PDF
Multi-GPU加速的二元合金定向凝固三维相场模型 被引量:1
2
作者 朱昶胜 徐升 +1 位作者 冯力 李浩 《兰州理工大学学报》 CAS 北大核心 2018年第6期24-29,共6页
基于三维相场模型,使用MPI+CUDA异构协同并行技术,在GPU集群上建立三维合金定向凝固的MultiGPU计算模型,实现了Al-Cu二元合金三维定向凝固的模拟.再现了Al-Cu二元合金三维定向凝固的过程,以及不同取向晶粒间的竞争生长现象.通过与传统CP... 基于三维相场模型,使用MPI+CUDA异构协同并行技术,在GPU集群上建立三维合金定向凝固的MultiGPU计算模型,实现了Al-Cu二元合金三维定向凝固的模拟.再现了Al-Cu二元合金三维定向凝固的过程,以及不同取向晶粒间的竞争生长现象.通过与传统CPU串行计算模型相比较,验证了Multi-GPU计算模型的计算效率和加速效果.实现了二元合金定向凝固的加速模拟计算,其加速比最大可达57.7. 展开更多
关键词 multi-gpu MPI+CUDA 定向凝固 相场法
下载PDF
An effi cient scheme for multi-GPU TTI reverse time migration 被引量:1
3
作者 Liu Guo-Feng Meng Xiao-Hong +1 位作者 Yu Zhen-Jiang Liu Ding-Jin 《Applied Geophysics》 SCIE CSCD 2019年第1期56-63,共8页
Reverse time migration (RTM) is an indispensable but computationally intensive seismic exploration technique. Graphics processing units (GPUs) by NVIDIA■offer the option for parallel computations and speed improvemen... Reverse time migration (RTM) is an indispensable but computationally intensive seismic exploration technique. Graphics processing units (GPUs) by NVIDIA■offer the option for parallel computations and speed improvements in such high-density processes. With increasing seismic imaging space, the problems associated with multi-GPU techniques need to be addressed. We propose an efficient scheme for multi-GPU programming based on the features of the compute-unified device Architecture (CUDA) using GPU hardware, including concurrent kernel execution, CUDA streams, and peer-to-peer (P2P) communication between the different GPUs. In addition, by adjusting the computing time for imaging during RTM, the data communication times between GPUs become negligible. This means that the overall computation effi ciency improves linearly, as the number of GPUs increases. We introduce the multi-GPU scheme by using the acoustic wave propagation and then describe the implementation of RTM in tilted transversely isotropic (TTI) media. Next, we compare the multi-GPU and the unifi ed memory schemes. The results suggest that the proposed multi- GPU scheme is superior and, with increasing number of GPUs, the computational effi ciency improves linearly. 展开更多
关键词 multi-gpu KERNEL PEER-TO-PEER FORWARD MODELING TTI RTM
下载PDF
并行显卡:nVIDIA SLI Multi-GPU技术再现 被引量:1
4
作者 张岩 《个人电脑》 2004年第8期192-197,共6页
将SLI推向普及化,将会对整个显卡市场产生深远的影响。
关键词 并行显卡 NVIDIA SLI multi-gpu 显存频率
下载PDF
Large-Eddy Simulation of Airflow over a Steep, Three-Dimensional Isolated Hill with Multi-GPUs Computing
5
作者 Takanori Uchida 《Open Journal of Fluid Dynamics》 2018年第4期416-434,共19页
The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence si... The present research attempted a Large-Eddy Simulation (LES) of airflow over a steep, three-dimensional isolated hill by using the latest multi-cores multi-CPUs systems. As a result, it was found that 1) turbulence simulations using approximately 50 million grid points are feasible and 2) the use of this system resulted in the achievement of a high computation speed, which exceeded the speed of parallel computation attained by a single CPU on one of the latest supercomputers. Furthermore, LES was conducted by using the multi-GPUs systems. The results of these simulations revealed the following findings: 1) the multi-GPUs environment which used the NVDIA? Tesla M2090 or the M2075 could simulate turbulence in a model with as many as approximately 50 million grid points. 2) The computation speed achieved by the multi-GPUs environments exceeded that by parallel computation which used four to six CPUs of one of the latest supercomputers. 展开更多
关键词 LES ISOLATED HILL Multi-Cores Multi-CPUs COMPUTING multi-gpus COMPUTING
下载PDF
SLI回归?——NVIDIA SLI multi-GPU简介
6
作者 本苯 《大众硬件》 2004年第8期91-91,共1页
6月底NVIDIA宣布推出最新的SLI multi-GPU技术。SLI的全称是Scalable Link Interface,强调其可升级性,这是自Voodoo2 SLI被淘汰后,我们首次在桌面系统上看到双显卡同时工作以提升性能的SLI技术。
关键词 NVIDIA SLI multi-gpu 显卡 显存频率 MIO接口 超频性能 前端总线
下载PDF
混合现实中基于GPU虚拟化的AI计算优化
7
作者 梁桂才 李玉荣 《通信与信息技术》 2024年第2期114-120,共7页
研究探讨混合现实(MR)应用中,通过GPU虚拟化优化AI计算,聚焦于多任务调度与资源共享。研究提出了一个模型,其包含一种根据任务优先级、资源需求和等待时间,动态为正在执行的任务分配GPU资源的机制。同时,模型采用优化的多任务调度算法,... 研究探讨混合现实(MR)应用中,通过GPU虚拟化优化AI计算,聚焦于多任务调度与资源共享。研究提出了一个模型,其包含一种根据任务优先级、资源需求和等待时间,动态为正在执行的任务分配GPU资源的机制。同时,模型采用优化的多任务调度算法,以提高调度效率。实验结果表明,尽管在单任务性能测试中模型的执行时间、GPU利用率和内存使用方面略逊于物理GPU,但在多任务并发和资源共享方面,研究提出的模型展现了显著优势。未来研究将探索设计更公平高效的资源共享策略,以及进一步优化多任务调度算法。 展开更多
关键词 混合现实 AI计算 多任务调度 资源共享 GPU虚拟化
下载PDF
基于多GPU数值框架的流域地表径流过程数值模拟
8
作者 冯新政 张大伟 +1 位作者 徐海卿 鞠琴 《南水北调与水利科技(中英文)》 CAS CSCD 北大核心 2024年第1期48-55,共8页
与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体... 与传统概念性水文模型相比,二维水动力模型可提供更丰富的流域地表水力要素信息,但是计算耗时太长的问题限制其推广应用,提升二维水动力模型的计算效率成为当前数字孪生流域建设工作中的关键技术难题之一。采用基于Godunov格式的有限体积法离散完整二维浅水方程组建立模型,通过消息传递接口(message passing interface,MPI)与统一计算设备架构(compute unified device architecture,CUDA)相结合的技术实现了基于多图形处理器(graphics processing unit,GPU)的高性能加速计算,采用理想算例和真实流域算例验证模型具有较好的数值计算精度,其中,理想算例中洪峰的相对误差为0.011%,真实流域算例中洪峰的相对误差为2.98%。选取宝盖寺流域为研究对象,分析不同单元分辨率下模型的加速效果,结果表明:在5、2、1 m分辨率下,使用8张GPU卡计算获得的加速比分别为1.58、3.92、5.77,单元分辨率越高,即单元数越多,多GPU卡的加速效果越明显。基于多GPU的水动力模型加速潜力巨大,可为数字孪生流域建设提供有力技术支撑。 展开更多
关键词 水动力模型 地表径流 多GPU Godunov格式 加速比
下载PDF
多GPU系统的高速互联技术与拓扑发展现状研究
9
作者 崔晨 吴迪 +1 位作者 陶业荣 赵艳丽 《航空兵器》 CSCD 北大核心 2024年第1期23-31,共9页
多GPU系统通过横向扩展实现性能提升,以满足人工智能日趋复杂的算法和持续激增的数据所带来的不断增长的计算需求。对于多GPU系统而言,处理器间的互联带宽以及系统的拓扑是决定系统性能的关键因素。在传统的基于PCIe的多GPU系统中,PCIe... 多GPU系统通过横向扩展实现性能提升,以满足人工智能日趋复杂的算法和持续激增的数据所带来的不断增长的计算需求。对于多GPU系统而言,处理器间的互联带宽以及系统的拓扑是决定系统性能的关键因素。在传统的基于PCIe的多GPU系统中,PCIe带宽是限制系统性能的瓶颈。当前,面向GPU的高速互联技术成为解决多GPU系统带宽限制问题的有效方法。本文首先介绍了传统多GPU系统所采用的PCIe互联技术及其典型拓扑,然后以Nvidia NVLink、AMD Infinity Fabric Link、Intel X^(e) Link、壁仞科技BLink为例,对国内外代表性GPU厂商的面向GPU的高速互联技术及其拓扑进行了梳理分析,最后讨论了关于互联技术的研究启示。 展开更多
关键词 多GPU系统 高速互联技术 拓扑 互联带宽 数据中心
下载PDF
基于GPU加速的等几何拓扑优化高效多重网格求解方法
10
作者 杨峰 罗世杰 +1 位作者 杨江鸿 王英俊 《中国机械工程》 EI CAS CSCD 北大核心 2024年第4期602-613,共12页
针对大规模等几何拓扑优化(ITO)计算量巨大、传统求解方法效率低的问题,提出了一种基于样条h细化的高效多重网格方程求解方法。该方法利用h细化插值得到粗细网格之间的权重信息,然后构造多重网格方法的插值矩阵,获得更准确的粗细网格映... 针对大规模等几何拓扑优化(ITO)计算量巨大、传统求解方法效率低的问题,提出了一种基于样条h细化的高效多重网格方程求解方法。该方法利用h细化插值得到粗细网格之间的权重信息,然后构造多重网格方法的插值矩阵,获得更准确的粗细网格映射信息,从而提高求解速度。此外,对多重网格求解过程进行分析,构建其高效GPU并行算法。数值算例表明,所提出的求解方法与线性插值的多重网格共轭梯度法、代数多重网格共轭梯度法和预处理共轭梯度法相比分别取得了最高1.47、11.12和17.02的加速比。GPU并行求解相对于CPU串行求解的加速比高达33.86,显著提高了大规模线性方程组的求解效率。 展开更多
关键词 等几何拓扑优化 方程组求解 h细化 多重网格法 GPU并行计算
下载PDF
基于GPU的多天线组阵卫星信号合成
11
作者 王怡文 刘凯 《工业控制计算机》 2024年第1期76-78,共3页
为满足高速率卫星通信系统下接收端的高接收信噪比需求,设计了一种基于GPU的多天线组阵合成卫星信号的实现方法。基于全频谱合成的传统方案,加入数字下变频级联多相滤波的非均匀信道化模块,提升处理信号带宽内非均匀分布子信道的灵活性... 为满足高速率卫星通信系统下接收端的高接收信噪比需求,设计了一种基于GPU的多天线组阵合成卫星信号的实现方法。基于全频谱合成的传统方案,加入数字下变频级联多相滤波的非均匀信道化模块,提升处理信号带宽内非均匀分布子信道的灵活性,并采用CPU+GPU异构平台进行高效实现。经仿真及实际信号测试,结果表明该设计相较传统CPU平台实现取得约10~20倍的加速比,为接收端的信号实时处理提供可能性。 展开更多
关键词 多天线组阵 卫星信号 信号合成 GPU 并行设计
下载PDF
基于GPU并行技术的超大型海面舰船电磁散射仿真
12
作者 郑文军 杨伟 周礼来 《电子科技大学学报》 EI CAS CSCD 北大核心 2023年第4期549-554,共6页
为了解决超电大尺寸海面舰船场景中电磁散射计算的瓶颈问题,研究基于多图像处理单元(Multi-GPU)并行加速技术的弹跳射线法(SBR)。借助统一设备计算架构(CUDA)提供的多线程服务(MPS),构建Multi-GPU并行加速框架,研究基于区域射线束划分GP... 为了解决超电大尺寸海面舰船场景中电磁散射计算的瓶颈问题,研究基于多图像处理单元(Multi-GPU)并行加速技术的弹跳射线法(SBR)。借助统一设备计算架构(CUDA)提供的多线程服务(MPS),构建Multi-GPU并行加速框架,研究基于区域射线束划分GPU计算任务和实现方式;研究基于矩阵网格的任务分割技术,最大限度提高GPU全局内存利用率;针对不同运算单元间的差异所带来的计算不同步问题,设计基于动态负载均衡算法的调度系统,进而提高计算资源利用率。仿真结果表明,在双GPU硬件平台上,该方案与现有并行技术算法相比,在确保结果准确性的情况下加速比接近甚至超过200%。因此,该技术方案能够有效解决超电大海面舰船电磁散射问题。 展开更多
关键词 超电大 multi-gpu 雷达散射截面 海面舰船 射线追踪法
下载PDF
基于USRP的双模无源雷达测试系统设计
13
作者 徐晓瑶 姜建军 朱辉杰 《现代电子技术》 2023年第16期65-68,共4页
文中设计一种可以在TDOA-DOA或Multi-TDOA两种定位模式下工作的双模无源雷达,并设计一种高性能的测试平台用于演示和验证。该测试平台由X310通用软件无线电外设(USRP)实现多通道信号采集,由嵌入式服务器中的GPU实现信号处理算法,具有大... 文中设计一种可以在TDOA-DOA或Multi-TDOA两种定位模式下工作的双模无源雷达,并设计一种高性能的测试平台用于演示和验证。该测试平台由X310通用软件无线电外设(USRP)实现多通道信号采集,由嵌入式服务器中的GPU实现信号处理算法,具有大动态、多通道、时频同步和本振机制灵活等优点。通过小型无人机的室外检测得出,在两种定位模式下,所设计的测试平台都可以达到米级的定位精度。 展开更多
关键词 通用软件无线电外设 双模无源雷达 TDOA-DOA Multi-TDOA GPU 测试平台 定位精度
下载PDF
基于改进FPM法高维复杂多相分离过程的GPU并行计算研究 被引量:1
14
作者 甄玉洁 胥康 +1 位作者 蒋涛 任金莲 《应用数学和力学》 CSCD 北大核心 2023年第1期93-104,共12页
为了高效、准确地模拟高维多元Cahn-Hilliard(C-H)方程描述的复杂相分离过程,该文发展了一种基于纯无网格改进有限点集法(corrected finite pointset method,CFPM)和CPU-GPU异构的快速并行算法(简称为CFPMGPU).CFPM-GPU的构造过程为:①... 为了高效、准确地模拟高维多元Cahn-Hilliard(C-H)方程描述的复杂相分离过程,该文发展了一种基于纯无网格改进有限点集法(corrected finite pointset method,CFPM)和CPU-GPU异构的快速并行算法(简称为CFPMGPU).CFPM-GPU的构造过程为:①基于Taylor展开和加权最小二乘思想,采用Wendland权函数推导出空间一/二阶导数的有限点集法(finite pointset method,FPM)格式;②将多元C-H方程中四阶导数分为两个二阶导数,依次运用FPM对其离散得到C-H的改进FPM法(CFPM);③基于CUDA的单个GPU架构,首次给出了CFPM的一种并行算法以提高计算效率.数值研究中,首先对二维径向或三维球对称C-H方程描述的相分离基准算例进行了求解,并与可靠结果作对比验证了提出的并行算法的准确性和高效性,单个CPU-GPU异构并行计算效率约是串行情况的160倍;其次,运用CFPM-GPU对复杂区域上二维/三维的两相或三相分离现象进行数值预测,并与其他方法结果做比较.数值结果表明,给出的CFPM-GPU能准确、高效地模拟二维/三维复杂区域上的多相分离过程. 展开更多
关键词 FPM格式 三维多相分离 多元Cahn-Hilliard GPU并行
下载PDF
RKDG有限元GPU 算法及其重排加速技术
15
作者 高缓钦 陈红全 +1 位作者 张加乐 贾雪松 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2023年第8期32-42,共11页
为提升并行化求解Navier Stokes方程的效率,构建了高阶有限元单元及单元边界映射线程结构和对应的各类GPU核函数,成功地把RKDG方法移植到GPU架构,发展出RKDG有限元GPU并行算法。算法数据访存能兼容GPU快慢不一的存储器,尤其在结构网格上... 为提升并行化求解Navier Stokes方程的效率,构建了高阶有限元单元及单元边界映射线程结构和对应的各类GPU核函数,成功地把RKDG方法移植到GPU架构,发展出RKDG有限元GPU并行算法。算法数据访存能兼容GPU快慢不一的存储器,尤其在结构网格上,算法涉及的数据依赖区结构有序,能较好满足GPU对齐合并访问的要求。但在非结构网格上,非结构化的数据依赖区,影响到访存效率。基于此提出一种适合高阶有限元算法框架的单元分层重排加速技术,致力于网格的层化结构,提升GPU访存效率。具体基于初始网格拓扑,创建单元或单元边界对应的分层结构,逐层重排,汇总形成适合GPU对齐合并访问的数据存储结构。文中结合排序实例,给出了这一重排加速技术的具体实施过程。算例表明,发展的算法逼近的阶数符合预期,计算结果能与现有文献或实验结果接近,且最大GPU加速比可达67.47。此外,非结构网格算例证实,算法可处理较为复杂的几何边界,且所提重排技术可进一步赢得重排加速。 展开更多
关键词 RKDG方法 GPU 分层排序 非结构网格 Navier Stokes方程
下载PDF
面向大图子图匹配的多GPU编程模型 被引量:1
16
作者 李岑浩 崔鹏杰 +1 位作者 袁野 王国仁 《计算机科学与探索》 CSCD 北大核心 2023年第7期1576-1585,共10页
子图匹配是复杂网络中进行数据挖掘的重要手段。近年来,基于图形处理器(GPU)的子图匹配算法已展现明显的速度优势。然而,由于大图数据的规模宏大以及子图匹配的大量中间结果,单块GPU的内存容量很快成为了处理大图子图匹配算法的主要瓶... 子图匹配是复杂网络中进行数据挖掘的重要手段。近年来,基于图形处理器(GPU)的子图匹配算法已展现明显的速度优势。然而,由于大图数据的规模宏大以及子图匹配的大量中间结果,单块GPU的内存容量很快成为了处理大图子图匹配算法的主要瓶颈。因此,提出了一种面向大图子图匹配的多GPU编程模型。首先,提出了基于多GPU的子图匹配算法框架,实现了子图匹配算法在多GPU上的协同操作,解决了GPU大图子图匹配的图规模问题。其次,采用了一种基于查询图的动态调节技术来处理跨分区子图集,解决了图划分导致的跨分区子图匹配难题。最后,结合GPU单指令多线程(SIMT)架构特性,提出一种优先级调度策略保证GPU的内部负载均衡,并设计了共享内存的流水线机制优化多核并发的缓存争用。实验表明,多GPU编程模型能够在数十亿级别的数据集上得到正确的匹配结果,与最新的基于GPU的解决方案相比,该算法框架能够获得1.2~2.6倍的加速比。 展开更多
关键词 图分析 多GPU 大图子图匹配 优先级调度 并行编程模型
下载PDF
列车-轨道-地基土耦合系统三维随机振动的多GPU并行计算方法
17
作者 朱志辉 杨啸 +2 位作者 李昊 徐海坤 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2023年第5期1722-1736,共15页
针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GP... 针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GPU上,采用基于CUDA的预处理共轭梯度法(PCG)并行求解对称正定的等效静力平衡方程。针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(CSR)格式存储大型稀疏矩阵以节省内存空间。最终通过MATLAB-CUDA混合平台开发并行计算程序,解决了随机振动分析中多个线性方程组串行求解效率低的难题。数值算例表明,基于四GPU节点的多GPU并行算法和单GPU加速PCG算法的计算效率是串行多点同步算法(MPSA)计算效率的22.59倍和3.75倍。 展开更多
关键词 随机振动 并行计算 多GPU 三维有限元法 列车-轨道-地基土耦合模型
下载PDF
面向多尺度拓扑优化的渐进均匀化GPU并行算法研究
18
作者 夏兆辉 刘健力 +4 位作者 高百川 聂涛 余琛 陈龙 余金桂 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2023年第6期722-735,共14页
针对多尺度结构拓扑设计计算效率低等问题,提出了一种基于水平集渐进均匀化的多尺度拓扑优化并行算法。基于通用图形处理器(graphics processing unit,GPU),通过水平集初始化、大型稀疏刚度矩阵方程求解以及本构矩阵并行计算,可大幅提... 针对多尺度结构拓扑设计计算效率低等问题,提出了一种基于水平集渐进均匀化的多尺度拓扑优化并行算法。基于通用图形处理器(graphics processing unit,GPU),通过水平集初始化、大型稀疏刚度矩阵方程求解以及本构矩阵并行计算,可大幅提升渐进均匀化算法的效率。实验结果表明,当三维晶胞单元网格细化至分辨率为10万时,多尺度结构拓扑优化GPU并行算法较CPU串行算法快数十倍。 展开更多
关键词 多尺度拓扑优化 渐进均匀化 统一计算设备架构(CUDA) GPU并行计算
下载PDF
基于多源信息感知和光学图像处理的电力装备数字化运维技术研究
19
作者 季巧宇 张施令 李玥 《电工技术》 2023年第9期160-164,共5页
将数字孪生技术引入新型电力系统高端电力设备,依据其孪生模型进行现场运维模拟试验和大电流、高电压、多谐波载荷下的功能性响应分析。从机械振动、气体成分、光学视觉、电气参量四个传感维度分析了新型电力系统装备智能感知技术提升,... 将数字孪生技术引入新型电力系统高端电力设备,依据其孪生模型进行现场运维模拟试验和大电流、高电压、多谐波载荷下的功能性响应分析。从机械振动、气体成分、光学视觉、电气参量四个传感维度分析了新型电力系统装备智能感知技术提升,并实现了现场运行参数与数字孪生模型数据之间的交互联动。另一方面,提出了支撑数字孪生多源感知技术的GPU算力拓展技术,可有效支撑10-5~103 s设备动态行为仿真监测,并提出了高端装备运行寿命评估策略。研究结果可为数字孪生技术应用于高端电力设备场景提供理论指导和技术参考,有效支撑“双高特征”为主的新型电力系统安全稳定运行。 展开更多
关键词 新型电力系统 特高压电力装备 数字孪生 多源感知 GPU算力拓展 寿命评估
下载PDF
面向多核CPU多GPU的节点内并行混合绘制模型 被引量:3
20
作者 刘华海 王攀 +3 位作者 蔡勋 曾亮 王文珂 李思昆 《系统仿真学报》 CAS CSCD 北大核心 2012年第1期94-98,112,共6页
分布式并行绘制集群节点可以配置多核CPU和多个GPU构建节点内多CPU多GPU系统。现有的节点内并行绘制模型既没有充分发挥多核CPU的强大计算能力,还将绘制、读回和合成阶段串行耦合在一起导致了大量的GPU闲置停顿,严重影响了节点内并行... 分布式并行绘制集群节点可以配置多核CPU和多个GPU构建节点内多CPU多GPU系统。现有的节点内并行绘制模型既没有充分发挥多核CPU的强大计算能力,还将绘制、读回和合成阶段串行耦合在一起导致了大量的GPU闲置停顿,严重影响了节点内并行绘制性能。提出了一种节点内高效的并行绘制模型,通过软件绘制与硬件绘制相结合的方法将硬件绘制与图像合成分离,同时利用DMA异步传输机制,构建了节点内绘制、读回和合成三段并行绘制流水线。与现有节点内并行绘制模型相比,并行混合绘制模型不但降低GPU资源闲置率,而且提高了CPU资源使用率。理论分析与实验表明相同应用采用并行混合绘制模型的性能可以达到现有模型的3-4倍,并且具有更好的数据扩展性、性能扩展性。 展开更多
关键词 multi-gpu MULTI-CPU 分布式并行绘制 异步合成 DMA
原文传递
上一页 1 2 8 下一页 到第
使用帮助 返回顶部