-
题名计算机统一设备架构加速外部计算机断层图像重建
被引量:2
- 1
-
-
作者
曾理
倪风岳
刘宝东
洪达平
-
机构
重庆大学光电技术及系统教育部重点实验室ICT研究中心
重庆大学数学与统计学院
重庆大学光电工程学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2011年第11期2665-2671,共7页
-
基金
国家自然科学基金(60972104)
重庆市自然科学基金(2010BB4222)资助课题
-
文摘
外部计算机断层成像(CT)重建主要用于重建管状物(如管道)的管壁截面图像,具有重要的实际意义。外部CT重建算法中,带子区域平均图像总变差最小的凸集投影(SA-TVM-POCS)重建数值算法可以得到高质量的CT图像,可用于管道的无损检测。但由于在实现过程中计算量较大,阻碍了其在一些时间要求较高环境中的应用。计算机统一设备架构(Computer Unified Device Architecture,CUDA)是近几年发展起来的解决高强度计算的有效工具之一,该文利用CUDA的高强度并行计算性能,提高外部CT问题SA-TVM-POCS算法的速度,从而增加该算法的应用范围;为充分利用CUDA其高强度数据级并行计算能力,该文改进了SA-TVM-POCS算法的实现过程以适应CUDA的并行计算架构。实验结果表明,该文方法可以在重建图像质量没有下降的情况下,加速比达到20倍以上;所以,利用CUDA可以加快SA-TVM-POCS算法的计算速度。
-
关键词
工业CT
外部图像重建
计算机统一设备架构
SA-TVM-POCS算法
并行计算
-
Keywords
Industrial CT
Exterior image reconstruction
Computer Unified Device Architecture(CUDA)
Subset Average-Total Variation Minimization-Projection Onto Convex Sets(SA-TVM-POCS) algorithm
Parallel computing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名CUDA架构下的改进多谱图WVD算法
- 2
-
-
作者
张昆帆
王锋
冯志红
赵拥军
-
机构
解放军信息工程大学导航与空天目标工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第12期3584-3586,3590,共4页
-
文摘
多谱图WVD算法在计算自项支撑域时需要估计噪声的方差,且由于WVD是二次型运算,当强弱信号共存时,弱信号将被淹没。针对此问题,通过利用所处理信号的双音动态范围来确定支撑域的阈值,并对支撑域的幅度进行修正,避免了对噪声方差的估计,改善了信号时频图的聚集性。仿真实验表明,改进算法在抑制交叉项的同时,很好地保留了弱信号的细节,提高了多谱图WVD算法所处理信号的双音动态范围。最后利用计算机统一设备架构的高强度并行能力实现了该算法,加速比达到50倍左右。
-
关键词
多谱图魏格纳威利分布
交叉项
双音动态范围
计算机统一设备架构
-
Keywords
multiple spectrograms WVD
cross terms
dual tone dynamic range
computer unified device architecture
-
分类号
TN911.7
[电子电信—通信与信息系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名ADS-B信号实时生成软件设计与实现
被引量:4
- 3
-
-
作者
胡铁乔
任志杰
-
机构
中国民航大学天津市智能信号与图像处理重点实验室
-
出处
《计算机工程与设计》
北大核心
2020年第11期3275-3281,共7页
-
基金
国家重点研发计划基金项目(2016YFB0502402)。
-
文摘
针对当前ADS-B信号源因硬件系统复杂导致开发周期长、功能可扩展性差的问题,提出一种ADS-B信号实时生成软件设计与实现方法。通过建立地空通信链路损耗与多普勒频移模型,利用DDS技术,实现对信号功率与多普勒频移的模拟;使用CUDA技术与乒乓操作对软件中耗时较长的模块进行优化,提升软件的执行效率;通过调用谷歌地球开发接口将谷歌地球嵌入进软件平台,以KML文件为媒介,实现航迹与定向卫星天线覆盖范围的可视化。测试结果表明,使用该方法设计并实现的ADS-B信号实时生成软件能够实时生成ADS-B信号。
-
关键词
广播式自动相关监视
实时
计算机统一设备架构
乒乓操作
谷歌地球
-
Keywords
ADS-B
real-time
CUDA
ping-pong operation
Google earth
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名图形处理器CUDA编程模型的应用研究
被引量:25
- 4
-
-
作者
钱悦
-
机构
同济大学软件学院
-
出处
《计算机与数字工程》
2008年第12期177-180,共4页
-
文摘
由于图形处理器(GPU)最近几年的快速发展,基于GPU的通用计算已经成为一个新的研究领域。通过对nVIDIA公司最新的通用计算GPU编程模型—CUDA的研究,阐明了CUDA应用程序的结构和它本身特征,讨论和分析了CUDA编程方法与普通CPU编程的差别,并以H.264数字视频编解码中,以消除宏块边界锯齿为主要目的的去块滤波模块为实例,详细描述了CUDA编程的方法和特点,最后通过与CPU编程实现的去块滤波模块的性能比较,揭示了CUDA在计算能力上的优势,为进一步优化编解码器性能和GPU通用计算提供了新的方法和思路。
-
关键词
图形处理器
通用计算
计算机统一设备架构
去块滤波
-
Keywords
GPU, general-purpose computation,CUDA, deblocking filter
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名虚拟手术中肝脏体实时切割系统
被引量:3
- 5
-
-
作者
王娜
陈国栋
何汉鑫
徐鲁雄
-
机构
福建师范大学福清分校电子与信息工程学院
无损检测技术福建省高等学校重点实验室(福建师范大学福清分校)
非遗数字化与多源信息融合福建省高校工程研究中心
福州大学物理与信息工程学院
-
出处
《计算机系统应用》
2020年第1期59-66,共8页
-
基金
国家自然科学基金(61471124)
福建省教育厅项目(FBJG20190127)
+3 种基金
福建省自然科学基金(2016J01293,2017J01107,2018J01787)
福建省中青年教师教育科研项目(JA15574)
校级国家自然基金校内培育项目(KY2017NS05)
校级项目(XJJG201905)~~
-
文摘
在检测二维医学图像的过程中利用医学图像的三维可视化技术有利于医生更加全面地分析图像数据,从而对病情做出准确的应对措施.以肝脏为例,首先提取可视人体数据集中连续横断面图像,采用区域生长的图像分割算法从连续的横断面图像中提取出肝脏轮廓的区域.然后对肝脏轮廓进行层间插值,利用VTK工具包结合面绘制方法构建出肝脏的三维模型.接着对初始模型进行一定程度的网格削减,降低数据冗余度,完成虚拟肝脏体的三维重建.采用CUDA架构进行肝脏体纹理的合成与映射工作,兼顾了体纹理的真实感和虚拟手术系统的实时性,对虚拟肝脏手术的发展有着重要的促进作用.
-
关键词
计算机统一设备架构
贝塞尔曲线
层间插值
面绘制
三维重建
-
Keywords
CUDA
Bézier curve
interlayer interpolation
surface rendering
three-dimensional reconstruction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP11
[自动化与计算机技术—控制理论与控制工程]
R657.3
[医药卫生—外科学]
-
-
题名一种基于CUDA的截断重叠维特比译码算法
- 6
-
-
作者
李晨杰
王志旭
-
机构
南京邮电大学通信与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第6期1828-1830,1835,共4页
-
文摘
为解决信道译码在高吞吐量通信系统中的瓶颈问题,通过对CUDA并行计算的了解和对维特比译码并行实现的探索,为卷积码提出了一种基于CUDA的截断重叠维特比译码器。算法通过截断式的子网格图相互重叠的方式,并行执行独立的正向度量计算和回溯过程。实验结果表明,在保证了译码算法误码率性能的同时,获得了良好的吞吐量提升表现,相比现有的实现方式提升了1.3~3.5倍,降低了硬件开销,能够有效运用于实际高吞吐量通信系统中。
-
关键词
卷积码
维特比译码
并行计算
计算机统一设备架构
-
Keywords
convolutional codes
Viterbi decoder
parallel processing
compute unified device architecture (CUDA)
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名并行Harris特征点检测算法
被引量:1
- 7
-
-
作者
朱超
吴素萍
-
机构
宁夏大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2019年第S11期289-293,共5页
-
基金
国家自然科学基金项目(61662059)资助
-
文摘
针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对比实验,实验结果表明,基于CUDA及OpenCL框架的GPU并行特征点检测算法具有良好的数据和平台可扩展性,基于GPU并行特征点检测算法的加速比最高可达91.19,加速效果显著。基于OpenMP的多核CPU特征点检测算法具有良好的多核可扩展性。
-
关键词
HARRIS
特征点检测
共享存储并行编程
计算机统一设备架构
开放式计算语言
并行算法
-
Keywords
Harris
Feature point detection
Open multi-processing(OpenMP)
Compute unified device architecture(CUDA)
Open computing language(OpenCL)
Parallel algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-