期刊文献+
共找到152篇文章
< 1 2 8 >
每页显示 20 50 100
高性能YOLOv3-tiny嵌入式硬件加速器的混合优化设计
1
作者 谭会生 肖鑫凯 卿翔 《半导体技术》 CAS 北大核心 2025年第1期55-63,共9页
为解决在嵌入式设备中部署神经网络受算法复杂度、执行速度和硬件资源约束的问题,基于Zynq异构平台,设计了一个高性能的YOLOv3-tiny网络硬件加速器。在算法优化方面,将卷积层和批归一化层融合,使用8 bit量化算法,简化了算法流程;在加速... 为解决在嵌入式设备中部署神经网络受算法复杂度、执行速度和硬件资源约束的问题,基于Zynq异构平台,设计了一个高性能的YOLOv3-tiny网络硬件加速器。在算法优化方面,将卷积层和批归一化层融合,使用8 bit量化算法,简化了算法流程;在加速器架构设计方面,设计了可动态配置的层间流水线和高效的数据传输方案,缩短了推理时间,减小了存储资源消耗;在网络前向推理方面,针对卷积计算,基于循环展开策略,设计了8通道并行流水的卷积模块;针对池化计算,采用分步计算策略实现对连续数据流的高效处理;针对上采样计算,提出了基于数据复制的2倍上采样方法。实验结果表明,前向推理时间为232 ms,功耗仅为2.29 W,系统工作频率为200 MHz,达到了23.97 GOPS的实际算力。 展开更多
关键词 YOLOv3-tiny网络 异构平台 硬件加速器 动态配置架构 硬件混合优化 数据复制上采样
原文传递
面向点云识别的最近邻搜索硬件加速器
2
作者 陈立 李桢旻 马宇晴 《合肥工业大学学报(自然科学版)》 北大核心 2025年第2期179-184,共6页
动态图卷积神经网络(dynamic graph convolutional neural network,DGCNN)作为点云识别主流算法之一,主要由边缘卷积层构成,而最近邻搜索操作占据边缘卷积层63%的计算时间。文章针对现有的最近邻搜索加速器准确率较低、速度较慢的问题,... 动态图卷积神经网络(dynamic graph convolutional neural network,DGCNN)作为点云识别主流算法之一,主要由边缘卷积层构成,而最近邻搜索操作占据边缘卷积层63%的计算时间。文章针对现有的最近邻搜索加速器准确率较低、速度较慢的问题,设计一种面向点云识别的最近邻搜索硬件加速器。该加速器采用基于点云分割的并行双调流水排序结构进行2轮双调排序,并用曼哈顿距离替代欧氏距离衡量点与点距离的远近。实验结果表明,在同样的实验环境配置下,相较于其他点云最近邻搜索加速器,文章设计的最近邻搜索加速器速度提升了3.6倍。 展开更多
关键词 最近邻搜索 硬件加速器 边缘卷积 双调排序 曼哈顿距离
下载PDF
时空图卷积网络的骨架识别硬件加速器设计
3
作者 谭会生 严舒琪 杨威 《电子测量技术》 北大核心 2024年第11期36-43,共8页
随着人工智能技术的不断发展,神经网络的数据规模逐渐扩大,神经网络的计算量也迅速攀升。为了减少时空图卷积神经网络的计算量,降低硬件实现的资源消耗,提升人体骨架识别时空图卷积神经网络(ST-GCN)实际应用系统的处理速度,利用现场可... 随着人工智能技术的不断发展,神经网络的数据规模逐渐扩大,神经网络的计算量也迅速攀升。为了减少时空图卷积神经网络的计算量,降低硬件实现的资源消耗,提升人体骨架识别时空图卷积神经网络(ST-GCN)实际应用系统的处理速度,利用现场可编程门阵列(FPGA),设计开发了一个基于时空图卷积神经网络的骨架识别硬件加速器。通过对原网络模型进行结构优化与数据量化,减少了FPGA实现约75%的计算量;利用邻接矩阵稀疏性的特点,提出了一种稀疏性矩阵乘加运算的优化方法,减少了约60%的乘法器资源消耗。经过对人体骨架识别实验验证,结果表明,在时钟频率100 MHz下,相较于CPU,FPGA加速ST-GCN单元,加速比达到30.53;FPGA加速人体骨架识别,加速比达到6.86。 展开更多
关键词 人体骨架识别 时空图卷积神经网络(ST-GCN) 硬件加速器 现场可编程门阵列(FPGA) 稀疏矩阵乘加运算硬件优化
原文传递
基于VIP与SystemVerilog的硬件加速器仿真模型设计
4
作者 杜越 吴益然 郑杰良 《计算机与网络》 2024年第4期307-313,共7页
随着片上系统(System on Chip,SoC)芯片规模与功能复杂度的膨胀,硬件加速器已成为大规模SoC的重要组成部分。为了缩短产品交付时间,有必要开发硬件加速器仿真模型,以在SoC设计初期支撑架构的探索与评估。在对硬件加速器的特点与建模需... 随着片上系统(System on Chip,SoC)芯片规模与功能复杂度的膨胀,硬件加速器已成为大规模SoC的重要组成部分。为了缩短产品交付时间,有必要开发硬件加速器仿真模型,以在SoC设计初期支撑架构的探索与评估。在对硬件加速器的特点与建模需求进行分析的基础上,提出一种基于AXI验证IP(Verification IP,VIP)、SystemVerilog信箱和旗语的硬件加速器建模方法。该方法支持完备的总线协议特性,同时支持多个处理引擎的并行处理与乱序输出。以实际SoC项目中的通信基带加速器为例,对提出的建模方法进行介绍,并进行相应的系统级仿真与分析。所提出的建模方法可实现对硬件加速器总线行为的高效建模,能够有力支撑SoC验证以及系统架构评估,缩短项目的开发周期。 展开更多
关键词 硬件加速器 仿真模型 片上系统 信箱 旗语 SYSTEMVERILOG 验证IP
下载PDF
一种基于FPGA的深度神经网络硬件加速器系统
5
作者 张雨豪 叶有时 +3 位作者 彭宇 张德正 阎之泓 王东 《空间控制技术与应用》 CSCD 北大核心 2024年第2期83-92,共10页
深度神经网络目标检测算法计算复杂度高、模型复杂,对硬件平台的算力有很高需求,针对以上问题,设计了一种基于现场可编程门阵列(field programmable gate array,FPGA)芯片的硬件专用加速器.通过软硬件协同方法,设计具有高并行度及深度... 深度神经网络目标检测算法计算复杂度高、模型复杂,对硬件平台的算力有很高需求,针对以上问题,设计了一种基于现场可编程门阵列(field programmable gate array,FPGA)芯片的硬件专用加速器.通过软硬件协同方法,设计具有高并行度及深度流水的片上架构,并使用模型量化、结构优化等方法对神经网络模型进行优化.在所设计的加速器系统中进行神经网络目标检测算法的部署,实现了高数据吞吐率、低功率消耗的FPGA神经网络计算,且模型精度损失低于1.2%,为在低能耗嵌入式平台上部署深度神经网络目标检测算法提供了有效解决方案,可广泛应用于机载、星载智能计算设备. 展开更多
关键词 FPGA 神经网络 硬件加速器 目标检测
下载PDF
面向小型边缘计算的深度可分离神经网络模型与硬件加速器设计
6
作者 孟群康 李强 +5 位作者 赵峰 庄莉 王秋琳 陈锴 罗军 常胜 《计算机应用研究》 CSCD 北大核心 2024年第3期861-865,879,共6页
神经网络参数量和运算量的扩大,使得在资源有限的硬件平台上流水线部署神经网络变得更加困难。基于此,提出了一种解决深度学习模型在小型边缘计算平台上部署困难的方法。该方法基于应用于自定义数据集的深度可分离网络模型,在软件端使... 神经网络参数量和运算量的扩大,使得在资源有限的硬件平台上流水线部署神经网络变得更加困难。基于此,提出了一种解决深度学习模型在小型边缘计算平台上部署困难的方法。该方法基于应用于自定义数据集的深度可分离网络模型,在软件端使用迁移学习、敏感度分析和剪枝量化的步骤进行模型压缩,在硬件端分析并设计了适用于有限资源FPGA的流水线硬件加速器。实验结果表明,经过软件端的网络压缩优化,这种量化部署模型具有94.60%的高准确率,16.64 M的较低的单次推理定点数运算量和0.079 M的参数量。此外,经过硬件资源优化后,在国产FPGA开发板上进行流水线部署,推理帧率达到了366 FPS,计算能效为8.57 GOPS/W。这一研究提供了一种在小型边缘计算平台上高性能部署深度学习模型的解决方案。 展开更多
关键词 边缘计算 深度可分离卷积 流水线部署 硬件加速器 FPGA
下载PDF
面向大规格矩阵协方差运算的高性能硬件加速器设计
7
作者 陈铠 刘传柱 +5 位作者 冯建哲 滕紫珩 李世平 傅玉祥 李丽 何国强 《电子与封装》 2024年第12期64-70,共7页
随着雷达系统向多通道、高带宽方向发展,大规格矩阵带来的协方差运算实时性问题限制了空时二维自适应处理(STAP)技术在先进机载雷达平台上的应用。提出了一种高性能硬件加速器设计方法,旨在满足日益增长的大规格矩阵协方差处理需求,同... 随着雷达系统向多通道、高带宽方向发展,大规格矩阵带来的协方差运算实时性问题限制了空时二维自适应处理(STAP)技术在先进机载雷达平台上的应用。提出了一种高性能硬件加速器设计方法,旨在满足日益增长的大规格矩阵协方差处理需求,同时提高低功耗约束下的运算效率。加速器由运算部件、控制模块、存储模块和DMA控制器组成,通过对矩阵按列分段处理的方式,在硬件存储资源有限的条件下,支持最大256×8192的矩阵协方差运算。设计了下三角运算控制逻辑,降低了运算量,并提出了一套高并发乒乓存储、流水乘累加树处理机制,提高了处理效能。流片测试结果表明,该加速器处理大规格矩阵协方差运算时性能为算力接近的CPU核的70倍以上。 展开更多
关键词 协方差 硬件加速器 流水计算 乘累加树 乒乓存储
下载PDF
支持抑制型脉冲神经网络的硬件加速器
8
作者 钱平 韩睿 +4 位作者 谢凌东 罗旺 徐华荣 李松松 郑振东 《计算机工程与应用》 CSCD 北大核心 2024年第8期338-347,共10页
现有脉冲神经网络加速器的设计过多关注于硬件层面的功能完备性,缺少算法层面的相关协同优化以保证硬件计算效率。此外,传统的事件驱动型脉冲神经网络加速器没有考虑到脉冲神经元模型中普遍存在的脉冲抖动现象,因此不能实现对抑制型脉... 现有脉冲神经网络加速器的设计过多关注于硬件层面的功能完备性,缺少算法层面的相关协同优化以保证硬件计算效率。此外,传统的事件驱动型脉冲神经网络加速器没有考虑到脉冲神经元模型中普遍存在的脉冲抖动现象,因此不能实现对抑制型脉冲神经网络的支持。为解决上述问题,采用软硬件结合的方式,提出了一种支持抑制型脉冲神经网络加速器的设计方法。软件优化层面通过对脉冲神经网络计算冗余性的分析,提出了相应的近似计算方法以大幅降低脉冲神经网络的计算量;硬件设计层面提出了解决脉冲抖动问题的计算模块,并在此基础上设计了与近似计算方法相适应的并行计算结构。为验证设计的合理性,在XilinxZC706 FPGA上部署了加速器原型FEAS。在主流数据集上的测试结果显示,相较以往脉冲神经网络的加速器部署,FEAS在保持97.54%原有模型精度的情况下获得超过一个数量级的性能提升。 展开更多
关键词 脉冲神经网络 事件驱动 抑制型网络 近似计算 硬件加速器
下载PDF
高能效低延迟的BNN硬件加速器设计
9
作者 周培培 杜高明 +1 位作者 李桢旻 王晓蕾 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第12期1655-1661,共7页
针对二值化神经网络(binary neural network,BNN)硬件设计过程中大量0值引发计算量增加以及BNN中同一权值数据与同一特征图数据多次重复运算导致计算周期和计算功耗增加的问题,文章分别提出全0值跳过方法和预计算结果缓存方法,有效减少... 针对二值化神经网络(binary neural network,BNN)硬件设计过程中大量0值引发计算量增加以及BNN中同一权值数据与同一特征图数据多次重复运算导致计算周期和计算功耗增加的问题,文章分别提出全0值跳过方法和预计算结果缓存方法,有效减少网络的计算量、计算周期和计算功耗;并基于现场可编程门阵列(field programmable gate array,FPGA)设计一款BNN硬件加速器,即手写数字识别系统。实验结果表明,使用所提出的全0值跳过方法和预计算结果缓存方法后,在100 MHz的频率下,设计的加速器平均能效可达1.81 TOPs/W,相较于其他BNN加速器,提升了1.27~4.34倍。 展开更多
关键词 二值化神经网络(BNN) 权值共享 重复运算 现场可编程门阵列(FPGA) 硬件加速器
下载PDF
高能效视觉SLAM硬件加速器设计
10
作者 齐修远 刘野 +1 位作者 郝爽 周军 《集成电路与嵌入式系统》 2024年第11期51-59,共9页
随着计算机视觉技术的不断迭代和发展,以计算机视觉技术为核心的智能应用和设备逐渐在人们的日常生活和工作中扮演越来越重要的角色。其中,基于视觉的同步定位与建图技术(Simultaneous Localization and Mapping,SLAM)在机器人、无人机... 随着计算机视觉技术的不断迭代和发展,以计算机视觉技术为核心的智能应用和设备逐渐在人们的日常生活和工作中扮演越来越重要的角色。其中,基于视觉的同步定位与建图技术(Simultaneous Localization and Mapping,SLAM)在机器人、无人机、自动驾驶等领域中被广泛应用,上述领域需要视觉SLAM技术为其提供精准的定位信息,以实现其精确建图和自主导航功能。然而,由于视觉SLAM算法本身的特性,计算量极大,数据依赖性极高,导致其在传统的硬件平台(CPU或GPU)上运行时,难以满足前述边缘端应用场景对实时性和低功耗的需求,成为限制视觉SLAM技术被广泛应用的关键因素。为了解决这一问题,本文基于算法与硬件协同设计的优化策略,针对ORB特征提取和匹配算法提出了一种面向视觉SLAM的高能效专用加速器,通过多种硬件设计技术提高计算性能和能效,包括基于数据依赖关系解耦的多层次并行计算技术、基于多尺寸存储桶的数据存储技术和像素级对称-轻量化描述子生成和方向计算策略。提出的视觉SLAM加速器在Xilinx ZCU104上进行了测试和验证。与ORB SLAM2的算法精度对比,本加速器的精度在5%以内,帧率提升至108 fps,与同期其他硬件加速器相比,查找表使用降低了32.7%,FF使用降低了41.17%,同时帧率提升了1.4倍和0.74倍。 展开更多
关键词 视觉SLAM 领域专用芯片 硬件加速器 机器人
下载PDF
基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计 被引量:32
11
作者 许芳 席毅 +1 位作者 陈虹 靳伟伟 《电子测量与仪器学报》 CSCD 2011年第4期377-383,共7页
针对复杂算法中矩阵运算量大,计算复杂,耗时多,制约算法在线计算性能的问题,从硬件实现角度,研究基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计,实现矩阵并行计算。首先根据矩阵运算的算法分析,设计了矩阵并行计算的硬件实现结构,并在Model... 针对复杂算法中矩阵运算量大,计算复杂,耗时多,制约算法在线计算性能的问题,从硬件实现角度,研究基于FPGA/Nios-Ⅱ的矩阵运算硬件加速器设计,实现矩阵并行计算。首先根据矩阵运算的算法分析,设计了矩阵并行计算的硬件实现结构,并在Modelsim中进行功能模块的仿真,然后将功能模块集成一个自定制组件,并通过Avalon总线与NiosⅡ主处理器通信,作为硬件加速器。最后在FPGA芯片中构建SoPC系统,并在Altera DE3开发板中进行矩阵实时计算测试。测试结果验证了基于FPGA/Nios-Ⅱ矩阵运算硬件加速器的正确性、可行性以及较高的计算性能。 展开更多
关键词 FPGA/Nios-Ⅱ 矩阵运算 硬件加速器 并行计算 实时测试验
下载PDF
基于AMBA总线的SOC硬件加速器的研究 被引量:2
12
作者 刘亮亮 宋征宇 蒋彭龙 《航天控制》 CSCD 北大核心 2009年第1期61-66,共6页
传统的控制算法由软件实现,运行速度相对较慢。为改善系统性能,提高系统处理速度,本文提出了基于AMBA总线的SOC硬件加速器的解决方案,并选取典型的四元数算法加以验证。本文介绍了实现四元数解算的硬件加速器设计,将该模块通过AMBA总线... 传统的控制算法由软件实现,运行速度相对较慢。为改善系统性能,提高系统处理速度,本文提出了基于AMBA总线的SOC硬件加速器的解决方案,并选取典型的四元数算法加以验证。本文介绍了实现四元数解算的硬件加速器设计,将该模块通过AMBA总线集成到LEON内核中,完成了系统级仿真,并在FPGA上进行了验证。结果表明SOC硬件加速器在控制系统中应用是可行的,且体现出很大优越性。 展开更多
关键词 SOC 硬件加速器 AMBA总线 四元数 浮点运算
下载PDF
变维度FFT硬件加速器结构设计及FPGA实现 被引量:3
13
作者 张多利 张玲佳 宋宇鲲 《微电子学与计算机》 CSCD 北大核心 2017年第12期34-39,44,共7页
本文设计了一种变维度FFT硬件加速器,其采用体-面-线的数据组织形式,提出了一种面划分^([1])兼多路并行的架构,从面和线2个层次展开计算,以面为基本存储单位,以线为基本计算单位,提高了FFT运算的并行度,减少了处理器间的数据交互,并通... 本文设计了一种变维度FFT硬件加速器,其采用体-面-线的数据组织形式,提出了一种面划分^([1])兼多路并行的架构,从面和线2个层次展开计算,以面为基本存储单位,以线为基本计算单位,提高了FFT运算的并行度,减少了处理器间的数据交互,并通过乒乓预读取的设计和无冲突的地址调整,提高了整机的运算访存比.本文设计的FFT加速器内含32个并行计算单元,支持IEEE-754标准下的32位单精度浮点数32点到64K点一维FFT运算,32点到256点的二维/三维FFT运算,且具有较强的可扩展性,可根据需要实现m×n×p序列的FFT运算.该设计已在Xilinx Virtex6FPGA芯片上进行原型验证,最高工作频率184.88 MHz. 展开更多
关键词 FFT硬件加速器 FFT处理器 地址调整模块 FPGA
下载PDF
基于UVM的可重用硬件加速器验证平台 被引量:1
14
作者 隋金雪 郁添林 +1 位作者 沈姒清 张霞 《计算机仿真》 北大核心 2023年第8期350-354,共5页
验证平台主要通过覆盖率驱动的收敛技术,并结合定向测试与可约束的随机激励,对多核加速器芯片中的IP进行功能型验证。验证环境按照卷积神经网络硬件加速器的验证需求搭建,对设计中卷积、激活、池化、全连接的功能层和基地址和数据偏移... 验证平台主要通过覆盖率驱动的收敛技术,并结合定向测试与可约束的随机激励,对多核加速器芯片中的IP进行功能型验证。验证环境按照卷积神经网络硬件加速器的验证需求搭建,对设计中卷积、激活、池化、全连接的功能层和基地址和数据偏移等数据流控制功能验证。实验结果证明,验证平台按照通用验证方法学(Universal Verification Methodology,UVM)中的机制,量化验证进度,确保功能模块的验证完备性;经过少量修改即可对不同结构层的神经网络模型的硬件加速器验证平台重用,缩短了验证周期。 展开更多
关键词 通用验证方法学 卷积神经网络 功能型验证 覆盖率 机制 硬件加速器
下载PDF
基于FPGA的硬件加速器设计的研究与应用 被引量:1
15
作者 张启英 刘亚刚 +1 位作者 张淑艳 朱娟 《计算机光盘软件与应用》 2013年第17期276-277,共2页
通过对硬件加速器的目的和原理作详细介绍,以sobel硬件加速器的设计为研究内容,设计硬件加速器由计算单元、地址产生器、从机接口和控制状态机等构成,将各模块连接验证进行测试。系统连接通过对图像进行边缘检测处理,使系统总处理时间降... 通过对硬件加速器的目的和原理作详细介绍,以sobel硬件加速器的设计为研究内容,设计硬件加速器由计算单元、地址产生器、从机接口和控制状态机等构成,将各模块连接验证进行测试。系统连接通过对图像进行边缘检测处理,使系统总处理时间降低,从而优化复杂系统设计。 展开更多
关键词 sobel硬件加速器 研究 验证 优化
下载PDF
基于统计分析的SoC定点硬件加速器字长设计
16
作者 周凡 时龙兴 杨军 《固体电子学研究与进展》 CAS CSCD 北大核心 2007年第2期240-245,274,共7页
在由通用RISC处理器核和附加定点硬件加速器构成的定点SoC(System-on-Chip)芯片体系架构基础上,提出了一种新颖的基于统计分析的定点硬件加速器字长设计方法。该方法利用统计参数在数学层面上求解计算出满足不同信噪比要求下的最小字长... 在由通用RISC处理器核和附加定点硬件加速器构成的定点SoC(System-on-Chip)芯片体系架构基础上,提出了一种新颖的基于统计分析的定点硬件加速器字长设计方法。该方法利用统计参数在数学层面上求解计算出满足不同信噪比要求下的最小字长,能有效地降低芯片面积、功耗和制作成本,从而在没有DSP协处理器的低成本RISC处理器核SoC芯片上运行高计算复杂度应用。 展开更多
关键词 硬件加速器 定点 系统芯片 信噪比 统计分析
下载PDF
基于PalladiumXP硬件加速器的JTAG UVM系统设计 被引量:2
17
作者 胡海生 贾一凡 《中国集成电路》 2015年第6期31-34,共4页
本文介绍了一种基于Palladium XP(PXP)硬件加速器技术的JTAG UVM系统设计方法。在对系统效率瓶颈分析的基础上,针对JTAG测试系统的特点,提出了一种通过信号交换包集中传输处理的系统搭建方案,从而提高了系统仿真效率。实验结果表明,与... 本文介绍了一种基于Palladium XP(PXP)硬件加速器技术的JTAG UVM系统设计方法。在对系统效率瓶颈分析的基础上,针对JTAG测试系统的特点,提出了一种通过信号交换包集中传输处理的系统搭建方案,从而提高了系统仿真效率。实验结果表明,与传统软件仿真器相比,该系统可以获得平均300倍的仿真加速比。 展开更多
关键词 硬件加速器
下载PDF
基于SOPC的Filterbank快速算法硬件加速器设计
18
作者 裴明敬 符茂胜 杨洋 《宿州学院学报》 2016年第1期106-108,共3页
针对MP3解码中Filterbank算法计算量大、耗时长的缺点,从以下两个方面进行了研究:一方面对算法进行改进,使用Filterbank快速算法;另一方面采用硬件实现Filterbank快速算法,其中,内部采用并行运算和流水线式设计。实验测试表明,采用硬件... 针对MP3解码中Filterbank算法计算量大、耗时长的缺点,从以下两个方面进行了研究:一方面对算法进行改进,使用Filterbank快速算法;另一方面采用硬件实现Filterbank快速算法,其中,内部采用并行运算和流水线式设计。实验测试表明,采用硬件加速器来实现Filterbank快速算法,和传统的用纯软件设计相比,不仅提高了系统的运算能力,而且大大提高了整个系统的解码速度,使得实时性效果更好。实验结果显示硬件加速器的速度是软件实现速度的4.21倍。 展开更多
关键词 Filterbank快速算法 硬件加速器 SOPC
下载PDF
基于Nios Ⅱ的IMDCT算法硬件加速器设计
19
作者 裴明敬 张歆奕 《五邑大学学报(自然科学版)》 CAS 2014年第1期40-44,共5页
为了提高MP3解码的运算速度,分解了IMDCT算法,基于NiosII软核设计了IMDCT算法的硬件结构,作为SOPC系统总线上一个硬件加速器模块进行解码.实验验证了硬件加速器的运算速度大约是软件运算速度的4.4倍.
关键词 MP3解码 IMDCT算法 硬件加速器
下载PDF
一种用于自适应直方图均衡化的硬件加速器 被引量:4
20
作者 陆申阳 冉峰 +1 位作者 郭爱英 沈华明 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第3期401-412,共12页
针对动态直方图均衡(dynamic histogram equalization,DHE)算法处理效果不理想和算法应用不灵活的问题,提出了一种基于改进型自适应直方图均衡化算法的现场可编程逻辑门阵列(field programmable gate array,FPGA)硬件加速器的设计方法.... 针对动态直方图均衡(dynamic histogram equalization,DHE)算法处理效果不理想和算法应用不灵活的问题,提出了一种基于改进型自适应直方图均衡化算法的现场可编程逻辑门阵列(field programmable gate array,FPGA)硬件加速器的设计方法.该硬件加速器对直方图均衡化算法做了改进,实现了自适应地限制对比度拉伸;并且充分利用FPGA的并行体系架构和丰富的块存储资源的优点,采用规则的模块化的设计方法完成了设计.实验结果表明:改进的算法不会产生过度增强、放大噪声、丢失图像细节的现象;设计的硬件加速器在充分节约硬件资源的前提下能较好地满足实际应用的需求;在实时图像处理中一帧图像的处理时间约为0.1 ms,使图像增强算法在图像实时处理中的应用更加灵活方便. 展开更多
关键词 现场可编程逻辑门阵列 自适应 直方图 硬件加速器
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部