期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
H.264解码器IT、IQ模块的硬件实现结构
1
作者 张翠 龚国栋 《集成电路应用》 2005年第6期41-44,共4页
H.264视频编码标准有压缩效率高、稳定性好的特点,适合于无线通信和数字电视的应用,这些应用很多用多媒体SoC的方式实现H.264解码器。本文根据H.264的特点,提出一种硬件实现结构,用了流水线、并行处理及组件共享等设计方法,能完成对H.26... H.264视频编码标准有压缩效率高、稳定性好的特点,适合于无线通信和数字电视的应用,这些应用很多用多媒体SoC的方式实现H.264解码器。本文根据H.264的特点,提出一种硬件实现结构,用了流水线、并行处理及组件共享等设计方法,能完成对H.264中各种宏块元素逆量化(IQ)和逆变换(IT)操作。 展开更多
关键词 H.264解码器 IT IQ模块 硬件实现结构 逆变换 逆量化 视频解码 SoC
下载PDF
BP神经网络FPGA实现结构的优化设计 被引量:7
2
作者 谭会生 徐界铭 张驾祥 《计算机工程与应用》 CSCD 北大核心 2022年第21期264-271,共8页
为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线... 为了实现反向传播(back propagation,BP)神经网络的现场可编程门阵列(field programmable gate array,FPGA)处理速度的提升和资源消耗的降低,提出一种总体设计和关键模块融合优化的BP神经网络的FPGA实现结构。利用定点数据量化和流水线结构,提高系统的处理速度;采用二次方程多段拟合Sigmoid激活函数,降低计算复杂度;通过调整并行转串行模块与激活函数模块的处理顺序,减少了95%的激活函数模块的使用,降低了资源消耗;采用一种网络原始权值读取与更新权值存储交替流水进行的双端口RAM存取方法,以提高数据存取的速度、降低存储资源消耗。经过对硬件优化设计的字符和服装识别实验验证,结果表明,优化后的总逻辑单元使用率为原来的31%。在FPGA中优化结构实现单样本前向传播与反向传播所用时间为24.332μs,为软件MATLAB实现时间的45.63%,提高了BP神经网络的运算速度。 展开更多
关键词 BP神经网络 现场可编程门阵列(FPGA) 硬件实现结构 流水线 并行结构
下载PDF
CORDIC算法研究及其硬件实现
3
作者 丁晓红 《甘肃科技纵横》 2010年第4期33-34,共2页
CORDIC算法可以通过迭代方法完成矢量旋转,从而完成三角函数的运算。扩展的CORDIC算法在选择不同模式和初始值,可以使其应用于直接计算正弦、余弦、反正切以及在极坐标和直角坐标之间的变换。CORDIC算法可以通过FPGA中的移位和加法运算... CORDIC算法可以通过迭代方法完成矢量旋转,从而完成三角函数的运算。扩展的CORDIC算法在选择不同模式和初始值,可以使其应用于直接计算正弦、余弦、反正切以及在极坐标和直角坐标之间的变换。CORDIC算法可以通过FPGA中的移位和加法运算即可完成,可以采用流水线结构,满足实时性要求,从而实现计算精度、运算速度和硬件资源利用等方面性能的兼顾。 展开更多
关键词 CORDIC算法 直角极坐标变换 硬件实现结构
下载PDF
交通速度预测时空图卷积网络及其FPGA实现研究
4
作者 谭会生 杨威 严舒琪 《电子测量技术》 北大核心 2024年第18期108-119,共12页
时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交... 时空图卷积网络(STGCN)通过图卷积和时间卷积捕获交通数据的空间依赖性和时间依赖性,可有效提升交通速度预测的精度。但是硬件实现交通速度预测STGCN具有计算量大难以满足实际应用的实时性要求、资源消耗大导致成本增高等问题,在优化交通速度预测STGCN模型基础上,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法。首先,通过轻量化裁剪和预测数据位宽的精确选择,对交通速度预测STGCN进行了模型优化,以降低计算复杂度和资源消耗,并经过Python仿真验证其可行性。其次,通过采用流水线、并行计算和数据交替流水存取等组合优化策略,提出了一种交通速度预测STGCN的FPGA实现结构组合优化的方法,以提升系统计算速度。最后,使用Verilog编程对交通速度预测STGCN进行了FPGA的实现仿真和硬件测试。利用PeMSD7(M)数据集进行实验,结果显示FPGA实现单数据交通速度预测的时间为355.5μs,相比CPU、GPU平台及FPGA设计方案1对比,其处理速度最大分别提高了25.9倍、6.7倍和3.5倍,证明了交通速度预测STGCN的FPGA实现结构组合优化方法,在保持预测准确性的前提下可较大幅度的提升系统处理速度。 展开更多
关键词 交通速度预测 时空图卷积网络 FPGA 硬件实现结构 流水线 并行结构
原文传递
H.264中1/4精度内插的硬件结构设计
5
作者 卜帆 顾美康 《电视技术》 北大核心 2008年第11期14-15,共2页
针对H.264中1/4精度像素内插的复杂算法,提出一种硬件实现结构。亮度分量中,对于4×4块的半像素计算,采用4个6抽头滤波器并行处理;同时整个计算过程,由一个状态机控制;对于1/4像素点计算,采用一个5×4的矩阵存储体完成对所有点... 针对H.264中1/4精度像素内插的复杂算法,提出一种硬件实现结构。亮度分量中,对于4×4块的半像素计算,采用4个6抽头滤波器并行处理;同时整个计算过程,由一个状态机控制;对于1/4像素点计算,采用一个5×4的矩阵存储体完成对所有点的1/4精度计算。色度分量中,采用移位和加法替代乘法完成1/8精度内插。实验结果表明,此结构可完成对于高清以及CIF图像的实时解码计算,且占用逻辑资源少。 展开更多
关键词 H.264标准 1/4精度内插 硬件实现结构
下载PDF
某测向系统中MUSIC算法的FPGA实现 被引量:7
6
作者 徐德琛 刘志文 徐友根 《北京理工大学学报》 EI CAS CSCD 北大核心 2010年第9期1107-1111,共5页
针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和... 针对多信号分类(MUSIC)算法计算复杂度高,难以实时实现的特点,给出了适用于均匀圆阵的实数化预处理算法和实用的空间谱定义,并选择了适合硬件实现的特征值分解算法和排序算法;另外,基于某测向系统给出了MUSIC算法FPGA实现的总体结构和执行流程,并重点讨论了大矩阵特征值分解和空间谱计算的硬件结构设计.验证结果表明,该FPGA实现能够完成MUSIC算法的准确、快速计算. 展开更多
关键词 MUSIC算法 测向 现场可编程门阵列(FPGA) 算法选择及优化 硬件实现结构
下载PDF
Hardware Architecture for RSA Cryptography Based on Residue Number System
7
作者 郭炜 刘亚灵 +2 位作者 白松辉 魏继增 孙达志 《Transactions of Tianjin University》 EI CAS 2012年第4期237-242,共6页
A parallel architecture for efficient hardware implementation of Rivest Shamir Adleman(RSA) cryptography is proposed.Residue number system(RNS) is introduced to realize high parallelism,thus all the elements under the... A parallel architecture for efficient hardware implementation of Rivest Shamir Adleman(RSA) cryptography is proposed.Residue number system(RNS) is introduced to realize high parallelism,thus all the elements under the same base are independent of each other and can be computed in parallel.Moreover,a simple and fast base transformation is used to achieve RNS Montgomery modular multiplication algorithm,which facilitates hardware implementation.Based on transport triggered architecture(TTA),the proposed architecture is designed to evaluate the performance and feasibility of the algorithm.With these optimizations,a decryption rate of 106 kbps can be achieved for 1 024-b RSA at the frequency of 100 MHz. 展开更多
关键词 residue number system RSA cryptography Montgomery algorithm computer architecture parallelalgorithm
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部