期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
适用于片上并行计算阵列的超精简处理器架构
1
作者 周韧研 刘雷波 魏少军 《电路与系统学报》 CSCD 北大核心 2012年第2期1-5,共5页
提出一种超精简处理单元架构。该处理单元基于运算-跳转式单指令处理器体系。使用指令优化和内部总线上加速器,该处理单元能够执行传统算术运算式单指令处理器难于执行的高效位运算以及执行效率较低的数据转移操作。以该处理单元构成的... 提出一种超精简处理单元架构。该处理单元基于运算-跳转式单指令处理器体系。使用指令优化和内部总线上加速器,该处理单元能够执行传统算术运算式单指令处理器难于执行的高效位运算以及执行效率较低的数据转移操作。以该处理单元构成的片上大规模并行计算阵列可用于图像处理等局部性强、实时性要求高的计算任务。包含有该处理单元架构的16 16的原型阵列已经在FPGA上实现,性能达30.7GOPS@120MHz,平均功耗39.5mW。 展开更多
关键词 超精简处理单元 并行计算 图像处理
下载PDF
面向对称密码领域的可重构阵列设计 被引量:5
2
作者 朱敏 刘雷波 +2 位作者 尹首一 陈英杰 魏少军 《微电子学》 CAS CSCD 北大核心 2012年第6期815-818,共4页
通过研究密码系统的特点,提出一种面向对称密码领域的可重构阵列结构。该阵列普遍适用于分组密码和流密码系统,灵活性高。通过配置信息的更新,可以快速动态切换加密功能,切换时间小于20ns。该结构包含几个16×16的比特阵列和8×... 通过研究密码系统的特点,提出一种面向对称密码领域的可重构阵列结构。该阵列普遍适用于分组密码和流密码系统,灵活性高。通过配置信息的更新,可以快速动态切换加密功能,切换时间小于20ns。该结构包含几个16×16的比特阵列和8×8的字节阵列,AES算法实现分组密码的加密速率为640Mb/s~2.56Gb/s,DES算法为1.6Gb/s~3.2Gb/s,SMS4算法为318Mb/s~1.6Gb/s,流密码Geffe的加密速率为400Mb/s。与文献[1]~[3]相比,SMS4算法的性能有接近2倍的提升。 展开更多
关键词 可重构计算 对称密码 AES DES
原文传递
一种CABAC解码引擎的芯片实现 被引量:2
3
作者 朱敏 刘雷波 +3 位作者 王星 殷崇勇 尹首一 魏少军 《电路与系统学报》 北大核心 2013年第2期6-11,共6页
CABAC(Context-based Adaptive Binary Arithmetic coding)是H.264中所采用的一种高效熵编码,压缩率高,但结构复杂,硬件实现难度大。本文在P.Zhang 2008年的工作[1]基础上提出一种单周期CABAC解码引擎的优化实现方法,通过查表替换、分... CABAC(Context-based Adaptive Binary Arithmetic coding)是H.264中所采用的一种高效熵编码,压缩率高,但结构复杂,硬件实现难度大。本文在P.Zhang 2008年的工作[1]基础上提出一种单周期CABAC解码引擎的优化实现方法,通过查表替换、分支预测、逻辑调整、反相器优化等关键路径优化方法和寄存器精简等面积优化方法进一步提高了解码性能。经过芯片验证,CABAC解码引擎性能提高到250Mbps,面积减少46%,峰值工作情形下功耗1.03mW,满足下一代视频编解码协议(QFHD)的需求。 展开更多
关键词 CABAC H 264 单周期CABAC解码引擎
下载PDF
可重构媒体处理器配置信息优化生成技术 被引量:1
4
作者 殷崇勇 尹首一 魏少军 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第4期1059-1065,共7页
为降低可重构媒体处理器任务编译器设计中系统配置代价,有效提升配置信息的配置效率,提出了一种新的配置信息优化生成方法。该生成方法在对输入的数据流图进行独立子图搜索和子图同构判定得到各类子图的属性的基础上,对配置模板生成步... 为降低可重构媒体处理器任务编译器设计中系统配置代价,有效提升配置信息的配置效率,提出了一种新的配置信息优化生成方法。该生成方法在对输入的数据流图进行独立子图搜索和子图同构判定得到各类子图的属性的基础上,对配置模板生成步骤增添约束来生成全等的配置模板以提升系统的配置性能。本文方法已被应用到可重构媒体处理器任务编译器的设计实践中。实验结果表明:本文方法能够有效地生成优化的配置信息,所生成的配置信息的配置性能明显优于传统贪婪方法生成的配置信息。 展开更多
关键词 电子技术 可重构计算 媒体处理器 配置信息 子图同构
下载PDF
基于位图索引的无线传感器网络可靠传输协议 被引量:1
5
作者 周韧研 刘雷波 +1 位作者 尹首一 魏少军 《计算机工程》 CAS CSCD 2012年第21期63-66,共4页
根据无线传感器网络中大量上行数据流实时传输的需求,提出一种基于位图索引的可靠传输协议(BRDT)。该协议使用迭代方式完成一组大量数据的传输。每次迭代的上行数据流采用无重传传输以减少延迟,并采用可靠后项传输传送带有错误标识的位... 根据无线传感器网络中大量上行数据流实时传输的需求,提出一种基于位图索引的可靠传输协议(BRDT)。该协议使用迭代方式完成一组大量数据的传输。每次迭代的上行数据流采用无重传传输以减少延迟,并采用可靠后项传输传送带有错误标识的位图索引以恢复丢失数据。在已有低功耗无线图像传感器网络Z-EYE系统中实现并进行验证,结果表明,与RMST协议相比,BRDT对下层的服务需求少,在网络质量较差的情况下,BRDT的性能明显优于NACK重传方法,在同等测试条件下,BRDT的传输效率优于PSFQ协议。 展开更多
关键词 无线传感器网络 无线图像传感器网络 可靠传输 位图索引 终端-网关 错误恢复
下载PDF
可重构媒体处理器任务编译器的前端设计 被引量:2
6
作者 殷崇勇 尹首一 +3 位作者 刘雷波 杨超 朱敏 魏少军 《北京邮电大学学报》 EI CAS CSCD 北大核心 2011年第3期108-112,126,共6页
为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务编译前端通过展开核心循环可提高并行执行度,在数据依赖分析确保运算正确执行的基础上,对循环体内的数组... 为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务编译前端通过展开核心循环可提高并行执行度,在数据依赖分析确保运算正确执行的基础上,对循环体内的数组访问进行标量替换,以优化数据传输开销.实验结果表明,该任务编译前端能有效提高代码并行性和优化数据传输能力,与Garp C编译器的编译前端相比,该任务编译前端设计的性能可提升约2~4倍. 展开更多
关键词 可重构计算 任务编译器 循环展开 标量替换
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部