期刊文献+
共找到31,116篇文章
< 1 2 250 >
每页显示 20 50 100
基于RISC-V的IOMMU设计
1
作者 王镇道 班贵龙 +1 位作者 胡锦 焦旭峰 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期187-194,共8页
在半导体技术受到管控的背景下,实现芯片的完全自主可控已成为现今半导体技术发展的重点.由于RISC-V具有开源、应用广泛的特性,研究RISC-V架构对于我国微处理器的自主可控具有重要研究意义.在微处理器系统中,由于物理资源的有限性和直... 在半导体技术受到管控的背景下,实现芯片的完全自主可控已成为现今半导体技术发展的重点.由于RISC-V具有开源、应用广泛的特性,研究RISC-V架构对于我国微处理器的自主可控具有重要研究意义.在微处理器系统中,由于物理资源的有限性和直接访问存储可能潜在危害,DMA访问I/O设备时将会受到诸多限制,从而影响访问性能.目前主流的方法是通过将I/O事务虚拟化,可以很好地解决这一问题.本文首次提出了一种基于RISC-V的I/O虚拟化架构,极大地加速了I/O访问进程,仅花费几个时钟周期就可快速完成I/O设备对内存的DMA请求.本设计将来可以作为IP,集成到RISC-V架构的处理器中,加速I/O设备对内存的访问. 展开更多
关键词 虚拟化 缓存 RISC-V
下载PDF
前言
2
作者 李华伟 哈亚军 姚海龙 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1349-1350,共2页
处理器芯片是信息系统的控制和算力根基.当前海量应用的不断演进对处理器性能和能效产生了指数级提升的追求,处理器芯片的设计规模和复杂度变得越来越大,设计难度越来越高,现有的层层分解的处理器设计流程已经难以实现全局能效最优.
关键词 处理器芯片 信息系统 处理器性能 设计流程 能效 指数级 设计难度 复杂度
下载PDF
基于RISC-V的超标量处理器的ROB压缩方法
3
作者 王洁 付丹阳 《计算机工程与科学》 CSCD 北大核心 2024年第7期1185-1192,共8页
RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量... RISC-V指令集具有灵活可扩展的优势,向量扩展是其扩展指令集之一。在实现向量扩展时需要将向量指令拆分成多条微指令,如果每条微指令都占用一项重排序缓存(ROB),会存在一定的信息冗余,并且会减少CPU中并行执行的指令(in-flight指令)数量,影响处理器性能。基于指令与微指令在ROB中的存储解耦方法,使用一个新的队列(RAB)存储每条微指令的目的寄存器的重命名映射关系等信息,每项ROB只存储其对应指令拆分的微指令的公共信息,ROB与RAB分别控制指令与微指令的提交与回滚,减少了存储信息冗余,缓解了由向量指令拆分的微指令过多导致的in-flight指令数量减少问题。在上述方法的基础上,同时实现了标量指令的ROB压缩,在ROB项数不变的情况下,增加了in-flight指令的最大数量。最终的仿真结果表明,此方法有效提高了处理器性能。 展开更多
关键词 RISC-V 超标量 处理器 ROB压缩
下载PDF
基于PCIe总线的主从CPU数据传输系统设计与实现
4
作者 龚行梁 李德文 +1 位作者 陈龙 王亮 《工业控制计算机》 2024年第5期1-3,6,共4页
电力系统保护自动化设备存在多CPU板卡间高速数据传输和存储需求,介绍了一种基于PCIe总线接口实现的主从CPU数据传输系统。采用飞腾FT2000/4处理器为核心构建硬件系统,通过嵌入式Linux操作系统、PCIe设备驱动和应用程序部署软件系统,主... 电力系统保护自动化设备存在多CPU板卡间高速数据传输和存储需求,介绍了一种基于PCIe总线接口实现的主从CPU数据传输系统。采用飞腾FT2000/4处理器为核心构建硬件系统,通过嵌入式Linux操作系统、PCIe设备驱动和应用程序部署软件系统,主CPU侧负责数据采集和处理,从CPU侧通过PCIe总线读取数据完成传输和存储功能。测试情况表明,该方案实现的系统稳定可靠,能够有效地满足高速传输、实时存储的应用业务需求,具有较高的工程应用价值。 展开更多
关键词 PCIe总线 主从CPU 数据传输
下载PDF
基于有限状态机的电口模块Flash初始化系统设计与实现
5
作者 陈旭东 邹国强 张倩武 《工业控制计算机》 2024年第9期107-109,共3页
在10GBASE-T RJ45 SFP+模块生产过程中,常用的生产方式是在贴片前对Flash进行烧录,当出现固件更新、烧录出错的情况时,模块无法方便地实现反复烧录。分析并提出了一种基于有限状态机的初始化系统,并在自主设计的模块中进行了实验验证。... 在10GBASE-T RJ45 SFP+模块生产过程中,常用的生产方式是在贴片前对Flash进行烧录,当出现固件更新、烧录出错的情况时,模块无法方便地实现反复烧录。分析并提出了一种基于有限状态机的初始化系统,并在自主设计的模块中进行了实验验证。在上位机之中存储固件数据,并对初始化流程进行整体控制;在MCU之中完成一个有限状态机,并通过MDIO控制PHY芯片,将数据写入到Flash之中,同时通过CRC完成固件数据的校验。测试结果表明,该系统能够实现模块在贴片后的重复烧录工作,减少88.55%的返工时间。 展开更多
关键词 10GBASE-T 状态机 PHY芯片 FLASH 上位机
下载PDF
基于元胞自动机的文体馆人员疏散仿真
6
作者 谢尊贤 杨欣琪 +2 位作者 张李慧 张枭雄 叶妮 《华北科技学院学报》 2024年第5期78-83,共6页
为研究封闭环境火情下人员疏散行为,提高文体馆内人员疏散效率,文章以西安某文体馆火灾疏散为例,基于元胞自动机模型,根据环境熟悉度将人员进行分类,引入随机运动,跟随运动,墙壁指示运动,通过matlab进行仿真模拟,研究了环境熟悉度、不... 为研究封闭环境火情下人员疏散行为,提高文体馆内人员疏散效率,文章以西安某文体馆火灾疏散为例,基于元胞自动机模型,根据环境熟悉度将人员进行分类,引入随机运动,跟随运动,墙壁指示运动,通过matlab进行仿真模拟,研究了环境熟悉度、不熟悉环境人员占比和场景等因素对人员疏散时间的影响。结果表明,当不熟悉环境人员占比较小时,人员向出口移动,容易在出口附近聚集;当不熟悉环境人员占比较大时,则容易向两侧墙壁移动,造成出口利用率降低;当人数一定时,不熟悉环境人员占比约为60%时,疏散时间相对较少;相对于出口横向摆放设施易使人们在疏散时聚集,导致不熟悉环境人员盲目跟随,设施纵向摆放时,疏散时间平均降低9.3%,更易于人员应急疏散。 展开更多
关键词 火情 人员疏散 文体馆 元胞自动机 仿真
下载PDF
循环轮询系统任务阻塞应对策略研究
7
作者 杜隆胤 《工业控制计算机》 2024年第9期103-104,共2页
针对循环轮询系统任务中的延时阻塞和事件阻塞导致的系统死锁、实时性不能保证和用户体验差问题,根据任务周期性和阻塞类型对任务进行分类拆分。拆分后的任务周期性和执行条件与原任务及阻塞特性有关。
关键词 循环轮训 延时阻塞 事件阻塞 任务拆分
下载PDF
用于VSLAM系统的CNN在FPGA平台上的加速 被引量:1
8
作者 郁媛 李沛君 +2 位作者 王光奇 张德兵 张春 《计算机工程与设计》 北大核心 2024年第1期71-78,共8页
为实现视觉同步定位与建图系统中卷积神经网络在FPGA上的加速,基于SuperPoint模型设计一种低功耗高效CNN加速器及相应的SoC系统。采用循环分块、数据复用、计算单元展开和双缓冲策略充分利用加速器的片上资源;为提高突发传输效率,预先... 为实现视觉同步定位与建图系统中卷积神经网络在FPGA上的加速,基于SuperPoint模型设计一种低功耗高效CNN加速器及相应的SoC系统。采用循环分块、数据复用、计算单元展开和双缓冲策略充分利用加速器的片上资源;为提高突发传输效率,预先对权重参数重排;提出Pack模块和Unpack模块,设计多通道数据传输,用于提高传输带宽。在Ultra96-V2 FPGA平台上部署整个SoC系统,在仅3 W左右的功耗下实现25.63 GOPS的吞吐量,其BRAM效率、DSP效率、性能密度和功耗效率相比之前的文献有明显优势。 展开更多
关键词 同步定位与建图系统 图像处理 卷积加速 数据复用 并行计算 突发传输 软硬件协作
下载PDF
机器学习辅助微架构功耗建模和设计空间探索综述 被引量:1
9
作者 翟建旺 凌梓超 +2 位作者 白晨 赵康 余备 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1351-1369,共19页
微架构设计是处理器开发的关键阶段,处在整个设计流程的上游,直接影响性能、功耗、成本等核心设计指标.在过去的数十年中,新的微架构设计方案,结合半导体制造工艺的进步,使得新一代处理器能够实现更高的性能和更低的功耗、成本.然而,随... 微架构设计是处理器开发的关键阶段,处在整个设计流程的上游,直接影响性能、功耗、成本等核心设计指标.在过去的数十年中,新的微架构设计方案,结合半导体制造工艺的进步,使得新一代处理器能够实现更高的性能和更低的功耗、成本.然而,随着集成电路发展至“后摩尔时代”,半导体工艺演进所带来的红利愈发有限,功耗问题已成为高能效处理器设计的主要挑战.与此同时,现代处理器的架构愈发复杂、设计空间愈发庞大,设计人员期望进行快速精确的指标权衡以获得更理想的微架构设计.此外,现有的层层分解的设计流程极为漫长耗时,已经难以实现全局能效最优.因此,如何在微架构设计阶段进行精确高效的前瞻性功耗估计和探索优化成为关键问题.为了应对这些挑战,机器学习技术被引入到微架构设计流程中,为处理器的微架构建模和优化提供了高质量方案.首先介绍了处理器的主要设计流程、微架构设计及其面临的挑战,然后阐述了机器学习辅助集成电路设计,重点在于使用机器学习技术辅助微架构功耗建模和设计空间探索的研究进展,最后进行总结展望. 展开更多
关键词 处理器设计自动化 微架构设计 功耗建模 设计空间探索 机器学习
下载PDF
基于RPU的TTI程序设计和分析方法
10
作者 高银康 陈香兰 +3 位作者 龚小航 蒋滨泽 李曦 周学海 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期98-119,共22页
实时嵌入式系统不仅要保证计算结果的逻辑正确性,还要确保与外界交互的时序正确性,所以底层程序要能精确表达上层模型中的时间行为.TTI指令集(time-triggered instruction set)的提出尝试解决计算机指令集体系结构层次缺少时间语义的问... 实时嵌入式系统不仅要保证计算结果的逻辑正确性,还要确保与外界交互的时序正确性,所以底层程序要能精确表达上层模型中的时间行为.TTI指令集(time-triggered instruction set)的提出尝试解决计算机指令集体系结构层次缺少时间语义的问题,并且基于TTI指令集实现的实时处理单元(real-time processing unit,RPU)证明了TTI指令集的可行性和有效性.但是目前的工作缺少对于TTI程序设计和分析方法的研究.所以,基于TTI指令集和RPU,提出了TTI指令集可以表达的4种时间语义,给出了TTI程序的设计范式.并且构建了TTI程序时间行为的表示方法——TFG+,TFG+是对TFG的扩展,TFG+区分了TTI程序中时间语义指令和普通代码段,可以表示TTI程序的控制流信息、用户规定的时间行为和TTI程序平台相关的时间属性.最后,提出了TTI程序的时间分析方法以及时间安全性检查方法,为TTI程序的设计和部署提供了依据. 展开更多
关键词 实时嵌入式系统 时间可预测性 时间语义指令集 实时处理器 WCET分析
下载PDF
基于MPI的鲲鹏CPU核间通信研究
11
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
算网融合DPU可定制化能力分层方法
12
作者 王立文 张岩 +2 位作者 曹畅 康凯 文湘江 《信息通信技术》 2024年第4期64-71,共8页
社会数字化转型推动着行业提升“联接+计算”能力,促进网络向算网融合发展。数据处理单元(Data Processing Unit,DPU)是在海量数据高效传输和处理需求下快速发展起来的新技术形态,部署位置处于网络和计算的衔接点,是算网融合的关键技术... 社会数字化转型推动着行业提升“联接+计算”能力,促进网络向算网融合发展。数据处理单元(Data Processing Unit,DPU)是在海量数据高效传输和处理需求下快速发展起来的新技术形态,部署位置处于网络和计算的衔接点,是算网融合的关键技术。文章首先阐述DPU的典型应用场景和方案,其次分析DPU的组成架构和可编程资源,最后提出DPU的可定制化能力分层方法,用于DPU的软硬件资源和可定制化能力细分,有助于用户根据业务需求和研发能力进行产品评估和选型、二次开发和业务优化,有利于DPU在算网融合场景中发挥其灵活和高效的数据处理能力实现算网业深度协同,助力DPU产业生态发展和算网融合技术创新。 展开更多
关键词 算网融合 数据处理器 定制化能力
下载PDF
面向56 Gb/s高速SerDes接收机DSP设计
13
作者 胡小月 王强 +2 位作者 吕方旭 许超龙 张锦 《计算机工程与科学》 CSCD 北大核心 2024年第7期1202-1209,共8页
高速接口芯片是高性能互连网络通信中的一款重要IP,针对56 Gb/s四脉冲幅度调制信号在高性能互连网络背板通信中,由于传输距离长信道衰减严重导致误码率高的问题,提出一种面向56 Gb/s高速Serdes接收机DSP设计。该DSP采用64路并行结构,通... 高速接口芯片是高性能互连网络通信中的一款重要IP,针对56 Gb/s四脉冲幅度调制信号在高性能互连网络背板通信中,由于传输距离长信道衰减严重导致误码率高的问题,提出一种面向56 Gb/s高速Serdes接收机DSP设计。该DSP采用64路并行结构,通过16抽头前向反馈均衡器,以及1抽头预判决反馈均衡器对接收端数字化后的信号进行处理;采用基于K-均值聚类算法生成动态变化的判决电平并结合最小均方误差算法,能够处理15~35 dB不同信道衰减下的均衡问题。为了验证算法的性能,还搭建了一个基于模拟前端芯片和现场可编程门阵列的实验验证平台。实验结果表明,在信道衰减为15~35 dB@14 GHz,速率为56 Gb/s的条件下,误码率均小于5e-10。 展开更多
关键词 K-均值算法 前向反馈均衡 预判决反馈均衡 自适应均衡
下载PDF
基于鲲鹏处理器的WRF移植与评估
14
作者 陈晔峰 晏臣 +2 位作者 陈锋 安卫士 何明扬 《数据与计算发展前沿》 CSCD 2024年第3期150-161,共12页
【目的】开展WRF模式在鲲鹏处理平台上的应用评估,为国产芯片在气象行业开展广泛应用提供参考。【应用背景】近年来气象数值预报技术不断发展,超级计算机成为气象发展的主要支撑,研究国产芯片对气象信息化支撑技术,有助于促进国产芯片... 【目的】开展WRF模式在鲲鹏处理平台上的应用评估,为国产芯片在气象行业开展广泛应用提供参考。【应用背景】近年来气象数值预报技术不断发展,超级计算机成为气象发展的主要支撑,研究国产芯片对气象信息化支撑技术,有助于促进国产芯片在气象行业的广泛应用。【方法】基于ARM架构的鲲鹏920处理器从STREAM、HPL、HPCG 3个方面进行基准测试,以气象行业典型应用WRF为例,展示鲲鹏处理器在模式移植、计算效率和扩展性方面的良好性能。【结果】从测试结果来看,鲲鹏处理器表现出优秀的访存带宽、浮点计算性能以及高扩展性;鲲鹏处理器的移植过程较为简单,应用性能满足气象行业的时效性与扩展性要求,预报结果能做到与气象现有平台保持一致。【结论】鲲鹏处理器具备在气象行业广泛应用的基础。 展开更多
关键词 高性能计算 ARM架构 鲲鹏920 WRF应用 性能评估
下载PDF
GROMACS在鲲鹏920平台的性能分析及运行优化
15
作者 原惠峰 陆腾 +4 位作者 朱延超 晏臣 马英晋 刘倩 金钟 《数据与计算发展前沿(中英文)》 CSCD 2024年第4期182-193,共12页
【应用背景】ARM众核架构处理器以其高性能、高并行性及低功耗的特点,在分子动力学、流体及天气模拟等领域扮演着越来越重要的作用。【局限】然而,分子动力学模拟软件运行时不同维度的任务分解策略(如粒子作用、时空域分解等)、多样化... 【应用背景】ARM众核架构处理器以其高性能、高并行性及低功耗的特点,在分子动力学、流体及天气模拟等领域扮演着越来越重要的作用。【局限】然而,分子动力学模拟软件运行时不同维度的任务分解策略(如粒子作用、时空域分解等)、多样化的并行策略导致负载特征多样而与众核处理器基于高度并行的计算资源所产生的算力这一特点难以很好地匹配,进而导致各计算单元运行时效率低的问题已成为了限制运行时性能提升的重要瓶颈之一。【方法】针对这一问题,以华为技术有限公司自主研发ARM架构鲲鹏920处理器和GROMACS软件为研究对象,通过对鲲鹏920处理器结构特点和算力特征、GROMACS软件任务分解、并行执行过程进行深入分析,提出运行时并行参数优化策略,以更好地适配软件的算力需求和硬件的算力特点,提升了软件计算性能。【结果】通过系统分析性能瓶颈并实践优化策略,相比优化前取得了16.9%的加速效果。【结论】此研究成果可为分子动力学模拟在众核计算环境下的性能优化、国产高性能计算系统及分子动力学模拟专用机等的研发提供一定的参考依据。 展开更多
关键词 分子动力学 GROMACS 鲲鹏920 性能优化
下载PDF
面向车载功能安全的低开销超标量双核锁步处理器架构设计
16
作者 张承译 王明羽 +1 位作者 虞志益 李兆麟 《汽车工程学报》 2024年第2期313-320,共8页
在车载功能安全领域,双核锁步架构是一种被广泛应用于解决处理器故障的冗余架构。为支持细粒度故障处理的超标量处理器提出一种新颖的双核锁步架构,通过以分支跳转指令的形式执行程序回滚,该架构能在故障发生的同一时钟周期内检测和纠... 在车载功能安全领域,双核锁步架构是一种被广泛应用于解决处理器故障的冗余架构。为支持细粒度故障处理的超标量处理器提出一种新颖的双核锁步架构,通过以分支跳转指令的形式执行程序回滚,该架构能在故障发生的同一时钟周期内检测和纠正故障,且不需要额外的专用硬件模块来满足细粒度回滚的需求。还提出一种虚拟写回机制,该机制将特定数据传送到只读寄存器以防止故障衍生,使处理器无需在程序执行期间持续保存现场,从而显著节省了面积开销。试验结果表明,该架构对注入处理器的故障实现了较彻底的故障覆盖,对处理器原型的性能影响很小,与先前双核锁步相关的工作相比,时间和面积开销更小。 展开更多
关键词 双核锁步 处理器 故障处理 程序回滚
下载PDF
面向SW26010Pro处理器的全局符号重定位优化
17
作者 钱宏 王飞 +3 位作者 刘沙 郑天宇 宋佳伟 安虹 《计算机系统应用》 2024年第2期62-71,共10页
申威异构众核处理器运算核心访问主存的延迟很大,程序中应尽量避免运算核心代码访问主存的操作.全局偏移表存放程序中全局变量和函数的地址,不适合保存在珍稀的运算核心局部存储空间中,并且其访问模式通常比较离散,因而也不适合对其做Ca... 申威异构众核处理器运算核心访问主存的延迟很大,程序中应尽量避免运算核心代码访问主存的操作.全局偏移表存放程序中全局变量和函数的地址,不适合保存在珍稀的运算核心局部存储空间中,并且其访问模式通常比较离散,因而也不适合对其做Cache预取,访问全局偏移表引入的访问主存操作对程序性能影响较大.本文针对异构众核程序静态链接与动态链接的使用场景,分析链接器relaxation优化的使用限制,通过“gp基地址+扩展偏移”的方法实现避免访问主存操作的全局符号重定位优化.实验结果表明,该重定位优化方法能够以增加少量代码为代价,在运算核心代码调用函数与访问全局变量时有效避免访问全局偏移表引入的访问主存的操作,提高众核程序的运行性能. 展开更多
关键词 众核处理器 全局偏移表 重定位 链接器优化 性能
下载PDF
弱耦合协处理器设计方法研究——以人工智能应用为例
18
作者 严忻恺 陈芳园 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第3期112-121,共10页
近些年随着人工智能、大数据、元宇宙等应用的蓬勃发展和半导体工艺进步的放缓,软件应用与硬件性能之间出现了巨大的算力鸿沟,通过软硬件协同设计的特定领域架构作为应对方案得到了学术界和工业界的广泛关注和认可.所以针对特定领域应... 近些年随着人工智能、大数据、元宇宙等应用的蓬勃发展和半导体工艺进步的放缓,软件应用与硬件性能之间出现了巨大的算力鸿沟,通过软硬件协同设计的特定领域架构作为应对方案得到了学术界和工业界的广泛关注和认可.所以针对特定领域应用的核心需求设计专用协处理器,研究专用协处理器的设计方法,对于提高软件应用性能和效率,提升硬件设计效率等问题具有重大意义.本文分析了不同耦合度和不同负载需求的协处理器设计空间,重点研究了弱耦合协处理器的设计方法,包括基于RISC-V定制指令设计协处理器指令架构、弱耦合协处理器在不同应用场景下的控制交互接口、访存接口和设计框架;同时归纳总结了人工智能应用的共性需求和人工智能协处理器研究现状;并给出了两种面向不同人工智能应用场景的弱耦合协处理器设计实例,为提高协处理器设计效率提供了有效支撑. 展开更多
关键词 协处理器 领域特定架构 弱耦合 RISC-V 人工智能
下载PDF
基于轻量级的RISC-V异构处理器的安全模型研究
19
作者 罗云鹏 吴晋成 +1 位作者 王正 王铜柱 《通信技术》 2024年第9期973-980,共8页
面对物联网的快速发展,需要低延时、高性能的处理器来实现关键数据的传输和保护,同时要提高处理器的硬件安全,减少非法用户对处理器的攻击。结合当前开源第五代精简指令集(Reduced Instruction Set Computing-Five,RISC-V)处理器架构优... 面对物联网的快速发展,需要低延时、高性能的处理器来实现关键数据的传输和保护,同时要提高处理器的硬件安全,减少非法用户对处理器的攻击。结合当前开源第五代精简指令集(Reduced Instruction Set Computing-Five,RISC-V)处理器架构优点,与现场可编程门阵列(Field Programmable Gate Array,FPGA)相结合,设计了异构处理器,提出了基于密码的安全启动模型。首先,细化RISC-V异构处理器的体系结构,设计轻量级密码启动安全模型TrustZone,实现处理器性能与安全的平衡,并结合FPGA的优点,实现定制化的专用协议与业务通信。其次,提出当前RISC-V异构处理器可实现的便捷途径,并基于此进行模型搭建和测试验证。验证结果表明,虽然采用TrustZone安全度量后处理器启动时间有所增加,但针对轻量级的处理器应用场景,在增强处理器安全的前提下,该启动时间开销是可以接受的。 展开更多
关键词 RISC-V 异构处理器 可信启动 密码协处理 TrustZone认证
下载PDF
基于功耗计数器的处理器功耗实时估算方法
20
作者 贾凡 章隆兵 《高技术通讯》 CAS 北大核心 2024年第1期25-32,共8页
针对现有的2类处理器功耗实时估算方法的不足,本文开发了一种基于功耗计数器的处理器功耗实时估算方法。该方法结合了基于性能事件计数器和基于电路信号方法的优点,利用功耗计数器记录与处理器功耗密切相关的电路信号的变化次数,能够以... 针对现有的2类处理器功耗实时估算方法的不足,本文开发了一种基于功耗计数器的处理器功耗实时估算方法。该方法结合了基于性能事件计数器和基于电路信号方法的优点,利用功耗计数器记录与处理器功耗密切相关的电路信号的变化次数,能够以较小的观测粒度实时估算处理器的功耗,并且具有较低的硬件开销。本文在龙芯GS364处理器上实现并评估了该方法。结果表明,使用16个功耗计数器可以在512个时钟周期的粒度内实现0.83%的估算误差,与此同时,它的硬件开销只占处理器总面积的0.063%。 展开更多
关键词 功耗估算 功耗计数器 功耗管理 性能事件计数 LASSO回归
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部