期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于ARMv8处理器的实数FFT实现与性能优化研究
1
作者 赵翔 贾海鹏 +3 位作者 张云泉 邓明森 张广婷 郭金鑫 《计算机学报》 EI CAS CSCD 北大核心 2023年第5期1003-1018,共16页
FFT(快速傅里叶变换)是离散傅里叶变换或其逆变换的一种常见快速算法,是高性能计算领域最重要的基础核心算法之一,在科学、工程和数学等领域的应用十分广泛.实数FFT算法,即输入或者输出为实数的FFT算法,其中包括R2C(Real-to-Complex)、C... FFT(快速傅里叶变换)是离散傅里叶变换或其逆变换的一种常见快速算法,是高性能计算领域最重要的基础核心算法之一,在科学、工程和数学等领域的应用十分广泛.实数FFT算法,即输入或者输出为实数的FFT算法,其中包括R2C(Real-to-Complex)、C2R(Complex-to-Real)等变换类型.相比复数FFT算法,实数FFT算法在图形图像处理、数据压缩等领域有着不可替代的作用.传统实数FFT实现针对的是输入规模为偶数,一般转变为复数FFT进行运算.然而当前鲜有针对输入规模为奇数的实数FFT高效实现.对此,本文提出了一种实数FFT高效算法(DRFFT),并采用蝶形网络优化、蝶形计算优化、访存优化、SIMD优化以及数据转置等方法进行优化,大幅提升了实数FFT算法性能,最终构建了一种针对实数FFT的高性能算法库.实验结果表明,本文实现的DRFFT R2C变换在单双精度浮点数处理方面较FFTW库性能分别平均提升了37.6%和4.6%,较ARMPL库性能分别平均提升了67.6%和28.1%.DRFFT C2R变换在单双精度浮点数处理方面则较FFTW库性能分别平均提升了58.6%和10.8%,较ARMPL库性能分别平均提升了121.8%和85.2%. 展开更多
关键词 ARMv8 FFT算法 R2C C2R FFTW
下载PDF
基于位串行计算的动态精度神经网络处理器
2
作者 郝一帆 支天 杜子东 《高技术通讯》 CAS 2022年第9期881-893,共13页
针对当前神经网络动态精度计算系统在周期性的模型重训练和动态精度切换的过程中会引入大量的计算和访存开销问题,提出了基于串行位计算的动态精度神经网络处理器(DPNN),其可支持任意规模、任意精度的神经网络模型;支持以非重训练的方... 针对当前神经网络动态精度计算系统在周期性的模型重训练和动态精度切换的过程中会引入大量的计算和访存开销问题,提出了基于串行位计算的动态精度神经网络处理器(DPNN),其可支持任意规模、任意精度的神经网络模型;支持以非重训练的方式对模型数据精度进行细粒度调整,并消除了动态精度切换时因权值bit位重叠造成的重复计算与访存。实验结果表明,相较于自感知神经网络系统(SaNNs)的最新进展之一MinMaxNN,DPNN可使计算量平均降低1.34~2.52倍,访存量降低1.16~1.93倍;相较于代表性的bit串行计算神经网络处理器Stripes,DPNN使性能提升2.57倍、功耗节省2.87倍、面积减少1.95倍。 展开更多
关键词 神经网络处理器 动态精度计算 位串行计算
下载PDF
基于数据面加速器的工业5G协议处理架构研究
3
作者 杨喜宁 周一青 陈洋 《高技术通讯》 CAS 2023年第10期1038-1046,共9页
伴随5G标准的不断演进和商用网络的规模部署,5G已成为引领我国智能制造高质量发展的新引擎。与此同时,以高带宽、高频次小包通信为特征的工业应用也对5G终端基带芯片协议处理提出了挑战。本文提出一种以数据面加速器(DPA)为核心的高性... 伴随5G标准的不断演进和商用网络的规模部署,5G已成为引领我国智能制造高质量发展的新引擎。与此同时,以高带宽、高频次小包通信为特征的工业应用也对5G终端基带芯片协议处理提出了挑战。本文提出一种以数据面加速器(DPA)为核心的高性能软硬件协同5G协议处理架构,该架构将异构芯片计算资源与协议处理功能进行了合理映射,并通过并行化设计大幅提升5G用户面数据处理性能。实验结果表明,相比纯软件的实现方案本文提出的协同架构在不同业务负载条件下,数据包处理时延平均下降28.3%,包处理通量平均提升38%。在0.5 ms的时隙周期配置下,本文架构的数据包处理速率大于2000包/s,可以满足工业5G大规模现场节点集中式数据采集的需求。 展开更多
关键词 工业5G 软硬协同 协议处理 加速器
下载PDF
香山开源高性能RISC V处理器敏捷设计实践 被引量:1
4
作者 王凯帆 徐易难 +2 位作者 何伟 张科 包云岗 《单片机与嵌入式系统应用》 2022年第12期4-6,36,共4页
2019年,在中国科学院支持下,由中国科学院计算技术研究所牵头发起“香山”高性能开源RISC V处理器项目,研发出目前国际上性能最高的开源高性能RISC V处理器核“香山”,在开源项目托管平台GitHub上获得超过3000个星标,形成360多个分支,... 2019年,在中国科学院支持下,由中国科学院计算技术研究所牵头发起“香山”高性能开源RISC V处理器项目,研发出目前国际上性能最高的开源高性能RISC V处理器核“香山”,在开源项目托管平台GitHub上获得超过3000个星标,形成360多个分支,成为国际上广受关注的开源硬件项目之一,得到国内外企业的支持。2021年6月22日,“香山”开源高性能RISC V处理器在首届RISC V中国峰会上亮相,引起了各界的广泛关注。本文根据第二届RISC V中国峰会的主会报告“香山开源高性能RISC V处理器敏捷设计实践”整理而成,分享香山过去一年的总体进展。 展开更多
关键词 RISC V 高性能处理器 SERVE
下载PDF
第一性原理极化率计算中的众核优化方法研究
5
作者 罗海文 吴扬俊 商红慧 《计算机科学》 CSCD 北大核心 2023年第6期1-9,共9页
基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效... 基于量子力学的密度泛函微扰理论(DFPT)可以用来计算分子和材料的多种物理化学性质,目前被广泛应用于新材料等领域的研究中;同时,异构众核处理器架构逐渐成为超算的主流。因此,针对异构众核处理器重新设计和优化DFPT程序以提升其计算效率,对物理化学性质的计算及其科学应用具有重要意义。文中对DFPT中一阶响应密度和一阶响应哈密顿矩阵的计算针对众核处理器体系结构进行了优化,并在新一代神威处理器上进行了验证。优化技术包括循环分块、离散访存处理和协同规约。其中,循环分块对任务进行划分从而由众核并行地执行;离散访存处理将离散访存转换为更高效的连续访存;协同规约解决了写冲突问题。实验结果表明,在一个核组上,优化后的程序性能较优化前提高了8.2~74.4倍,并且具有良好的强可扩展性和弱可扩展性。 展开更多
关键词 密度函数微扰理论 第一性原理计算 高性能计算 新一代神威异构众核处理器
下载PDF
基于OpenGL ES的图像滤波算法实现及优化研究 被引量:1
6
作者 常文斌 牟明任 +2 位作者 贾海鹏 张云泉 张思佳 《计算机工程》 CAS CSCD 北大核心 2023年第11期257-266,共10页
图像滤波算法广泛应用在机器学习、图像处理、图像识别等领域,在降低椒盐噪声、图像二值化、边缘识别和特征提取等方面发挥着重要作用。现有图像滤波算法虽然在OpenCV开源库中均有实现,但是在Android平台的性能表现与其他平台相比仍存... 图像滤波算法广泛应用在机器学习、图像处理、图像识别等领域,在降低椒盐噪声、图像二值化、边缘识别和特征提取等方面发挥着重要作用。现有图像滤波算法虽然在OpenCV开源库中均有实现,但是在Android平台的性能表现与其他平台相比仍存在较大差距。随着嵌入式平台的高速发展,实际应用对嵌入式平台上滤波算法的性能要求越来越高。为此,从形态学滤波、盒式滤波、阈值滤波、压缩滤波、算术滤波等具有广泛应用场景的滤波算法入手,提出并实现针对Android平台设计、基于OpenGL ES的一系列高性能图像滤波算法。使用OpenGL ES计算着色器对算法进行并行加速,使用纹理对象进行访存优化,并在图像边界处理、图像数据类型和数据通信等方面进行深入优化,取得了较优的性能。将优化的图像滤波算法与开源OpenCV库中对应算法进行对比,实验结果表明,基于Android平台使用OpenGL ES接口的图像滤波算法整体性能明显优于OpenCV库中的相关算法,且图像规模越大计算优势越明显,性能最大提升为OpenCV库中对应算法的110.018倍。 展开更多
关键词 OpenGL ES接口 图像滤波 嵌入式平台 计算着色器 图像纹理
下载PDF
空天地网络确定性服务架构、挑战及关键技术 被引量:3
7
作者 曹欢 陈岩 +4 位作者 周一青 苏泳涛 刘子凡 陈道进 丁雅帅 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期1-18,共18页
面向空天地全域垂直行业用户极致通信的需求,协同地面移动通信网络和快速发展的非地面(NTN)通信网络,打破传统“尽力而为”的僵化服务模式,为用户提供全域确定性服务是未来6G通信重要的发展方向之一。首先,概述了未来空天地一体化组网... 面向空天地全域垂直行业用户极致通信的需求,协同地面移动通信网络和快速发展的非地面(NTN)通信网络,打破传统“尽力而为”的僵化服务模式,为用户提供全域确定性服务是未来6G通信重要的发展方向之一。首先,概述了未来空天地一体化组网架构及该架构下的确定性服务内涵与场景需求,并提出了一种面向全域网络的确定性服务管控技术框架。然后,分析了全域确定性服务过程中面临的三大挑战,包括全域全场景用户业务感知难以保障、空天地一体端到端切片组网编排困难和切片子网内全域多维资源协同快速调度困难等问题。针对上述挑战,分别介绍了基于智能云的全域全场景业务感知技术、基于网络拓扑预测的星地端到端智能切片编排和数据与模型驱动的星地资源智能分配技术三个解决方案,为空天地一体网络极致服务技术的发展提供参考。 展开更多
关键词 空天地一体 确定性服务 智能感知 网络切片 智能资源调度
下载PDF
基于异常行为的海洋气象传感网的入侵检测方法研究
8
作者 苏新 田天 +1 位作者 Ziyang Gong 周一青 《通信学报》 EI CSCD 北大核心 2023年第7期86-99,共14页
应对海洋气象传感网面临的异常数据流攻击,分析安全机制,针对其复杂庞大的网络结构和节点内分布极端不平衡的数据流,对基于异常行为的海洋气象传感网入侵检测方法进行研究,并搭建入侵检测系统。重点考虑数据集不平衡问题,使用深度生成网... 应对海洋气象传感网面临的异常数据流攻击,分析安全机制,针对其复杂庞大的网络结构和节点内分布极端不平衡的数据流,对基于异常行为的海洋气象传感网入侵检测方法进行研究,并搭建入侵检测系统。重点考虑数据集不平衡问题,使用深度生成网络CVAE-GAN学习数据集中少数类的分布,实现有效的数据生成。使用基于OPTICS的去噪算法清除多数类中噪声点,清晰化类别边界。从数据角度入手,降低数据集不平衡率,减小不平衡数据集对入侵检测系统的影响,提高分类器对少数类异常流量的识别能力。仿真结果表明,所提系统能够有效识别各类异常流量,尤其是少数类异常流量,所采用的不平衡数据集处理方法对分类器的检测能力有显著提高。 展开更多
关键词 海洋气象传感网 入侵检测系统 数据集平衡化 CVAE-GAN OPTICS
下载PDF
基于感通算融合和信息年龄优化的车联网多节点协同感知
9
作者 周一青 张浩岳 +3 位作者 齐彦丽 蔡青 刘玲 王江舟 《通信学报》 EI CSCD 北大核心 2024年第3期1-16,共16页
面向未来自动驾驶系统中的实时性业务需求(如高清地图更新),基于感知-通信-计算融合,引入信息年龄作为实时性度量,设计感通算融合的车联网多节点协同感知机制。在通信-计算资源和车辆能耗约束下,优化调度感知节点信息采集和传输处理,最... 面向未来自动驾驶系统中的实时性业务需求(如高清地图更新),基于感知-通信-计算融合,引入信息年龄作为实时性度量,设计感通算融合的车联网多节点协同感知机制。在通信-计算资源和车辆能耗约束下,优化调度感知节点信息采集和传输处理,最小化感知信息的平均信息年龄;提出基于李雅普诺夫的在线调度算法,将复杂的长期随机优化问题转化为单时隙在线优化问题,并设计低复杂度算法求解。仿真表明,与现有仅考虑通信与计算融合的机制相比,所提机制信息实时性可提高9%~50%。 展开更多
关键词 自动驾驶 感知信息实时性 感知-通信-计算融合 信息年龄 李雅普诺夫随机优化
下载PDF
基于真值表的函数自动生成的神经网络模型
10
作者 贺文凯 支天 +4 位作者 胡杏 张曦珊 张蕊 杜子东 郭崎 《高技术通讯》 CAS 北大核心 2024年第3期265-274,共10页
作为目前最常见的程序综合问题,示例编程通过用户提供的输入/输出示例生成程序,为编程能力不足的开发者提供了便利。近年来,示例编程已经被应用于Microsoft Office Excel办公软件的自动编程,以及勘探、测井、航空航天等领域。鉴于目前... 作为目前最常见的程序综合问题,示例编程通过用户提供的输入/输出示例生成程序,为编程能力不足的开发者提供了便利。近年来,示例编程已经被应用于Microsoft Office Excel办公软件的自动编程,以及勘探、测井、航空航天等领域。鉴于目前示例编程鲜有关于二进制流的研究,本文针对基于真值表函数自动生成问题具有函数表达式的语法符号序列中各语法符号的关系与它们的距离大小无关、函数表达式的生成语义规则与布尔向量函数采样的结果长度无关的特点,设计了一种神经网络模型和算法,在程序综合、功能等价和序列匹配的指标上分别取得了70.56%、64.66%、0.6355的结果,分别优于现有最先进的程序综合模型55.07%、49.70%、0.5690。 展开更多
关键词 真值表 神经网络 序列模型 示例编程 程序综合
下载PDF
基于深度强化学习的海洋移动边缘计算卸载方法 被引量:2
11
作者 苏新 孟蕾蕾 +1 位作者 周一青 CELIMUGE Wu 《通信学报》 EI CSCD 北大核心 2022年第10期133-145,共13页
海洋信息系统网络节点之间的强异构特性为海洋移动边缘计算任务卸载优化带来了复杂高维度的限制条件,同时复杂多样化的海事应用会导致海洋网络局部区域出现计算任务的超负荷处理。为实现海洋网络节点计算任务的最佳卸载与资源优化,满足... 海洋信息系统网络节点之间的强异构特性为海洋移动边缘计算任务卸载优化带来了复杂高维度的限制条件,同时复杂多样化的海事应用会导致海洋网络局部区域出现计算任务的超负荷处理。为实现海洋网络节点计算任务的最佳卸载与资源优化,满足网络低时延、高可靠的应用服务需求,提出基于多尺度异构特征属性的海洋网络节点分层归类方法和基于深度强化学习的海洋移动边缘计算卸载方法。仿真结果表明,所提方法较传统方法能够在海洋信息系统下有效地降低网络节点的计算任务卸载时延,并且能够在大规模任务流下保持海洋网络的稳健性。 展开更多
关键词 海洋信息系统 边缘计算 计算任务卸载 功率与计算资源分配 深度强化学习
下载PDF
量子游走相关算法研究进展
12
作者 李萌 孙晓明 《信息通信技术与政策》 2022年第7期28-36,共9页
量子游走是经典随机游走在量子世界的对应,已经被证明是一种通用的量子计算模型,也是设计高效量子算法和量子信息处理方案的基础工具之一。简要介绍了量子游走的概念和基本原理,阐述了量子游走在搜索问题及其他方面的一些重要应用,并总... 量子游走是经典随机游走在量子世界的对应,已经被证明是一种通用的量子计算模型,也是设计高效量子算法和量子信息处理方案的基础工具之一。简要介绍了量子游走的概念和基本原理,阐述了量子游走在搜索问题及其他方面的一些重要应用,并总结和展望了量子游走的未来发展前景。 展开更多
关键词 量子游走 量子算法 量子加速 量子应用
下载PDF
AI for Technology:技术智能在高技术领域的应用实践与未来展望
13
作者 陈云霁 郭崎 《中国科学院院刊》 CSCD 北大核心 2024年第1期34-40,共7页
以智能化科研(AI for Science)为核心的第五科研范式已经在多个自然科学和高技术领域得到了广泛应用。与人工智能(AI)在自然科学领域的应用强调发现新原理、新机理和新规律不同,高技术领域更强调用AI技术来发明创造新方案、新工具和新产... 以智能化科研(AI for Science)为核心的第五科研范式已经在多个自然科学和高技术领域得到了广泛应用。与人工智能(AI)在自然科学领域的应用强调发现新原理、新机理和新规律不同,高技术领域更强调用AI技术来发明创造新方案、新工具和新产品,以解决特定的领域问题。文章总结了AI在高技术领域的应用——“技术智能”(AI for Technology)的典型特征和科学问题,并以CPU芯片全自动设计为例介绍过往的成功案例。最后,文章指出技术智能的目标不仅是加速创新流程并减少人工投入,同时也希望其具备更强的创造能力,最终超过人类的水平。 展开更多
关键词 技术智能 智能化科研 发明创造 CPU设计
原文传递
意图抽象与知识联合驱动的6G内生智能网络架构 被引量:2
14
作者 杨静雅 唐晓刚 +2 位作者 周一青 刘玲 Jiangzhou Wang 《通信学报》 EI CSCD 北大核心 2023年第2期12-26,共15页
6G将以智能网络为演进形式,具备内生智能、开放性的特征。智能网络标准化研究中强调了意图驱动网络对实现网络智能化的必要性。但目前基于意图的网络将意图理解为“What to do”而非“What you want”,利用知识定义网络(KDN)可在一定程... 6G将以智能网络为演进形式,具备内生智能、开放性的特征。智能网络标准化研究中强调了意图驱动网络对实现网络智能化的必要性。但目前基于意图的网络将意图理解为“What to do”而非“What you want”,利用知识定义网络(KDN)可在一定程度上根据“What to do”完成“How to configure the network”。基于此,提出了意图抽象与知识联合驱动的6G内生智能网络架构,旨在根据“What you want”实现“How to configure the network”。首先,设计了意图抽象模块,通过意图获取、意图转译、意图映射和意图建模,从“What you want”获取“What to do”。其次,提出了认知模块,利用机器学习和逻辑推理联合动态优化获取网络知识,从而根据“What to do”完成“How to configure the network”。最后,介绍了支撑6G内生智能实现的意图映射、网络信息测量、网络策略生成、网络策略验证等关键技术及未来挑战。 展开更多
关键词 6G 内生智能 意图抽象 网络知识
下载PDF
通感算协同的无人机群轨迹规划与功率分配 被引量:1
15
作者 吴义豪 齐彦丽 +3 位作者 周一青 蔡青 刘玲 石晶林 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期61-74,共14页
区域性自然灾害会造成地面基础通信设施的损坏,无人机群组网可作为空中基站恢复通信。现有研究集中于静态场景下如何在无人机频谱和电池容量受限的条件下为救援人员提供高效通信服务。然而,实际场景中救援人员的位置移动和业务变化会导... 区域性自然灾害会造成地面基础通信设施的损坏,无人机群组网可作为空中基站恢复通信。现有研究集中于静态场景下如何在无人机频谱和电池容量受限的条件下为救援人员提供高效通信服务。然而,实际场景中救援人员的位置移动和业务变化会导致静态方案失效。针对这一问题,提出了通感算协同的无人机群调度算法。首先实时感知环境信息,即救援人员历史位置信息和业务需求,并对救援人员未来位置和业务需求进行预测,为无人机群的调度提供先验信息;其次,针对无人机负载约束提出了改进的k-sums算法用于实现无人机群位置的部署,以实现无人机群负载均衡;最后,进一步采用强化学习算法,对无人机群的发射功率进行优化,在有限带宽下保证救援人员的通信服务质量。仿真结果表明,相比于静态场景下基于信噪比建立救援人员与无人机群关联,所提的无人机群调度算法能够有效提升约20%的网络效用(网络通信收益与通信成本之差),为应急救灾场景下救援人员的业务服务提供保障。 展开更多
关键词 通感算协同 无人机 应急通信 强化学习
下载PDF
基于GNN-LSTM-CNN网络的6G车辆轨迹预测算法 被引量:1
16
作者 蔡国庆 刘玲 +1 位作者 张冲 周一青 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期50-60,共11页
6G时代将实现万物互联,建立多层级、全覆盖的无缝连接,车联网作为通信、交通、汽车等多个行业融合交叉的关键领域将借助6G技术发展、部署。针对6G车联网中车辆轨迹预测精度不足的问题,采用深度学习的方法,提出了一种三通道神经网络模型... 6G时代将实现万物互联,建立多层级、全覆盖的无缝连接,车联网作为通信、交通、汽车等多个行业融合交叉的关键领域将借助6G技术发展、部署。针对6G车联网中车辆轨迹预测精度不足的问题,采用深度学习的方法,提出了一种三通道神经网络模型。该模型考虑了车辆之间的交互信息、目标车辆的轨迹信息和车道结构信息对轨迹的影响。模型使用长短期记忆网络(LSTM)提取车辆轨迹信息特征,使用图神经网络(GNN)提取不同车辆之间的交互特征,使用卷积神经网络(CNN)提取车道结构特征。通过计算三通道特征向量的权重得到目标车辆预测的轨迹;通过NGSIM数据集对模型进行训练和测试。测试结果表明:与其他预测模型相比,考虑多维度信息的三通道网络预测方法在预测精度和长时域预测上有优势,预测精度提高了20%以上。降低6G车联网系统的数据传输量,可提升车联网系统的用户隐私安全。 展开更多
关键词 自动驾驶 轨迹预测 神经网络 长短期记忆网络
下载PDF
基于K近邻的数字电路自动测试向量生成方法
17
作者 李文星 王天成 李华伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第11期1802-1810,共9页
基于分支限界搜索的自动测试向量生成(ATPG)是数字电路测试中的关键技术,搜索中的回溯次数对ATPG性能造成很大影响.为了减少ATPG回溯次数,提出一种基于K近邻(KNN)的数字电路ATPG方法.将机器学习中的KNN算法引入POEDM测试生成算法,KNN结... 基于分支限界搜索的自动测试向量生成(ATPG)是数字电路测试中的关键技术,搜索中的回溯次数对ATPG性能造成很大影响.为了减少ATPG回溯次数,提出一种基于K近邻(KNN)的数字电路ATPG方法.将机器学习中的KNN算法引入POEDM测试生成算法,KNN结合电路结构数据和可测试性度量信息来指导PODEM算法中回退路径的选择,替代传统的启发式策略,以尽快地到达有效决策点,减少回溯次数.在ISCAS85,ISCAS89和ITC99基准电路上进行验证,与传统启发式策略以及一种基于人工神经网络(ANN)的回退路径选择策略相比,所提方法在回溯次数、回退次数、运行时间和故障覆盖率指标方面分别实现了最高1625.0%,466.0%,260.0%和2.2%的改进.同时,相比基于ANN的方法,KNN没有显式的训练过程,在搭建模型阶段能够节省一定的显存资源开销,并且可以使用更少的训练集样本得到有效的预测模型. 展开更多
关键词 数字电路测试 自动测试向量生成 K近邻 分支限界搜索 回溯次数
下载PDF
面向高可靠汽车电子系统的低延时异构多核并行差错检测方法
18
作者 吕浙帆 王天成 李华伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第11期1789-1801,共13页
与业界常用的双核锁步方法相比,异构并行差错检测技术以较小的面积开销实现接近的差错覆盖率,但是会增加差错检测延时并影响主核的性能.针对差错检测不及时带来的潜在安全风险,提出一种低延时的异构并行差错检测方法.首先通过复制寄存... 与业界常用的双核锁步方法相比,异构并行差错检测技术以较小的面积开销实现接近的差错覆盖率,但是会增加差错检测延时并影响主核的性能.针对差错检测不及时带来的潜在安全风险,提出一种低延时的异构并行差错检测方法.首先通过复制寄存器时暂停物理寄存器释放的策略降低复制寄存器对主核性能的影响;然后利用主核控制流指导检查核取指,并基于预测检查核运行时间来划分程序段,以提升差错检测的性能,使得最大差错检测延时可控.使用1个开源香山处理器核作为主核,16个开源Rocket处理器作为检查核进行了方法实现,采用基准程序评估的实验结果表明,所提方法能够以50%的逻辑开销和22%的存储开销实现差错检测,小于双核锁步接近100%的面积开销.同时,在主核上的平均性能开销小于1%,且能将差错检测延迟控制在2000个时钟周期以内.此外,与原有分支预测策略相比,检查核的平均性能提升了14.9%. 展开更多
关键词 差错检测 容错 可靠性 异构处理器 锁步
下载PDF
CNN-Transformer轻量级智能调制识别算法
19
作者 杨静雅 齐彦丽 +3 位作者 周一青 赵登攀 王尚权 石晶林 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期40-49,共10页
现有基于深度学习的调制识别方法,当存在噪声及不确定信道干扰影响时识别率较低,同时由于模型参数量大,难以直接应用到移动终端。针对该问题,提出一种基于卷积神经网络(CNN)和Transformer的轻量级智能调制识别方法。该方法首先利用卷积... 现有基于深度学习的调制识别方法,当存在噪声及不确定信道干扰影响时识别率较低,同时由于模型参数量大,难以直接应用到移动终端。针对该问题,提出一种基于卷积神经网络(CNN)和Transformer的轻量级智能调制识别方法。该方法首先利用卷积神经网络对信号进行局部信息特征提取,然后利用卷积神经网络通道注意力和Transformer时域注意力模块分别从信号的通道和时域两个维度关注最有利于识别的特征,降低信道或噪声等的影响,以提升识别率。所提方法可以适应多种信号表征,如原始IQ信号、幅度相位信号及变换域特征。仿真表明,在RadioML2016.10b数据集上,相较现有基于卷积神经网络的方法,所提方法的平均识别率提升了约8%~12%,相比基于残差神经网络和长短时记忆网络的方法,参数量降低了约90%~92%,计算量降低了约83%~93%。实验结果验证了所提方法增加模型分类精度的同时,有效地降低了模型的参数量和计算量。 展开更多
关键词 调制识别 通道注意力 时域注意力 轻量级网络
下载PDF
ResNet使能的OTFS联合信道估计和信号检测
20
作者 周硕 周一青 +1 位作者 张冲 邢旺 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第3期19-30,共12页
正交时频空调制能够在高多普勒频偏下实现宽带可靠通信,是6G感通算融合场景中的潜在应用技术之一。针对该系统中接收机算法复杂度高、性能受限的问题,提出了一种基于修正残差神经网络的联合信道估计和信号检测方案,在无需获得显式信道... 正交时频空调制能够在高多普勒频偏下实现宽带可靠通信,是6G感通算融合场景中的潜在应用技术之一。针对该系统中接收机算法复杂度高、性能受限的问题,提出了一种基于修正残差神经网络的联合信道估计和信号检测方案,在无需获得显式信道信息的情况下直接恢复传输符号信息。根据时延-多普勒域信道的稳定性,将深度学习技术引入到接收机设计中,采用嵌入式导频的数据帧结构,设计了一种能够充分提取信号特征的轻量级残差神经网络模型,可以直接对时延-多普勒域信号输入输出关系进行拟合,实现隐式的信道估计并完成信号检测。联合设计方案利用实际通信链路中采集的数据进行离线训练,获取最优网络模型用于在线检测,以离线训练时间为代价来减少在线检测的耗时,同时借助误差反向传播机制和梯度下降准则实现信道估计和信号检测的联合优化,有效提升通信性能。仿真结果表明,与传统接收算法对比,所提方案兼具更强的鲁棒性和良好的泛化性,不仅降低了算法的复杂度,同时将误码率性能也提升了2 dB左右。 展开更多
关键词 正交时频空调制 深度学习 信道估计 信号检测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部