期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
RECTANGLE: a bit-slice lightweight block cipher suitable for multiple platforms 被引量:28
1
作者 ZHANG WenTao BAO ZhenZhen +3 位作者 LIN DongDai Vincent RIJMEN YANG Bo Han Ingrid VERBAUWHEDE 《Science China Chemistry》 SCIE EI CAS CSCD 2015年第12期85-99,共15页
In this paper, we propose a new lightweight block cipher named RECTANGLE. The main idea of the design of RECTANGLE is to allow lightweight and fast implementations using bit-slice techniques. RECTANGLE uses an SP-netw... In this paper, we propose a new lightweight block cipher named RECTANGLE. The main idea of the design of RECTANGLE is to allow lightweight and fast implementations using bit-slice techniques. RECTANGLE uses an SP-network. The substitution layer consists of 16 4 × 4 S-boxes in parallel. The permutation layer is composed of 3 rotations. As shown in this paper, RECTANGLE offers great performance in both hardware and software environment, which provides enough flexibility for different application scenario. The following are3 main advantages of RECTANGLE. First, RECTANGLE is extremely hardware-friendly. For the 80-bit key version, a one-cycle-per-round parallel implementation only needs 1600 gates for a throughput of 246 Kbits/s at100 k Hz clock and an energy efficiency of 3.0 p J/bit. Second, RECTANGLE achieves a very competitive software speed among the existing lightweight block ciphers due to its bit-slice style. Using 128-bit SSE instructions,a bit-slice implementation of RECTANGLE reaches an average encryption speed of about 3.9 cycles/byte for messages around 3000 bytes. Last but not least, we propose new design criteria for the RECTANGLE S-box.Due to our careful selection of the S-box and the asymmetric design of the permutation layer, RECTANGLE achieves a very good security-performance tradeoff. Our extensive and deep security analysis shows that the highest number of rounds that we can attack, is 18(out of 25). 展开更多
关键词 lightweight cryptography block cipher design bit-slice hardware efficiency software efficiency
原文传递
面向SIMD指令集的SM4算法比特切片优化
2
作者 王闯 丁滟 +1 位作者 黄辰林 宋连涛 《计算机研究与发展》 EI CSCD 北大核心 2024年第8期2097-2109,共13页
SM4算法是中国自主设计的商用分组密码算法,其加解密计算性能成为影响信息系统数据机密性保障的重要因素之一.现有SM4算法优化主要面向硬件设计和软件查表等方向展开研究,分别存在依赖特定硬件环境、效率低下且易遭受侧信道攻击等问题.... SM4算法是中国自主设计的商用分组密码算法,其加解密计算性能成为影响信息系统数据机密性保障的重要因素之一.现有SM4算法优化主要面向硬件设计和软件查表等方向展开研究,分别存在依赖特定硬件环境、效率低下且易遭受侧信道攻击等问题.比特切片技术通过对输入数据重组实现了并行化高效分组密码处理,可以抵御针对缓存的侧信道攻击.然而现有切片分组密码研究对硬件平台相关性强、处理器架构支持单一,并且并行化处理流水启动较慢,面向小规模数据的加解密操作难以充分发挥单指令多数据(single instruction multiple data,SIMD)等先进指令集的优势.针对上述问题,首先提出了一种跨平台的通用切片分组密码算法模型,支持面向不同的处理器指令字长提供一致化的通用数据切片方法.在此基础上,提出了一种面向SIMD指令集的细粒度切片并行处理SM4优化算法,通过细粒度明文切片重组与线性处理优化有效缩短算法启动时间.实验结果表明,相比通用SM4算法,优化的SM4比特切片算法加密速率最高可达438.0 MBps,加密每字节所需的时钟周期最快高达7.0 CPB(cycle/B),加密性能平均提升80.4%~430.3%. 展开更多
关键词 SM4算法 性能优化 比特切片 侧信道攻击 SIMD指令集
下载PDF
基于寄存器的SM4软件优化实现方法
3
作者 陈晨 郭华 +2 位作者 刘源灏 龚子睿 张宇轩 《密码学报(中英文)》 CSCD 北大核心 2024年第2期427-440,共14页
SM4算法的实现效率是密码算法国产化进程中亟需解决的关键问题,许多学者致力于研究如何提升SM4算法的实现速度.比特切片是目前SM4算法软件实现方法中公认速度较高的一种实现方法,它通过在一次加密运算中并行加密多组明文数据的方式,在... SM4算法的实现效率是密码算法国产化进程中亟需解决的关键问题,许多学者致力于研究如何提升SM4算法的实现速度.比特切片是目前SM4算法软件实现方法中公认速度较高的一种实现方法,它通过在一次加密运算中并行加密多组明文数据的方式,在处理大批量数据时显著提高了SM4算法的实现速度.使用该方法时,每次加密运算前需一次性将多组数据的相同位加载到CPU的寄存器中,由此会带来CPU寄存器与内存之间数据传输的时间开销.为了减小寄存器一次性加载数据的规模,本文对于比特切片方法中的数据编排方式进行了改进,使得每次CPU执行运算时只加载必要的运算数据,从而减少了内存与寄存器之间的交互操作,进一步提高了用比特切片方法实现SM4时的整体加密效率.采用改进后的比特切片方法实现了SM4算法的64组数据并行加解密,该方法的理论加解密速度可达4.1 cycles/byte,经测试在AMD Ryzen75800H平台上加密速率达到了11162Mb/s.该方法对基于比特切片方法设计的对称加密算法软件优化实现方法具有重要参考价值. 展开更多
关键词 SM4算法 比特切片 内存读取 数据编排
下载PDF
一种基于复合域的国密SM4算法快速软件实现方法 被引量:4
4
作者 陈晨 郭华 +2 位作者 王闯 刘源灏 刘建伟 《密码学报》 CSCD 2023年第2期289-305,共17页
成为ISO/IEC国际标准算法后,SM4的性能受到更多关注.目前针对SM4算法实现效率提升的方法主要集中在缩短S盒的运算时间,其中采用复合域实现的方法大都基于AES算法实现的复合域,而在GF((2^(4))^(2))上鲜有针对SM4算法软件实现的复合域被提... 成为ISO/IEC国际标准算法后,SM4的性能受到更多关注.目前针对SM4算法实现效率提升的方法主要集中在缩短S盒的运算时间,其中采用复合域实现的方法大都基于AES算法实现的复合域,而在GF((2^(4))^(2))上鲜有针对SM4算法软件实现的复合域被提出.本文首次在GF((2^(4))^(2))上找到了一个针对SM4算法S盒软件实现的复合域,给出一种基于复合域的SM4算法快速软件实现方法,使用穷举搜索和数学分析优化了算法S盒的复合域数学构造,构建了同构映射矩阵及其最小化目标函数,仅使用175个门函数就完成了S盒运算,平均每个输出比特占用22个门函数.基于比特切片技术,利用扩展指令集AVX2实现了SM4算法256组消息的并行化加密.每字节加解密平均耗时仅6.5个时钟周期.对硬件依赖程度低,经测试在Intel i5、Intel i7和AMD R7环境下均能显著提升SM4算法的计算效率,对有相似S盒结构的密码算法快速软件实现具有重要的参考价值. 展开更多
关键词 SM4算法 S盒 复合域 比特切片 AVX2扩展指令集
下载PDF
基于宽度学习防御对抗攻击的图像分类
5
作者 冼卓滢 陈国明 +1 位作者 罗家梁 梁伟堂 《现代计算机》 2023年第17期49-56,共8页
深度网络分类模型在对抗样本的攻击下存在着对机器学习应用的安全性问题。针对该问题,设计并运用宽度学习来抵御对抗攻击,旨在提高智能系统对对抗样本的分类准确率,从而提升系统的安全性。同时,为了验证上述方法对抵御对抗样本攻击的有... 深度网络分类模型在对抗样本的攻击下存在着对机器学习应用的安全性问题。针对该问题,设计并运用宽度学习来抵御对抗攻击,旨在提高智能系统对对抗样本的分类准确率,从而提升系统的安全性。同时,为了验证上述方法对抵御对抗样本攻击的有效性,首先设计优化宽度学习网络,对标准公共对抗数据集DAmageNet进行验证,实验结果表明,该网络对于对抗样本的验证准确率最高可从57.33%提升到80.67%,提高了23.34个百分点。然后,运用该优化网络对混合了FGSM、C&W、JSMA、Deepfool四种攻击方法的乳腺摄影图数据集(Mammographic Image Analysis Society)进行训练。通过大量的实验证明,宽度网络能够有效提高对抗样本中攻击方法的分类准确率,验证准确率可从55.00%提升至80.75%,较加宽前网络结构提高了25.75个百分点。对抗样本目标图像选取的位平面不同时,宽度网络抵御攻击的能力不同,通过创新性提出切割位平面的可解释方法进行研究,选取其中一种攻击方法(FGSM)进行解释,对宽度学习模型抵御攻击方法的内部机理进行分析。 展开更多
关键词 宽度学习 图像分类 对抗样本 卷积神经网络 位平面分解 可解释性
下载PDF
Challenges to Data-Path Physical Design Inside SOC 被引量:2
6
作者 经彤 洪先龙 +5 位作者 蔡懿慈 许静宇 杨长旗 张轶谦 周强 吴为民 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2002年第8期785-793,共9页
Previously,a single data-path stack was adequate for data-path chips,and the complexity and size of the data-path was comparatively small.As current data-path chips,such as system-on-a-chip (SOC),become more complex,m... Previously,a single data-path stack was adequate for data-path chips,and the complexity and size of the data-path was comparatively small.As current data-path chips,such as system-on-a-chip (SOC),become more complex,multiple data-path stacks are required to implement the entire data-path.As more data-path stacks are integrated into SOC,data-path is becoming a critical part of the whole giga-scale integrated circuits (GSI) design.The traditional physical design methodology can not satisfy the data-path performance requirements,because it can not accommodate the data-path bit-sliced structure and the strict performance (such as timing,coupling,and crosstalk) constraints.Challenges in the data-path physical design are addressed.The fundamental problems and key technologies in data-path physical design are analysed.The corresponding researches and solutions in this research field are also discussed. 展开更多
关键词 physical design data-path bit-sliced structure SYSTEM-ON-A-CHIP giga-scale integrated circuits very-deep-submicron
下载PDF
轻量级分组密码算法FBC 被引量:10
7
作者 冯秀涛 曾祥勇 +4 位作者 张凡 曾光 唐灯 甘国华 王永兴 《密码学报》 CSCD 2019年第6期768-785,共18页
FBC是一族轻量级分组密码算法,主要包含FBC128-128,FBC128-256和FBC256-256三个版本,可支持128和256两种比特长度的明文分组以及128和256两种比特长度的密钥.FBC算法采用4路两重Feistel结构设计,在结构上通过增加两个异或操作的微小代... FBC是一族轻量级分组密码算法,主要包含FBC128-128,FBC128-256和FBC256-256三个版本,可支持128和256两种比特长度的明文分组以及128和256两种比特长度的密钥.FBC算法采用4路两重Feistel结构设计,在结构上通过增加两个异或操作的微小代价较大提高整体结构的扩散特性.非线性函数F采用切片技术,其中,S盒基于NFSR构造,其各项密码学性质达到最优,同时硬件实现代价达到最小,为最轻的S盒之一;线性变换L仅由循环移位和异或构成,具有较好的密码学特性的同时兼顾好的软硬件实现效能.在安全性方面,我们基于混合整数线性规划(MILP)寻找最少活跃S盒个数的方法对其进行差分、线性、不可能差分以及积分等方法的分析.实验结果表明,FBC可以抵抗上述各种攻击方法的攻击.FBC算法不仅具有结构简洁,轻量化,安全性高等特性,还具有灵活高效的软硬件实现方式,可以满足不同平台的应用需求. 展开更多
关键词 轻量级分组密码 FEISTEL结构 FBC算法 混合整数线性规划 比特切片
下载PDF
SoC测试中低成本、低功耗的芯核包装方法 被引量:4
8
作者 王伟 韩银和 +2 位作者 胡瑜 李晓维 张佑生 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第9期1397-1402,共6页
提出一种SoC测试中新颖的并行芯核包装方法(parallel core wrapper design,pCWD),该包装方法利用扫描切片重叠这一特点,通过缩短包装扫描链长度来减少测试功耗和测试时间.为了进一步减少测试时间,还提出了一种测试向量扫描切片划分和赋... 提出一种SoC测试中新颖的并行芯核包装方法(parallel core wrapper design,pCWD),该包装方法利用扫描切片重叠这一特点,通过缩短包装扫描链长度来减少测试功耗和测试时间.为了进一步减少测试时间,还提出了一种测试向量扫描切片划分和赋值算法.实验结果表明,针对ITC 2002基准SoC集中d695芯片,应用并行包装方法和测试向量切片划分及赋值算法,能够减少50%的测试时间及95%的测试功耗. 展开更多
关键词 SOC测试 芯核包装电路 不确定位 扫描切片
下载PDF
普及型教学计算机系统的设计与实现 被引量:3
9
作者 王诚 刘卫东 +1 位作者 周继群 王鑫 《计算机工程与应用》 CSCD 北大核心 1999年第3期46-49,共4页
文章介绍了对计算机硬件系列的课程教学和实验研制的一种全新的实验计算机系统。该计算机8位字长,硬件(包括CPU)子系统和软件(包括指令系统)子系统完全自行设计,配置合理,设计新颖,实验性能强。运算器部件选用位片结构器件... 文章介绍了对计算机硬件系列的课程教学和实验研制的一种全新的实验计算机系统。该计算机8位字长,硬件(包括CPU)子系统和软件(包括指令系统)子系统完全自行设计,配置合理,设计新颖,实验性能强。运算器部件选用位片结构器件实现,控制器部分采用微程序或组合逻辑方案实现,在监控程序支持下,能接入多种外设,在不同方式下完成输入/输出操作。有比较高的性能/价格比,使用效果令人满意。 展开更多
关键词 计算机 教学实验 位片结构 微程序控制器
下载PDF
TANGRAM:一个基于比特切片的适合多平台的分组密码 被引量:6
10
作者 张文涛 季福磊 +5 位作者 丁天佑 杨博翰 赵雪锋 向泽军 包珍珍 刘雷波 《密码学报》 CSCD 2019年第6期727-747,共21页
本文提出一族新的分组密码算法TANGRAM.TANGRAM包含三个版本:TANGRAM128/128,分组长度和密钥长度均为128比特;TANGRAM 128/256,分组长度为128比特,密钥长度为256比特;TANGRAM 256/256,分组长度和密钥长度均为256比特.TANGRAM分组密码采... 本文提出一族新的分组密码算法TANGRAM.TANGRAM包含三个版本:TANGRAM128/128,分组长度和密钥长度均为128比特;TANGRAM 128/256,分组长度为128比特,密钥长度为256比特;TANGRAM 256/256,分组长度和密钥长度均为256比特.TANGRAM分组密码采用SP网络,我们对其S盒的选取以及线性层移位参数的选取进行了深入研究,以使TANGRAM尽可能达到最优的安全性和实现性能的性价比.我们深入分析了TANGRAM针对差分、线性、不可能差分、积分、相关密钥等重要密码分析方法的安全性,为它预留了足够的安全冗余.得益于比特切片方法,TANGRAM在多种软件和硬件平台上都具有很好的表现,可以灵活地适用于多种应用场景. 展开更多
关键词 分组密码 比特切片方法 安全性分析 软件实现 硬件实现 侧信道防护
下载PDF
锁相伺服技术及其在CNC机床中的应用 被引量:4
11
作者 肖本贤 《微电机》 北大核心 1999年第3期21-23,共3页
基于锁相环原理和基准脉冲技术,应用锁相伺服同步系统,实现了直接式位置跟踪控制,它把机床的齿轮传动链变成电子传动链,大大提高了系统的跟踪控制性能和柔性。
关键词 数控机床 锁相伺服 单片机 跟踪控制
下载PDF
基于弱小红外目标的图像增强研究 被引量:1
12
作者 花兴艳 葛耀林 《电子设计工程》 2016年第24期148-150,共3页
海天背景下远距离拍摄的红外图像目标模糊、灰度不均匀而且噪声复杂,严重影响图像中目标识别与判读。文中提出了一种基于自适应直方图均衡化、比特平面重建以及对比度拉伸相结合的红外目标细节增强方法。实验结果证明,文中方法增强后的... 海天背景下远距离拍摄的红外图像目标模糊、灰度不均匀而且噪声复杂,严重影响图像中目标识别与判读。文中提出了一种基于自适应直方图均衡化、比特平面重建以及对比度拉伸相结合的红外目标细节增强方法。实验结果证明,文中方法增强后的图像,目标与背景对比度增强,能够完整检测出复杂海天背景下的弱小目标。与传统方法相比,该方法更有利于海面目标红外图像的识别与判读。 展开更多
关键词 比特平面分层 自适应直方图均衡 对比度拉伸 红外图像
下载PDF
基于比特平面分层和彩虹伪彩色编码的红外图像增强方法 被引量:1
13
作者 花兴艳 葛耀林 《红外》 CAS 2016年第5期33-37,共5页
由经纬仪拍摄的海空远距离红外目标图像具有对比度低、灰度不均匀以及含有大量复杂噪声等缺点,这会严重影响对图像中目标的判读。为此,提出了一种基于比特平面分层和自适应彩虹码伪彩变换的图像增强方法。结果表明,经该方法增强处理后... 由经纬仪拍摄的海空远距离红外目标图像具有对比度低、灰度不均匀以及含有大量复杂噪声等缺点,这会严重影响对图像中目标的判读。为此,提出了一种基于比特平面分层和自适应彩虹码伪彩变换的图像增强方法。结果表明,经该方法增强处理后的伪彩色图像的颜色饱和度更高,细节和边缘更清晰,尤其是由目标边缘可以清晰辨别出不同的颜色层次,因而更符合人眼的视觉习惯。 展开更多
关键词 比特平面分层 彩虹码 伪彩色 自动阈值 红外图像增强
下载PDF
教学计算机系统的设计与实现
14
作者 王诚 蔡月茹 刘卫东 《计算机研究与发展》 EI CSCD 北大核心 1997年第6期472-476,共5页
为计算机硬件系列的课程教学和实验研制了一种全新的实验计算机系统.该计算机16位字长,硬件(包括CPU)子系统和软件(包括指令系统)子系统完全自行设计,配置合理,设计新颖,实验性能强.运算器部件选用位片结构器件实现,控... 为计算机硬件系列的课程教学和实验研制了一种全新的实验计算机系统.该计算机16位字长,硬件(包括CPU)子系统和软件(包括指令系统)子系统完全自行设计,配置合理,设计新颖,实验性能强.运算器部件选用位片结构器件实现,控制部件采用微程序方案,支持动态微程序设计.在监控程序支持下,能接入多种外设,在不同入出方式下完成输入/输出操作. 展开更多
关键词 教学实验 位片结构 教学计算机系统
下载PDF
针对扫描阻塞结构的测试数据压缩方案
15
作者 蔡烁 杨致远 +1 位作者 刘铁桥 王伟征 《计算机应用研究》 CSCD 北大核心 2012年第4期1378-1380,共3页
分析了集成电路测试面临的测试数据量大、测试应用时间长等问题,对常用的测试压缩方法进行了介绍,并在扫描阻塞测试结构基础上,提出了对数据进行部分编码压缩的方案。在附加硬件开销很小的情况下,进一步压缩了测试数据。理论分析和实验... 分析了集成电路测试面临的测试数据量大、测试应用时间长等问题,对常用的测试压缩方法进行了介绍,并在扫描阻塞测试结构基础上,提出了对数据进行部分编码压缩的方案。在附加硬件开销很小的情况下,进一步压缩了测试数据。理论分析和实验结果都表明了本压缩方案的可行性和有效性。 展开更多
关键词 扫描阻塞结构 确定位 测试片段 泊松分布 编码压缩
下载PDF
一种新的MPEG-2VBR视频场景切换判别法
16
作者 潘健 施建良 +1 位作者 谭径薇 余松煜 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第5期509-512,共4页
提出了一种新的MPEG-2VBR视频场景切换判别法.此判别法表明,相邻编码帧宏块条码率的频域互相关能够有效反映图像活动性变化的特点.以此作为判决准则,将频域互相关的结果与自适应门限进行比较,可以准确地判断出运动图像场... 提出了一种新的MPEG-2VBR视频场景切换判别法.此判别法表明,相邻编码帧宏块条码率的频域互相关能够有效反映图像活动性变化的特点.以此作为判决准则,将频域互相关的结果与自适应门限进行比较,可以准确地判断出运动图像场景发生切换的位置及其帧类型,具有实现简单,计算量少的优点,可以满足实时应用. 展开更多
关键词 MPEG-2 VBR视频 场景切换判别法 视频编码
下载PDF
基于宏块条互相关的MPEG-2 VBR视频统计复用 被引量:4
17
作者 潘健 施建良 余松煜 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第4期394-397,共4页
针对MPEG-2编码VBR视频业务,提出了一种简便的统计复用方法.该方法对不同业务中宏块条码率样本进行互相关,根据互相关函数局部极小值所对应的码率样本偏移量,将不同业务的宏块条起始位置相对平移,并实现业务累加.从信元... 针对MPEG-2编码VBR视频业务,提出了一种简便的统计复用方法.该方法对不同业务中宏块条码率样本进行互相关,根据互相关函数局部极小值所对应的码率样本偏移量,将不同业务的宏块条起始位置相对平移,并实现业务累加.从信元丢失率的角度与帧平移法统计复用进行了对比,结果表明,本方法的信元丢失率明显减小,并且随复用业务数量的增加。 展开更多
关键词 MPEG-2 宏块条 VBR视频业务 统计复用 图像处理
下载PDF
MGS片层重要性分析及其应用
18
作者 陈旭 柳伟 《计算机应用研究》 CSCD 北大核心 2011年第1期381-384,共4页
基于中粒度质量可伸缩(medium grain scalable,MGS)编码在可伸缩编码(scalable video coding,SVC)应用中的广泛性,在分析了MGS编码结构特点和问题的基础上,利用DCT系数分布特性提出MGS片层数据重要性的估计方法实现对MGS编码各片层重要... 基于中粒度质量可伸缩(medium grain scalable,MGS)编码在可伸缩编码(scalable video coding,SVC)应用中的广泛性,在分析了MGS编码结构特点和问题的基础上,利用DCT系数分布特性提出MGS片层数据重要性的估计方法实现对MGS编码各片层重要性的估计。在此重要性估计方法的前提基础上,将之应用于指导可伸缩编码中的码流提取和容错编码。实验测试结果表明,MGS片层数据重要性估计方法的准确性和应用有效性,保障了视频码流质量,提高了码流提取效率。 展开更多
关键词 视频编码 中粒度质量可伸缩 片层 码流提取 容错编码
下载PDF
基于ρ域源模型的H.264宏块行层码率控制算法
19
作者 徐平 朱善安 《中国图象图形学报》 CSCD 北大核心 2006年第12期1806-1812,共7页
在H.264中,对于一个宏块行,ρ与比特率仍然满足线性关系。基于此,提出了基于ρ域源模型的H.264宏块行层码率控制算法。在宏块行间,根据第一次RDO时各个宏块行所耗用比特数的百分比来分配比特数。实验结果表明,与JM8.4中采用的码率控制... 在H.264中,对于一个宏块行,ρ与比特率仍然满足线性关系。基于此,提出了基于ρ域源模型的H.264宏块行层码率控制算法。在宏块行间,根据第一次RDO时各个宏块行所耗用比特数的百分比来分配比特数。实验结果表明,与JM8.4中采用的码率控制算法相比,本文提出的宏块行层码率控制算法在保证基本相同的编码效率情况下,能显著降低比特数估计偏差,更好地跟踪目标码率。 展开更多
关键词 H.264 ρ域源模型 码率控制 宏块行 比特分配
下载PDF
SM4算法快速软件实现 被引量:22
20
作者 张笑从 郭华 +2 位作者 张习勇 王闯 刘建伟 《密码学报》 CSCD 2020年第6期799-811,共13页
SM4是对称分组密码国家标准.加解密计算效率是衡量算法实现性能的重要指标,而目前关于SM4软件实现方法方面的研究不多.利用比特切片技术,结合支持单指令多数据(SIMD)的AVX2指令集,本文提出了一种SM4算法的快速软件优化实现方法,使用256... SM4是对称分组密码国家标准.加解密计算效率是衡量算法实现性能的重要指标,而目前关于SM4软件实现方法方面的研究不多.利用比特切片技术,结合支持单指令多数据(SIMD)的AVX2指令集,本文提出了一种SM4算法的快速软件优化实现方法,使用256位的YMM寄存器实现了SM4算法的256分组数据并行加解密.首先基于已有的选择函数构造了新的选择函数,之后改进了搜索算法,基于新的选择函数和改进的搜索算法化简了S盒的逻辑表达式,将实现逻辑表达式所需的逻辑门电路数量由3000(最简与或式)降至497.在Intel Core i7-7700HQ(Kabylake)@2.80 GHz处理器上,实现速度达到了2580 Mbps,同公开文献中的最好结果1795 Mbps(Intel Core i7-5500U(Broadwell-U)@2.40 GHz)相比,实现效率提高了43%.基于比特切片技术的软件实现优化方法无需内存或高速缓存查表,因此该方法可抵抗缓存-计时侧信道攻击,从而安全性得到了提升.本文提出的优化方法具有可扩展性,不仅适用于在X86平台上借助拓展指令集AVX2实现,还可利用RISC指令集在资源受限,安全性要求高的ARM等嵌入式平台上实现.此外,新的选择函数和搜索算法具有通用性,可用于其它一般逻辑函数的化简. 展开更多
关键词 SM4算法 软件优化实现 比特切片 SIMD技术
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部