期刊文献+
共找到1,765篇文章
< 1 2 89 >
每页显示 20 50 100
面向RISC-V的基础数学库实现
1
作者 李飞 郭绍忠 +3 位作者 郝江伟 侯明 宋广辉 许瑾晨 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1633-1647,共15页
RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数... RISC-V指令集架构(Instruction Set Architecture,ISA)作为一种新兴的精简ISA,因免费、开源、自由等特点而得到快速发展.由于国内外对RISC-V的研究主要集中在硬件开发,软件生态相较于成熟ISA还很薄弱,实现一套RISC-V指令集高性能基础数学库可以进一步丰富RISC-V软件生态.本文基于自动化移植技术实现申威数学库到RISC-V的移植,为RISC-V指令架构提供首个使用向量指令优化的基础数学库系统.本文提出向量寄存器自动分支查表法与路径标记插入法,重点解决不同架构间寄存器映射过程中的寄存器复用问题,实现寄存器正确高效映射,并依据不同指令等价转换策略自动化移植数学函数69个.测试结果表明,RISC-V基础数学库函数可实现正确计算,最大误差为1.90ULP,函数性能平均为157.03节拍. 展开更多
关键词 RISC-V 申威 汇编 向量 数学库 自动化移植
下载PDF
RSA算法中大素数快速生成和运算方法实现
2
作者 杜俊 《中阿科技论坛(中英文)》 2024年第9期108-112,共5页
RSA算法是目前应用最为广泛的公钥密码算法,其安全性是以大质数因子的分解不存在经典的多项式算法为基础,对极大整数进行因数分解的难度决定了RSA算法的可靠性。密钥的生成需要依赖于大素数,而大数的产生由于其复杂性和计算成本较高,成... RSA算法是目前应用最为广泛的公钥密码算法,其安全性是以大质数因子的分解不存在经典的多项式算法为基础,对极大整数进行因数分解的难度决定了RSA算法的可靠性。密钥的生成需要依赖于大素数,而大数的产生由于其复杂性和计算成本较高,成为影响RSA算法效率的重要因素。文章提出并实现了一种快速产生大数的方法,使用随机数生成器生成指定范围内的随机数,并利用素性测试算法对生成的随机数进行素性验证;针对不符合条件的数值进行调整和重新生成,直至得到符合要求的大素数。测试验证结果表明,文章提出的快速生成大数方法能显著提高大素数生成的效率,大幅缩短大素数的生成时间,有效保证生成数的素性和安全性。 展开更多
关键词 网络安全 RSA 大素数 素性测试 快速生成
下载PDF
基于人工智能的船舶故障检测结果智能推荐系统 被引量:1
3
作者 涂芳 周华涛 《舰船科学技术》 北大核心 2024年第11期173-176,共4页
为全面整合船舶故障相关的各种知识,为检修人员智能推荐便于理解的故障检测结果,设计基于人工智能的船舶故障检测结果智能推荐系统。知识图谱模块依据船舶故障维修日志建立船舶故障知识图谱;实体抽取模块利用人工智能的长短时记忆网络,... 为全面整合船舶故障相关的各种知识,为检修人员智能推荐便于理解的故障检测结果,设计基于人工智能的船舶故障检测结果智能推荐系统。知识图谱模块依据船舶故障维修日志建立船舶故障知识图谱;实体抽取模块利用人工智能的长短时记忆网络,在船舶故障描述文本内抽取故障实体;实体识别匹配模块,利用基于实体识别的文本匹配技术,计算抽取的故障实体与知识图谱内故障实体间的匹配得分,以最高匹配得分对应的故障实体为船舶故障检测智能推荐结果。实验证明,该系统可有效构建检查故障知识图谱;该系统可有效抽取船舶故障实体,完成船舶故障检测结果智能推荐。 展开更多
关键词 人工智能 船舶故障 智能推荐 文本相似度 实体识别
下载PDF
映射字典导向的64位ARM到RISC-V汇编翻译
4
作者 贾金成 朱家鑫 +2 位作者 唐震 王志鹏 王伟 《小型微型计算机系统》 CSCD 北大核心 2024年第8期2041-2048,共8页
RISC-V是一个新兴开放的精简指令集架构,采用模块化设计,具有精简、可靠且支持多平台的优点.RISC-V指令集架构的推广需要其软件生态的支撑,但目前RISC-V的软件生态还不够丰富,亟需建设,软件生态建设过程中需要将其他架构的软件向RISC-V... RISC-V是一个新兴开放的精简指令集架构,采用模块化设计,具有精简、可靠且支持多平台的优点.RISC-V指令集架构的推广需要其软件生态的支撑,但目前RISC-V的软件生态还不够丰富,亟需建设,软件生态建设过程中需要将其他架构的软件向RISC-V架构迁移适配,现有的ARM到RISC-V汇编迁移辅助工具还不够成熟,存在寄存器使用错误、程序分支控制错误等诸多问题.因此,本文设计和实现了一个64位ARM到RISC-V的汇编翻译工具,通过设计指令映射字典将指令映射关系与工具的其他模块松耦合,实现了工具的高拓展性;根据两种架构的应用二进制接口差异设计了寄存器映射字典,充分利用了RISC-V的寄存器与内存资源.与现有工具相比,本工具更易拓展,并且支持更多指令类型. 展开更多
关键词 RISC-V ARM 汇编语言 软件移植
下载PDF
Crystal-Kyber算法的FPGA高效并行优化
5
作者 吕顺森 李斌 +2 位作者 翟嘉琪 李松岐 周清雷 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1679-1689,共11页
多项式乘法运算制约着基于格的后量子密码在现实中的应用.为提高后量子密码Crystal_Kyber算法的性能效率,减少运行时间,降低多项式乘法的影响,本文设计了一种新的蝶形运算单元对素模q=3329的Kyber方案进行优化.首先,采用16路并行调度新... 多项式乘法运算制约着基于格的后量子密码在现实中的应用.为提高后量子密码Crystal_Kyber算法的性能效率,减少运行时间,降低多项式乘法的影响,本文设计了一种新的蝶形运算单元对素模q=3329的Kyber方案进行优化.首先,采用16路并行调度新型蝶形运算单元的方式执行算法,缩短了计算周期;其次,使用流水线技术以及改进的K2RED算法,设计实现新型蝶形运算单元,用于降低资源消耗;最后,利用多RAM的方式存储数据,并且多通道优化RAM,允许数据交替存储在RAM中,提高资源复用率.实验结果表明,本文优化后的数论变换(Number Theoretic Transform,NTT)、逆数论变换(Inverse NTT,INTT)、点对位相乘(Point-Wise Multiplication,PWM)的效率达到200 MHz,合并执行Kyber效率达到175 MHz,优于其他方案,具有良好的性能. 展开更多
关键词 后量子密码 Crystal-Kyber K2RED 蝶形运算 多项式乘法 硬件效率
下载PDF
AI环境下第三方支付虚拟账户安全检测与保护技术研究
6
作者 刘欢 肖蔚 《现代电子技术》 北大核心 2024年第17期105-108,共4页
为了探索AI环境下第三方支付虚拟账户的安全检测与保护技术,提升整个支付系统的安全性与有效性,文中应用动态输入复合加密技术、第三方认证技术、复合加密技术、自定义编码转换表等进行支付复合加密技术的设计。仿真实验证明,所设计技术... 为了探索AI环境下第三方支付虚拟账户的安全检测与保护技术,提升整个支付系统的安全性与有效性,文中应用动态输入复合加密技术、第三方认证技术、复合加密技术、自定义编码转换表等进行支付复合加密技术的设计。仿真实验证明,所设计技术在AI环境中实现了动态输入复合加密技术、第三方认证技术以及复合加密支付流程,并在实际应用中具备抵御安全威胁的能力。针对AI环境下第三方支付虚拟账户的安全问题,该技术成功改进了支付流程设计,提高了支付流程的安全性和有效性,对提升第三方支付系统的整体安全水平提供了重要的理论支持与实践指导。 展开更多
关键词 AI环境 虚拟账户 安全检测 保护技术 第三方支付 复合加密
下载PDF
基于密度峰值的进化数据流聚类算法
7
作者 翁佳桥 吕莉 +1 位作者 樊棠怀 康平 《计算机仿真》 2024年第6期448-454,共7页
针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助... 针对现有数据流聚类算法聚类精度低、不能检测数据流簇进化等问题,提出一种基于密度峰值的进化数据流聚类(DPStream)算法。DPStream采用在线微聚类与离线宏聚类两阶段处理框架,引入密度衰减反映数据流近期演化信息;在线微聚类阶段借助核心微簇与潜在微簇反映簇的生成、进化和衰退,通过生成和维护机制对微簇进行增量维护;当用户聚类请求到来时,使用密度峰值聚类算法进行离线宏聚类,找出核心微簇的簇中心,将剩余核心微簇分配给相应的簇中心所在簇,得到最终的聚类结果。DPStream算法能在数据流的任意时间给出聚类结果,聚类数据流的聚类纯度在小窗口时保持在95%以上,能高质量、高响应的完成数据流聚类。 展开更多
关键词 密度峰值聚类 数据流 两阶段框架 微簇 簇进化 密度衰减
下载PDF
基于用户系统调用序列的二进制代码识别
8
作者 黄海翔 彭双和 钟子煜 《计算机应用》 CSCD 北大核心 2024年第7期2160-2167,共8页
针对编译优化、跨编译器、混淆等带来的二进制代码相似性识别准确率低的问题,提出并实现了一种基于用户系统调用序列的识别方案UstraceDiff。首先,基于Intel Pin框架设计了一个动态分析插桩工具,动态提取二进制代码的用户系统调用序列... 针对编译优化、跨编译器、混淆等带来的二进制代码相似性识别准确率低的问题,提出并实现了一种基于用户系统调用序列的识别方案UstraceDiff。首先,基于Intel Pin框架设计了一个动态分析插桩工具,动态提取二进制代码的用户系统调用序列及参数;其次,通过序列对齐获得被分析的2个二进制代码的系统调用序列的公有序列,并设计了一个有效参数表用于筛选出有效系统调用参数;最后,为评估二进制代码的相似性,提出一种算法利用公有序列及有效参数,计算它们的同源度。使用Coreutils数据集在4种不同的编译条件下对UstraceDiff进行了评估。实验结果表明,相较于Bindiff和DeepBinDiff,UstraceDiff对于同源程序识别的平均准确率分别提高了35.1个百分点和55.4个百分点,对于非同源程序的区分效果也更好。 展开更多
关键词 代码识别 动态分析 系统调用 程序溯源 二进制相似性分析
下载PDF
面向大型数据集的高效决策树参数剪枝算法 被引量:3
9
作者 谢兆贤 邹兴敏 张文静 《计算机工程》 CSCD 北大核心 2024年第1期156-165,共10页
决策树在数据分类上具有较好的效果,但容易产生过拟合的现象,解决方案是对决策树进行剪枝处理,然而传统剪枝算法普遍存在预剪枝容易欠拟合、后剪枝时间消耗多、网络搜索剪枝仅适用于小型数据集等问题。为了解决以上问题,提出一种高效的... 决策树在数据分类上具有较好的效果,但容易产生过拟合的现象,解决方案是对决策树进行剪枝处理,然而传统剪枝算法普遍存在预剪枝容易欠拟合、后剪枝时间消耗多、网络搜索剪枝仅适用于小型数据集等问题。为了解决以上问题,提出一种高效的决策树参数剪枝算法。根据网络安全态势感知模型,建立剪枝决策树态势感知系统架构,分析网络数据流。在生成决策树的过程中,利用枚举与二分搜索算法找出决策树最大深度,采用深度优先搜索算法找到节点最小分裂数和最大特征数,最终结合这3个最优参数自上而下完成剪枝。实验结果表明,所提算法在大型数据集上的过拟合风险较小,训练集与测试集准确率都在95%以上,同时相比于后剪枝算法中表现较好的悲观错误剪枝算法快了近20倍。 展开更多
关键词 决策树 剪枝 过拟合 安全态势感知 泛化性
下载PDF
一种面向嵌入式设备的动态插桩方法
10
作者 司健鹏 洪征 +2 位作者 周振吉 陈乾 李涛 《计算机科学》 CSCD 北大核心 2024年第11期347-355,共9页
现有动态插桩方法大多基于x86/x64指令集,对嵌入式设备常用的RISC兼容性较差,且在应用嵌入式设备时存在插桩效率低、资源消耗大等问题。文中提出了一种面向嵌入式设备的动态插桩方法DIEB(Dynamic Instrumentation Method for Embedded P... 现有动态插桩方法大多基于x86/x64指令集,对嵌入式设备常用的RISC兼容性较差,且在应用嵌入式设备时存在插桩效率低、资源消耗大等问题。文中提出了一种面向嵌入式设备的动态插桩方法DIEB(Dynamic Instrumentation Method for Embedded Physical Devices)。DIEB在嵌入式设备中使用以控制转移指令为探针的探测模式对目标进程进行动态二进制插桩。DIEB提出了一种轻量化的解释执行指令方法,根据指令的运行环境设置指令解释执行区域,并在解释执行区域中解释执行指令获取执行结果。在目标进程动态运行过程中,DIEB通过解释执行用作探针的控制转移指令,获取控制转移指令的目的地址,从而跟踪目标进程的执行流,在软硬件资源紧张的嵌入式设备上高效地进行动态插桩。ARM指令集是一种典型的RISC指令集,测试实验以ARM指令集为验证对象,在NetGear R7000等设备上进行。实验结果表明,经过DIEB插桩的进程可以正常运行,插桩导致的时延远小于基于ptrace的插桩方式,解决了PIN,Dynamorio等现有动态插桩框架难以在嵌入式设备上运行的问题。此外,DIEB具有在多线程环境下稳定运行的能力,可以准确记录并发线程的执行流轨迹。 展开更多
关键词 动态二进制插桩 指令解释执行 嵌入式设备 灰盒测试 程序运行状态反馈
下载PDF
以Barendregt的变量约定形式化编程语言研究
11
作者 阿力木江·亚森 艾合买提·阿不来提 +2 位作者 沙尔旦尔·帕尔哈提 阿布都克力木·阿布力孜 哈里旦木·阿布都克里木 《计算机工程与科学》 CSCD 北大核心 2024年第10期1807-1814,共8页
编程语言、类型系统和逻辑系统中常见的命名绑定,在实践中实现存在困难。在理论中以抽象思考发现并避免即将发生的变量捕获。在实践中变量捕获的检测需要定义笨拙的辅助操作,使形式化和证明变得复杂。现有几种命名绑定技术旨在表达式具... 编程语言、类型系统和逻辑系统中常见的命名绑定,在实践中实现存在困难。在理论中以抽象思考发现并避免即将发生的变量捕获。在实践中变量捕获的检测需要定义笨拙的辅助操作,使形式化和证明变得复杂。现有几种命名绑定技术旨在表达式具有良好的可读性,无变量捕获的代换操作和直观的证明。然而,这些技术的形式化与理论之间存在差别,两者的表达式和证明过程可能有很大的不同。提出一种命名绑定技术,其中在代换操作和推理规则中引入的表达式刷新函数使形式化遵守Barendregt的变量约定,形式系统的形式化与其理论几乎相同。以无类型λ-演算和具有简单数据类型的λ-演算的形式化展示了该技术的优点。 展开更多
关键词 变量命名 命名绑定 形式系统 Barendregt的变量约定 编程语言理论
下载PDF
数字孪生视角下流程制造业设计模式探讨——以波兰MAL01项目数字化交付为例
12
作者 周晓刚 方旭彬 卢小同 《中国水泥》 CAS 2024年第7期72-75,共4页
水泥工业作为典型的流程制造业,正不断深化应用数字孪生技术,推动数字化转型。构建数字化基础信息模型,合理选择基于数字化技术的设计模式,对提高设计质量和推进设计进度具有关键作用。通过分析数字化设计特点与水泥工程各类影响因素,... 水泥工业作为典型的流程制造业,正不断深化应用数字孪生技术,推动数字化转型。构建数字化基础信息模型,合理选择基于数字化技术的设计模式,对提高设计质量和推进设计进度具有关键作用。通过分析数字化设计特点与水泥工程各类影响因素,得出适合不同场景的设计模式,并针对复杂子项及特定场景总结出两种设计模式。以波兰MAL01项目为例,探索不同设计模式在水泥工程设计中的应用情况,为水泥工程数字化转型提供一定参考。 展开更多
关键词 数字孪生 流程制造 水泥工程设计 设计模式
下载PDF
探究Intel CPU用户中断机制
13
作者 彭茜珍 章福枝 《湖北科技学院学报》 2024年第6期135-139,共5页
中断是现代处理器中极为重要的硬件机制,但它在设计和运用中几乎都是跨越特权级界限并通过内核进行事件处理,然而对于特权级较低的用户空间中的代码在处理与其关联事件时的迟延会很高并且效率通常很低。2023年,Intel公司推出了新的用户... 中断是现代处理器中极为重要的硬件机制,但它在设计和运用中几乎都是跨越特权级界限并通过内核进行事件处理,然而对于特权级较低的用户空间中的代码在处理与其关联事件时的迟延会很高并且效率通常很低。2023年,Intel公司推出了新的用户中断机制,能够绕过内核直接处理用户关联的事件,以获得更低的迟延和更高的效率。本文介绍了Intel CPU用户中断的原理和特性,分析了用户中断的关键核心机制以及未来应用需求,为发挥处理器能力提供一个新思路。 展开更多
关键词 CPU 中断 用户中断
下载PDF
元宇宙虚拟空间中AI数字货币的高效率路由交易算法研究
14
作者 赵长明 薛莹 《现代电子技术》 北大核心 2024年第18期121-126,共6页
基于元宇宙虚拟空间,对AI数字货币的高效率路由交易算法进行了研究。在选择路由算法路径阶段引入惩罚点数,在每个支付通道不同方向分别进行一个惩罚点数的维护,并结合交易的失败或成功,对惩罚点数进行动态调整。在获得多条AI数字货币交... 基于元宇宙虚拟空间,对AI数字货币的高效率路由交易算法进行了研究。在选择路由算法路径阶段引入惩罚点数,在每个支付通道不同方向分别进行一个惩罚点数的维护,并结合交易的失败或成功,对惩罚点数进行动态调整。在获得多条AI数字货币交易路径后,使用概率对每条支付通道的支付能力进行刻画,通过最小化AI数字货币交易前后交易路径的支付通道的成功概率损失和,将交易AI数字货币分配在不同路径上。选取闪电网络拓扑信息构建仿真实验。实验结果表明,所提出的Compass路由算法在AI数字货币交易成功率、交易延迟方面均优于其他对比算法。 展开更多
关键词 元宇宙 虚拟空间 AI数字货币 路由交易算法 支付通道 资源分配
下载PDF
基于深度学习的计算机软件安全性能检测方法 被引量:2
15
作者 周香 《信息与电脑》 2023年第1期17-19,共3页
由于计算机软件的大范围开发及开发者编写的代码逐渐简单化,导致软件存在漏洞,影响其安全性能,故提出基于深度学习的计算机软件安全性能检测方法。提取计算机软件代码数据,预处理代码数据作为模型输入参数,基于深度学习构建一个软件安... 由于计算机软件的大范围开发及开发者编写的代码逐渐简单化,导致软件存在漏洞,影响其安全性能,故提出基于深度学习的计算机软件安全性能检测方法。提取计算机软件代码数据,预处理代码数据作为模型输入参数,基于深度学习构建一个软件安全漏洞检测模型。实验结果表明,该方法的检测漏报率为0.04%、误报率为2.71%、检测时间为254 s,具有良好的软件安全漏洞检测能力。 展开更多
关键词 深度学习 计算机软件 安全性能 检测方法
下载PDF
EB软件在水泥工程数字化设计中的应用
16
作者 王振强 丁杰 《水泥》 CAS 2024年第1期71-74,共4页
在数字经济发展日新月异的时代,国家“十四五”规划和2035年远景目标强调,以科技创新和数字化变革催生新的发展动能,加强数字基础设施建设和数据安全合作,实现企业高质量发展。在此背景下,水泥工程设计的数字化转型变得尤为重要。本文... 在数字经济发展日新月异的时代,国家“十四五”规划和2035年远景目标强调,以科技创新和数字化变革催生新的发展动能,加强数字基础设施建设和数据安全合作,实现企业高质量发展。在此背景下,水泥工程设计的数字化转型变得尤为重要。本文介绍了利用EB(Engineering Base)软件进行工程设计的优势及应用实例。EB是最新一代以对象为导向并以中央数据库为核心的集成式工程设计协同平台,能有效提高设计标准化、设计效率及设计质量,其唯一数据源的特性使其能够快速提供整套设计数据用于工厂运维及智能生产,助力设计单位数字化交付。 展开更多
关键词 Engineering Base软件 水泥工程 数字化设计
原文传递
浅谈数学算法在计算机编程优化中的作用
17
作者 杨谦 《数字通信世界》 2024年第1期93-95,共3页
近年来,随着计算机软件研发的不断深入,编程技术也得到了完善与优化。计算机编程的本质是利用特定编程语言来描述和解决具体问题,而计算机程序在很多方面依赖于数学理论和数学方法,数学不仅为计算机编程提供了理论基础,也为计算机编程... 近年来,随着计算机软件研发的不断深入,编程技术也得到了完善与优化。计算机编程的本质是利用特定编程语言来描述和解决具体问题,而计算机程序在很多方面依赖于数学理论和数学方法,数学不仅为计算机编程提供了理论基础,也为计算机编程提供了实践工具。因而数学算法这种按照数学原理和运算规则的方法一直使用计算机编程领域,对计算机编程带来了深刻的影响,并展现出强大的应用效能,其已经成为计算机编程中重要的优化途径。本文重点阐述数学算法的特点以及与计算机编程的内在关联,梳理数学算法应用于计算机编程之中的积极价值,并罗列当下数学算法在计算机编程中的具体优化应用,希望为相关工作人员提供参考借鉴。 展开更多
关键词 数学算法 计算机编程 优化策略
下载PDF
自创教学案例在C语言教学中的应用研究
18
作者 王远敏 《数字通信世界》 2024年第1期96-98,共3页
在“C语言程序设计”课程的理论教学中,传统的教学案例偏向数学类的应用,学生对语法的学习很容易出现理解不透彻、对语句的使用方法不灵活等问题。笔者根据多年的“C语言程序设计”课程教学经验,设计了一些易于理解、具有趣味性且与学... 在“C语言程序设计”课程的理论教学中,传统的教学案例偏向数学类的应用,学生对语法的学习很容易出现理解不透彻、对语句的使用方法不灵活等问题。笔者根据多年的“C语言程序设计”课程教学经验,设计了一些易于理解、具有趣味性且与学生学习生活相关的教学案例,从而提高了教学效果。 展开更多
关键词 自创教学 案例 C语言
下载PDF
蓝印花布纹样标准数据集的构建 被引量:4
19
作者 于翔 张莉 沈美 《吉林大学学报(信息科学版)》 CAS 2023年第3期521-529,共9页
针对在以数字化的方式传承和保护蓝印花布的技术中由于缺乏具有原始手工特征的蓝色印花图案数据集,极大地限制了深度学习技术在蓝印花布纹样识别领域的应用问题,构建了一个大规模蓝印花布纹样数据集。该数据集包含50 216张蓝印花布纹样... 针对在以数字化的方式传承和保护蓝印花布的技术中由于缺乏具有原始手工特征的蓝色印花图案数据集,极大地限制了深度学习技术在蓝印花布纹样识别领域的应用问题,构建了一个大规模蓝印花布纹样数据集。该数据集包含50 216张蓝印花布纹样,从动物、植物、中国神话传说及复合四大题材的角度将数据分为85个子类。该数据集的创建不仅涉及到蓝印花布的数字化建设,如蓝印花布纹样检索及相关纹样命名,还能使相关研究人员设计和验证机器学习算法。在所构建的数据集基础上,提供了4个典型深度学习网络的实验结果,以此作为其性能基准。 展开更多
关键词 非物质文化遗产 蓝印花布纹样 图像识别 标准数据集 深度学习
下载PDF
基于FT-M7002的复数域行向量矩阵乘法移植与优化 被引量:1
20
作者 莫尚丰 周振芬 +3 位作者 胡勇华 徐敏敏 毛春献 袁钰迪 《计算机科学》 CSCD 北大核心 2023年第S02期827-832,共6页
FT-M7002是我国自主研发的高性能DSP,具有强大的向量处理能力。为有效地发挥它的性能优势,亟待优化移植面向FT-M7002的高效VSIP函数库。复数域行向量矩阵乘法是VSIP库中频繁使用的算法,在数字通信、图像处理等应用领域中大量使用。文中... FT-M7002是我国自主研发的高性能DSP,具有强大的向量处理能力。为有效地发挥它的性能优势,亟待优化移植面向FT-M7002的高效VSIP函数库。复数域行向量矩阵乘法是VSIP库中频繁使用的算法,在数字通信、图像处理等应用领域中大量使用。文中在FT-M7002 DSP上研究优化复数域行向量矩阵乘法算法,通过改变计算矩阵列向量为计算矩阵行向量、向量化、循环展开和软件流水等手段提升算法性能。测试结果表明:优化后的向量C算法相比VSIP库函数获得了6.2~20.6的加速比,汇编优化算法相比向量C算法获得了3.4~14.3的加速比,加速效果明显。 展开更多
关键词 矩阵乘法 数字信号处理器 单指令多数据流 VSIPL
下载PDF
上一页 1 2 89 下一页 到第
使用帮助 返回顶部