期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于随机森林分类器构建高性能应用程序性能分析模型的方法
1
作者 柴旭清 乔一航 范黎林 《计算机工程与科学》 CSCD 北大核心 2024年第7期1218-1228,共11页
高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时... 高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时进程切换次数、内存利用率、磁盘I/O负载等7种性能数据,经PCA降维等数据预处理后,使用随机森林分类器训练程序性能问题分析模型。实验验证该模型可识别出内存利用率过高、磁盘I/O负载过重等5类性能问题。为评估模型的指导有效性,分别采集HotSpot3D程序和LU-Decomposition程序运行时产生的性能数据,并根据模型输出结果指导,分别基于运行级和编译级优化2个验证程序运行。实验结果表明,所提方法可有效指导优化程序的运行性能,2个验证程序的加速比分别为1.056和5.657。 展开更多
关键词 Nmon 性能分析 变分自编码器 聚类 随机森林
下载PDF
WASNCI:一种基于多模态深度学习的NCIs计算方法
2
作者 赵恩杰 李文泽 +1 位作者 柴旭清 毛文涛 《化学研究与应用》 CAS 北大核心 2024年第9期2064-2072,共9页
非共价相互作用(NCIs)的识别和研究,特别是NCIs值大小的测量和计算,对于药物的设计、超分子体系以及功能材料的设计都有重要意义。本文提出基于二代小波和AE的自注意力多模态特征融合NCIs计算方法(WASNCI)。引用二代小波方法将分子的电... 非共价相互作用(NCIs)的识别和研究,特别是NCIs值大小的测量和计算,对于药物的设计、超分子体系以及功能材料的设计都有重要意义。本文提出基于二代小波和AE的自注意力多模态特征融合NCIs计算方法(WASNCI)。引用二代小波方法将分子的电子密度特征按多尺度分解为具有能量意义的不同频带信息,之后计算频带重要度对频带信息自适应加权,提高特征利用率。同时,使用自编码器对分子样本的基本化学性质提取特征。最后,构建自注意力特征融合模块,其多头自注意力机制捕捉两种特征的复杂关系,使特征既能表达分子的电子密度,又能充分利用分子的化学性质。该方法在公用数据集上进行实验验证。实验结果表明,与最新的计算方法Deep NCI相比,本文提出的WASNCI方法计算NCIs的RMSE降低到了0.109 kcal/mol,精度提高了42%。本文所提计算方法可以准确地对分子NCIs进行计算,为非共价相互作用的研究提供了技术支持。 展开更多
关键词 非共价相互作用 深度学习 二代小波 多头自注意力
下载PDF
基于国产c86处理器的CP2K软件移植与优化 被引量:3
3
作者 范黎林 乔一航 +3 位作者 李俊飞 柴旭清 崔容培 韩秉豫 《计算机科学》 CSCD 北大核心 2023年第6期58-65,共8页
CP2K是目前运行最快的开源第一性原理材料计算和模拟软件,源码中调用协处理器的部分基于CUDA架构编写。因平台底层硬件架构和编译环境不同,原生的CP2K软件无法调用国产c86处理器平台上的DCU,因此不能实现跨平台应用。为解决该问题,提出... CP2K是目前运行最快的开源第一性原理材料计算和模拟软件,源码中调用协处理器的部分基于CUDA架构编写。因平台底层硬件架构和编译环境不同,原生的CP2K软件无法调用国产c86处理器平台上的DCU,因此不能实现跨平台应用。为解决该问题,提出了一种CP2K面向该平台的移植方案。该方案的核心思想为:对CP2K软件中主要基于CUDA接口实现的DBCSR库进行代码分析,拆解对应结构体和类的封装方式,并基于HIP的编程标准对其进行实现和封装。在国产c86处理器平台上编译安装HIP版的DBCSR库,链接CP2K软件,最终实现运行DCU版的CP2K软件。后续选取两个测试算例,基于编译级与运行级对其进行优化实验。实验发现,删除CP2K脚本链自动安装的FFTW库可提高计算结果精度。实验结果表明,所使用的优化方法可显著提升CP2K软件的计算效率和计算准确性,为实现开源软件面向国产平台的移植优化和国产化替代做出贡献。 展开更多
关键词 CP2K DBCSR 编译优化 MPI运行优化 HIP移植 JIT编译
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部