期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于随机森林分类器构建高性能应用程序性能分析模型的方法
1
作者
柴旭清
乔一航
范黎林
《计算机工程与科学》
CSCD
北大核心
2024年第7期1218-1228,共11页
高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时...
高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时进程切换次数、内存利用率、磁盘I/O负载等7种性能数据,经PCA降维等数据预处理后,使用随机森林分类器训练程序性能问题分析模型。实验验证该模型可识别出内存利用率过高、磁盘I/O负载过重等5类性能问题。为评估模型的指导有效性,分别采集HotSpot3D程序和LU-Decomposition程序运行时产生的性能数据,并根据模型输出结果指导,分别基于运行级和编译级优化2个验证程序运行。实验结果表明,所提方法可有效指导优化程序的运行性能,2个验证程序的加速比分别为1.056和5.657。
展开更多
关键词
Nmon
性能分析
变分自编码器
聚类
随机森林
下载PDF
职称材料
WASNCI:一种基于多模态深度学习的NCIs计算方法
2
作者
赵恩杰
李文泽
+1 位作者
柴旭清
毛文涛
《化学研究与应用》
CAS
北大核心
2024年第9期2064-2072,共9页
非共价相互作用(NCIs)的识别和研究,特别是NCIs值大小的测量和计算,对于药物的设计、超分子体系以及功能材料的设计都有重要意义。本文提出基于二代小波和AE的自注意力多模态特征融合NCIs计算方法(WASNCI)。引用二代小波方法将分子的电...
非共价相互作用(NCIs)的识别和研究,特别是NCIs值大小的测量和计算,对于药物的设计、超分子体系以及功能材料的设计都有重要意义。本文提出基于二代小波和AE的自注意力多模态特征融合NCIs计算方法(WASNCI)。引用二代小波方法将分子的电子密度特征按多尺度分解为具有能量意义的不同频带信息,之后计算频带重要度对频带信息自适应加权,提高特征利用率。同时,使用自编码器对分子样本的基本化学性质提取特征。最后,构建自注意力特征融合模块,其多头自注意力机制捕捉两种特征的复杂关系,使特征既能表达分子的电子密度,又能充分利用分子的化学性质。该方法在公用数据集上进行实验验证。实验结果表明,与最新的计算方法Deep NCI相比,本文提出的WASNCI方法计算NCIs的RMSE降低到了0.109 kcal/mol,精度提高了42%。本文所提计算方法可以准确地对分子NCIs进行计算,为非共价相互作用的研究提供了技术支持。
展开更多
关键词
非共价相互作用
深度学习
二代小波
多头自注意力
下载PDF
职称材料
基于国产c86处理器的CP2K软件移植与优化
被引量:
3
3
作者
范黎林
乔一航
+3 位作者
李俊飞
柴旭清
崔容培
韩秉豫
《计算机科学》
CSCD
北大核心
2023年第6期58-65,共8页
CP2K是目前运行最快的开源第一性原理材料计算和模拟软件,源码中调用协处理器的部分基于CUDA架构编写。因平台底层硬件架构和编译环境不同,原生的CP2K软件无法调用国产c86处理器平台上的DCU,因此不能实现跨平台应用。为解决该问题,提出...
CP2K是目前运行最快的开源第一性原理材料计算和模拟软件,源码中调用协处理器的部分基于CUDA架构编写。因平台底层硬件架构和编译环境不同,原生的CP2K软件无法调用国产c86处理器平台上的DCU,因此不能实现跨平台应用。为解决该问题,提出了一种CP2K面向该平台的移植方案。该方案的核心思想为:对CP2K软件中主要基于CUDA接口实现的DBCSR库进行代码分析,拆解对应结构体和类的封装方式,并基于HIP的编程标准对其进行实现和封装。在国产c86处理器平台上编译安装HIP版的DBCSR库,链接CP2K软件,最终实现运行DCU版的CP2K软件。后续选取两个测试算例,基于编译级与运行级对其进行优化实验。实验发现,删除CP2K脚本链自动安装的FFTW库可提高计算结果精度。实验结果表明,所使用的优化方法可显著提升CP2K软件的计算效率和计算准确性,为实现开源软件面向国产平台的移植优化和国产化替代做出贡献。
展开更多
关键词
CP2K
DBCSR
编译优化
MPI运行优化
HIP移植
JIT编译
下载PDF
职称材料
题名
一种基于随机森林分类器构建高性能应用程序性能分析模型的方法
1
作者
柴旭清
乔一航
范黎林
机构
河南师范大学
计算
机与信息工程学院
河南师范大学高性能计算中心
智慧商务与物联网技术
河南
省工程实验室
出处
《计算机工程与科学》
CSCD
北大核心
2024年第7期1218-1228,共11页
基金
国家自然科学基金(12274117)
河南省优秀青年科学基金(202300410226)
河南省高校科技创新计划(20HASTIT026)。
文摘
高性能应用程序的传统性能分析方法因分析过程存在额外开销和分析结果不准确等缺陷,致使用户耗费更多的时间和领域知识。为解决以上问题,将程序的性能分析问题转化成高维特征下非平衡小样本数据集的多分类问题,采集500条包含程序运行时进程切换次数、内存利用率、磁盘I/O负载等7种性能数据,经PCA降维等数据预处理后,使用随机森林分类器训练程序性能问题分析模型。实验验证该模型可识别出内存利用率过高、磁盘I/O负载过重等5类性能问题。为评估模型的指导有效性,分别采集HotSpot3D程序和LU-Decomposition程序运行时产生的性能数据,并根据模型输出结果指导,分别基于运行级和编译级优化2个验证程序运行。实验结果表明,所提方法可有效指导优化程序的运行性能,2个验证程序的加速比分别为1.056和5.657。
关键词
Nmon
性能分析
变分自编码器
聚类
随机森林
Keywords
Nmon
performance analysis
variational autoencoder
cluster
random forest
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
WASNCI:一种基于多模态深度学习的NCIs计算方法
2
作者
赵恩杰
李文泽
柴旭清
毛文涛
机构
河南师范大学
计算
机与信息工程学院
智慧商务与物联网技术
河南
省工程实验室
河南师范大学高性能计算中心
出处
《化学研究与应用》
CAS
北大核心
2024年第9期2064-2072,共9页
基金
国家自然科学基金项目(12274117)资助
河南省科技攻关项目(222102210333)资助
+1 种基金
中国高校产学研创新基金-新一代信息技术创新项目资助课题计划书项目(2020ITA07040)资助
产学合作协同育人项目(202102089014,202102533043)资助。
文摘
非共价相互作用(NCIs)的识别和研究,特别是NCIs值大小的测量和计算,对于药物的设计、超分子体系以及功能材料的设计都有重要意义。本文提出基于二代小波和AE的自注意力多模态特征融合NCIs计算方法(WASNCI)。引用二代小波方法将分子的电子密度特征按多尺度分解为具有能量意义的不同频带信息,之后计算频带重要度对频带信息自适应加权,提高特征利用率。同时,使用自编码器对分子样本的基本化学性质提取特征。最后,构建自注意力特征融合模块,其多头自注意力机制捕捉两种特征的复杂关系,使特征既能表达分子的电子密度,又能充分利用分子的化学性质。该方法在公用数据集上进行实验验证。实验结果表明,与最新的计算方法Deep NCI相比,本文提出的WASNCI方法计算NCIs的RMSE降低到了0.109 kcal/mol,精度提高了42%。本文所提计算方法可以准确地对分子NCIs进行计算,为非共价相互作用的研究提供了技术支持。
关键词
非共价相互作用
深度学习
二代小波
多头自注意力
Keywords
non-covalent interactions
deep learning
wavelet packet
multi-head self-attention
分类号
O641 [理学—物理化学]
下载PDF
职称材料
题名
基于国产c86处理器的CP2K软件移植与优化
被引量:
3
3
作者
范黎林
乔一航
李俊飞
柴旭清
崔容培
韩秉豫
机构
河南师范大学
计算
机与信息工程学院
河南师范大学高性能计算中心
智慧商务与物联网技术
河南
省工程实验室
中国科学院
大学
计算
机科学与技术学院
河南师范大学
软件学院
出处
《计算机科学》
CSCD
北大核心
2023年第6期58-65,共8页
基金
光合基金B类(20210702202107022768,20210702202107022686)
河南省高等教育教学改革研究与实践立项项目(2021SJGLX354)
+1 种基金
中国高校产学研创新基金-新一代信息技术创新项目资助课题计划书(2020ITA07040)
产学合作协同育人项目(202102089014,202102533043)。
文摘
CP2K是目前运行最快的开源第一性原理材料计算和模拟软件,源码中调用协处理器的部分基于CUDA架构编写。因平台底层硬件架构和编译环境不同,原生的CP2K软件无法调用国产c86处理器平台上的DCU,因此不能实现跨平台应用。为解决该问题,提出了一种CP2K面向该平台的移植方案。该方案的核心思想为:对CP2K软件中主要基于CUDA接口实现的DBCSR库进行代码分析,拆解对应结构体和类的封装方式,并基于HIP的编程标准对其进行实现和封装。在国产c86处理器平台上编译安装HIP版的DBCSR库,链接CP2K软件,最终实现运行DCU版的CP2K软件。后续选取两个测试算例,基于编译级与运行级对其进行优化实验。实验发现,删除CP2K脚本链自动安装的FFTW库可提高计算结果精度。实验结果表明,所使用的优化方法可显著提升CP2K软件的计算效率和计算准确性,为实现开源软件面向国产平台的移植优化和国产化替代做出贡献。
关键词
CP2K
DBCSR
编译优化
MPI运行优化
HIP移植
JIT编译
Keywords
CP2K
DBCSR
Compilation optimization
MPI running optimization
HIP transplantation
Just-in-time compilation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种基于随机森林分类器构建高性能应用程序性能分析模型的方法
柴旭清
乔一航
范黎林
《计算机工程与科学》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
WASNCI:一种基于多模态深度学习的NCIs计算方法
赵恩杰
李文泽
柴旭清
毛文涛
《化学研究与应用》
CAS
北大核心
2024
0
下载PDF
职称材料
3
基于国产c86处理器的CP2K软件移植与优化
范黎林
乔一航
李俊飞
柴旭清
崔容培
韩秉豫
《计算机科学》
CSCD
北大核心
2023
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部