大规模科学装置与重大科学实验使得科学发现进入了数据密集型的第四范式,借助蓬勃发展的人工智能技术促进智能科学发现势在必行.机器学习作为人工智能中的一项重要技术,已广泛应用于各个科学领域.然而,现有工作仅研究特定任务下的机器...大规模科学装置与重大科学实验使得科学发现进入了数据密集型的第四范式,借助蓬勃发展的人工智能技术促进智能科学发现势在必行.机器学习作为人工智能中的一项重要技术,已广泛应用于各个科学领域.然而,现有工作仅研究特定任务下的机器学习方法,没能抽象出一个通用的智能科学发现研究框架.本文首先总结了科学发现任务中常用的机器学习方法,并将科学任务归类为五大机器学习问题.其次,提出了基于机器学习的智能科学发现研究框架,作为“AI for Science”的典型范例,阐述了一种高效的智能科学发现模式.再次,本文以时域天文学中发现瞬变事件这一科学任务为例,通过实验证明了唯有恰当地结合领域知识后,机器学习算法才能更好地服务于智能科学发现,验证了该框架的有效性.最后进行总结与展望,以期对各领域进行智能科学发现形成参考意义.展开更多
图划分是大图数据并行计算的基础,目前主要采用分布式算法实现大图划分.非易失存储器(Non-Volatile Memory,NVM)速度接近动态随机存储器(Dynamic Random Access Memory,DRAM),且具有低功耗、高密度、低时延等优点,本文针对分布式图划分...图划分是大图数据并行计算的基础,目前主要采用分布式算法实现大图划分.非易失存储器(Non-Volatile Memory,NVM)速度接近动态随机存储器(Dynamic Random Access Memory,DRAM),且具有低功耗、高密度、低时延等优点,本文针对分布式图划分算法难以分析和调试等问题,设计了基于混合内存的单机图划分算法框架.作者提出了基于邻边结构的图划分结果动态缓存管理策略(AeFdy),以提高缓存区邻居节点的搜索效率.在17种真实应用数据上的实验结果表明,采用新方法的平均图划分速度是基于邻点结构算法的4.9倍.本文还针对NVM寿命有限的问题,设计了基于内存页读写特征的迁移算法,实现了NVM写操作受限条件下的迁移优化方案.相对于Linux Swap、M-CLOCK、Dr.Swap混合内存管理策略,使用AeFdy策略的性能分别提升了128.5%、87.4%与50.4%.仿真实验结果表明,本文设计的混合内存管理方法实现了NVM+DRAM高效协同.展开更多
文摘大规模科学装置与重大科学实验使得科学发现进入了数据密集型的第四范式,借助蓬勃发展的人工智能技术促进智能科学发现势在必行.机器学习作为人工智能中的一项重要技术,已广泛应用于各个科学领域.然而,现有工作仅研究特定任务下的机器学习方法,没能抽象出一个通用的智能科学发现研究框架.本文首先总结了科学发现任务中常用的机器学习方法,并将科学任务归类为五大机器学习问题.其次,提出了基于机器学习的智能科学发现研究框架,作为“AI for Science”的典型范例,阐述了一种高效的智能科学发现模式.再次,本文以时域天文学中发现瞬变事件这一科学任务为例,通过实验证明了唯有恰当地结合领域知识后,机器学习算法才能更好地服务于智能科学发现,验证了该框架的有效性.最后进行总结与展望,以期对各领域进行智能科学发现形成参考意义.