-
题名基于异构硬件的LSTM训练系统
- 1
-
-
作者
黄为新
胡伟方
曹雪娇
石宣化
-
机构
华中科技大学计算机科学与技术学院
华中科技大学大数据技术与系统国家地方联合工程研究中心
-
出处
《大数据》
2024年第4期172-188,共17页
-
基金
新一代人工智能国家科技重大专项(No.2020AAA0108501)
湖北省重大攻关项目(JD)(No.2023BAA024)。
-
文摘
在大数据时代,以LSTM为代表的深度神经网络模型具有处理海量数据的能力,在语言处理、语音识别、时序数据预测等领域表现优异。随着模型复杂度的提高,训练成本大幅提升。现有的LSTM训练系统使用了算子融合、多流等加速手段,但忽略了训练算子内部计算的可并行性,导致计算资源的利用率低,整体耗时长。为此,设计了基于细粒度模型划分和多流并行调度方法的LSTM训练系统TurboLSTM,在英伟达GPU和国产昇腾NPU这两种异构硬件上构建的全新底层训练算子实现了任务对计算资源的合理利用。与已有训练系统相比,在GPU上TurboLSTM的单算子训练时间缩短了23%,模型的整体训练时间缩短了17%,在NPU上TurboLSTM的单算子训练时间缩短了15%,且对计算资源的利用率显著提高。这表明提出的加速方案是高效的,具有良好的泛化能力。
-
关键词
LSTM
训练加速
细粒度并行
多流调度
-
Keywords
LSTM
training acceleration
fine-grained parallelism
multi-stream scheduling
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于马尔可夫随机场的眼底图像血管分割研究
被引量:3
- 2
-
-
作者
李语尧
李晓宇
陆子旭
黄为新
-
机构
吉林大学计算机科学与技术学院
-
出处
《计算机应用与软件》
北大核心
2019年第7期254-258,306,共6页
-
基金
吉林大学国家级大学生创新创业训练项目(2018A2115)
-
文摘
眼底图像血管分割是医用图像分割中较为复杂的一种,在目前的研究中存在分割精度低、效率不高等问题。提出基于马尔可夫随机场的眼底图像血管分割算法,根据眼底图像的特点构建马尔可夫随机场模型,提取H通道作为特征场参数,利用最大后验准则完成标号场更新,最终实现对视网膜血管的分割。算法通过眼底图像数据库DRIVE进行测试,结果表明:该算法平均准确度为0.954 6,平均敏感度为0.899 9,平均特异度为0.957 1,具有很好的分割效果,且运行稳定,计算方便快捷,具有鲁棒性。
-
关键词
马尔可夫随机场
眼底图像
视网膜血管分割
特征场
-
Keywords
Markov random field
Fundus image
Retinal vein segmentation
Characteristic field
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于迁移学习的发票号码识别研究
- 3
-
-
作者
黄为新
陶杨
张继超
苏笛
牛砚
-
机构
吉林大学计算机科学与技术学院
吉林大学数学学院
-
出处
《软件导刊》
2021年第6期45-48,共4页
-
基金
吉林大学校级大学生创新创业训练项目(201910183X365)。
-
文摘
财务系统中的发票管理长期以来严重依靠人力,并存在一定的失误率,且目前一些发票识别方法存在准确率不高、数字识别实时性不足等问题。鉴于此,基于已有较成熟的手写体数字识别工作,从迁移学习思想和方法入手,设计一种能准确快速识别发票号码的新方法。选取迁移学习的3种具体方法,即Tradaboost、微调和卷积神经网络提取特征并运用于SVM,分别应用于数字识别模块。通过大量测试和比对,结果表明,第3种方法即采用CNN结合SVM的算法在实验中能达到99.75%的准确率,且识别速度快,具有较好的稳定性、鲁棒性。
-
关键词
发票识别
印刷数字识别
字符分割
迁移学习
-
Keywords
invoice recognition
printing digital recognition
character segmentation
transfer learning
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-