期刊文献+
共找到1,519篇文章
< 1 2 76 >
每页显示 20 50 100
构建支持大模型训练的计算机系统需要考虑的4个问题 被引量:1
1
作者 郑纬民 《大数据》 2024年第1期1-8,共8页
支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭... 支持大模型训练的计算机系统有3种类型,其中基于国产AI芯片系统的生态系统不是很好,要想改变这个局面,需要做好AI编译器、并行加速等10个关键软件;基于超级计算机的系统需要做好软硬件协同设计,从而更好地服务于大模型训练。针对如何搭建大模型的基础设施,提出4点平衡设计,以确保系统的性能、可靠性和可扩展性。 展开更多
关键词 模型训练 计算机系统 超算系统 模型基础设施
下载PDF
美国人工智能模型训练合理使用认定的成案经验研究
2
作者 熊琦 陈子懿 《科技与法律(中英文)》 CSSCI 2024年第6期11-23,共13页
人工智能模型依赖于对大量作品的复制分析,从而导致传统版权业者与人工智能训练需求之间的紧张关系。目前模型训练合理使用争议的原因,在于著作权人对人工智能模型训练方式认识不足以及对技术驱动下新兴市场收益预期未能达成。在美国的... 人工智能模型依赖于对大量作品的复制分析,从而导致传统版权业者与人工智能训练需求之间的紧张关系。目前模型训练合理使用争议的原因,在于著作权人对人工智能模型训练方式认识不足以及对技术驱动下新兴市场收益预期未能达成。在美国的司法实践中,合理使用已被广泛适用于从广播时代到互联网时代的诸多使用行为,在历史上具有典型意义的索尼案、谷歌数字图书案和坎贝尔案中给利用新技术的新兴产业拓展了发展空间。尽管美国法院在人工智能模型训练的合理使用问题上仍在继续要求各方补充证据,但其合理使用条款解释的丰富历史经验已经提供了诸多可供参考的答案,对我国调整版权产业与人工智能产业的关系具有参考意义。 展开更多
关键词 人工智能 模型训练 合理使用 非表达替代
下载PDF
基于深度学习的多模态病虫害检测模型训练与验证研究
3
作者 李冰 王瀛龙 《计算机应用文摘》 2024年第22期87-90,96,共5页
多模态病虫害数据集具有多样性,导致模型平均精度较低。基于此,文章设计了一种基于深度学习的多模态病虫害检测模型。首先,采集高清图像、音频、视频等多模态数据来整合现有资源构成数据集;其次,进行数据增强以提高模型的泛化能力,减少... 多模态病虫害数据集具有多样性,导致模型平均精度较低。基于此,文章设计了一种基于深度学习的多模态病虫害检测模型。首先,采集高清图像、音频、视频等多模态数据来整合现有资源构成数据集;其次,进行数据增强以提高模型的泛化能力,减少了过拟合风险;最后,选用深度学习中的MobileNet作为主干网络来捕捉关键特征,模型训练融合了多模态数据,并通过动态权重分配和注意力机制显著增强了检测效能。实验结果表明,在迭代60次时,设计模型的mAP达到0.87,远超文献[1]和文献[2]模型的0.72与0.79,能够快速收敛并准确检测多种病虫害。 展开更多
关键词 深度学习 MobileNet 多模态 病虫害检测 模型训练
下载PDF
从BERT到ChatGPT:大模型训练中的存储系统挑战与技术发展 被引量:6
4
作者 冯杨洋 汪庆 +1 位作者 谢旻晖 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期809-823,共15页
以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算... 以ChatGPT为代表的大模型在文字生成、语义理解等任务上表现卓越,引起了工业界和学术界的广泛关注.大模型的参数量在3年内增长数万倍,且仍呈现增长的趋势.首先分析了大模型训练的存储挑战,指出大模型训练的存储需求大,且具有独特的计算模式、访存模式、数据特征,这使得针对互联网、大数据等应用的传统存储技术在处理大模型训练任务时效率低下,且容错开销大.然后分别阐述了针对大模型训练的3类存储加速技术与2类存储容错技术.针对大模型训练的存储加速技术包括:1)基于大模型计算模式的分布式显存管理技术,依据大模型计算任务的划分模式和计算任务间的依赖关系,设计模型数据在分布式集群中的划分、存储和传输策略;2)大模型训练访存感知的异构存储技术,借助大模型训练中的访存模式可预测的特性,设计异构设备中的数据预取和传输策略;3)大模型数据缩减技术,针对大模型数据的特征,对模型训练过程中的数据进行缩减.针对大模型训练的存储容错技术包括:1)参数检查点技术,将大模型参数存储至持久化存储介质;2)冗余计算技术,在多张GPU中重复计算相同版本的参数.最后给出了总结和展望. 展开更多
关键词 ChatGPT 模型 存储系统 容错 模型训练系统
下载PDF
深度学习编译器模型训练负载均衡优化方法
5
作者 王丽 高开 +3 位作者 赵雅倩 李仁刚 曹芳 郭振华 《计算机科学与探索》 CSCD 北大核心 2024年第1期111-126,共16页
对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三... 对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三种计算图负载均衡优化方法:第一,通过自动建立数据加载与模型训练的高效流水实现中央处理器和后端计算设备的负载均衡,提高了系统整体能效;第二,通过计算图的分层优化技术,实现计算图在后端设备执行调度时的负载均衡;最后,通过自动建立层间的高效流水提高后端设备的资源利用率。实验结果表明,计算图负载均衡优化方法实现了训练任务到底层硬件设备自动映射过程中系统的负载均衡,与Tensorflow、nGraph等传统的深度学习框架和编译器相比,在不同模型训练中通过任务调度负载均衡优化技术分别获得了2%~10%的性能提升,同时能够使系统整体的能耗降低10%以上。 展开更多
关键词 模型训练 编译器优化 负载均衡 分层调度 自动流水
下载PDF
面向多模态模型训练的高效样本检索技术
6
作者 唐秀 伍赛 +1 位作者 侯捷 陈刚 《软件学报》 EI CSCD 北大核心 2024年第3期1125-1139,共15页
深度学习中,多模态模型的训练通常需要大量高质量不同类型的标注数据,如图像、文本、音频等.然而,获取大规模的多模态标注数据是一项具有挑战性和昂贵的任务.为了解决这一问题,主动学习作为一种有效的学习范式被广泛应用,能够通过有针... 深度学习中,多模态模型的训练通常需要大量高质量不同类型的标注数据,如图像、文本、音频等.然而,获取大规模的多模态标注数据是一项具有挑战性和昂贵的任务.为了解决这一问题,主动学习作为一种有效的学习范式被广泛应用,能够通过有针对性地选择最有信息价值的样本进行标注,从而降低标注成本并提高模型性能.现有的主动学习方法往往面临着低效的数据扫描和数据位置调整问题,当索引需要进行大范围的更新时,会带来巨大的维护代价.为解决这些问题,提出了一种面向多模态模型训练的高效样本检索技术So-CBI.该方法通过感知模型训练类间边界点,精确评估样本对模型的价值;设计了半有序的高效样本索引,通过结合数据排序信息和部分有序性,降低了索引维护代价和时间开销.在多组多模态数据集上通过与传统主动学习训练方法实验对比,验证了So-CBI方法在主动学习下的训练样本检索问题上的有效性. 展开更多
关键词 多模态模型训练 主动学习 样本检索
下载PDF
深度学习模型训练的优化器实验设计 被引量:1
7
作者 张波 肖杰 《电子制作》 2024年第2期114-117,共4页
针对目前国内对深度学习的卷积神经网络(Convolutional Neural Network,CNN)模型教学过程中,对优化器理论学习过程中存在实践不足问题,首先利用kaggle平台上的猫狗数据库,然后通过迁移学习方法设计猫狗识别的深度学习神经网络模型,最后... 针对目前国内对深度学习的卷积神经网络(Convolutional Neural Network,CNN)模型教学过程中,对优化器理论学习过程中存在实践不足问题,首先利用kaggle平台上的猫狗数据库,然后通过迁移学习方法设计猫狗识别的深度学习神经网络模型,最后分别选择AdaGrad、RMSProp和Adam三种不同的梯度下降优化算法,对同一网络模型结构进行训练。观察到使用AdaGrad算法对模型训练准确率可达84.1%,RMSProp优化算法对模型训练准确率可达85.6%,Adam算法对模型训练准确率可达86.3%。实验结果表明,在模型优化中,适合的优化算法不但会使模型收敛更快。也会影响模型的性能。同时加深学生理解不同优化器对模型的优化能力。 展开更多
关键词 深度学习 卷积神经网络 模型训练 优化器
下载PDF
图像数据处理模型训练系统设计与实现 被引量:2
8
作者 杨政 徐亮 +2 位作者 廖一星 王亮 官永杨 《工业控制计算机》 2024年第5期100-101,共2页
结合复杂图像数据处理及模型训练应用场景需求,开展图像数据处理系统模块化设计与搭建工作,将图像处理功能单元及模型库进行封装处理,同时搭建训练及接口并通过构建API进行功能和处理模型的调度,并实现功能单元和模型快速组合与应用,以... 结合复杂图像数据处理及模型训练应用场景需求,开展图像数据处理系统模块化设计与搭建工作,将图像处理功能单元及模型库进行封装处理,同时搭建训练及接口并通过构建API进行功能和处理模型的调度,并实现功能单元和模型快速组合与应用,以此解决图像数据处理耗时长、处理工作量大以及图像数据的模型训练不及时等问题,为机器视觉技术在产品外观缺陷识别、缺陷目标特征定位及检测等应用方面提供理论支撑和技术参考。 展开更多
关键词 图像数据 模型训练 模块化设计
下载PDF
基于同态加密的神经网络模型训练方法 被引量:2
9
作者 赵敏 田有亮 +2 位作者 熊金波 毕仁万 谢洪涛 《计算机科学》 CSCD 北大核心 2023年第5期372-381,共10页
针对云环境下数据隐私泄露与基于同态加密的隐私保护神经网络中精度不足的问题,文中提出了一种双服务器协作的隐私保护神经网络训练(PPNT)方案,在云服务器协同训练过程中实现了对数据传输、计算过程及模型参数的隐私保护。首先,为避免... 针对云环境下数据隐私泄露与基于同态加密的隐私保护神经网络中精度不足的问题,文中提出了一种双服务器协作的隐私保护神经网络训练(PPNT)方案,在云服务器协同训练过程中实现了对数据传输、计算过程及模型参数的隐私保护。首先,为避免使用多项式近似方法实现指数和比较等非线性函数,并提高非线性函数的计算精度,基于Paillier半同态加密方案和加法秘密共享技术设计了一系列基础安全计算协议;其次,在已设计的安全计算协议基础上,构造了神经网络中的全连接层、激活层、Softmax层及反向传播相应的安全计算协议,以实现PPNT方案;最后,通过理论与安全性分析,证明了PPNT方案的正确性及安全性。性能实验结果显示,与PPMLaaS方案相比,PPNT方案的模型精度提高了1.7%,且在安全计算过程中支持客户端离线。 展开更多
关键词 Paillier半同态加密 加法秘密共享 安全计算协议 隐私保护 模型训练
下载PDF
一种用于电视节目播出异态识别的人工智能模型训练方法
10
作者 汤冻 奚晓轶 闫涛 《电视技术》 2023年第1期61-65,共5页
提出一种用于电视节目画面播出异态识别的人工智能模型训练方法,解决没有针对广播电视安全播出监看领域图像识别的神经网络模型,以及自有模型训练异态样本量少的问题。最终训练集可以达到97%的训练精度,实际测试检测准确度超过90%,可以... 提出一种用于电视节目画面播出异态识别的人工智能模型训练方法,解决没有针对广播电视安全播出监看领域图像识别的神经网络模型,以及自有模型训练异态样本量少的问题。最终训练集可以达到97%的训练精度,实际测试检测准确度超过90%,可以满足应用需求。 展开更多
关键词 人工智能 图像识别 模型训练
下载PDF
铁路车辆监测图像识别模型训练及验证平台研究 被引量:1
11
作者 杨凯 张淼 祁苗苗 《铁路计算机应用》 2023年第6期26-30,共5页
针对铁路车辆轨边图像检测系统现有图像自动识别模型训练及评价过程中训练数据不足、数据质量不高、评价标准不一致等问题,研究铁路车辆监测图像识别模型训练及验证平台。设计故障图像数据统一接入,专家标定数据形成,自动识别模型接入... 针对铁路车辆轨边图像检测系统现有图像自动识别模型训练及评价过程中训练数据不足、数据质量不高、评价标准不一致等问题,研究铁路车辆监测图像识别模型训练及验证平台。设计故障图像数据统一接入,专家标定数据形成,自动识别模型接入、训练、对比评测等方法,为故障图像自动识别模型提供标准训练数据、统一评测验证与管理服务的能力。实践表明,该平台实现了车辆故障图像数据的集中汇总与统一管理,为铁路车辆监测图像自动识别技术的发展提供了有力支持。 展开更多
关键词 轨边图像检测系统 安全监测 图像识别 模型训练 数据标定
下载PDF
水轮机空化现象智能识别的分类模型训练方法 被引量:1
12
作者 汪刚 王桂虹 +5 位作者 骆彦辰 梁权伟 黄曦 吴建平 王智勇 陈梓豪 《水力发电》 CAS 2023年第7期67-72,77,共7页
目前国内暂无相关成熟的分类模型训练方法以支持机器自动识别水轮机初生空化现象,针对于此,提出了一种支持向量分类算法(SVCC)用于水轮机空化现象智能识别的分类模型训练,以解决现有技术中分类算法对非线性可分样本数据分类效果不佳的... 目前国内暂无相关成熟的分类模型训练方法以支持机器自动识别水轮机初生空化现象,针对于此,提出了一种支持向量分类算法(SVCC)用于水轮机空化现象智能识别的分类模型训练,以解决现有技术中分类算法对非线性可分样本数据分类效果不佳的问题。对该分类模型的核函数和超参数选取等环节进行了优化,以更好地适应水轮机空化试验数据的特点。训练好后的分类模型已应用于东方电机有限公司水轮机模型试验台进行水轮机初生空化的识别。实际应用表明,该分类模型能够提高机器对水轮机初生空化现象的识别效率且其最终判别准确率可达80%。 展开更多
关键词 水轮机 模型试验 空化现象 分类模型训练方法 最优分类超平面 分类器 升维函数 松弛变量
下载PDF
试误法在高中人工智能模型训练教学中的应用 被引量:1
13
作者 叶大盛 《教育与装备研究》 2023年第2期60-63,共4页
人工智能有许多晦涩难懂专业术语和专业知识,学生在学习过程中会产生畏难心理,影响学习兴趣。试误法通过试误引发实践问题反向推动学生自主学习探究,解决了学习内在驱动力问题。文中通过案例分析讲述试误教学法的教学模式及实施策略,帮... 人工智能有许多晦涩难懂专业术语和专业知识,学生在学习过程中会产生畏难心理,影响学习兴趣。试误法通过试误引发实践问题反向推动学生自主学习探究,解决了学习内在驱动力问题。文中通过案例分析讲述试误教学法的教学模式及实施策略,帮助解决高中人工智能教学中难点问题。 展开更多
关键词 试误法 人工智能 模型训练
下载PDF
中国工程院院士、清华大学计算机系教授郑纬民:人工智能大模型训练硬件软件都面临挑战
14
作者 高艳飞 《当代贵州》 2023年第23期29-29,共1页
ChatGPT出来以后,技术层次有三方面进展:第一,数据清洗;第二,人工标注反馈;第三,整体系统工程化。其中,整体系统工程化实际上是软硬件协同的系统设计与优化。近年来,新型硬件层出不穷,做人工智能大模型训练的机器类型也有很多。
关键词 人工智能 数据清洗 软硬件协同 模型训练 中国工程院院士 硬件软件 计算机系 CHAT
下载PDF
基于最大互信息的离散隐马尔柯夫模型训练方法 被引量:7
15
作者 茅晓泉 胡光锐 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第11期1713-1716,共4页
在基于隐马尔柯夫模型 (HMM)的语音识别系统中 ,模型训练最常用的算法是 Baum-Welch算法 .该算法具有快速收敛及保证每步迭代模型的似然概率单调增的优点 .但它基于最大似然训练准则 ,而该准则不能将各个模型很好地分开 .这直接导致了... 在基于隐马尔柯夫模型 (HMM)的语音识别系统中 ,模型训练最常用的算法是 Baum-Welch算法 .该算法具有快速收敛及保证每步迭代模型的似然概率单调增的优点 .但它基于最大似然训练准则 ,而该准则不能将各个模型很好地分开 .这直接导致了识别时的错误 .鉴于最大互信息可以克服这一缺点 ,提出了一种基于最大互信息的训练方法 .该方法借助于梯度 ,调整参数以使模型与训练数据的互信息最大 .实验结果表明 。 展开更多
关键词 隐马尔柯夫模型 最大互信息 偏导数 语音识别 模型训练 训练准则 似然概率
下载PDF
基于混合协同粒子群优化的广义T-S模糊模型训练方法 被引量:1
16
作者 周欣然 滕召胜 易钊 《系统工程与电子技术》 EI CSCD 北大核心 2009年第5期1189-1193,共5页
针对广义Takagi-Sugeno(T-S)模糊模型训练中存在的高维、非线性、混合参数估计问题,提出了一种基于混合协同粒子群优化的广义T-S模糊模型训练方法。该方法用离散二进制微粒位置表示模型的结构参数,用普通微粒位置表示模型规则中模糊集... 针对广义Takagi-Sugeno(T-S)模糊模型训练中存在的高维、非线性、混合参数估计问题,提出了一种基于混合协同粒子群优化的广义T-S模糊模型训练方法。该方法用离散二进制微粒位置表示模型的结构参数,用普通微粒位置表示模型规则中模糊集隶属函数的参数;这两种微粒位置联合体构成一个模型完整的模型前件参数集。两种群通过协同进化优化所有前件参数;模型后件参数用卡尔曼滤波算法估计。该方法不要任何先验知识,能产生紧凑的、泛化性能较好的模糊模型。函数逼近的数字仿真说明了该方法的有效性。 展开更多
关键词 广义Takagi-Sugeno模糊模型 混合协同粒子群优化 协同进化 模型训练 卡尔曼滤波算法
下载PDF
自制乳腺囊肿模型训练法在超声引导穿刺实践教学中的效果评价 被引量:4
17
作者 冷晓玲 黄国福 《影像研究与医学应用》 2021年第1期219-220,共2页
目的:分析超声引导穿刺实践教学中自制乳腺囊肿模型训练法的实施效果。方法:选取2018年4月我院临床医学专业班学生100人。采用训练方法不同将患者分为对照组和观察组,每组各有50例,对照组超声引导穿刺实践教学上采取传统教学模式,观察... 目的:分析超声引导穿刺实践教学中自制乳腺囊肿模型训练法的实施效果。方法:选取2018年4月我院临床医学专业班学生100人。采用训练方法不同将患者分为对照组和观察组,每组各有50例,对照组超声引导穿刺实践教学上采取传统教学模式,观察组采用自制乳腺囊肿模型训练法。对比两组学生的教学效果,将实践操作考核成绩和学生学习情况作为观察指标。结果:对照组囊强抽吸效果(14.01±3.21),操作步骤(18.11±3.04),操作准备(28.33±4.32);观察组囊强抽吸效果(19.88±3.34),操作步骤(24.99±3.11),操作准备(29.44±4.61),观察组学生操作准备、操作步骤以及囊腔抽吸效果都要明显高于对照组,各项数据对比均具明显差异(P<0.05),对照组激发学习兴趣33(66),加强理论实践联系37(74),有利于自主思考41(82),有利于临床思维提高40(80),有利于实践操作提高38(76);观察组激发学习兴趣46(92),加强理论实践联系48(96)48(96),有利于自主思考47(94),有利于临床思维提高46(92)。观察组学生在知识运用、能力培养和以及课堂学习多个方面相比对照组都有着更高的满意度,组间对比差异明显(P<0.05)具有研究对照价值。结论:在超声引导穿刺实践教学中应用自制乳腺囊肿模型训练方法,能够提高患者实践成绩,激发学生学习兴趣,加强学生实践和理论之间的联系,让学生通过自主思考加深对课堂知识的理解,掌握超声引导下乳腺囊肿的穿刺技巧。 展开更多
关键词 乳腺囊肿 模型训练 超声引导 实践教学 效果评价
下载PDF
改良静脉穿刺模型训练的效果观察 被引量:1
18
作者 杨定姣 张礼宾 +1 位作者 王中军 陶丽云 《南华大学学报(医学版)》 2002年第3期275-275,277,共2页
关键词 静脉穿刺 模型训练 穿刺成功率
下载PDF
DB4Trans:数据库内置知识图谱嵌入模型训练引擎 被引量:1
19
作者 柳鹏凯 王鑫 +2 位作者 刘宝珠 蔡顺汀 李思卓 《计算机学报》 EI CAS CSCD 北大核心 2022年第9期1969-1982,共14页
知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧... 知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧增加.然而,大部分的知识图谱嵌入工作主要关注模型训练的结果,忽略了对于数据规模的可扩展性,在处理大规模知识图谱时表现出较差的性能.近年来的一些研究工作将数据库技术应用于机器学习算法的优化,同时提供了用于数据库内机器学习的各类工具.通过将知识图谱嵌入模型与数据库在数据管理上的优势进行有效的结合,能够在保证知识图谱嵌入模型训练的准确率和效率的同时,提供更好的可扩展性以支持大规模知识图谱数据的训练.基于此,本文提出一种数据库内置知识图谱嵌入模型训练引擎DB4Trans.首先,设计了一种用于知识图谱嵌入模型训练的数据存储方案,对实体和关系进行编码并建立索引结构,以实现模型训练过程中对中间结果的快速访问和更新;其次,提出了一种数据库内置的模型训练优化算法,对数据库与内存间的数据批量交换方案进行设计以支持大规模数据的训练与存储;最后,在不同数据集上进行了测试,比较了模型训练与预测的时间、模型训练的准确率、存储时间和空间效率并验证了方法的可扩展性.实验结果表明,所提出的方法能够在不影响模型训练效率和准确率的同时,通过内存与数据库间的数据交换,支持在数据库内完成大规模知识图谱的训练过程. 展开更多
关键词 数据库 知识图谱嵌入 模型训练引擎 DB4AI TransE
下载PDF
上一页 1 2 76 下一页 到第
使用帮助 返回顶部