-
题名SMViT:用于新冠肺炎诊断的轻量化孪生网络模型
- 1
-
-
作者
马自萍
谭力刀
马金林
陈勇
-
机构
北方民族大学数学与信息科学学院
北方民族大学计算机科学与工程学院
宁夏医科大学总医院放射介入科
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第10期2499-2510,共12页
-
基金
国家自然科学基金(61462002)
宁夏自然科学基金(2022AAC03268,2020AAC03215,2020AAC02004)。
-
文摘
针对新冠肺炎的深度学习诊断模型存在的准确率不高、泛化能力较差和参数量较大的问题,基于ViT和孪生网络,提出了一种新冠肺炎诊断的轻量化孪生网络SMViT。首先,提出了循环子结构轻量化策略,使用多个具有相同结构的子网络构成诊断网络,从而降低网络的参数量;其次,提出ViT掩码自监督预训练模型,以增强模型的潜在特征表达能力;然后,构建新冠肺炎诊断的孪生网络SMViT,有效提升模型的诊断准确率,改善小样本下模型泛化能力较差的问题;最后,使用消融实验验证并确定了模型结构,通过对比实验验证模型的诊断性能和轻量化能力。实验结果表明:与最具竞争力的ViT架构的诊断模型相比,该模型在X-ray数据集上的准确率、特异度、灵敏度与F1分数值分别提高了1.42%、4.62%、0.40%和2.80%,在CT图像数据集上的准确率、特异度、灵敏度与F1分数值分别提高了2.16%、2.17%、2.05%和2.06%;在样本量较小时,模型具有较强的泛化能力;与ViT相比,SMViT模型具有更小的参数量和更高的诊断性能。
-
关键词
新冠肺炎诊断
孪生网络
vit模型
自监督学习
轻量化模型
-
Keywords
diagnosis of COVID-19
siamese network
vision transformer
self-supervised learning
lightweight model
-
分类号
TP391.5
[自动化与计算机技术—计算机应用技术]
-
-
题名基于ViT与语义引导的视频内容描述生成
- 2
-
-
作者
赵宏
陈志文
郭岚
安冬
-
机构
兰州理工大学计算机与通信学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第5期247-254,共8页
-
基金
国家自然科学基金“基于深度学习的广谱恶意域名检测方法研究”(62166025)
甘肃省重点研发计划“监控视频内容理解和描述文本生成以及在重点行业的示范应用”(21YF5GA073)。
-
文摘
现有视频内容描述模型生成的视频内容描述文本可读性差且准确率不高。基于ViT模型提出一种语义引导的视频内容描述方法。利用ReNeXt和ECO网络提取视频的视觉特征,以提取的视觉特征为输入、语义标签的概率预测值为输出训练语义检测网络(SDN)。在此基础上,通过ViT模型对静态和动态视觉特征进行全局编码,并与SDN提取的语义特征进行注意力融合,采用语义长短期记忆网络对融合特征进行解码,生成视频对应的描述文本。通过引入视频中的语义特征能够引导模型生成更符合人类习惯的描述,使生成的描述更具可读性。在MSR-VTT数据集上的测试结果表明,该模型的BLEU-4、METEOR、ROUGE-L和CIDEr指标分别为44.8、28.9、62.8和51.1,相比于当前主流的视频内容描述模型ADL和SBAT,提升的得分总和达到16.6和16.8。
-
关键词
视频内容描述
视频理解
vit模型
语义引导
长短期记忆网络
注意力机制
-
Keywords
video content caption
video understanding
Vision Transformer(vit)model
semantic guidance
Long Short-Term Memory(LSTM)network
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度网络的汽车配件两级备件决策
被引量:2
- 3
-
-
作者
张明蓝
孙林夫
邹益胜
-
机构
西南交通大学计算机与人工智能学院
四川省制造业产业链协同与信息化支撑技术重点实验室
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2022年第12期3822-3831,共10页
-
基金
国家重点研发计划资助项目(2020YFB1711802)
四川省科技计划资助项目(2021YFG0040)。
-
文摘
备件业务是汽车配件售后市场重要组成部分,针对汽车备件决策过程中信息不完备与多样性的问题,提出一种正则化VIT-BiLSTM两级备件决策模型。首先,根据配件类型对数据进行两级划分,以获取其内在联系。然后,利用Vision Transformer(VIT)模型对配件数据进行关键特征的提取。随后,通过双向长短时记忆循环神经网络(BiLSTM)捕捉特征之间的双向长时依赖关系,并在每个序列单元中融入组套索正则化项,进一步提高模型准确率。最后,利用第三方云平台的配件数据进行算例分析。实验结果表明,模型一级与二级的决策准确率分别高达99%、97%,召回率分别为97.3%、96.6%,F值分别为0.977、0.964,说明本模型可以为配件代理商提供实时数据参考,辅助其进行备件决策。
-
关键词
汽车配件
深度网络
两级备件决策
vit模型
BiLSTM模型
组套索正则化
-
Keywords
auto parts
deep network
two-level spare parts decision
vision transformer model
bidirectional long short term memory model
group lasso regularization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-