基于增强Swin Transformer的深度伪造人脸检测

Deepfake face detection based on enhanced Swin Transformer

下载PDF

导出

摘要针对传统卷积神经网络感受野的大小受限和特征交互学习能力弱,基于卷积神经网络的伪造人脸检测技术提取到的特征相对单一的问题,提出了基于增强Swin Transformer的深度伪造人脸检测方法,引入了局部多头自注意力和全局多头自注意力机制,结合了Swin Transformer的优势,能够有效地捕获图像上下文信息和视频时序关系,具有较强的全局感受野和长距离依赖建模能力。在DFDC数据集的实验结果表明,该方法优于基线方法,具有较好的深度伪造人脸检测能力。 Addressing the issues of limited receptive field size and weak feature interaction learning capabilities in traditional convolutional neural networks,resulting in relatively singular feature extraction in conventional convolutional neural network‑based deepfake face detection techniques,a deepfake face detection method based on enhanced Swin Transformer is proposed in this pa‑per.This method introduces local multi‑head self‑attention and global multi‑head self‑attention mechanisms,leveraging the strengths of Swin Transformer to effectively capture image context information and video temporal relationships,with strong global receptive fields and long‑distance dependency modeling capabilities.Experimental results on the DFDC dataset demonstrate that our approach outperforms baseline methods,exhibiting superior deepfake face detection capabilities.

作者李杏清王志兵杨恺 Li Xingqing;Wang Zhibing;Yang Kai(College of Information Engineering,Guangdong Innovative Technical College,Dongguan 523960,China;School of Electronic Information,Dongguan Polytechnic,Dongguan 523808,China;School of Architecture,Dongguan Polytechnic,Dongguan 523808,China)

机构地区广东创新科技职业学院信息工程学院东莞职业技术学院电子信息学院东莞职业技术学院建筑学院

出处《现代计算机》 2024年第14期26-30,58,共6页 Modern Computer

基金广东省教育厅2022年度普通高校科研平台特色创新类项目(2022KTSCX385) 广东省教育厅2023年度普通高校科研平台特色创新类项目(2023KTSCX356) 2022年东莞市社会发展科技面上项目(20221800903482) 东莞职业技术学院科研基金资助项目(2022a01)。

关键词增强Swin Transformer 伪造人脸检测音视频分解一致性分析特征融合 enhanced Swin Transformer deepfake face detection audiovisual decomposition consistency analysis feature fusion

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1胡永健,卓思超,刘琲贝,†王宇飞,李纪成.基于多尺度时空特征和篡改概率改善换脸检测的跨库性能[J].华南理工大学学报（自然科学版）,2024,52(6):110-119.
2陈傲然,黄海,朱玥琰,薛俊笙.复杂端到端场景的跨视觉域目标检测算法[J].北京邮电大学学报,2024,47(4):57-62.
3徐敏靖,范永胜,桑彬彬,苏谦.基于多尺度扩张注意力的Styleformer汽车造型设计[J].新疆大学学报（自然科学版中英文）,2024,41(5):591-598.
4赵欣,李森,李智生.基于CNN和Transformer并行编码的腹部多器官图像分割[J].吉林大学学报（理学版）,2024,62(5):1145-1154.
5王友卫,王炜琦,凤丽洲,朱建明,李洋.基于广度-深度采样和图卷积网络的谣言检测方法[J].浙江大学学报（工学版）,2024,58(10):2040-2052.
6戎妍,刘嘉雯,李馨蕾.面向学生课堂情感计算的自适应混合网络[J].计算机应用,2024,44(9):2919-2930.
7焦鹏飞,吴子安,刘欢,张纪林,万健.基于多视图对比学习的动态图链接预测方法[J].南京大学学报（自然科学版）,2024,60(3):383-395.
8杨炳乾,冯秀芳,董云云,张源榕.结合CNN和Transformer病变信号引导的蜂窝肺CT图像识别[J].激光与光电子学进展,2024,61(14):447-456. 被引量：1

现代计算机

2024年第14期

浏览历史

内容加载中请稍等...

基于增强Swin Transformer的深度伪造人脸检测

相关作者

相关机构

相关主题

浏览历史