基于帧结构的语音对抗样本重点区域扰动分析

Perturbation Analysis of the Vital Region in Speech Adversarial Example Based on Frame Structure

下载PDF

导出

摘要目前针对语音识别模型的对抗攻击主要是在整条语音上添加噪声,扰动范围大且引入了高频噪声.现有研究在一定程度上缩小了扰动范围,但由于语音对抗攻击需要在每帧添加扰动实现对转录结果的控制,限制了扰动范围的进一步降低.针对此问题,从帧结构的角度研究了语音识别系统中的特征提取流程,发现分帧和加窗处理决定了帧结构中重点区域的分布,即帧内各采样点上添加扰动的重要性受采样点所处位置的影响.首先,根据对输入特征的扰动分析结果进行区域划分;然后,为了量化这些采样点对求解对抗样本的重要性,提出了对抗样本空间度量方法和相应的评价指标,并设计了在帧内不同区间上添加扰动的交叉实验,进而确定了扰动添加的重点区域;最后,在多个模型上进行了广泛的实验,表明了在重点区域添加对抗扰动能够缩小扰动范围,为高质量语音对抗样本的生成提出新的角度. At present,adversarial attacks on speech recognition models have typically involved adding noise to the entire speech signal,resulting in a wide perturbation range and introducing high-frequency noise.Existing research has attempted to reduce the perturbation range by designing optimization targets.However,controlling the transcription result requires adding perturbations to each frame,thus limiting further reduction in perturbation range.To address this issue,we propose a novel approach that examines the feature extraction process of speech recognition systems from a frame structure perspective.The study finds that framing and windowing determine the distribution of critical regions within the frame structure.Specifically,the weight of adding perturbation to each sampling point within the frame is influenced by its location.Based on the results of perturbation analysis on input features,we partition regions with shared attributes.Then we propose the adversarial example space measurement method and evaluation index to quantify the weight of sampling points for adversarial examples generation.We conduct crossexperiments by adding perturbations at different intervals within the frame,which enables us to identify key regions for perturbation addition.Our experiments on multiple models demonstrate that adding adversarial perturbation to vital regions can narrow the perturbation range,and provide a new perspective for generating high-quality audio adversarial examples.

作者韩松莘郭松辉徐开勇杨博于淼 Han Songshen;Guo Songhui;Xu Kaiyong;Yang Bo;Yu Miao(Strategic Support Force Information Engineering University,Zhengzhou 450001;Henan Key Laboratory of Information Security(Strategic Support Force Information Engineering University),Zhengzhou 450001)

机构地区战略支援部队信息工程大学河南省信息安全重点实验室(战略支援部队信息工程大学)

出处《计算机研究与发展》 EI CSCD 北大核心 2024年第3期685-700,共16页 Journal of Computer Research and Development

基金国家自然科学基金项目(62176265)。

关键词语音识别对抗攻击输入特征扰动分析对抗样本空间度量 speech recognition adversarial attack input feature perturbation analysis adversarial example space metric

分类号 TP309 [自动化与计算机技术—计算机系统结构] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1张万里,陈越,杨奎武,张田,胡学先.一种局部遮挡人脸识别的对抗样本生成方法[J].计算机研究与发展,2023,60(9):2067-2079. 被引量：2
2沈轶杰,李良澄,刘子威,刘天天,罗浩,沈汀,林峰,任奎.基于单“音频像素”扰动的说话人识别隐蔽攻击[J].计算机研究与发展,2021,58(11):2350-2363. 被引量：2
3魏春雨,孙蒙,邹霞,张雄伟.语音对抗样本的攻击与防御综述[J].信息安全学报,2022,7(1):100-113. 被引量：2

二级参考文献6

1刘波,王凌,金以慧.差分进化算法研究进展[J].控制与决策,2007,22(7):721-729. 被引量：291
2王涛,王国中,朱林林.一种基于声纹识别的智能门锁系统设计与实现[J].电子测量技术,2019,42(3):107-111. 被引量：9
3魏莲芳.基于“互联网+”的声纹识别技术在刑事案件侦破中的应用研究[J].现代电子技术,2020,43(7):34-38. 被引量：7
4束鑫,唐慧,杨习贝,宋晓宁,吴小俊.基于差分量化局部二值模式的人脸反欺诈算法研究[J].计算机研究与发展,2020,57(7):1508-1521. 被引量：7
5苗晓孔,孙蒙,张雄伟,李嘉康,张星昱.基于参数转换的语音深度伪造及其对声纹认证的威胁评估[J].信息安全学报,2020,5(6):53-59. 被引量：4
6张田,杨奎武,魏江宏,刘扬,宁原隆.面向图像数据的对抗样本检测与防御技术综述[J].计算机研究与发展,2022,59(6):1315-1328. 被引量：10

共引文献3

1李前,蔺琛皓,杨雨龙,沈超,方黎明.云边端全场景下深度学习模型对抗攻击和防御[J].计算机研究与发展,2022,59(10):2109-2129. 被引量：8
2孙书魁,范菁,孙中强,曲金帅,代婷婷.基于深度学习的图像数据增强研究综述[J].计算机科学,2024,51(1):150-167. 被引量：8
3付锦燚,张自嘉,孙伟,邹凯鑫.改进YOLOv8的航拍图像小目标检测算法[J].计算机工程与应用,2024,60(6):100-109. 被引量：6

1熊昊,罗显康,黄玉莲.矩阵方程X-A^(*)(R+B^(*)XB)^(-t)A=Q的Hermite正定解及其扰动分析[J].内江师范学院学报,2024,39(2):37-43.
2张文宇,彭舒凡,叶乃夫.综合多尺度的重点人多维空间数据关联分析[J].地理空间信息,2023,21(12):14-20.
3黄娟.基于SpringBoot和Vue.js的医院数据提取管理平台的设计与实现[J].信息与电脑,2023,35(22):91-93. 被引量：2
4王雁峰,王竞楷,张博威.永智煤矿迎采巷道支护研究与应用[J].煤,2024,33(3):18-21.
5刘健宇,黎琴,贺隽,董侨,李睿琦,王思可.基于RANSAC算法与滑动窗口的路面点云裂缝特征提取方法[J].公路,2023,68(11):325-332.
6黄云,董天宇.电力人工智能指标算法模型多场景鲁棒性评价方法[J].吉林大学学报（信息科学版）,2024,42(1):162-167.
7王海春,雷东记,代振华,覃杰.机械扩孔煤体增透应力变化规律研究[J].煤矿安全,2024,55(1):28-33.

计算机研究与发展

2024年第3期

浏览历史

内容加载中请稍等...

基于帧结构的语音对抗样本重点区域扰动分析

参考文献3

二级参考文献6

共引文献3

相关作者

相关机构

相关主题

浏览历史