结合最优种子数确定和基于SCE的数据增强的逻辑访问攻击检测研究

作者

  • Jichen Yang Guangdong Polytechnic Normal University 作者
  • Jiawei Wu Guangdong Polytechnic Normal University 作者
  • Wen He Guangdong Polytechnic Normal University 作者
  • Zili Gao Zhuhai Fudan Innovation Institute 作者

DOI:

https://doi.org/10.70695/skknxc45

摘要

近期在语音转换和文本到语音技术的进步使得能够产生听起来自然的语音,这对自动说话人验证系统(ASV)构成了挑战。为了应对这一挑战,研究界加强了对欺骗对策的研究,以保护ASV系统不受这些威胁的影响。尽管先进的欺骗对策能够检测已知类型的欺骗攻击,但在训练集中未出现的未知攻击面前,它们的有效性会降低。在这项工作中,为了解决确定最佳基线和最佳种子数的挑战,并确保我们和其他人能够轻松地复制并可能增强结果,我们提出了一种确定最佳种子数的方法。在最佳基线的基础上,我们提出了一种名为SCE的新型数据增强技术,该技术基于信号压缩和扩展。具体来说,信号压缩采用a-law和μ-law算法,而信号扩展则利用原始训练集的24位和32位变体。我们认为,我们提出的方法通过SCE数据增强增强了检测系统的鲁棒性。我们的研究利用ASVspoof 2019逻辑访问语料库,并采用基于ResNet的系统。结果表明,SCE技术超过了许多领先单一系统的性能,展示了其在应对攻击不可预测性方面的强大能力。值得注意的是,其t-DCF和EER指标分别达到了0.050和1.60%,这可以排名至今为止的前几名系统。

已发布

2024-12-31

如何引用

Yang, J., Wu, J., He, W., & Gao, Z. (2024). 结合最优种子数确定和基于SCE的数据增强的逻辑访问攻击检测研究. 人工智能应用创新, 1(4), 54-69. https://doi.org/10.70695/skknxc45