针对音频语言模型的通用目标攻击

Research Paper#Adversarial Attacks, Audio-Language Models, Security🔬 Research|分析: 2026年1月3日 16:56
发布: 2025年12月29日 21:56
1分で読める
ArXiv

分析

本文揭示了音频语言模型中的一个关键漏洞,特别是在编码器层面。它提出了一种新颖的攻击方法,该方法是通用的(适用于不同的输入和说话者)、有针对性的(实现特定输出)并且在潜在空间中运行(操纵内部表示)。这很重要,因为它突出了一个以前未被探索的攻击面,并证明了对抗性攻击可能损害这些多模态系统的完整性。 专注于编码器而不是更复杂的语言模型简化了攻击,使其更具实用性。
引用 / 来源
查看原文
"The paper demonstrates consistently high attack success rates with minimal perceptual distortion, revealing a critical and previously underexplored attack surface at the encoder level of multimodal systems."
A
ArXiv2025年12月29日 21:56
* 根据版权法第32条进行合法引用。