Safety#LLM🔬 Research分析: 2026年1月10日 11:46

持续微调LLM中的持久后门攻击

发布:2025年12月12日 11:40
1分で読める
ArXiv

分析

这篇ArXiv论文突出了大型语言模型(LLM)中的一个关键漏洞。该研究侧重于即使在持续微调的情况下,后门攻击的持久性,强调需要强大的防御机制。

引用

该论文可能讨论了与后门攻击和持续微调相关的LLM中的漏洞。