LLM学術レビューにおける多言語プロンプトインジェクション攻撃

公開:2025年12月29日 18:43
1分で読める
ArXiv

分析

この論文は、学術的な査読に利用されるLLMが、隠されたプロンプトインジェクション攻撃に対して脆弱であることを調査しています。これは、現実世界のアプリケーション(査読)を探求し、敵対的な攻撃がLLMの出力をどのように操作できるかを示しているため重要です。多言語の側面は、言語固有の脆弱性を明らかにし、さらなる複雑さを加えています。

参照

プロンプトインジェクションは、英語、日本語、中国語のインジェクションではレビューのスコアと採択/拒否の決定に大きな変化を引き起こしますが、アラビア語のインジェクションではほとんど影響がありません。