AdvJudge-Zero: 敵対的トークンによるLLM判断の操作

Research#LLM🔬 Research|分析: 2026年1月10日 09:41
公開: 2025年12月19日 09:22
1分で読める
ArXiv

分析

この研究は、敵対的制御トークンを使用してバイナリ判断を操作できることを示し、LLMの脆弱性を探求しています。信頼できる判断を必要とするアプリケーションにおけるLLMの信頼性にとって、これは重要な意味を持ちます。
引用・出典
原文を見る
"The study is sourced from ArXiv."
A
ArXiv2025年12月19日 09:22
* 著作権法第32条に基づく適法な引用です。