Microsoft が LLM セキュリティスキャナーを発表、隠れたバックドアを検出する力をユーザーに提供
分析
Microsoft の画期的な研究は、オープンソースの大規模言語モデル (LLM) に潜む「スリーパーエージェント」を検出する無料のセキュリティスキャナーを紹介します。この革新的なツールにより、ユーザーは LLM の安全性を検証し、特定のプロンプトによってトリガーされる可能性のある悪意のある動作から保護できます。この積極的な対策は、オープンソース AI の安全性と信頼性を強化します。