Safety#LLM Safety🔬 Research分析: 2026年1月10日 10:20

使用LLM作为评判者的安全指标评估

发布:2025年12月17日 17:24
1分で読める
ArXiv

分析

这项研究探索了一种评估 LLM 安全性的新方法。 使用 LLM 作为评判者为自动化安全评估提供了有趣的视角。

引用

该研究基于来自 ArXiv 的论文。