research#llm🔬 Research分析: 2026年1月29日 05:02

Gap-K%: 一种检测大型语言模型预训练数据的新方法

发布:2026年1月29日 05:00
1分で読める
ArXiv ML

分析

这项研究提出了一种开创性的方法 Gap-K%,用于识别生成式人工智能大型语言模型 (LLM) 中使用的预训练数据。这种创新方法利用了模型的前 1 预测与目标标记之间的对数概率差距,从而在数据检测方面实现了最先进的性能。

引用 / 来源
查看原文
"在这项工作中,我们提出了 Gap-K%,一种基于 LLM 预训练的优化动态的新型预训练数据检测方法。"
A
ArXiv ML2026年1月29日 05:00
* 根据版权法第32条进行合法引用。