Gap-K%: 一种检测大型语言模型预训练数据的新方法

research #llm 🔬 Research|分析: 2026年1月29日 05:02•

发布: 2026年1月29日 05:00

•

1分で読める

分析

这项研究提出了一种开创性的方法 Gap-K%，用于识别生成式人工智能大型语言模型 (LLM) 中使用的预训练数据。这种创新方法利用了模型的前 1 预测与目标标记之间的对数概率差距，从而在数据检测方面实现了最先进的性能。

引用 / 来源

"在这项工作中，我们提出了 Gap-K%，一种基于 LLM 预训练的优化动态的新型预训练数据检测方法。"

ArXiv ML2026年1月29日 05:00

* 根据版权法第32条进行合法引用。

Revolutionizing LLM-Driven Control: Counterfactual Reasoning Unveiled

Decentralized Federated Learning Revolutionizes Computer Vision with Enhanced Efficiency