Propella-1:多语言赋能,LLM数据策展新时代!

research#llm🔬 Research|分析: 2026年2月16日 05:02
发布: 2026年2月16日 05:00
1分で読める
ArXiv NLP

分析

Propella-1 引入了一种新颖的 LLM 预训练数据策展方法,超越了单一评分评估。 这项创新实现了更灵活的过滤,并提供了对预训练数据集组成的更深入的见解。
引用 / 来源
查看原文
"我们推出了 propella-1,这是一个小型多语言 LLM 系列(0.6B、1.7B、4B 参数),可在 18 个属性(分为六个类别)上注释文本文档..."
A
ArXiv NLP2026年2月16日 05:00
* 根据版权法第32条进行合法引用。