Propella-1:多语言赋能,LLM数据策展新时代!research#llm🔬 Research|分析: 2026年2月16日 05:02•发布: 2026年2月16日 05:00•1分で読める•ArXiv NLP分析Propella-1 引入了一种新颖的 LLM 预训练数据策展方法,超越了单一评分评估。 这项创新实现了更灵活的过滤,并提供了对预训练数据集组成的更深入的见解。要点•Propella-1 使用小型多语言 大语言模型 (LLM)。•它跨越 18 个属性注释文档,提供详细的见解。•所有模型和注释均在宽松许可下提供。引用 / 来源查看原文"我们推出了 propella-1,这是一个小型多语言 LLM 系列(0.6B、1.7B、4B 参数),可在 18 个属性(分为六个类别)上注释文本文档..."AArXiv NLP2026年2月16日 05:00* 根据版权法第32条进行合法引用。较旧MLLMs: A New Era of AI Intelligence较新Groundbreaking Algorithm Ushers in New Era for Truncated Linear Regression相关分析research革新AI评估:为多轮智能体模拟真实用户2026年4月2日 18:00research麻省理工学院研究:人工智能对就业的影响将是上升的浪潮,而非崩溃的巨浪!2026年4月2日 18:00research在“无GPU”笔记本电脑上使用 LLM 构建本地 AI 智能体2026年4月2日 08:15来源: ArXiv NLP