Wordllama:用于LLM令牌嵌入的轻量级实用程序

Research#llm👥 Community|分析: 2026年1月3日 08:53
发布: 2024年9月15日 03:25
2分で読める
Hacker News

分析

Wordllama是一个使用LLM令牌嵌入进行语义字符串操作的库。它优先考虑速度、轻量级和易用性,针对CPU平台,并避免依赖PyTorch等深度学习运行时。该库的核心涉及平均池化的令牌嵌入,使用多重负排名损失和俄罗斯套娃表示学习等技术进行训练。虽然不如完整的Transformer模型强大,但与词嵌入模型相比,它表现良好,并提供更小的尺寸和更快的推理速度。其重点是提供一个实用的工具,用于输入准备、信息检索和评估等任务,降低了使用LLM嵌入的门槛。
引用 / 来源
查看原文
"The model is simply token embeddings that are average pooled... While the results are not impressive compared to transformer models, they perform well on MTEB benchmarks compared to word embedding models (which they are most similar to), while being much smaller in size (smallest model, 32k vocab, 64-dim is only 4MB)."
H
Hacker News2024年9月15日 03:25
* 根据版权法第32条进行合法引用。