FineFreq:基于网络规模文本的多语言字符频率数据集

Research#NLP🔬 Research|分析: 2026年1月10日 12:18
发布: 2025年12月10日 14:49
1分で読める
ArXiv

分析

FineFreq的创建通过提供一个新颖的大型数据集,对NLP社区做出了宝贵的贡献。 这一资源特别适用于涉及字符级分析和多语言处理的任务。
引用 / 来源
查看原文
"FineFreq is a multilingual character frequency dataset derived from web-scale text."
A
ArXiv2025年12月10日 14:49
* 根据版权法第32条进行合法引用。