プログラミング言語ファミリーの解明:コードLLMを強化
分析
本研究は、多言語コードの大規模言語モデル(LLM)のトレーニングとパフォーマンスを向上させるために、プログラミング言語間の根本的な関係性を探求しています。言語的特徴を分析し、埋め込みを作成することにより、研究は言語ファミリーを特定し、これらの洞察を活用してLLMトレーニング戦略を最適化し、大幅なパフォーマンス向上を実現します。
重要ポイント
引用・出典
原文を見る"Building on the uncovered language families, we propose three strategies to enhance multilingual LLM training: transfer learning across linguistically related languages, linguistic proximity-guided curriculum learning, and centroid-based intermediary code translation."