日本語性能世界一の音声認識モデル「lilfugu」が誕生product#voice📝 Blog|分析: 2026年4月16日 08:08•公開: 2026年4月16日 07:55•1分で読める•Qiita AI分析Holo The Rapper氏は、日本語に特化した非常に優秀なオープンソースの音声認識モデル「lilfugu」を発表しました。Qwen3-ASR-1.7Bをファインチューニングして構築されたこのモデルは、他のローカルAI音声ツールを悩ませてきた技術用語や句読点の問題を見事に解決しています。この画期的なモデルにより、高速で自然な音声が読みやすさを保ったテキストにシームレスに文字起こしされ、そのままSlackに貼り付けたり、AIエージェントに渡したりすることが可能になります。重要ポイント•lilfuguは、Next.jsやVercelといった技術用語の正確なキャッチアップに加え、数字や句読点の適切なフォーマットにより、日本語の文字起こしを劇的に改善します。•既存のベンチマークでは日本語のテキスト正規化の真の品質を正確に反映できなかったため、作成者はADLIBという新しいベンチマークも開発しました。•このモデルは、自然で早口の音声を楽々と処理できるように設計されており、バイブコーディングやAIエージェントとのやり取りに理想的なツールとなっています。引用・出典原文を見る"ないなら作るか、ということでQwen3-ASR-1.7BというモデルをベースにLoRAでファインチューニングしました。できたのがlilfuguです。"QQiita AI2026年4月16日 07:55* 著作権法第32条に基づく適法な引用です。古い記事Stanford AI Index 2026: Why Mastering Fundamental Data Skills Remains a Game-Changer!新しい記事36Kr Launches 2026 'Most Watched' Enterprise List to Identify Top AI and Tech Innovators関連分析productAIの驚くべき進化:職場で繰り広げられる教育と共創の冒険2026年4月18日 08:30productClaude Code の Monitor ツール完全ガイド — バックグラウンドプロセスをリアルタイム監視する革新的な仕組み2026年4月18日 08:00productAIエージェントフレームワーク完全ガイド2026:CrewAI、LangGraph、AutoGen、Mastraの徹底比較2026年4月18日 07:30原文: Qiita AI