从零开始构建大语言模型 (LLM)：开源TypeScript的胜利

infrastructure #llm 📝 Blog|分析: 2026年4月18日 14:36•

发布: 2026年4月18日 14:06

•

1分で読める

•r/learnmachinelearning

分析

这是一个极好的草根工程展示，展现了对学习机器学习基础机制的专注。开发者不仅从零开始构建了一个大语言模型 (LLM)；他们还设计了一个高度优化的框架，该框架包含用于闪存注意力和AdamW优化器等操作的自定义CUDA内核。能够使用WebGPU直接从浏览器运行具有1200万参数的模型，这使得该项目对社区来说变得极其容易接触且令人兴奋。

关键要点

引用 / 来源

"我们决定在TypeScript中从零开始创建一个类似PyTorch的框架，然后用它训练了一个LLM。在这个过程中，我们意识到需要做更多的优化，并整合了Rust后端、CUDA和WebGPU支持。"

R

r/learnmachinelearning2026年4月18日 14:06

* 根据版权法第32条进行合法引用。

Practical Claude Code Subagents: Accelerating Development Through Parallel Task Processing

From Zero to Tech Builder: How AI Empowered a Novice to Build a Custom PC and 4 Apps

相关分析

极致的并行AI编程终端环境：tmux + workmux + sidekick.nvim 配置指南

2026年4月19日 21:10

谷歌与迈威尔科技合作，大幅提升下一代AI基础设施

2026年4月19日 13:52

解锁 Google AI 生态：突破计费防火墙，在 CLI 智能体中自由生成图像的终极指南

2026年4月19日 13:30

来源: r/learnmachinelearning