Ask HN: ChatGPT 如何工作?
分析
这篇文章是 Hacker News 上的一个提问,寻求对熟悉人工神经网络 (ANN) 但不熟悉 Transformer 的人解释 ChatGPT 的内部工作原理。它还询问了 ChatGPT 性能优越的原因以及其知识库的规模。
要点
引用 / 来源
查看原文"I'd love a recap of the tech for someone that remembers how ANNs work but not transformers (ELI5?). Why is ChatGPT so much better, too? and how big of a weight network are we talking about that it retains such a diverse knowledge on things?"