克服灾难性遗忘:LLM微调的新方法
分析
这项研究深入探讨了生成式人工智能中灾难性遗忘的关键挑战,展示了对各种大语言模型微调技术的创新实验。 对 EWC、经验回放和知识蒸馏等方法的探索,为持续努力增强 LLM 在多个领域的性能提供了宝贵的见解。
要点
引用 / 来源
查看原文"实际问题:你在 Mistral-7B 上微调医疗 QA。 这很棒。 然后你对法律数据进行微调。 现在它无法再回答医疗问题了。 这是灾难性遗忘——自 1989 年以来就已为人所知,至今未在生产中得到解决。"
"实际问题:你在 Mistral-7B 上微调医疗 QA。 这很棒。 然后你对法律数据进行微调。 现在它无法再回答医疗问题了。 这是灾难性遗忘——自 1989 年以来就已为人所知,至今未在生产中得到解决。"