拓展阅读

读完本书之后，如果还想进一步学习大模型及训练相关知识，笔者推荐以下文献，其中的 arXiv 文献在「幻觉翻译」上都有收录：

Foundations of Large Language Models ^2501.09223，一本大模型基础知识书，内容比较新。
大规模语言模型：从理论到实践 ^intro-llm，全面介绍了大模型领域的相关基础知识。
Reinforcement Learning: An Overview ^2412.05265，强化学习基础知识。
Alice's Adventures in a Differentiable Wonderland ^2404.17625，神经网络基础知识。
Neural Networks from Scratch in Python ^nnfs，使用 Python 实现神经网络。
The Ultra-Scale Playbook: Training LLMs on GPU Clusters ^Ultra-Scale，覆盖了大规模模型训练所需的知识。
A Survey of LLM x DATA ^2505.18458，一篇关于大模型数据相关的综述，数据是大模型训练和微调的核心。

拓展阅读 ​