Skip to content

拓展阅读

读完本书之后,如果还想进一步学习大模型及训练相关知识,笔者推荐以下文献,其中的 arXiv 文献在「幻觉翻译」上都有收录:

  • Foundations of Large Language Models ^2501.09223,一本大模型基础知识书,内容比较新。
  • 大规模语言模型:从理论到实践 ^intro-llm,全面介绍了大模型领域的相关基础知识。
  • Reinforcement Learning: An Overview ^2412.05265,强化学习基础知识。
  • Alice's Adventures in a Differentiable Wonderland ^2404.17625,神经网络基础知识。
  • Neural Networks from Scratch in Python ^nnfs,使用 Python 实现神经网络。
  • The Ultra-Scale Playbook: Training LLMs on GPU Clusters ^Ultra-Scale,覆盖了大规模模型训练所需的知识。
  • A Survey of LLM x DATA ^2505.18458,一篇关于大模型数据相关的综述,数据是大模型训练和微调的核心。