第0章：基础知识

本页的内容涵盖了课程的前五天。它可以被视为完成本课程更高级部分（如强化学习、转换器、机制可解释性、大规模训练和生成模型）所需的所有基础知识。

本章的一些亮点包括：

第1章：转换器可解释性

本页的内容涵盖了转换器（它们是什么，如何训练，如何用于生成输出）以及机制可解释性（它是什么，目前该领域最重要的一些结果，为什么它可能对对齐很重要）和其他与可解释性相关的主题（功能向量和模型引导）。

本章的一些亮点包括：

与第一章不同（其中所有材料都是必修的），本章除了前两个练习集外，所有部分都是可选的扩展。在前两个练习集中，你将构建和训练转换器，并获得对转换器模型机制可解释性的基本理解，包括归纳头和使用TransformerLens。之后，你可以选择其他六个练习集中的任何一个 - 没有先决条件！

如果你已经完成了必修材料，正在选择其他六个练习集，我们建议选择前三个中的一个（IOI、叠加和功能向量）。IOI适合实验主义者，叠加适合理论家/数学家，功能向量适合工程师，所以每个人都能找到适合自己的内容！

此外，每个可选的练习集在完成后都包括大量建议的额外材料/进一步探索，包括建议阅读和复现的论文。

强化学习是机器学习的一个重要领域。它通过教导代理在环境中采取行动以最大化累积奖励来工作。

在本章中，你将学习RL的一些基础知识，并使用OpenAI的Gym环境来进行自己的实验。

本章的一些亮点包括：

此外，后面的练习集包括大量建议的额外材料/进一步探索，包括建议阅读和复现的论文。