#机械可解释性

SAELens:用于语言模型的稀疏自编码器训练与分析工具

2 个月前
Cover of SAELens:用于语言模型的稀疏自编码器训练与分析工具

TransformerLens: 揭开语言模型内部机制的强大工具

2 个月前
Cover of TransformerLens: 揭开语言模型内部机制的强大工具