热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#自动可解释性
transformer-debugger - 深入洞察小型语言模型行为的自动化调试工具
Github
开源项目
语言模型
稀疏自编码器
Transformer Debugger
自动可解释性
神经元查看器
Transformer Debugger是一款由OpenAI超级对齐团队开发的工具,专门用于分析小型语言模型的特定行为。该工具结合了自动化解释技术和稀疏自编码器,无需编写代码即可快速探索模型行为。它能识别影响特定行为的关键组件,自动生成解释,并追踪组件间的连接,从而揭示神经元回路。通过支持对前向传播的干预和观察,Transformer Debugger为研究人员提供了深入分析语言模型内部机制的强大功能。
1
1
相关文章
Transformer Debugger: 探索和理解大型语言模型内部机制的强大工具
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号