#自动解释性

自动化解释性:使用人工智能理解人工智能

3 个月前

3 个月前

相关项目

automated-interpretability

automated-interpretability项目开发了一套自动化工具，用于生成、模拟和评分语言模型中神经元行为的解释。该项目提供了代码库、神经元激活查看器和GPT-2 XL神经元的公开数据集。这些资源旨在帮助研究人员和开发者深入理解大型语言模型的内部机制。

投诉举报邮箱: service@vectorlightyear.com