热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#RuLES
llm_rules - RuLES基准测试评估语言模型遵循规则能力
LLM
规则遵循
RuLES
语言模型评估
基准测试
Github
开源项目
RuLES是一个评估语言模型遵循规则能力的基准测试项目。它提供多种测试场景,如身份验证和问答。项目包括评估脚本、红队测试工具和测试用例可视化工具。研究人员可以评估不同语言模型遵循简单规则的表现,并计算RuLES得分。项目还包含GCG攻击和模型微调的相关代码与指南。
1
1
相关文章
大型语言模型能否学习和遵循规则?探索LLM规则学习的新前沿
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号