热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#JailbreakBench
jailbreakbench - 大语言模型越狱攻防能力评估基准
JailbreakBench
语言模型
基准测试
安全性
AI伦理
Github
开源项目
JailbreakBench是一个评估大语言模型越狱攻防能力的开源基准。它包含JBB-Behaviors数据集、官方排行榜和越狱字符串存储库,全面追踪越狱攻击和防御进展。研究人员可利用JailbreakBench加载越狱字符串、访问数据集、进行红队测试,以及提交新的攻击和防御方法。该项目为大语言模型安全研究提供了稳定的性能比较平台。
1
1
相关文章
JailbreakBench: 开放的大型语言模型越狱鲁棒性基准测试
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号