#EasyJailbreak

EasyJailbreak: 一个用于生成对抗性越狱提示的统一框架

3 个月前

EasyJailbreak AI对抗大语言模型安全研究 Python框架 Github 开源项目

3 个月前

相关项目

EasyJailbreak

EasyJailbreak是一个针对大语言模型安全研究的Python框架,将越狱攻击过程分解为可迭代步骤。框架提供多种选择器、变异器、约束和评估器组件,构建了越狱攻击实验平台。项目包含11种攻击方法在10种大语言模型上的结果,并提供API文档。研究人员可使用现有方法或添加新组件进行实验,便于大语言模型安全研究。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com