#对抗性提示

AdvPrompter:快速自适应对抗性提示方法提高大语言模型安全性

2 个月前
Cover of AdvPrompter:快速自适应对抗性提示方法提高大语言模型安全性

PromptBench: 一个统一的大语言模型评估框架

3 个月前
Cover of PromptBench: 一个统一的大语言模型评估框架