#SafetyBench

Safety-Prompts学习资料汇总 - 中文大模型安全性评估与提升工具

2 个月前

2 个月前

3 个月前

3 个月前

相关项目

Safety-Prompts

Safety-Prompts项目提供用于评测和提升中文大语言模型安全性的prompts，确保模型输出与人类价值观一致。项目包含10万条安全场景prompts和ChatGPT回复，涵盖各类安全场景和指令攻击，并提供多选题评测平台，适用于训练和微调更安全的模型，帮助研究人员评估大模型安全性。

投诉举报邮箱: service@vectorlightyear.com