热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#技能集
FLASK - 细粒度语言模型评估框架
Github
开源项目
语言模型评估
对齐评估
FLASK
技能集
细粒度分析
FLASK是一个开源的语言模型评估框架,采用细粒度的实例级技能集作为评估指标。该框架提供任务无关的评估协议,包含模型推理、GPT-4评估和结果分析功能。FLASK还具备自动元数据标注能力,可标注领域、技能集和难度级别。项目包含详细使用说明和在线演示,为语言模型评估提供全面解决方案。
1
1
相关文章
Flask: 轻量级的Python Web框架
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号