热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#动态评估
MixEval - 动态更新的大语言模型评测基准
MixEval
LLM评估
基准测试
动态评估
模型排名
Github
开源项目
MixEval是一个动态更新的大语言模型评测基准,结合现有基准和真实用户查询构建而成。该基准在保持高准确度的同时,实现了快速、低成本和可重复的评测。MixEval提供更全面、公平的查询分布,并通过定期更新机制避免数据污染。作为一个高效可靠的评测工具,MixEval适用于各类大语言模型研究和应用场景。
1
1
相关文章
MixEval: 革新大语言模型评估的动态基准
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号