热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#LLM战斗
llm-colosseum - 通过街头霸王对决实时评估LLMs的AI战斗力
LLM战斗
Street Fighter III
实时对决
ELO排名
Mistral 7B
Github
开源项目
llm-colosseum利用街头霸王III平台让LLMs展开对战,评测它们的快速决策和策略适应。各模型根据表现获取ELO评分,通过模拟真实对战环境,探索不同LLM在实际竞技表现。项目创设新型基准测试,通过实战对比加深对LLM竞技性和响应智能的了解。
1
1
相关文章
llm-colosseum学习资料汇总 - 用街霸3对战评估LLM性能的创新方法
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号