热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#长文本评估
InfiniteBench - 长文本语言模型评测基准 挑战10万词极限
InfiniteBench
长文本评估
语言模型
基准测试
人工智能
Github
开源项目
InfiniteBench是一个专门评测语言模型超长文本处理能力的基准工具。它设计了12个涵盖真实和合成场景的任务,用于测试模型在10万词以上上下文中的理解和推理能力。该基准不仅有助于推动语言模型技术进步,还为改进LLM应用提供了重要参考。InfiniteBench的多样性和专业性使其成为评估长文本处理能力的有效工具。
1
1
相关文章
InfiniteBench: 突破100K令牌的长上下文评估基准
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号