#InfiniteBench

InfiniteBench: 突破100K令牌的长上下文评估基准

3 个月前

InfiniteBench 长文本评估语言模型基准测试人工智能 Github 开源项目

3 个月前

相关项目

InfiniteBench

InfiniteBench是一个专门评测语言模型超长文本处理能力的基准工具。它设计了12个涵盖真实和合成场景的任务，用于测试模型在10万词以上上下文中的理解和推理能力。该基准不仅有助于推动语言模型技术进步，还为改进LLM应用提供了重要参考。InfiniteBench的多样性和专业性使其成为评估长文本处理能力的有效工具。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com