热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#复杂推理能力
Chain-of-Thought Hub: 测量大语言模型的复杂推理能力
2 个月前
Chain-of-Thought Hub是一个开源的评估套件,用于测量大语言模型在多步推理任务上的能力。它通过链式思考提示技术来评估模型在数学、科学、符号推理等复杂任务上的表现。
复杂推理能力
大语言模型
Chain-of-Thought
LLM评估
长文本处理
Github
开源项目
2 个月前
相关项目
chain-of-thought-hub
Chain-of-Thought Hub汇集了数学、科学、符号推理等多个领域的挑战性任务,旨在全面评估大型语言模型的复杂推理能力。该项目通过精选数据集和模型,为语言模型发展提供可靠参考。同时,它将链式思考提示工程视为新一代系统调用,为基于大型语言模型的应用生态系统发展奠定基础。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号