#复杂推理能力

Chain-of-Thought Hub: 测量大语言模型的复杂推理能力

2 个月前

Cover of Chain-of-Thought Hub: 测量大语言模型的复杂推理能力

Chain-of-Thought Hub是一个开源的评估套件,用于测量大语言模型在多步推理任务上的能力。它通过链式思考提示技术来评估模型在数学、科学、符号推理等复杂任务上的表现。

复杂推理能力大语言模型 Chain-of-Thought LLM评估长文本处理 Github 开源项目

2 个月前

Cover of Chain-of-Thought Hub: 测量大语言模型的复杂推理能力

相关项目

Project Cover

chain-of-thought-hub

Chain-of-Thought Hub汇集了数学、科学、符号推理等多个领域的挑战性任务，旨在全面评估大型语言模型的复杂推理能力。该项目通过精选数据集和模型，为语言模型发展提供可靠参考。同时，它将链式思考提示工程视为新一代系统调用，为基于大型语言模型的应用生态系统发展奠定基础。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号