热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#T-Eval
T-Eval: 评估大型语言模型工具使用能力的创新方法
2 个月前
T-Eval是一个创新的评估框架,旨在逐步评估大型语言模型的工具使用能力。它将工具使用能力分解为多个子过程,提供了一种全面而细致的评估方法,为大型语言模型的能力分析提供了新的视角。
T-Eval
大语言模型
工具使用能力
评估
基准测试
Github
开源项目
2 个月前
相关项目
T-Eval
T-Eval是一个评估大语言模型工具使用能力的基准测试框架。它将评估过程分解为指令遵循、规划、推理、检索、理解和审查等多个子过程,实现了细粒度分析。该项目提供英文和中文评测数据集、测试脚本和排行榜。T-Eval为研究人员和开发者提供了一个深入分析语言模型工具使用能力的新方法。
查看
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号