#测试结果

AgentBench入门学习资料汇总 - 首个系统评估LLM作为Agent的基准测试

2 个月前
Cover of AgentBench入门学习资料汇总 - 首个系统评估LLM作为Agent的基准测试

AgentBench: 评估大语言模型作为智能体的全面基准测试

3 个月前
Cover of AgentBench: 评估大语言模型作为智能体的全面基准测试