#评估系统
Latitude - 团队协作的开源LLM开发平台
AI工具提示工程LLM协作平台可观察性评估系统
Latitude是一个开源的大语言模型(LLM)开发平台,为AI开发团队提供协作环境以构建、测试和部署智能功能。平台集成了提示管理系统、自动化监控和评估工具,支持创建和迭代提示、代码集成、性能监控等。其特色功能包括版本控制、参数化提示和链式操作,有助于高效开发和维护LLM应用。无论是初创公司还是大型企业的AI团队,都能借助Latitude快速构建、优化和扩展基于LLM的创新解决方案。
CRUD_RAG - 全面评估中文检索增强生成系统的基准测试
CRUD-RAG中文基准测试检索增强生成大语言模型评估系统Github开源项目
CRUD_RAG是一个全面的中文检索增强生成(RAG)系统评估基准。该项目包含36166个测试样本,覆盖CRUD操作,支持多种评估指标。CRUD_RAG提供原生中文数据集、评估任务和基线模型,并具备一键式评估功能。这一工具可助力研究人员和开发者全面评估和优化中文RAG系统性能,推动中文自然语言处理技术的进步。