#AI测试

DeepEval: 开源LLM评估框架的全面解析

3 个月前

DeepEval LLM评估开源框架 AI测试指标评估 Github 开源项目

3 个月前

相关项目

deepeval

DeepEval是一款开源的大型语言模型(LLM)输出评估框架。它提供G-Eval、幻觉检测和答案相关性等多种评估指标，支持本地运行。该框架适用于RAG和微调应用，可与LangChain和LlamaIndex等工具集成。DeepEval具备批量评估、自定义指标创建功能，易于集成到CI/CD环境。此外，它还支持对主流LLM基准进行简易评估，并可与Confident AI平台对接，实现持续评估和结果分析。

testRigor

testRigor是一款基于AI的测试自动化平台,支持用户以自然语言创建端到端UI测试。无需编程技能即可大幅提升测试效率和覆盖率,同时减少维护工作。该平台支持Web、移动和桌面应用测试,并可集成多种开发工具。testRigor从用户视角模拟真实交互,有效提高软件质量和交付速度。

Autify

Autify专注于AI驱动的软件测试自动化，提供Zenes和Autify NoCode两款核心产品。Zenes通过AI简化测试创建，Autify NoCode使非专业人士也能进行自动化端到端测试。这些解决方案旨在提高测试效率，加快软件发布速度，并维护应用稳定性。Autify在自动化测试领域引入创新技术，获得多家知名企业的信赖与采用。

Octomind

Octomind为web应用提供AI驱动的自动化端到端测试服务。该平台能自动发现、生成和执行Playwright测试用例，支持并行运行和高性能托管。无需访问源代码，可与主流CI/CD管道集成，有效提升测试效率并降低维护成本。

TestSprite Beta

TestSprite Beta是一款智能软件测试平台，能够自动生成测试计划、实现集成和端到端测试、执行测试用例并进行调试。该平台支持移动和网络应用以及SDK产品的测试，帮助开发团队加快测试过程，提高效率。通过自动化测试流程，TestSprite Beta为用户提供了一个高效、便捷的测试解决方案，无需额外雇佣测试工程师。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com