llvm-test-suite

LLVM测试套件提升编译器性能与稳定性

LLVM test-suite是一个开源的综合测试框架，专为LLVM编译器基础设施设计。它提供大量测试用例，评估编译器性能、优化能力和稳定性。开发者可利用此套件验证LLVM功能，确保代码质量，并进行跨平台性能比较。通过持续集成和自动化测试，test-suite有效支持LLVM项目的可靠性和效率。

Github

文档

介绍相关项目

oss-fuzz-gen - 使用AI生成并评估C/C++项目的模糊测试目标

C/C++GithubLLMOSS-Fuzz代码覆盖率开源项目漏洞检测

该框架利用大型语言模型生成并评估真实世界的C/C++项目的模糊测试目标，并通过OSS-Fuzz平台进行基准测试。支持的模型包括OpenAI GPT系列和Gemini系列。评估指标涵盖可编译性、运行时崩溃、运行时覆盖率和与现有人类编写目标的差异。最新实验显示，生成的模糊测试目标显著提升了代码覆盖率，并发现了多项新漏洞。详细使用指南和合作信息，请参见项目页面。

llmperf-leaderboard - LLM推理服务性能基准测试与比较

GithubLLMPerfLLM推理提供商吞吐量响应时间开源项目性能基准测试

LLMPerf Leaderboard 项目对多家LLM推理服务进行性能评测，主要衡量输出令牌吞吐量和首个令牌响应时间(TTFT)。测试涵盖Llama-2系列的7B、13B和70B聊天模型，为开发者提供客观透明的性能数据和可复现的测试方法，有助于选择合适的LLM服务。

testpilot - 基于 LLM 的 JavaScript/TypeScript 单元测试生成工具

GithubLLMTestPilotnpm包单元测试开源项目自动生成

TestPilot 是一个开源项目，利用大型语言模型为 JavaScript/TypeScript npm 包自动生成单元测试。该工具通过向 LLM 提供函数信息来生成测试骨架，并将结果转换为可执行的单元测试。TestPilot 无需额外训练或强化学习，为测试生成领域提供了新的研究方向。目前主要用于学术研究和技术探索，而非日常开发使用。

llmperf - 开源工具评估大语言模型API性能

API测试GithubLLMLLMPerfRay开源项目性能评估

LLMPerf是一个评估大语言模型API性能的开源工具。它通过负载测试和正确性测试来衡量模型的响应延迟、生成吞吐量和输出准确性。该工具支持OpenAI、Anthropic、TogetherAI等主流LLM API,并可扩展适配新API。LLMPerf采用Ray框架处理并发请求,能够模拟实际负载环境。开发者和研究人员可利用LLMPerf便捷地评估和对比不同LLM API的性能表现。

promptfoo - 本地LLM应用测试与评估工具

GithubLLM应用promptfoo基准测试开源项目测试驱动开发自动化红队

提供专业工具集，专为本地测试、评估及红队操作LLM应用设计。支持多种模型和API，确保应用安全可靠，提升评估效率并自动评分输出。适用于CLI、库和CI/CD环境，支持OpenAI、Anthropic等API，完全开源且本地运行，保障数据隐私。

LLMBox - 全面的大型语言模型训练与评估框架

GithubLLMBox大语言模型开源项目模型评估训练管道高效推理

LLMBox是一个综合性大型语言模型(LLM)库，集成了统一的训练流程和全面的模型评估功能。该框架旨在提供LLM训练和应用的完整解决方案，其设计注重实用性，在训练和使用过程中体现出高度的灵活性和效率。LLMBox支持多样化的训练策略和数据集，提供丰富的评估方法，并具备高效的推理和量化能力，为LLM的研究和开发提供了强大支持。

gcc - 多语言支持的GNU开源编译器集合

GCCGNU编译器集合Github免费软件开源项目源代码版权信息

GNU Compiler Collection (GCC) 是一套开源编译器集合，支持多种编程语言。GCC提供完整的编译工具链，用于开发跨平台软件。它以代码优化能力和广泛的平台兼容性著称，为开发者提供可靠的编译工具。作为自由软件，GCC允许自由使用、修改和分发，推动了开源社区的发展。

fuzz4all - 大语言模型驱动的通用模糊测试框架

Fuzz4AllGithubLLM开源项目模糊测试自动提示软件测试

Fuzz4All是一个基于大语言模型的通用模糊测试框架。它利用LLMs生成和变异多样化的测试输入，适用于各种编程语言。该项目创新性地引入自动提示技术和LLM驱动的模糊测试循环，实现了针对多种语言和特性的通用测试。Fuzz4All支持自动生成任意输入，提供灵活的配置选项和详细的输出分析，为软件测试和安全研究领域提供了有力支持。

uptrain - 开源平台评估优化LLM应用

GithubLLM应用UpTrain开源平台开源项目改进评估

UpTrain是一个专注于评估和优化大型语言模型(LLM)应用的开源平台。它提供全面的工具和功能,用于衡量LLM应用性能、识别问题并持续改进。该平台支持自动化评估、错误分析和性能跟踪,有助于提高LLM应用的质量和可靠性。UpTrain提供多种评估指标和定制选项,适用于各种LLM应用场景。

sonar-cxx - SonarQube C++插件，集成多种代码分析和测试工具

C++GithubSonarQube代码质量开源插件开源项目静态分析

sonar-cxx是一个开源的SonarQube C++插件，旨在集成现有的C++分析工具。该插件支持从C++03到C++20的语法解析，兼容多种编译器扩展，并提供静态和动态代码分析功能。它支持多种测试框架和覆盖率报告工具，允许自定义规则和集成第三方工具。sonar-cxx适用于Windows和Linux环境，为C++项目提供全面的代码质量管理解决方案。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com