Project Icon

llvm-test-suite

LLVM测试套件 提升编译器性能与稳定性

LLVM test-suite是一个开源的综合测试框架,专为LLVM编译器基础设施设计。它提供大量测试用例,评估编译器性能、优化能力和稳定性。开发者可利用此套件验证LLVM功能,确保代码质量,并进行跨平台性能比较。通过持续集成和自动化测试,test-suite有效支持LLVM项目的可靠性和效率。

oss-fuzz-gen - 使用AI生成并评估C/C++项目的模糊测试目标
C/C++GithubLLMOSS-Fuzz代码覆盖率开源项目漏洞检测
该框架利用大型语言模型生成并评估真实世界的C/C++项目的模糊测试目标,并通过OSS-Fuzz平台进行基准测试。支持的模型包括OpenAI GPT系列和Gemini系列。评估指标涵盖可编译性、运行时崩溃、运行时覆盖率和与现有人类编写目标的差异。最新实验显示,生成的模糊测试目标显著提升了代码覆盖率,并发现了多项新漏洞。详细使用指南和合作信息,请参见项目页面。
llmperf-leaderboard - LLM推理服务性能基准测试与比较
GithubLLMPerfLLM推理提供商吞吐量响应时间开源项目性能基准测试
LLMPerf Leaderboard 项目对多家LLM推理服务进行性能评测,主要衡量输出令牌吞吐量和首个令牌响应时间(TTFT)。测试涵盖Llama-2系列的7B、13B和70B聊天模型,为开发者提供客观透明的性能数据和可复现的测试方法,有助于选择合适的LLM服务。
testpilot - 基于 LLM 的 JavaScript/TypeScript 单元测试生成工具
GithubLLMTestPilotnpm包单元测试开源项目自动生成
TestPilot 是一个开源项目,利用大型语言模型为 JavaScript/TypeScript npm 包自动生成单元测试。该工具通过向 LLM 提供函数信息来生成测试骨架,并将结果转换为可执行的单元测试。TestPilot 无需额外训练或强化学习,为测试生成领域提供了新的研究方向。目前主要用于学术研究和技术探索,而非日常开发使用。
llmperf - 开源工具评估大语言模型API性能
API测试GithubLLMLLMPerfRay开源项目性能评估
LLMPerf是一个评估大语言模型API性能的开源工具。它通过负载测试和正确性测试来衡量模型的响应延迟、生成吞吐量和输出准确性。该工具支持OpenAI、Anthropic、TogetherAI等主流LLM API,并可扩展适配新API。LLMPerf采用Ray框架处理并发请求,能够模拟实际负载环境。开发者和研究人员可利用LLMPerf便捷地评估和对比不同LLM API的性能表现。
promptfoo - 本地LLM应用测试与评估工具
GithubLLM应用promptfoo基准测试开源项目测试驱动开发自动化红队
提供专业工具集,专为本地测试、评估及红队操作LLM应用设计。支持多种模型和API,确保应用安全可靠,提升评估效率并自动评分输出。适用于CLI、库和CI/CD环境,支持OpenAI、Anthropic等API,完全开源且本地运行,保障数据隐私。
LLMBox - 全面的大型语言模型训练与评估框架
GithubLLMBox大语言模型开源项目模型评估训练管道高效推理
LLMBox是一个综合性大型语言模型(LLM)库,集成了统一的训练流程和全面的模型评估功能。该框架旨在提供LLM训练和应用的完整解决方案,其设计注重实用性,在训练和使用过程中体现出高度的灵活性和效率。LLMBox支持多样化的训练策略和数据集,提供丰富的评估方法,并具备高效的推理和量化能力,为LLM的研究和开发提供了强大支持。
gcc - 多语言支持的GNU开源编译器集合
GCCGNU编译器集合Github免费软件开源项目源代码版权信息
GNU Compiler Collection (GCC) 是一套开源编译器集合,支持多种编程语言。GCC提供完整的编译工具链,用于开发跨平台软件。它以代码优化能力和广泛的平台兼容性著称,为开发者提供可靠的编译工具。作为自由软件,GCC允许自由使用、修改和分发,推动了开源社区的发展。
fuzz4all - 大语言模型驱动的通用模糊测试框架
Fuzz4AllGithubLLM开源项目模糊测试自动提示软件测试
Fuzz4All是一个基于大语言模型的通用模糊测试框架。它利用LLMs生成和变异多样化的测试输入,适用于各种编程语言。该项目创新性地引入自动提示技术和LLM驱动的模糊测试循环,实现了针对多种语言和特性的通用测试。Fuzz4All支持自动生成任意输入,提供灵活的配置选项和详细的输出分析,为软件测试和安全研究领域提供了有力支持。
uptrain - 开源平台评估优化LLM应用
GithubLLM应用UpTrain开源平台开源项目改进评估
UpTrain是一个专注于评估和优化大型语言模型(LLM)应用的开源平台。它提供全面的工具和功能,用于衡量LLM应用性能、识别问题并持续改进。该平台支持自动化评估、错误分析和性能跟踪,有助于提高LLM应用的质量和可靠性。UpTrain提供多种评估指标和定制选项,适用于各种LLM应用场景。
sonar-cxx - SonarQube C++插件,集成多种代码分析和测试工具
C++GithubSonarQube代码质量开源插件开源项目静态分析
sonar-cxx是一个开源的SonarQube C++插件,旨在集成现有的C++分析工具。该插件支持从C++03到C++20的语法解析,兼容多种编译器扩展,并提供静态和动态代码分析功能。它支持多种测试框架和覆盖率报告工具,允许自定义规则和集成第三方工具。sonar-cxx适用于Windows和Linux环境,为C++项目提供全面的代码质量管理解决方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号