param

全面评估AI训练平台性能的综合基准测试套件

PARAM Benchmarks AI训练性能评估通信基准计算基准 Github 开源项目

PARAM (PyTorch based Arbitrary Range Micro-benchmarks) Benchmarks是一个评估AI训练和推理平台的综合基准测试库。它包括通信和计算微基准测试以及完整工作负载，弥补了独立C++基准测试和应用级基准测试之间的空白。PARAM能够深入分析系统架构和框架级开销，涵盖通信、计算和端到端工作负载评估。该开源项目采用MIT许可证，欢迎社区贡献。

Github

介绍相关项目

BARS - 推荐系统开放基准测试项目

BARSGithub基准测试开源项目性能评估推荐系统

BARS项目致力于解决推荐系统领域缺乏统一基准测试的问题。它通过开放式基准测试提高研究可重复性和结果一致性。目前涵盖CTR预测和候选项匹配任务，未来将扩展到列表重排序和多任务推荐领域。该项目鼓励学术界和业界参与，共同推动推荐系统研究的进步。

FL-bench - 开源联邦学习基准测试平台

FL-benchGithub个性化联邦学习开源项目算法实现联邦学习领域泛化

FL-bench是一个开源的联邦学习基准测试平台,实现了多种经典和前沿算法。平台支持个性化联邦学习和域泛化等研究方向,提供简单接口用于自定义数据集和模型。集成了可视化工具,方便研究人员快速实现和对比不同方法。FL-bench旨在促进联邦学习领域的创新与发展。

phoenix - AI应用开发的全方位观测与评估工具

AI观察平台GithubLLM评估Phoenix开源项目数据可视化

Phoenix是一款开源AI观测平台，为大语言模型应用提供全面的跟踪、评估和实验功能。该平台集成了OpenTelemetry跟踪、LLM性能测试、数据集管理、实验记录和推理分析等特性。Phoenix支持主流AI框架和LLM服务，适用于本地和云端环境，为AI开发人员提供了强大的实验、评估和问题诊断能力。

evaluate - 多框架兼容的机器学习评估工具库

EvaluateGithub开源项目指标机器学习模型比较评估

evaluate是一个开源的机器学习评估工具库，支持Numpy、Pandas、PyTorch、TensorFlow和JAX等多种框架。它提供了数十种涵盖自然语言处理和计算机视觉等领域的常用评估指标。用户可以使用evaluate进行模型评估、性能对比和结果报告。该库还支持创建新的评估模块并推送至Hugging Face Hub，便于比较不同指标的输出。evaluate的其他特点包括类型检查、指标卡片和社区指标功能，为研究人员和开发者提供了全面的模型评估支持。

AI Parabellum - 打造AI工具探索评估和推广的一站式平台

AI工具AI工具目录AI应用AI技术人工智能开发者资源

AI Parabellum汇集多领域AI工具,为开发者、研究人员和爱好者提供全面资源。平台覆盖图像、文本、视频、音频等AI应用,支持工具提交、推广和文章发布。作为专业AI工具目录,网站致力于成为探索和使用AI技术的首选平台。

GPU-Benchmarks-on-LLM-Inference - GPU和Apple芯片在LLaMA 3推理性能基准对比

GPUGithubLLaMA基准测试开源项目推理量化

项目对比测试了NVIDIA GPU和Apple芯片在LLaMA 3模型上的推理性能,涵盖从消费级到数据中心级的多种硬件。测试使用llama.cpp,展示了不同量化级别下8B和70B模型的推理速度。结果以表格形式呈现,包括生成速度和提示评估速度。此外,项目提供了编译指南、使用示例、VRAM需求估算和模型困惑度比较,为LLM硬件选型和部署提供全面参考。

Determined AI - 开源深度学习平台助力模型训练和优化

AI工具GPU资源分布式训练模型训练深度学习超参数调优

Determined AI是一个开源深度学习训练平台，集成了超参数调优和分布式训练功能。该平台支持多种深度学习框架，可在云端或本地运行，提供资源管理、实验跟踪和结果可视化等功能。它能显著加快模型训练速度，提高模型精度，让研究人员更专注于模型开发而非基础设施管理，从而提升深度学习团队的整体效率。

chinese-llm-benchmark - 中文大模型性能基准测试与排行榜

CLiBGithub中文大模型开源模型开源项目能力排行评测榜单

项目持续更新,目前已评测113个中文大模型,包括GPT-4、文心一言、通义千问等商用模型和百川、Qwen、GLM等开源模型。评测维度全面,涵盖分类、信息抽取、阅读理解、数据分析、中文编码效率等。提供综合能力和细分能力排行榜,并开放原始评测数据。为选择和研究中文大模型提供客观依据。

EvalAI - 专为机器学习与人工智能算法评估和比较设计的平台

EvalAIGithub人工智能开源平台开源项目机器学习算法比较

EvalAI是一个开源平台，用于评估和比较机器学习及AI算法，提供中心化排行榜和提交界面，支持自定义评估协议和多语言环境，可适应高需求的计算挑战，助力研究者复现研究结果，进行准确可靠的分析。

benchmarks - Node.js Web框架性能基准测试和对比分析

FastifyGithubNode.jsweb框架开源项目性能基准测试服务器比较

Benchmarks项目进行了全面的Node.js Web框架性能对比测试。通过严格的测试方法，比较了多个流行框架的请求处理速度、延迟和吞吐量。测试结果显示Fastify、Polka等框架性能表现优异。项目采用autocannon工具测试不同框架，结果以表格形式呈现，直观展示各框架性能差异。这些数据可帮助开发者根据项目需求选择合适的Web框架。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号