Project Icon

dataloader

适用于 TensorFlow、PyTorch 和 JAX 的 GPU 优化数据加载器

Merlin Dataloader 提供适用于 TensorFlow、PyTorch 和 JAX 的 GPU 优化数据加载器,大幅提升推荐模型的训练速度。优势包括速度提升超10倍、支持大于内存的数据集、每个周期的数据随机化及分布式训练。这些特点使其成为高效训练推荐模型的理想工具。

awesome-jax - 自动微分与XLA在高性能机器学习中的应用
GithubJAXXLA编译器加速器开源项目机器学习自动微分
该页面收录了JAX相关的优质库、项目和资源,旨在帮助机器学习研究人员在GPU和TPU等加速器上实现高性能计算。资源涵盖神经网络库、强化学习工具和概率编程等多个领域,并提供了详细的库介绍、学术论文和教程。用户可以找到如Flax、Haiku、Objax等知名库,以及新兴的FedJAX、BRAX等库,适用于机器学习和科研项目中使用JAX进行快速原型开发和高效计算。
distributed-llama - 优化大型语言模型的分布式计算性能
Distributed LlamaGithubLlama 3Python 3TCP socketsTensor parallelism开源项目
通过分布式计算技术,分散大型语言模型(LLMs)的工作负载到多个设备上,即使是性能较弱的设备也能运行强大的LLMs。项目使用TCP sockets同步状态,用户可以使用家庭路由器轻松配置AI集群,实现显著加速效果。Distributed Llama支持多种模型架构,提供简便的设置和操作方法,用户可以在本地运行大规模语言模型。
gpt-neox - 大规模语言模型训练库,支持多系统和硬件环境
DeepSpeedEleutherAIFlash AttentionGPT-NeoXGithubMegatron Language Model开源项目
GPT-NeoX是EleutherAI开发的库,专注于在GPU上训练大规模语言模型。它基于NVIDIA的Megatron,并结合了DeepSpeed技术,提供前沿的架构创新和优化,支持多种系统和硬件环境。广泛应用于学术界、工业界和政府实验室,支持AWS、CoreWeave、ORNL Summit等多个平台。主要功能包括分布式训练、3D并行、旋转和嵌入技术,以及与Hugging Face等开源库的无缝集成。
determined - 深度学习平台,支持分布式训练与超参数调优
DeterminedGithubPyTorchTensorFlow分布式训练开源项目深度学习平台
Determined平台兼容PyTorch和TensorFlow,提供分布式训练、超参数调优和资源管理,降低云端GPU成本并支持实验追踪分析和可复现性。通过Python库、命令行界面和Web用户界面,用户能够轻松构建和管理模型,支持本地和云端部署,包括AWS和GCP。丰富的文档和示例帮助快速上手,通过用户指南、社区支持和贡献者指南,确保完整平台功能的利用。
NeMo-Curator - 提供GPU加速的大型语言模型数据集优化与管理解决方案
GPU加速GithubNeMo CuratorPython库大语言模型开源项目数据集准备
NeMo Curator 是一款专为大型语言模型(LLM)设计的开源Python库,通过结合Dask和RAPIDS等技术,实现GPU加速的数据集准备与管理。其功能包括数据下载、语言识别、文本清理、质量过滤、文档去重和个人信息保护等模块,为多种LLM任务提供快速、灵活和可扩展的解决方案,显著提升数据处理效率与模型质量。
merlinn - AI全天候待命开发者助手,自动分析根本原因
AIGithubMerlinnRCASlackopen-source开源项目
Merlinn是一款开源的AI待命工程师助手,自动处理生产事故和警报,实时提供上下文洞察和根本原因分析。它与Slack、Datadog、GitHub等流行平台无缝集成,支持自托管确保数据安全。通过自动化RCA和直观的用户体验,Merlinn帮助开发者快速解决问题,提高工作效率。
tensorpack - 高效的神经网络训练接口,支持多GPU和分布式训练
GithubTensorpack可重复性研究开源项目数据加载性能训练速度高质量实现
Tensorpack是基于TensorFlow的神经网络训练接口,专注于提升训练速度与性能。其高效的数据加载和并行化策略显著提高了训练速度,尤其是在CNN上的表现比Keras代码快1.2到5倍。Tensorpack适合需要可重复和灵活研究的开发者,支持多GPU和分布式训练,并提供多个著名论文的高质量复现案例。Tensorpack并不是一个模型包装器,用户可以灵活使用TensorFlow及其他高层API。
talos - 全自动化TensorFlow和Keras超参数优化工具
GithubKerasTalosTensorFlow开源项目模型评估超参数优化
Talos通过自动化超参数实验和模型评估,提升了TensorFlow (tf.keras) 和 Keras 的工作流程,无需学习新的语法或模板。用户可以在几分钟内配置和评估超参数实验,适用于各种预测任务。Talos支持 Linux、Mac OS 和 Windows 系统,并兼容 CPU、GPU 和多 GPU 系统,非常适合研究者和数据科学家使用。
llama-2-jax - 基于JAX的大语言模型高效实现
GithubJAXLlama 2大语言模型开源项目机器学习模型实现
这是一个利用JAX框架实现Llama 2模型的开源项目。该项目致力于提高模型训练和推理效率,构建高质量Transformer代码库,为自然语言处理领域提供有价值见解。项目功能包括参数转换、数据加载、模型架构实现等,并在持续开发训练和生成功能。这为研究人员和开发者提供了便捷的Llama 2模型研究与应用工具。
recommenders - 利用TensorFlow构建推荐系统模型的库
GithubKerasTensorFlow Recommenders开源项目推荐系统数据准备模型训练
TensorFlow Recommenders 是一款利用TensorFlow构建推荐系统模型的库。它涵盖了数据准备、模型构建、训练、评估和部署的完整工作流程,基于Keras,旨在为用户提供易学且灵活的体验,能够支持构建复杂模型。只需确保安装TensorFlow 2.x,并使用pip安装即可开始使用。详细的文档和教程能够帮助用户快速入门。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

问小白

问小白是一个基于 DeepSeek R1 模型的智能对话平台,专为用户提供高效、贴心的对话体验。实时在线,支持深度思考和联网搜索。免费不限次数,帮用户写作、创作、分析和规划,各种任务随时完成!

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号