serve
TorchServe是一款高效灵活的平台,用于生产环境中PyTorch模型的部署和扩展。最新版本通过默认启用的令牌授权机制和增强的模型API控制,有效预防未授权API调用和恶意代码风险。此外,该平台还支持在不同环境(包括本地、云服务及各类硬件)中快速部署模型。
agentscope
AgentScope是一个先进的多智能体平台,专为开发人员构建基于大规模模型的多智能体应用而设计。该平台易于使用,并配备全面的组件和详尽的文档,同时提供定制的容错控制和重试机制以增强应用的稳定性。其分布式架构简化了多智能体系统的开发流程,提高了开发效率。
fairscale
FairScale是一个开源的PyTorch扩展库,旨在提升大规模深度学习模型的训练效率。它不仅增强了PyTorch的基础功能,还引入了先进的模型扩展技术。通过提供模块化组件和简洁的API,FairScale使研究人员能够更轻松地实现分布式训练,有效应对资源受限情况下的模型扩展挑战。该库在设计时特别强调了易用性、模块化和性能优化,并支持全面分片数据并行(FSDP)等多种先进扩展技术。
Knover
Knover是一个基于PaddlePaddle的知识增强对话生成工具包,专为高效训练和推理大规模对话模型而设计。它支持Q-TOD、PLATO-KAG和PLATO-XL等多个先进项目,覆盖任务型、知识型和开放域对话领域。Knover运行于Python 3.7+和PaddlePaddle-GPU 2.4.0+环境,为研究人员和开发者提供了完整的安装指南和使用文档。
micro_diffusion
micro_diffusion是一个开源项目,旨在提供低成本训练大规模扩散模型的方法。该项目计划发布完整训练代码和模型检查点,为研究人员和AI爱好者提供实验资源。通过降低研究门槛,micro_diffusion有望促进扩散模型领域的广泛参与和创新。
min-max-gpt
min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术,并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型,展现了其在大规模语言模型训练方面的能力。
ml-aim
AIM项目开发了一系列采用自回归生成目标预训练的视觉模型。研究发现,图像特征的自回归预训练呈现出与大型语言模型类似的扩展性。该项目能够将模型参数轻松扩展到数十亿级,并能有效处理大规模未筛选的图像数据。AIM提供多种预训练模型,兼容PyTorch、MLX和JAX等多个框架,为计算机视觉领域的研究与应用提供了有力支持。
EasyRec
EasyRec是一个开源的推荐系统框架,集成了多种深度学习模型,用于候选生成、评分和多任务学习等推荐任务。该框架支持多种运行平台和数据输入方式,提供简单配置、智能功能和丰富的模型选择。EasyRec通过简化配置和超参数调优,提高了高性能模型的生成效率。它还支持大规模部署、自定义开发和快速向量检索,适用于多种推荐场景。
MultiModal_BigModels_Survey
这个项目提供了大规模多模态预训练模型的全面调研。内容包括发展历程、关键技术、代表性模型和应用场景。调研分析了模型架构、预训练策略和下游任务等研究热点,并探讨了未来方向。这份资料可为多模态人工智能研究和开发提供参考。