#大规模模型

AgentScope学习资料汇总 - 打造大型语言模型驱动的多智能体应用的开发平台

2024年09月10日
Cover of AgentScope学习资料汇总 - 打造大型语言模型驱动的多智能体应用的开发平台

TorchServe学习资料汇总-灵活易用的PyTorch模型服务工具

2024年09月10日
Cover of TorchServe学习资料汇总-灵活易用的PyTorch模型服务工具

大规模多模态预训练模型综述:技术进展与未来展望

2024年09月05日
Cover of 大规模多模态预训练模型综述:技术进展与未来展望

EasyRec: 阿里巴巴开源的大规模推荐算法框架

2024年09月05日
Cover of EasyRec: 阿里巴巴开源的大规模推荐算法框架

FlagAI: 快速、易用、可扩展的大规模AI模型工具包

2024年09月05日
Cover of FlagAI: 快速、易用、可扩展的大规模AI模型工具包

AIM: 突破性的大规模自回归图像模型预训练技术

2024年09月05日
Cover of AIM: 突破性的大规模自回归图像模型预训练技术

min-max-gpt: 极简实现的大规模GPT训练框架

2024年09月05日
Cover of min-max-gpt: 极简实现的大规模GPT训练框架

MicroDiffusion: 从有限2D显微镜投影重建3D结构的创新方法

2024年09月05日
Cover of MicroDiffusion: 从有限2D显微镜投影重建3D结构的创新方法

Knover: 基于PaddlePaddle的大规模开放领域知识对话系统

2024年09月04日
Cover of Knover: 基于PaddlePaddle的大规模开放领域知识对话系统

FairScale: 突破大规模机器学习训练瓶颈的PyTorch扩展库

2024年09月04日
Cover of FairScale: 突破大规模机器学习训练瓶颈的PyTorch扩展库
相关项目
Project Cover

serve

TorchServe是一款高效灵活的平台,用于生产环境中PyTorch模型的部署和扩展。最新版本通过默认启用的令牌授权机制和增强的模型API控制,有效预防未授权API调用和恶意代码风险。此外,该平台还支持在不同环境(包括本地、云服务及各类硬件)中快速部署模型。

Project Cover

agentscope

AgentScope是一个先进的多智能体平台,专为开发人员构建基于大规模模型的多智能体应用而设计。该平台易于使用,并配备全面的组件和详尽的文档,同时提供定制的容错控制和重试机制以增强应用的稳定性。其分布式架构简化了多智能体系统的开发流程,提高了开发效率。

Project Cover

fairscale

FairScale是一个开源的PyTorch扩展库,旨在提升大规模深度学习模型的训练效率。它不仅增强了PyTorch的基础功能,还引入了先进的模型扩展技术。通过提供模块化组件和简洁的API,FairScale使研究人员能够更轻松地实现分布式训练,有效应对资源受限情况下的模型扩展挑战。该库在设计时特别强调了易用性、模块化和性能优化,并支持全面分片数据并行(FSDP)等多种先进扩展技术。

Project Cover

Knover

Knover是一个基于PaddlePaddle的知识增强对话生成工具包,专为高效训练和推理大规模对话模型而设计。它支持Q-TOD、PLATO-KAG和PLATO-XL等多个先进项目,覆盖任务型、知识型和开放域对话领域。Knover运行于Python 3.7+和PaddlePaddle-GPU 2.4.0+环境,为研究人员和开发者提供了完整的安装指南和使用文档。

Project Cover

micro_diffusion

micro_diffusion是一个开源项目,旨在提供低成本训练大规模扩散模型的方法。该项目计划发布完整训练代码和模型检查点,为研究人员和AI爱好者提供实验资源。通过降低研究门槛,micro_diffusion有望促进扩散模型领域的广泛参与和创新。

Project Cover

min-max-gpt

min-max-gpt是一个针对大规模GPT模型训练优化的开源项目。该框架集成了muP初始化、混合精度训练、FSDP和DeepSpeed Zero-3等技术,并提供了不依赖Hugging Face的训练选项。这使得研究人员和开发者能够更灵活地控制训练过程。项目已在8块80GB A100 GPU上成功训练20B参数模型,展现了其在大规模语言模型训练方面的能力。

Project Cover

ml-aim

AIM项目开发了一系列采用自回归生成目标预训练的视觉模型。研究发现,图像特征的自回归预训练呈现出与大型语言模型类似的扩展性。该项目能够将模型参数轻松扩展到数十亿级,并能有效处理大规模未筛选的图像数据。AIM提供多种预训练模型,兼容PyTorch、MLX和JAX等多个框架,为计算机视觉领域的研究与应用提供了有力支持。

Project Cover

EasyRec

EasyRec是一个开源的推荐系统框架,集成了多种深度学习模型,用于候选生成、评分和多任务学习等推荐任务。该框架支持多种运行平台和数据输入方式,提供简单配置、智能功能和丰富的模型选择。EasyRec通过简化配置和超参数调优,提高了高性能模型的生成效率。它还支持大规模部署、自定义开发和快速向量检索,适用于多种推荐场景。

Project Cover

MultiModal_BigModels_Survey

这个项目提供了大规模多模态预训练模型的全面调研。内容包括发展历程、关键技术、代表性模型和应用场景。调研分析了模型架构、预训练策略和下游任务等研究热点,并探讨了未来方向。这份资料可为多模态人工智能研究和开发提供参考。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号