#分布式推理

petals - 本地运行大型语言模型,BitTorrent 风格
Github开源项目Llama 3.1Petals分布式推理大模型微调GPU共享
Petals项目让用户能够在家中或通过Google Colab运行Llama 3.1、Mixtral、Falcon和BLOOM等大型语言模型。通过分布式网络托管模型层,推理速度可提升至10倍。用户可以微调模型以满足特定任务需求,并且支持隐私保护和私人群组设置。该项目依赖社区共享GPU资源,提供详细的教程和支持,帮助用户快速上手并充分利用其功能。
exo - 家用设备组建分布式AI集群 实现高性能计算
Github开源项目分布式推理exoAI集群设备发现模型分区
exo是一个开源项目,用于将日常设备如智能手机、平板和个人电脑整合成家庭AI集群。该项目支持多种模型,包括Llama 3.1,具备动态模型分区和自动设备发现功能。exo采用点对点连接架构,实现设备间平等协作,无需专业GPU即可运行大型AI模型。此外,exo还提供ChatGPT兼容的API接口。
AIE Labs - 多元化AI娱乐平台 打造创作与变现生态系统
AI工具内容创作分布式推理虚拟伴侣AIE LabsAI娱乐
AIE Labs作为AI娱乐内容平台,整合AI艺术创作、智能聊天机器人和去中心化推理网络。平台支持用户创作、变现和分享AI内容,并规划L2区块链和代币发行。通过提供全面基础设施,AIE Labs致力于推动AI娱乐产业创新发展。
cake - 框架实现分布式大模型推理 充分利用闲置设备
Github开源项目分布式推理大型模型Cake异构集群AI民主化
Cake是基于Candle的Rust框架,通过整合iOS、Android、macOS、Linux和Windows设备为异构集群,实现大型模型(70B+)的分布式推理。该框架将transformer块分片到多设备上,突破单设备GPU内存限制,有效利用闲置硬件资源,降低AI应用门槛。