Exo: 革命性的家庭AI集群解决方案

Exo: 打造属于你的家庭AI集群

在人工智能快速发展的今天,运行大型AI模型往往需要昂贵的NVIDIA GPU。然而,一个名为Exo的开源项目正在改变这一现状。Exo允许用户将日常设备如iPhone、iPad、Android设备、Mac和Linux电脑等整合成一个强大的GPU集群,为家庭用户提供平价高效的AI运算解决方案。

Exo logo

Exo的核心特性

广泛的模型支持

Exo支持多种流行的AI模型,包括LLaMA等。它通过MLX和tinygrad两种不同的实现方式来支持LLaMA模型。这种灵活性使得Exo能够适应不同的硬件环境和用户需求。

动态模型分区

Exo的一大亮点是其智能模型分区策略。系统会根据当前网络拓扑和可用设备资源,自动将模型进行最优分割。这意味着用户可以运行比单个设备内存更大的模型,充分利用家中所有设备的计算能力。

自动设备发现

使用Exo无需繁琐的配置过程。系统会自动发现网络中的其他设备,并将它们纳入计算集群。这种即插即用的特性大大降低了用户的使用门槛。

ChatGPT兼容API

为了方便开发者使用,Exo提供了一个与ChatGPT兼容的API。这意味着开发者只需一行代码的改动,就可以将原本调用ChatGPT的应用迁移到Exo上,在自己的硬件上运行AI模型。

设备平等性

与其他分布式推理框架不同,Exo采用了点对点(P2P)的连接方式,而非主从架构。只要设备连接在网络中的某处,它就可以被用于运行模型。这种设计理念确保了网络中每个设备的重要性,充分发挥了所有硬件的潜力。

Ring topology

Exo的工作原理

Exo采用了名为环形内存加权分区的策略来分割模型。在这种策略下,推理过程在一个环形结构中进行,每个设备运行的模型层数与其内存容量成正比。这种方法既保证了负载均衡,又充分利用了每个设备的资源。

安装和使用Exo

目前,推荐的安装方式是从源代码安装Exo。安装步骤如下:

克隆Exo仓库:

git clone https://github.com/exo-explore/exo.git

进入Exo目录:
```
cd exo
```
安装依赖:
```
pip install .
```

或者,你也可以使用虚拟环境:

source install.sh

需要注意的是,Exo要求Python版本不低于3.12.0,这是由于早期版本中asyncio的一些问题。

在多台MacOS设备上使用Exo

使用Exo非常简单,以下是在两台MacOS设备上运行Exo的示例:

在设备1上运行:

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

在设备2上也运行相同的代码:

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

就是这么简单!Exo会自动发现其他设备,无需任何额外配置。