Project Icon

paddler

专为优化llama.cpp服务器设计的负载均衡和反向代理工具

Paddler是一个开源、生产就绪的负载均衡和反向代理工具,专为优化llama.cpp服务器设计。它支持动态添加和移除服务器、自动扩展、请求缓冲、AWS集成以及StatsD协议。Paddler通过监控服务器的可用槽位,实现高效的请求分配,适用于需要可配置和可预测内存分配的环境。

项目介绍:Paddler

什么是 Paddler

Paddler 是一个开源的、可生产使用的、有状态的负载均衡器和反向代理,专为优化运行在 llama.cpp 上的服务器而设计。Paddler 的独特之处在于其专注于 llama.cpp 的特定需求,能够有效利用服务器的多个请求处理槽(slots),以实现请求的高效分配。

为什么选择 Paddler

传统的负载均衡策略,如轮询(round robin)和最少连接数(least connections),在处理 llama.cpp 服务器时并不高效,因为这些服务器使用连续批处理算法,可以配置多个并发请求处理槽。Paddler 则为此提供了更优化的解决方案。

在 llama.cpp 中,所谓的“槽”是服务器内预先定义的内存片段,用于处理单个请求。每当一个请求到达时,它会被分配到一个可用的槽中进行处理。这种设计使得请求处理变得更为可预测和可配置。

Paddler 的主要特点

  • 代理监控:使用代理监控每个 llama.cpp 实例的请求处理槽。
  • 动态扩展:支持动态添加或移除 llama.cpp 服务器,便于与自动扩展工具集成。
  • 请求缓冲:能够缓冲请求,使基础设施能够从零主机扩展。
  • 内置仪表盘和集成:内置的仪表盘支持 StatsD 协议,并提供 AWS 集成。

工作原理

使用 Paddler 时,需要将 llama.cpp 实例注册到 Paddler 系统中,然后在这些实例旁边安装 Paddler 的代理。这些代理负责任地报告槽的状态给负载均衡器,以确保系统运作流畅。

使用方法

安装

用户可以从 Paddler 发布页面 下载适用于 Linux、Mac 或 Windows 平台的最新版本。如果在 Linux 系统中希望 Paddler 可以被系统范围访问,可以将下载的可执行文件重命名并移动到 /usr/bin/usr/local/bin

运行 llama.cpp

在运行 llama.cpp 时,需要启用槽端点功能,可以通过添加 --slots 参数来实现。

运行 Paddler 代理

接下来,需要运行 Paddler 的代理程序。这些代理会在 llama.cpp 实例上注册并监控槽的状态。配置代理时,需提供若干连接信息,如主机地址和端口等。

特性亮点

聚合的健康状态

Paddler 可聚合多个 llama.cpp 实例的健康状态,报告可用和正在处理请求的槽总数。

请求缓冲和零扩展

负载均衡器的请求缓冲功能允许基础设施从零主机进行扩展,对于低流量项目尤为适用,因为它能降低使用服务时的成本。

状态仪表盘和 StatsD 支持

Paddler 还拥有内置的状态仪表盘,方便用户查看集群状态,同时支持 StatsD 指标报告功能。

AWS 集成

在 AWS 环境下,Paddler 支持通过云上元数据自动获取本地 IP 地址,以便于更灵活的网络配置。

为什么命名为 Paddler

起初,该项目打算使用 Raft 共识算法(Paddler 的灵感来自于划桨,即小船在 Raft 上划桨的动作),虽然最终未采纳这种算法,但名称保留了下来。团队也接受了来自 Simpson 中 "that's a paddlin'" 的幽默。

社区

关注 Paddler 的开发及支持可以加入其 Discord 社区:Paddler社区 来与其他开发者交流。

这个介绍详细涵盖了 Paddler 项目的重大特色及其与其他负载均衡器的不同之处,并为用户怎样上手提供了指导。希望这能为用户在选择负载均衡方案时提供参考。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号