Project Icon

ialacol

轻量化OpenAI API兼容替代方案,适合Kubernetes环境并支持快速Helm安装

ialacol是一个轻量级的OpenAI API兼容替代方案,支持LLaMa 2、Mistral、StarCoder等多种模型,并提供Kubernetes集群的一键Helm安装。项目具备CUDA加速、流式体验和与GitHub Copilot VSCode扩展的兼容性。通过配置示例和运行指南,可以灵活部署和配置服务,实现快速启动和高效使用。ialacol兼容ctransformers和多种LLMs,适合多种应用场景。

ialacol 项目介绍

简介

ialacol(发音为"localai")是一个轻量级的替代方案,旨在替换OpenAI API。它是一个兼容OpenAI API的包装器,支持ctransformers、GGML和GPTQ,可以选择进行CUDA/Metal加速。该项目受到了其他类似项目的启发,如LocalAI、privateGPT以及其他项目,特别关注Kubernetes的部署。

功能特点

  • 兼容性:全兼容OpenAI API,支持与langchain结合。
  • 轻量级:可以在Kubernetes集群上简单地进行部署,只需一键安装。
  • 流式服务:优先采用流式服务以提升用户体验。
  • CUDA加速:可以选择进行CUDA加速。
  • 兼容集成:支持与Github Copilot VSCode扩展集成。

支持模型

ialacol支持许多模型,包括LLaMa 2变体、StarCoder、WizardCoder、StarChat变体、MPT-7B、MPT-30B、Falcon等所有ctransformers支持的LLMs。

用户界面

虽然ialacol没有自带的用户界面,但它兼容任何支持OpenAI API的网页界面,如chat-ui。

快速入门

Kubernetes部署

ialacol对Kubernetes提供了一流支持,使用户能够自动化配置。快速开始步骤如下:

helm repo add ialacol https://chenhunghan.github.io/ialacol
helm repo update
helm install llama-2-7b-chat ialacol/ialacol

默认情况下,它会部署由TheBloke量化的Meta的Llama 2 Chat模型。

端口转发
kubectl port-forward svc/llama-2-7b-chat 8000:8000
交互示例

可以使用curl与默认模型进行聊天:

curl -X POST \
     -H 'Content-Type: application/json' \
     -d '{ "messages": [{"role": "user", "content": "How are you?"}], "model": "llama-2-7b-chat.ggmlv3.q4_0.bin", "stream": false}' \
     http://localhost:8000/v1/chat/completions

配置

配置主要通过环境变量完成,支持多种参数设定,如默认模型ID、日志等级、采样参数等。

在容器中运行

用户可从GitHub Registry 中拉取docker镜像运行ialacol。

GPU加速

通过使用专为GPU配置的容器镜像,并设置GPU_LAYERS环境变量,用户可实现GPU/CUDA加速。

开发及贡献

开发者可以从源码编译运行,并使用Python虚拟环境进行开发和调试。

项目规划

未来将在GPU加速、模型支持以及与Apache-2.0模型的集成方面持续扩展。

总而言之,ialacol为开发者提供了一个灵活且高效的本地AI替代解决方案,通过兼容广泛的模型配置和Kubernetes支持,满足多样化的机器学习部署需求。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号