Project Icon

serge

开源自托管大语言模型聊天平台

Serge是一个开源的自托管大语言模型聊天平台,基于llama.cpp开发,支持运行GGUF模型。该项目采用SvelteKit构建前端,使用Redis存储聊天历史,并通过FastAPI和LangChain封装API。Serge目前支持超过30种主流大语言模型,如LLaMA、Mistral和Mixtral等。用户可以通过Docker或Kubernetes快速部署,无需API密钥即可搭建私有AI聊天服务。其简单的用户界面使得即使非技术用户也能轻松搭建和管理自己的AI聊天服务。

Serge - 让LLaMA变得简单 🦙

许可证 Discord

Serge是一个使用llama.cpp制作的聊天界面,用于运行GGUF模型。无需API密钥,完全自托管!

  • 🌐 SvelteKit 前端
  • 💾 Redis 用于存储聊天历史和参数
  • ⚙️ FastAPI + LangChain 用于API,使用python绑定封装对llama.cpp的调用

🎥 演示:

demo.webm

⚡️ 快速开始

🐳 Docker:

docker run -d \
    --name serge \
    -v weights:/usr/src/app/weights \
    -v datadb:/data/db/ \
    -p 8008:8008 \
    ghcr.io/serge-chat/serge:latest

🐙 Docker Compose:

services:
  serge:
    image: ghcr.io/serge-chat/serge:latest
    container_name: serge
    restart: unless-stopped
    ports:
      - 8008:8008
    volumes:
      - weights:/usr/src/app/weights
      - datadb:/data/db/

volumes:
  weights:
  datadb:

然后,只需访问 http://localhost:8008 ,您可以在 http://localhost:8008/api/docs 找到API文档

🌍 环境变量

以下环境变量可用:

变量名描述默认值
SERGE_DATABASE_URL数据库连接字符串sqlite:////data/db/sql_app.db
SERGE_JWT_SECRET用于认证令牌加密的密钥。使用随机字符串uF7FGN5uzfGdFiPzR
SERGE_SESSION_EXPIRY用户需要重新认证的时间(分钟)60
NODE_ENVNode.js运行环境production

🖥️ Windows

确保您已安装Docker Desktop,配置了WSL2,并有足够的可用RAM来运行模型。

☁️ Kubernetes

wiki中可以找到在Kubernetes上设置Serge的说明。

🧠 支持的模型

类别模型
Alfred40B-1023
BioMistral7B
Code13B, 33B
CodeLLaMA7B, 7B-Instruct, 7B-Python, 13B, 13B-Instruct, 13B-Python, 34B, 34B-Instruct, 34B-Python
Codestral22B v0.1
Gemma2B, 1.1-2B-Instruct, 7B, 1.1-7B-Instruct
GorillaFalcon-7B-HF-v0, 7B-HF-v1, Openfunctions-v1, Openfunctions-v2
Falcon7B, 7B-Instruct, 40B, 40B-Instruct
LLaMA 27B, 7B-Chat, 7B-Coder, 13B, 13B-Chat, 70B, 70B-Chat, 70B-OASST
LLaMA 311B-Instruct, 13B-Instruct, 16B-Instruct
LLaMA Pro8B, 8B-Instruct
Med4270B
Medalpaca13B
MedicineChat, LLM
Meditron7B, 7B-Chat, 70B
Meta-LlaMA-38B, 8B-Instruct, 70B, 70B-Instruct
Mistral7B-V0.1, 7B-Instruct-v0.2, 7B-OpenOrca
MistralLite7B
Mixtral8x7B-v0.1, 8x7B-Dolphin-2.7, 8x7B-Instruct-v0.1
Neural-Chat7B-v3.3
Notus7B-v1
Notux8x7b-v1
Nous-Hermes 2Mistral-7B-DPO, Mixtral-8x7B-DPO, Mistral-8x7B-SFT
OpenChat7B-v3.5-1210
OpenCodeInterpreterDS-6.7B, DS-33B, CL-7B, CL-13B, CL-70B
OpenLLaMA3B-v2, 7B-v2, 13B-v2
Orca 27B, 13B
Phi 22.7B
Phi 3mini-4k-instruct, medium-4k-instruct, medium-128k-instruct
Python Code13B, 33B
PsyMedRP13B-v1, 20B-v1
Starling LM7B-Alpha
SOLAR10.7B-v1.0, 10.7B-instruct-v1.0
TinyLlama1.1B
Vicuna7B-v1.5, 13B-v1.5, 33B-v1.3, 33B-Coder
WizardLM2-7B, 13B-v1.2, 70B-v1.0
Zephyr3B, 7B-Alpha, 7B-Beta

可以通过提交GitHub问题来请求额外的模型。其他模型也可在Serge Models获取。

⚠️ 内存使用

如果没有足够的可用内存用于模型,LLaMA将会崩溃

💬 支持

需要帮助?加入我们的Discord

🧾 许可证

Nathan Sarrazin贡献者Serge是根据MIT许可证Apache-2.0授权的免费开源软件。

🤝 贡献

如果你发现了bug或有功能想法,欢迎提出问题或PR。

要在开发模式下运行Serge:

git clone https://github.com/serge-chat/serge.git
cd serge/
docker compose -f docker-compose.dev.yml up --build

该解决方案将在端口5678上接受Python调试器会话。VSCode的示例launch.json:

{
    "version": "0.2.0",
    "configurations": [
        {
            "name": "远程调试",
            "type": "python",
            "request": "attach",
            "connect": {
                "host": "localhost",
                "port": 5678
            },
            "pathMappings": [
                {
                    "localRoot": "${workspaceFolder}/api",
                    "remoteRoot": "/usr/src/app/api/"
                }
            ],
            "justMyCode": false
        }
    ]
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号