Project Icon

serge

开源自托管大语言模型聊天平台

Serge是一个开源的自托管大语言模型聊天平台,基于llama.cpp开发,支持运行GGUF模型。该项目采用SvelteKit构建前端,使用Redis存储聊天历史,并通过FastAPI和LangChain封装API。Serge目前支持超过30种主流大语言模型,如LLaMA、Mistral和Mixtral等。用户可以通过Docker或Kubernetes快速部署,无需API密钥即可搭建私有AI聊天服务。其简单的用户界面使得即使非技术用户也能轻松搭建和管理自己的AI聊天服务。

LangSaaS - 面向开发者的RAG聊天机器人SaaS模板
AI工具LangChainLangSaaSNextJSRAGchatbot
LangSaaS为开发者提供了一个用于创建基于检索增强生成(RAG)技术的AI聊天机器人应用的SaaS模板。该模板集成了现代化前端(Next.js)和后端(Python环境中的LangChain),以及LangChain、Qdrant、Cohere、UnstructuredIO和Stripe支付网关等工具。开发者可以利用这一模板快速构建和部署RAG聊天机器人应用,大幅缩短开发周期。LangSaaS的模块化架构使其具有良好的可定制性,能够满足不同项目的特定需求。
InferLLM - 轻量化语言模型推理框架,兼容多种模型格式和设备
GithubInferLLMllama.cpp多模型兼容开源项目模型推理高效率
InferLLM 是一个高效简洁的语言模型推理框架,源于 llama.cpp 项目。主要特点包括结构简单、高性能、易于上手,并支持多模型格式。目前兼容 CPU 和 GPU,可优化 Arm、x86、CUDA 和 riscv-vector,并支持移动设备部署。InferLLM 引入了专有 KVstorage 类型以简化缓存和管理,适合多种应用场景。最新支持的模型包括 LLama-2-7B、ChatGLM、Alpaca 等。
minimal-chat - 轻量级多语言聊天应用,支持本地与自定义模型
DockerGithubMinimalChatPWA支持开源开源项目语言模型
开源轻量级聊天应用,支持GPT-4 Omni等多种语言模型和本地/自定义模型端点,具备移动PWA支持。可通过Docker自托管,能转换和编辑消息,支持语音互动、Markdown和代码高亮,并集成DALL-E 3。提供导入导出对话功能,兼容Open AI响应API端点,支持离线使用,对话本地存储确保安全。
LLaMA-Factory - 提升语言模型微调效率的统一平台
GithubLLaMA Factory大语言模型开源项目快速微调性能优化模型量化热门
LLaMA-Factory是一个高效的语言模型微调工具,支持多种模型和算法。该平台专注于提高微调速度,支持连续预训练、监督微调和激励建模等策略。LLaMA-Factory利用LoRA技术实现高效训练,并提供详尽的数据监控和快速推理能力。此外,新版本还增加了PiSSA算法,且支持多种开发平台如Colab和DSW,适合高质量文本生成和智能应用开发。
Llama-2-70B-Chat-GGUF - 支持文本生成与特殊符号的先进开源模型
GithubHuggingfaceLlama 2兼容性开源项目文本生成模型模型文件量化方法
Llama 2 70B Chat项目采用全新GGUF格式,取代已弃用的GGML格式,提升标记化与特殊符号支持功能。此项目由Meta Llama 2开发,兼容多种UI与库,支持多平台GPU加速应用,在文本生成与性能方面提供明显改善。GGUF格式还具备元数据支持,具备更强的扩展性,适用于复杂多变的应用场景。
llama2 - 基于Meta开源Llama 2模型的优化轻量级聊天机器人
GithubLlama 2Llama2-7BMetaReplicateStreamlit开源项目
此聊天机器人应用使用Meta的开源Llama 2模型,尤其是a16z团队部署的Llama2-7B模型。应用程序经过重构,可以轻量级部署到Streamlit Community Cloud平台。需要获取Replicate API令牌才能使用。除此之外,还可以尝试更大规模的Llama2-13B和Llama2-70B模型。
h2ogpt-4096-llama2-7b-chat - 基于Meta Llama 2的开源增强对话模型
GithubHuggingfaceLlama 2h2oGPT人工智能大型语言模型开源项目模型自然语言处理
该项目是对Meta Llama 2 7B Chat模型的优化升级版本。项目提供在线演示平台,可进行多个语言模型的性能对比和私人文档对话。通过h2oGPT平台可体验实时对话功能,并在模型排行榜中查看性能评估结果。
chatgpt-demo - 基于OpenAI GPT-3.5 Turbo API的ChatGPT演示项目,包括多聊天和图像生成功能
AnseChatGPT-APIDockerGithubOpenAIVercel开源项目
该项目为基于OpenAI GPT-3.5 Turbo API的ChatGPT演示站点,提供多聊天和图像生成功能,并附有详细的本地运行与部署指南,支持Vercel、Netlify、Docker和Sealos等多种部署方式。需注意:项目需要OpenAI API Key。
Hermes-3-Llama-3.1-70B - 基于Llama 3的新一代通用语言模型
GithubHermes 3Huggingface人工智能函数调用大语言模型对话系统开源项目模型
Hermes-3-Llama-3.1-70B是一个基于Llama 3架构的开源语言模型,由Nous Research团队开发。模型支持多轮对话、长文本理解、结构化输出等功能,采用ChatML格式进行交互。在基准测试中,该模型展现出与Llama-3.1 Instruct相当的性能表现。通过系统提示词可实现灵活的角色定制和功能调用。
llm-resource - 大模型资源汇总及实用技术详解
ChatGPTGPT-2GithubLLMMOETransformer开源项目
LLM百宝箱是大模型相关资源的综合汇总,包括算法、训练、推理、数据工程、压缩和测评等方面。用户可以通过目录和链接快速找到相关内容,如Transformer和GPT模型的原理和源码解析,以及混合专家模型(MoE)等前沿技术。此外,还提供了LLM微调、对齐和推理优化的实现方案和技巧,帮助开发者和研究者深入掌握并应用大模型技术。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号