Project Icon

awesome-local-ai

全面收录开源本地AI工具和解决方案

awesome-local-ai收录了多种开源本地AI工具和解决方案,包括推理引擎、用户界面、完整平台、开发工具、用户工具和AI代理等。项目旨在为开发者和用户提供丰富的本地AI资源,便于探索和应用最新AI技术,同时确保数据隐私。此外,还涵盖了LLM排行榜和相关研究论文,为AI领域从业者和爱好者提供全面参考。

超棒的本地AI 推文

如果你尝试过Jan桌面版并且喜欢它,请也查看以下开源和/或本地AI工具和解决方案的精彩集合。

欢迎您随时贡献!

列表

推理引擎

仓库描述支持的模型格式CPU/GPU支持UI语言平台类型
llama.cpp- 纯C/C++的LLaMA模型推理GGML/GGUF两者C/C++文本生成
Nitro- 3MB推理引擎,可嵌入您的应用。使用Llamacpp等两者两者文本生成
ollama- CLI和本地服务器。使用Llamacpp两者两者文本生成
koboldcpp- 使用KoboldAI的UI运行各种GGML模型的简单单文件方式GGML两者C/C++文本生成
LoLLMS- 大型语言模型之王Web用户界面。几乎所有两者Python文本生成
ExLlama- HF transformers的Llama实现的更节省内存的重写版本AutoGPTQ/GPTQGPUPython/C++文本生成
vLLM- vLLM是一个快速且易用的LLM推理和服务库。GGML/GGUF两者Python文本生成
SGLang- 比vLLM高3-5倍的吞吐量(控制流、RadixAttention、KV缓存重用)Safetensor / AWQ / GPTQGPUPython文本生成
LmDeploy- LMDeploy是一个用于压缩、部署和服务LLM的工具包。Pytorch / Turbomind两者Python/C++文本生成
Tensorrt-llm- 在NVIDIA GPU上高效推理Python / C++ 运行时两者Python/C++文本生成
CTransformers- 使用GGML库在C/C++中实现的Transformer模型的Python绑定GGML/GPTQ两者C/C++文本生成
llama-cpp-python- llama.cpp的Python绑定GGUF两者Python文本生成
llama2.rs- 纯Rust实现的快速llama2解码器GPTQCPURust文本生成
ExLlamaV2- 一个快速推理库,用于在现代消费级GPU上本地运行LLMGPTQ/EXL2GPUPython/C++文本生成
LoRAX- 可扩展到1000多个微调LLM的多LoRA推理服务器Safetensor / AWQ / GPTQGPUPython/Rust文本生成
text-generation-inference- 推理服务工具箱,为每种LLM架构提供优化的内核Safetensors / AWQ / GPTQ两者Python/Rust文本生成

推理UI

  • oobabooga - 一个用于大型语言模型的Gradio网页界面。
  • LM Studio - 发现、下载和运行本地大语言模型。
  • LocalAI - LocalAI是一个即插即用的REST API替代品,兼容OpenAI API规范,用于本地推理。
  • FireworksAI - 体验世界上最快的LLM推理平台,无需额外费用即可部署您自己的模型。
  • faradav - 离线与AI角色聊天,本地运行,零配置。
  • GPT4All - 一个免费使用、本地运行、注重隐私的聊天机器人。
  • LLMFarm - 使用GGML库在iOS和MacOS上离线运行llama和其他大型语言模型。
  • LlamaChat - LlamaChat允许您在Mac上本地运行LLaMa、Alpaca和GPT4All模型进行聊天。
  • LLM as a Chatbot Service - 将LLM作为聊天机器人服务。
  • FuLLMetalAi - Fullmetal.Ai是一个分布式的自托管大型语言模型(LLMs)网络。
  • Automatic1111 - Stable Diffusion网页界面。
  • ComfyUI - 一个功能强大且模块化的Stable Diffusion图形用户界面,具有图形/节点界面。
  • Wordflow - 在浏览器中运行、分享和发现AI提示。
  • petals - 像BitTorrent一样在家运行LLMs。微调和推理速度比卸载快10倍。
  • ChatUI - 为HuggingChat应用提供支持的开源代码库。
  • AI-Mask - 为网页应用提供模型推理的浏览器扩展。由web-llm和transformers.js支持。
  • everything-rag - 通过易于使用的、100%本地的Gradio聊天机器人与Hugging Face Hub上的(几乎)任何LLM进行交互。
  • LmScript - SGLang和Outlines的用户界面

平台/完整解决方案

  • H2OAI - H2OGPT 最快、最准确的AI云平台。
  • BentoML - BentoML是一个用于构建可靠、可扩展和高效的AI应用程序的框架。
  • Predibase - LLMs的无服务器LoRA微调和服务。

开发者工具

  • Jan Framework - Jan的核心是一个跨平台、本地优先和AI原生的应用框架,可用于构建任何东西。
  • Pinecone - AI的长期记忆。
  • PoplarML - PoplarML使用最少的工程努力即可部署生产就绪、可扩展的ML系统。
  • Datature - 构建和部署视觉AI的一站式平台。
  • One AI - 让生成式AI适用于商业。
  • Gooey.AI - 创建您自己的无代码AI工作流程。
  • Mixo.io - AI网站构建器。
  • Safurai - AI代码助手,帮助您节省修改、优化和搜索代码的时间。
  • GitFluence - 一个AI驱动的解决方案,帮助您快速找到正确的命令。立即开始使用Git命令生成器,节省时间。
  • Haystack - 一个用于构建NLP应用程序(如代理、语义搜索、问答)的框架,使用语言模型。
  • LangChain - 一个用于开发由语言模型驱动的应用程序的框架。
  • gpt4all - 一个在大量干净的助手数据(包括代码、故事和对话)上训练的聊天机器人。
  • LMQL - LMQL是一种针对大型语言模型的查询语言。
  • LlamaIndex - 一个数据框架,用于构建基于外部数据的LLM应用程序。
  • Phoenix - 由Arize开发的开源ML可观察性工具,在您的笔记本环境中运行。监控和微调LLM、CV和表格模型。
  • trypromptly - 在几分钟内创建AI应用和聊天机器人。
  • BentoML - BentoML是软件工程师构建AI产品的平台。
  • LiteLLM - 使用OpenAI格式调用所有LLM API。

用户工具

  • llmcord.py - Discord LLM聊天机器人 - 与您的朋友一起与LLMs交谈!

代理

  • SuperAGI - 开源AGI基础设施。
  • Auto-GPT - 一个试图让GPT-4完全自主的开源实验性尝试。
  • BabyAGI - Baby AGI是一个使用Python开发的自主AI代理,通过OpenAI和Pinecone API运行。
  • AgentGPT - 在浏览器中组装、配置和部署自主AI代理。
  • HyperWrite - HyperWrite帮助你更智能、更快速、更轻松地工作。
  • AI Agents - 提升你生产力的AI代理。
  • AgentRunner.ai - 利用GPT-4的力量创建和训练完全自主的AI代理。
  • GPT Engineer - 指定你想要构建的内容,AI会询问澄清,然后构建它。
  • GPT Prompt Engineer - 自动化提示工程。它生成、测试和排序提示以找到最佳提示。
  • MetaGPT - 多代理框架:给出一行需求,返回PRD、设计、任务、代码库。
  • Open Interpreter - 让语言模型运行代码。让你的代理编写和执行代码。
  • CrewAI - 用于编排角色扮演、自主AI代理的前沿框架。

训练

  • FastChat - 用于训练、服务和评估大型语言模型的开放平台。
  • DeepSpeed - DeepSpeed是一个深度学习优化库,使分布式训练和推理变得简单、高效和有效。
  • BMTrain - 大型模型的高效训练。
  • Alpa - Alpa是一个用于训练和服务大规模神经网络的系统。
  • Megatron-LM - 正在进行的大规模训练transformer模型的研究。
  • Ludwig - 用于构建自定义LLM、神经网络和其他AI模型的低代码框架。
  • Nanotron - 极简的大型语言模型3D并行训练。
  • TRL - 使用强化学习进行语言模型对齐。
  • PEFT - 参数高效微调(LoRA、DoRA、模型合并等)

LLM排行榜

研究

  • 注意力就是一切(2017):介绍了原始的transformer模型。它有助于序列到序列的任务,如机器翻译。[论文]
  • BERT:用于语言理解的深度双向Transformers预训练(2018):有助于语言建模和预测任务。[论文]
  • FlashAttention:具有IO感知的快速且内存高效的精确注意力机制(2022):改进transformer的机制。[论文]
  • 通过生成式预训练提高语言理解(2019):OpenAI关于GPT的论文。[论文]
  • Cramming:在一天内用单个GPU训练语言模型(2022):论文专注于一种使用最少计算能力提高性能的方法。[论文]
  • LaMDA:对话应用的语言模型(2022):LaMDA是谷歌基于Transformer的神经语言模型系列。[论文]
  • 通过人类反馈训练语言模型遵循指令(2022):使用人类反馈来对齐LLM。[论文]
  • TurboTransformers:Transformer模型的高效GPU服务系统(PPoPP'21) [论文]
  • 大型语言模型的快速分布式推理服务(arXiv'23) [论文]
  • 基于CPU的Transformer语言模型的高效稀疏推理软件加速器(arXiv'23) [论文]
  • 使用分阶段推测解码加速LLM推理(arXiv'23) [论文]
  • ZeRO:面向训练万亿参数模型的内存优化(SC'20) [论文]
  • TensorGPT:基于张量列分解的LLM嵌入层高效压缩 2023 [论文]

社区

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号