#开源模型

Langchain-Chatchat - 基于Langchain实现的开源知识库问答和Agent应用
Langchain-Chatchat知识库问答模型部署框架开源模型APIGithub开源项目热门
Langchain-Chatchat是一个基于ChatGLM与Langchain技术开发的开源项目,支持离线部署。该项目提供一个可扩展的知识库问答解决方案,特别适用于中文语境和开源模型。项目最新版本集成了多种模型推理框架,如Xinference、Ollama等,支持API调用和WebUI操作,致力于提供一个完备的知识管理与问答系统。
DeepSeek - 大模型与API服务
热门AI助手AI对话AI工具DeepSeek-V2人工智能模型排名开源模型API价格
DeepSeek,一个高级AI平台,通过其大规模模型DeepSeek-V2,在主要AI排行榜如AlignBench和MT-Bench中获得高分,提供数学、编程和推理的精确解决方案。以竞争力的API定价,支持128K上下文长度和多语言,是开发者和研究者的优选。
dbrx - 大规模开源语言模型DBRX,支持灵活定制
DBRXDatabricksMixture-of-Experts开源模型LLM FoundryGithub开源项目
DBRX是由Databricks训练的开源大型语言模型,采用开放许可。该模型包含基本代码和示例,用于推理操作,并提供相关资源。DBRX是一个Mixture-of-Experts模型,拥有1320亿总参数和12T文本预训练数据,支持TensorRT-LLM和vLLM等多种推理库。DBRX提供基础版和指令微调版,且支持在Databricks平台上的多种集成应用。
MING - 中文医疗问诊模型
MING医疗问答智能问诊开源模型医疗大模型Github开源项目
明医 (MING) 是一款开源的中文医疗问诊模型,基于医疗指令进行微调,主要功能包括医疗问答和智能问诊。最新的MING-MOE版本通过稀疏低秩适配器专家提升多任务学习性能。该项目由上海交通大学和上海人工智能实验室智慧医疗中心合作开发,提供多种模型版本供下载使用。
what-llm-to-use - 主流开源与商业LLM模型的选择标准、特点及应用场景的详细介绍
DevAILLM开源模型商业模型编程Github开源项目
DevAI领域发展迅速,开发者需选择适合的LLM模型。本文详细介绍主流开源与商业LLM模型的选择标准、特点及应用场景,包含从本地环境到托管服务的部署指南,提供全面对比与建议,帮助开发者提升开发效率。欢迎贡献意见以完善此LLM索引。
WhisperSpeech - 多语言支持的开源文本转语音系统,功能强大并易于定制
WhisperSpeech文本转语音多语言支持开源模型语音克隆Github开源项目
WhisperSpeech是基于开源Whisper框架开发的文本至语音系统,提供了商业级安全的语音合成解决方案。当前支持英语LibreLight数据集,并计划拓展到多语言支持。用户可通过在线Colab平台体验其高效的语音合成和声音克隆功能。
Discord-AI-Chatbot - 智能聊天伴侣
Discord AI Chatbot免费语言模型开源模型个性选择安全凭证管理Github开源项目
Discord AI Chatbot是一个创新的聊天机器人,为Discord平台增添了丰富多样的功能。它支持多语言、可个性化配置,搭载图像生成和安全的凭证管理技术。此外,其简单的配置与防误操作设计促进了在特定频道的灵活使用。Chatbot是一款免费且开源的软件,便于用户根据个别需求进行调整。
CareGPT - 医疗人工智能开源模型
CareGPT医疗LLM开源模型数据集部署Github开源项目
CareGPT是为医疗行业设计的开源大型语言模型,提供全面的医学数据整合、高效的模型部署和资源持续更新。此项目优化了模型与知识库的结合,全面支持LLaMA系列模型的训练,并构建了高效的问答系统,从而在医疗人工智能领域中取得显著成效。深入了解CareGPT,发掘更多医疗应用案例,并推进科技与医疗的深度结合。
tribe - 快速搭建多智能体团队的低代码AI工具
Tribe AI多代理团队低代码工具开源模型序列工作流Github开源项目
Tribe AI是一款低代码平台,它允许用户迅速构建和协调多智能体团队,适合处理如足球分析、旅行规划和客户服务等多种复杂任务。平台特色包括顺序和层级工作流、自定义智能体技能、集成开源模型、以及增强的任务监控和持续对话管理。
SkyCode-AI-CodeX-GPT3 - 多语言支持与中文优化的开源代码生成模型
SkyCode代码生成开源模型GPT3多语言Github开源项目
SkyCode是一款由奇点智源发布的多语言开源代码生成模型,基于GPT3架构并使用大量代码进行训练。支持Java、JavaScript、C、C++、Python、Go和shell等主流编程语言,并能理解中文注释。SkyCode在中文编码优化和HumanEval数据集的解题性能上表现卓越,使开发者能够高效完成编程任务。了解更多信息,请访问Hugging Face模型主页。
ComfyUI-BRIA_AI-RMBG - BRIA Background Removal v1.4的非官方实现,支持批量处理和视频背景去除
ComfyUIBRIA Background RemovalRMBG开源模型批量处理Github开源项目
ComfyUI-BRIA_AI-RMBG是BRIA Background Removal v1.4的非官方实现,支持批量处理和视频背景去除。最新版本V1.5新增输出mask功能,并能与ComfyUI无缝集成,简化视频处理工作,显著提升效率。通过简便的安装步骤即可快速上手,适用于多种视频编辑任务。
Baichuan-13B - 包含130亿参数和出色Benchmark性能的大规模开源语言模型
Baichuan-13B百川智能开源模型对齐模型量化版本Github开源项目
Baichuan-13B是一个包含130亿参数的开源模型,支持中英双语,并在多项Benchmark测试中表现优异。它具有更大的参数量和数据规模,更高效的推理能力,且完全免费商业使用。通过简单的代码即可部署,量化版本大大降低了部署门槛,广泛适用于学术研究和商业应用。
private-detector - 开源的不雅图像识别器
Private DetectorBumble识别淫秽图片Efficientnet-v2开源模型Github开源项目
Private Detector™是一个由Bumble推出的开源图像分类器,能够识别不雅图像。基于Efficientnet-v2模型并使用内部数据集进行训练,用户可以下载预训练模型并进行微调。项目提供详细的推理示例和训练指南,帮助开发者通过Python脚本轻松配置和使用。Private Detector™旨在提升互联网安全性,特别为保护女性免受不雅图像困扰。
codellama - 基于Llama 2的多功能代码生成模型
Code Llama大语言模型代码生成AI编程开源模型Github开源项目
Code Llama是基于Llama 2开发的代码语言模型系列,提供多种功能变体。这些模型支持代码补全、处理大规模输入和零样本指令跟随。项目包含基础模型、Python专用模型和指令跟随模型,参数规模从7B到34B不等。经过16k令牌序列训练,模型在处理长达100k令牌的输入时表现优异。Code Llama为开发者提供了适用于多种编程任务的代码生成工具。
recognize-anything - 通用图像识别模型:支持开放域类别和高精度标签生成
RAM++图像识别开源模型零样本学习多模态Github开源项目
Recognize Anything Model是一系列开源图像识别模型,包括RAM++、RAM和Tag2Text。这些模型能准确识别常见和开放域类别,支持高精度图像标签生成和全面描述。项目提供预训练模型、推理代码和训练数据集,适用于多种计算机视觉任务。模型性能优于现有先进方案,尤其在零样本识别方面表现突出。
Local-LLM-User-Guideline - 本地大语言模型深度解析 理论与实践全方位探讨
LLM开源模型本地部署隐私保护自定义Github开源项目
本项目提供Local-LLM全面指南,深入剖析大语言模型背景、开源LLM利弊、在线与本地LLM对比及应用场景。详述LLM运作机制、应用差异和在线使用挑战。指南助力用户选择合适LLM方案,尤其适合本地部署LLM的开发者和研究人员参考。
parler-tts - 轻量级开源TTS模型 支持自定义语音特征
Parler-TTS文本转语音开源模型语音合成自然语言处理Github开源项目
Parler-TTS是一个轻量级开源文本转语音模型,通过文本提示控制语音特征如性别、语速和音调。项目提供完整训练和推理代码及预训练模型,便于用户定制TTS模型。最新版本引入SDPA和Flash Attention 2,显著提升生成速度。该模型支持随机声音生成和特定说话人复制,适用于多种TTS应用场景。
DeepSeek-MoE - 创新MoE架构打造高效大规模语言模型
DeepSeekMoE大语言模型MoE架构模型评估开源模型Github开源项目
DeepSeek-MoE项目开发了创新的混合专家架构语言模型,采用细粒度专家分割和共享专家隔离策略。该16.4B参数模型仅使用40%计算量就达到DeepSeek 7B和LLaMA2 7B的性能水平。模型可在单个40GB内存GPU上直接部署运行,无需量化,为学术和商业研究提供了高效便捷的工具。
sqlcoder - 自然语言转SQL查询的开源AI模型
SQLCoder自然语言转SQL语言模型数据库查询开源模型Github开源项目
SQLCoder是一系列开源的大型语言模型,专注于将自然语言问题转换为SQL查询。这些模型在性能测试中表现优异,超越了GPT-4和其他主流开源模型。SQLCoder适配多种硬件环境,包括NVIDIA GPU、Apple Silicon和CPU,便于不同用户安装使用。通过简单的命令行操作,用户可以连接数据库并进行可视化查询。该项目采用开放许可,欢迎社区参与和贡献。
DeepSeek-Coder-V2 - 开源代码语言模型
DeepSeek-Coder-V2MoE模型代码智能开源模型AI模型Github开源项目
DeepSeek-Coder-V2是一款性能出色的开源代码语言模型,在多项代码相关任务中展现了强大实力。该模型支持338种编程语言,拥有128K的上下文长度,采用混合专家(MoE)架构。提供16B和236B两种参数版本,在代码生成、补全和修复等任务中表现卓越,同时在数学推理和通用语言任务中也展现出强大能力,为代码智能领域带来重要进展。
DeepSeek-Math - 开源数学推理模型的新突破
DeepSeekMath大语言模型数学推理开源模型人工智能Github开源项目
DeepSeek-Math是基于DeepSeek-Coder-v1.5 7B预训练的开源数学推理模型。在MATH基准测试中,它达到51.7%的成绩,接近Gemini-Ultra和GPT-4的水平。项目提供基础、指令微调和强化学习三个7B模型版本,支持数学问题求解、工具使用和定理证明。DeepSeek-Math在保持通用能力的同时提升了数学推理能力,为数学研究提供了新的AI工具。
LLMsNineStoryDemonTower - 大语言模型全面学习路径 从入门到实战进阶
LLMsChatGLM3微调开源模型自然语言处理Github开源项目
LLMsNineStoryDemonTower项目提供全面的大语言模型学习资源,涵盖NLP基础到高级应用的九个层次。内容包括ChatGLM、Baichuan、Llama2等主流模型实践,以及模型微调、推理加速和多模态应用等进阶主题。该项目为学习者构建了从理论到实践的完整大语言模型学习路径。
Telechat - 开源多语言对话模型,支持长文生成和高效部署
TeleChat大语言模型中文数据集模型评测开源模型Github开源项目
TeleChat是一系列开源大语言模型,包含1B至12B规模,支持中英双语。采用优化结构和训练方法,在多领域表现优异。项目开源预训练数据集和评测结果,支持模型微调与高效部署。
TripoSR - 高效单图3D重建开源工具
TripoSR3D重建单图重建开源模型人工智能Github开源项目
TripoSR是Tripo AI和Stability AI合作开发的开源3D重建模型,基于大型重建模型(LRM)原理,能从单张图像快速生成3D模型。在NVIDIA A100 GPU上,处理时间不到0.5秒。该模型在多个公共数据集上表现出色,为3D内容创作和研究提供了高效工具。
PurpleLlama - Meta推出全面AI安全工具集 推动负责任生成式AI发展
Purple LlamaAI安全开源模型网络安全生成式AIGithub开源项目
Purple Llama是Meta开发的开源AI安全项目,为开发者提供全面工具和评估标准。该项目包含Llama Guard输入输出防护工具和CyberSec Eval网络安全基准,采用开放许可支持研究和商业应用。Purple Llama旨在推动AI信任与安全标准的社区协作,促进负责任的生成式AI技术发展。
InternLM-Math - 开源双语数学推理大模型
InternLM-Math数学推理大语言模型开源模型人工智能Github开源项目
InternLM-Math是一个开源的双语数学推理大模型,在形式化和非形式化数学推理方面表现优异。它集成了数学问题求解、证明、验证和增强等功能。该模型在MiniF2F、MATH和GSM8K等基准测试中展现出领先性能,并支持使用Lean语言进行可验证的数学推理。InternLM-Math还可作为奖励模型和数学问题增强助手,为数学研究和应用提供有力支持。
ChatGLM3 - 突破性能与功能的开源对话模型
ChatGLM3大语言模型开源模型对话系统AIGithub开源项目
ChatGLM3是智谱AI与清华大学KEG实验室联合开发的开源对话模型。该模型在保持对话流畅和易于部署的基础上,引入了更强大的基础架构、更全面的功能支持和多个开源版本。ChatGLM3-6B不仅支持多轮对话,还能进行工具调用和代码执行,在10B以下模型中表现出色。此外,项目还开源了基础模型和长文本版本,为学术研究和商业应用提供了多样化选择。
MiniCPM - 轻量级大语言模型实现高性能端侧部署
MiniCPM端侧大语言模型开源模型多模态模型量化Github开源项目
MiniCPM是一系列高效的端侧大语言模型,仅有2.4B非词嵌入参数。经过优化后,在多项评测中表现优异,甚至超越了一些参数量更大的模型。该项目支持多模态功能,可在移动设备上流畅运行。MiniCPM开源了多个版本,涵盖文本、多模态、量化和长文本等应用场景,适用于学术研究和特定商业用途。这一开源项目由面壁智能与清华大学自然语言处理实验室联合开发。
WizardLM - 增强大型语言模型执行复杂指令的开源项目
WizardLM大语言模型指令跟随开源模型人工智能Github开源项目
WizardLM项目致力于增强大型预训练语言模型处理复杂指令的能力。通过创新训练方法,该项目使模型更好地理解和执行多步骤、高难度任务。WizardLM在编程、数学和通用对话等基准测试中表现卓越。项目开源多个不同规模的模型版本,为语言模型技术的研究与应用提供有力支持。
MoA - 多层LLM集成方法MoA在基准测试中超越GPT-4
MoALLMAI模型开源模型自然语言处理Github开源项目
MoA项目开发了一种多层LLM集成方法,在AlpacaEval 2.0评测中得分65.1%,超过GPT-4 Omni的57.5%。项目提供简洁实现代码、交互式演示和评估脚本,便于研究者使用和复现。该方法在多个基准测试中表现优异,为AI系统性能提升提供新思路。
secret-llama - 浏览器端运行的私密LLM聊天机器人 支持多种开源模型
Secret LlamaLLMWebGPU开源模型浏览器应用Github开源项目
Secret Llama是一款在浏览器中运行的私密LLM聊天机器人,支持Llama 3、Mistral等开源模型。对话数据完全保留在本地计算机,无需服务器或安装。界面易用性媲美ChatGPT,支持离线工作。运行需要支持WebGPU的现代浏览器,不同模型可能有特定内存要求。项目欢迎贡献者参与改进界面、扩展模型支持和优化加载性能。
NSQL - 专为SQL生成设计的开源大型语言模型系列
NSQLSQL生成开源模型数据库查询人工智能Github开源项目
NSQL是一个专注于SQL生成的开源大型语言模型系列。该项目提供多种规模的模型,参数量从350M到7B不等,均可在HuggingFace平台上获取。NSQL能够连接Postgres或SQLite数据库,实现自然语言到SQL的直接查询转换。此外,项目还包含用于生成NSText2SQL训练数据集的脚本。NSQL采用Apache 2.0许可证发布,为开发者提供了高效的SQL生成工具。
ComfyUI-BiRefNet-ZHO - 基于BiRefNet的开源背景抠除工具,支持图像和视频处理
ComfyUIBiRefNet背景抠除开源模型图像处理Github开源项目
ComfyUI-BiRefNet-ZHO是一个基于BiRefNet模型的开源背景抠除工具。该插件支持图像和视频处理,具有模型加载与图像处理分离、输出透明背景PNG图和视频抠像等功能。作为ComfyUI的扩展,它易于安装和使用,适用于各种需要高质量背景去除的场景。ComfyUI-BiRefNet-ZHO提供了高效的图像处理能力,是当前表现优异的开源背景抠除解决方案之一。
FuseAI - 多模型知识融合提升大语言模型性能
FuseLLM大语言模型知识融合FuseChat开源模型Github开源项目
FuseAI项目通过知识融合技术整合多个开源大语言模型的优势,开发出高性能新模型。FuseChat-7B-VaRM在MT-Bench评测中得分8.22,超过多个知名对话模型;FuseLLM-7B在多项任务中表现优于Llama-2-7B。该项目为大语言模型研究提供了新的发展方向。
awesome-llama-prompts - Llama模型提示工程技巧与最佳实践
Llama提示词AI助手开源模型对话结构Github开源项目
该项目汇集了Llama模型的多样化提示示例,涵盖Llama 2和Llama 3的提示技巧、系统提示及代码解释器提示。项目提供详细的提示模板和最佳实践,涉及对话、角色扮演和专家身份生成等应用场景。对于希望深入理解和应用Llama模型的开发者和研究人员而言,这是一个极具参考价值的资源库。
gorilla - 集成1600+ API调用的LLM模型,有效减少生成幻觉
GorillaAPI调用函数调用开源模型Berkeley Function Calling LeaderboardGithub开源项目
Gorilla项目展示了如何通过其模型实现大规模语言模型(LLM)与1600多个API的精确调用,有效减少幻觉生成并提升功能调用能力。Gorilla支持商用,具有开源许可,用户可在本地运行或通过CLI界面与之交互。项目还提供APIBench数据集和评估代码,帮助开发者优化和评估LLM工具。