顶级模型部署工具集合 | 好用、免费与开源的AI解决方案

albert-xxlarge-v1

albert-xxlarge-v1

HPU模型部署

Habana Gaudi处理器上的ALBERT XXL模型运行配置与效率提升方案

Mistral-7B-OpenOrca-GPTQ

Mistral-7B-OpenOrca-GPTQ

GPTQ量化自然语言处理

Mistral语言模型的GPTQ量化优化实现

Llama-2-7b-chat-hf-q4f32_1-MLC

Llama-2-7b-chat-hf-q4f32_1-MLC

模型部署聊天机器人

基于Llama-2的MLC格式聊天模型

gemma-2-2b-jpn-it-gguf

gemma-2-2b-jpn-it-gguf

日语语言模型llama.cpp

基于Gemma的日语大模型跨平台量化部署版

Llama-3.2-11B-Vision-Instruct-nf4

Llama-3.2-11B-Vision-Instruct-nf4

神经网络量化图像识别

量化视觉语言模型实现高效图像分析与理解

MiniCPM-Llama3-V-2_5-gguf

MiniCPM-Llama3-V-2_5-gguf

开源项目模型

GGUF格式大语言模型轻量化推理工具

huihui-ai_-_Qwen2.5-14B-Instruct-abliterated-v2-gguf

huihui-ai_-_Qwen2.5-14B-Instruct-abliterated-v2-gguf

Qwen2.5-14B大语言模型

Qwen2.5-14B模型无审查量化版本集合

mamba-130m-hf

mamba-130m-hf

模型开源项目

轻量级Mamba模型为序列建模提供高效替代方案

mlrun

mlrun

MLRunMLOps

MLRun简化机器学习应用的全生命周期管理

openmodelz

openmodelz

OpenModelZ模型部署

开源平台简化机器学习模型的部署和扩展

qgate-sln-mlrun

qgate-sln-mlrun

MLRun质量测试

MLRun解决方案的全面质量检测工具

text_classifier_tf2

text_classifier_tf2

文本分类深度学习模型

多模型文本分类框架 支持TextCNN、BERT等

fsdl-text-recognizer-2022-labs

fsdl-text-recognizer-2022-labs

深度学习PyTorch

深度学习全流程实践 手写识别到模型部署教程

seldon-core

seldon-core

Seldon Core机器学习

Kubernetes上的机器学习模型部署与管理平台

mlops-zoomcamp

mlops-zoomcamp

MLOps机器学习

MLOps实践指南,机器学习服务的端到端生产化

Deep-learning-in-cloud

Deep-learning-in-cloud

云GPU深度学习

深度学习云计算资源和工具综合指南

Remyx AI

Remyx AI

AI工具Remyx AI

无代码平台快速定制视觉AI模型

DataRobot MLOps

DataRobot MLOps

AI工具MLOps

统一管理生产环境中的机器学习模型

Liner.ai

Liner.ai

AI工具机器学习

无需编程快速创建和部署机器学习应用的工具

Google Gemma Chat Online

Google Gemma Chat Online

AI工具Gemma

基于Google Gemma的多功能在线对话系统