Project Icon

modelmesh

高扩展性分布式模型服务管理框架

ModelMesh是一个通用的模型服务管理框架,适用于大规模、高密度和动态变化的模型部署环境。它作为分布式LRU缓存,与各种模型服务器协同工作,优化运行时模型的服务。支持Kubernetes部署,提供自定义资源管理,并能无缝集成多种开源模型服务器。

awesome-microservices - 全面汇总微服务架构资源
APIGithub开源开源项目微服务框架编程语言
该项目汇总了微服务架构相关的平台、框架、工具和最佳实践。内容涵盖了从开发到部署的各个环节,包括服务治理、API设计、前端集成等方面。开发者可以利用这些资源,更高效地构建和管理分布式微服务系统。
csghub-server - 开源大型模型资产管理平台
CSGHubGit LFSGithubREST API大模型资产管理开源开源项目
CSGHub Server是一个开源的大型模型资产管理平台,通过REST API提供模型、数据集和其他AI资产的管理功能。核心特性包括用户组织管理、自动标签、搜索、数据集预览、内容审核、文件下载和活动追踪。支持灵活配置Git服务器和LFS存储系统,适应不同场景需求。作为AI资产管理解决方案,CSGHub Server致力于简化开发流程,提高资源利用效率。
serving - 灵活且高效的机器学习模型推理平台
DockerGithubTensorFlow Serving开源项目机器学习模型部署高性能推理
TensorFlow Serving 是一个为生产环境设计的灵活且高性能的机器学习模型推理系统。它管理训练后的模型生命周期,通过高效查询表提供版本化访问,支持多模型和多版本同时部署。系统支持 gRPC 和 HTTP 推理端点,允许无缝部署新版本,支持金丝雀发布和 A/B 测试,并且延迟极低。调度器将推理请求分组以在 GPU 上联合执行,支持包括 TensorFlow 模型、嵌入、词汇表和特征转换在内的多种服务对象。
distributed-llama - 优化大型语言模型的分布式计算性能
Distributed LlamaGithubLlama 3Python 3TCP socketsTensor parallelism开源项目
通过分布式计算技术,分散大型语言模型(LLMs)的工作负载到多个设备上,即使是性能较弱的设备也能运行强大的LLMs。项目使用TCP sockets同步状态,用户可以使用家庭路由器轻松配置AI集群,实现显著加速效果。Distributed Llama支持多种模型架构,提供简便的设置和操作方法,用户可以在本地运行大规模语言模型。
ModelsLab - 全面的AI API平台助力下一代智能应用开发
AI工具AI绘图APILLMStable Diffusion模型训练
ModelsLab是一个综合性AI API服务平台,提供稳定扩散、大型语言模型等多种AI功能接口。平台支持文本生成图像、图像编辑、视频生成、语音克隆等应用,无需用户配置高性能硬件。拥有10,000多个预训练模型和模型微调功能,可满足个人到企业的多样化AI需求。ModelsLab支持快速集成先进AI技术,加速新一代智能应用的开发与落地。
kube-fledged - Kubernetes容器镜像缓存管理工具
GithubImageCacheKuberneteskubefledged-controller容器镜像缓存开源项目自定义资源
kube-fledged是一个Kubernetes操作符,用于在集群工作节点上管理容器镜像缓存。它允许定义镜像列表和缓存位置,加速应用容器启动。通过API接口管理缓存生命周期,支持多种配置选项。适用于需快速扩展的应用、Serverless函数、边缘计算等场景,可提高容器启动速度和集群性能。
ModelCenter - 高效实现大规模预训练语言模型的开源工具
GithubModelCenter低资源分布式训练大语言模型开源项目高效实现
ModelCenter是一个开源的预训练语言模型实现工具。它基于OpenBMB/BMTrain后端,支持高效低资源的模型使用和分布式训练。相较于其他框架,ModelCenter在代码封装、环境配置、内存利用和训练速度等方面都有明显优势。该工具支持BERT、GPT、T5等多种主流预训练模型,并提供简洁易用的API接口。
k8s-mediaserver-operator - Kubernetes一站式媒体服务器管理工具
GithubKubernetesk8s-mediaserver-operator媒体服务器容器化开源项目自动化部署
k8s-mediaserver-operator是一个Kubernetes操作器,集成了Plex、Jellyfin、Sonarr和Radarr等主流媒体工具。它提供简单的配置选项,支持多种存储和网络环境,便于快速部署和管理完整的媒体服务器。这个项目能够满足电影、电视剧和播客等多样化的媒体需求,是搭建个人媒体中心的理想选择。
K8Studio - 高效可视化的Kubernetes集群管理平台
AI工具CloudMapsDevOpsK8StudioKubernetes集群管理
K8Studio是一款功能全面的Kubernetes管理工具,通过CloudMaps可视化技术将复杂集群数据转化为清晰洞察。支持多集群管理、资源可视化、YAML编辑、SSH连接和日志访问等功能。适用于不同经验水平的Kubernetes用户,注重性能优化和数据隐私保护。K8Studio能高效处理大型集群,为Kubernetes监控和管理提供流畅、直观的解决方案。
nvshare - 多进程安全共享GPU的开源解决方案
CUDAGPU共享GithubKubernetesnvshare内存管理开源项目
nvshare是一个开源的GPU共享机制,支持多个进程或Kubernetes容器在同一GPU上安全并发运行。它利用统一内存API和系统RAM作为交换空间,使每个进程都能访问全部GPU内存。通过nvshare-scheduler管理GPU访问时间,有效避免内存抖动。这种方案适用于GPU使用呈突发性的场景,如交互式开发环境中的Jupyter notebooks等。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

Trae

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号