Project Icon

modelmesh

高扩展性分布式模型服务管理框架

ModelMesh是一个通用的模型服务管理框架,适用于大规模、高密度和动态变化的模型部署环境。它作为分布式LRU缓存,与各种模型服务器协同工作,优化运行时模型的服务。支持Kubernetes部署,提供自定义资源管理,并能无缝集成多种开源模型服务器。

distributed-ml-patterns - 构建并优化分布式机器学习系统的方法
Argo WorkflowsDistributed Machine Learning PatternsGithubKubeflowKubernetes分布式机器学习开源项目
《Distributed Machine Learning Patterns》一书详细介绍了如何构建可扩展和高可靠性的机器学习系统。内容涵盖数据摄取、分布式训练、模型服务等方面,以及如何利用Kubernetes、TensorFlow、Kubeflow和Argo Workflows实现任务自动化。通过该书,读者将掌握关键概念与实际案例,并学会在大规模集群上管理和监控机器学习任务。本书适合具备基础机器学习知识的数据分析师、数据科学家和软件工程师。
distributed-llama - 优化大型语言模型的分布式计算性能
Distributed LlamaGithubLlama 3Python 3TCP socketsTensor parallelism开源项目
通过分布式计算技术,分散大型语言模型(LLMs)的工作负载到多个设备上,即使是性能较弱的设备也能运行强大的LLMs。项目使用TCP sockets同步状态,用户可以使用家庭路由器轻松配置AI集群,实现显著加速效果。Distributed Llama支持多种模型架构,提供简便的设置和操作方法,用户可以在本地运行大规模语言模型。
ModelsLab - 全面的AI API平台助力下一代智能应用开发
AI工具AI绘图APILLMStable Diffusion模型训练
ModelsLab是一个综合性AI API服务平台,提供稳定扩散、大型语言模型等多种AI功能接口。平台支持文本生成图像、图像编辑、视频生成、语音克隆等应用,无需用户配置高性能硬件。拥有10,000多个预训练模型和模型微调功能,可满足个人到企业的多样化AI需求。ModelsLab支持快速集成先进AI技术,加速新一代智能应用的开发与落地。
serving - 灵活且高效的机器学习模型推理平台
DockerGithubTensorFlow Serving开源项目机器学习模型部署高性能推理
TensorFlow Serving 是一个为生产环境设计的灵活且高性能的机器学习模型推理系统。它管理训练后的模型生命周期,通过高效查询表提供版本化访问,支持多模型和多版本同时部署。系统支持 gRPC 和 HTTP 推理端点,允许无缝部署新版本,支持金丝雀发布和 A/B 测试,并且延迟极低。调度器将推理请求分组以在 GPU 上联合执行,支持包括 TensorFlow 模型、嵌入、词汇表和特征转换在内的多种服务对象。
kube-fledged - Kubernetes容器镜像缓存管理工具
GithubImageCacheKuberneteskubefledged-controller容器镜像缓存开源项目自定义资源
kube-fledged是一个Kubernetes操作符,用于在集群工作节点上管理容器镜像缓存。它允许定义镜像列表和缓存位置,加速应用容器启动。通过API接口管理缓存生命周期,支持多种配置选项。适用于需快速扩展的应用、Serverless函数、边缘计算等场景,可提高容器启动速度和集群性能。
K8Studio - 高效可视化的Kubernetes集群管理平台
AI工具CloudMapsDevOpsK8StudioKubernetes集群管理
K8Studio是一款功能全面的Kubernetes管理工具,通过CloudMaps可视化技术将复杂集群数据转化为清晰洞察。支持多集群管理、资源可视化、YAML编辑、SSH连接和日志访问等功能。适用于不同经验水平的Kubernetes用户,注重性能优化和数据隐私保护。K8Studio能高效处理大型集群,为Kubernetes监控和管理提供流畅、直观的解决方案。
UbiOps - AI模型部署与编排的简化解决方案
AI基础设施AI工具UbiOps云计算机器学习模型部署
UbiOps是一个AI模型部署和编排平台,专为简化AI和机器学习项目而设计。该平台使数据科学团队能够将AI工作负载快速转化为可靠的微服务,无需深厚的DevOps经验。支持LLM和计算机视觉等多种AI模型,提供自动扩展、混合云部署和工作流管理功能。UbiOps致力于优化AI产品的开发流程,同时提高计算资源利用效率,降低运营成本。
graphstorm - 训练和部署大规模图机器学习模型的企业级框架
GithubGraphStorm分布式训练图机器学习开源项目节点分类链接预测
GraphStorm是一个面向企业的图机器学习框架,能处理数十亿节点和边的超大规模图。它提供可扩展的训练和推理管道,内置多种GML模型,支持一键训练。框架还提供丰富配置选项用于自定义模型和训练流程,并支持分布式训练自定义GML模型,只需提供模型实现即可实现扩展。
mmengine - 深度学习训练引擎支持大规模模型训练和多种策略
GithubMMEngineOpenMMLabPyTorch开源项目深度学习训练引擎
MMEngine是基于PyTorch的深度学习模型训练基础库,作为OpenMMLab代码库的训练引擎。它集成主流大规模模型训练框架,支持混合精度训练等多种策略,提供友好的配置系统和主流监控平台支持。MMEngine不仅适用于OpenMMLab项目,还可广泛应用于其他深度学习项目。
nvshare - 多进程安全共享GPU的开源解决方案
CUDAGPU共享GithubKubernetesnvshare内存管理开源项目
nvshare是一个开源的GPU共享机制,支持多个进程或Kubernetes容器在同一GPU上安全并发运行。它利用统一内存API和系统RAM作为交换空间,使每个进程都能访问全部GPU内存。通过nvshare-scheduler管理GPU访问时间,有效避免内存抖动。这种方案适用于GPU使用呈突发性的场景,如交互式开发环境中的Jupyter notebooks等。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号