#大型模型

kaito - Kubernetes集群AI/ML模型自动化部署与管理工具
KubernetesAIGPU大型模型自动化Github开源项目
Kaito是一款专为Kubernetes集群设计的AI/ML模型自动化管理工具。它支持falcon和phi-3等开源大模型,通过容器镜像管理模型文件,提供预设配置,自动配置GPU节点,并利用Microsoft Container Registry托管模型镜像。Kaito显著简化了在Kubernetes环境中部署和管理大型AI推理模型的过程,为开发者和运维人员提供了高效、便捷的解决方案。
Awesome_Matching_Pretraining_Transfering - 多模态模型、参数高效微调及视觉语言预训练研究进展汇总
多模态模型参数高效微调视觉语言预训练图像文本匹配大型模型Github开源项目
该项目汇总了多模态模型、参数高效微调、视觉语言预训练和图像-文本匹配领域的研究进展。内容涵盖大语言模型、视频多模态模型等多个方向,定期更新最新论文和资源。项目为相关领域的研究人员和开发者提供了系统的学习参考。
large-ocr-model.github.io - OCR 技术提升多模态大模型视觉问答性能研究
OCR大型模型多模态视觉问答缩放法则Github开源项目
本项目研究 OCR 技术对多模态大模型性能的影响。实验表明,OCR 能显著提高模型在视觉问答任务中的表现。研究者构建了 REBU-Syn 数据集,验证了 OCR 领域的缩放法则,并开发了高精度 OCR 模型。这项工作为多模态大模型的应用开辟了新方向,揭示了 OCR 在增强模型能力方面的重要价值。
cake - 框架实现分布式大模型推理 充分利用闲置设备
Cake分布式推理大型模型异构集群AI民主化Github开源项目
Cake是基于Candle的Rust框架,通过整合iOS、Android、macOS、Linux和Windows设备为异构集群,实现大型模型(70B+)的分布式推理。该框架将transformer块分片到多设备上,突破单设备GPU内存限制,有效利用闲置硬件资源,降低AI应用门槛。