#高效推理

Marlin入门学习资料 - 高性能LLM推理内核

2 个月前
Cover of Marlin入门学习资料 - 高性能LLM推理内核

Awesome Efficient AIGC: 提升人工智能生成内容效率的前沿技术综述

3 个月前
Cover of Awesome Efficient AIGC: 提升人工智能生成内容效率的前沿技术综述

Cobra: 多模态大语言模型的高效推理革新

3 个月前
Cover of Cobra: 多模态大语言模型的高效推理革新

LLMBox:打造全面的大语言模型开发与评估工具库

3 个月前
Cover of LLMBox:打造全面的大语言模型开发与评估工具库

大型语言模型的效率优化:一项全面调查

3 个月前
Cover of 大型语言模型的效率优化:一项全面调查

Marlin固件:开源3D打印机驱动程序的革新之作

3 个月前
Cover of Marlin固件:开源3D打印机驱动程序的革新之作
相关项目
Project Cover

marlin

Marlin是一款专为LLM推理设计的FP16xINT4优化内核,可实现接近4倍的速度提升,并支持16-32个token的batchsize。通过高效利用GPU资源,如全局内存、L2缓存、共享内存和张量核心,Marlin克服了现代GPU的FLOP和字节比率挑战。多种优化技术包括异步权重加载和双缓冲共享内存加载,确保性能最大化。该项目适用于CUDA 11.8及以上版本,支持NVIDIA Ampere或Ada架构的GPU,并与torch 2.0.0和numpy兼容。在各种基准测试中,Marlin展示了卓越的性能,尤其在持久计算和大batchsize处理方面表现出色。

Project Cover

Efficient-LLMs-Survey

本项目系统性地综述了大语言模型效率优化研究,包括模型压缩、高效预训练、微调和推理等方面。从模型、数据和框架三个维度对相关技术进行分类,全面梳理了该领域的最新进展,为研究人员和从业者提供了有价值的参考资料。

Project Cover

LLMBox

LLMBox是一个综合性大型语言模型(LLM)库,集成了统一的训练流程和全面的模型评估功能。该框架旨在提供LLM训练和应用的完整解决方案,其设计注重实用性,在训练和使用过程中体现出高度的灵活性和效率。LLMBox支持多样化的训练策略和数据集,提供丰富的评估方法,并具备高效的推理和量化能力,为LLM的研究和开发提供了强大支持。

Project Cover

awesome-efficient-aigc

该项目汇集了提高AI生成内容(AIGC)效率的最新技术资源,包括大语言模型(LLMs)和扩散模型(DMs)的优化方法。收录内容涵盖前沿研究论文、代码实现和综述文章,重点关注量化、微调等效率提升技术。这一持续更新的资源库为AIGC领域的研究和开发提供了全面的参考,有助于推动相关技术的进步与落地应用。

Project Cover

cobra

Cobra项目是一个基于Mamba架构的多模态大语言模型,旨在实现高效推理。该模型支持文本和图像输入,提供预训练权重、训练代码和推理脚本。Cobra在处理视觉语言任务时保持高性能,为研究人员和开发者提供了实用的工具。项目包括模型加载、图像处理和文本生成等功能,便于用户快速上手和应用。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号