#批处理

FlexGen入门指南 - 在单个GPU上高吞吐量运行大型语言模型

2 个月前
Cover of FlexGen入门指南 - 在单个GPU上高吞吐量运行大型语言模型

Apache Flink: 强大的流处理框架

3 个月前
Cover of Apache Flink: 强大的流处理框架

Apache Beam: 统一批处理和流处理的开源大数据处理框架

3 个月前
Cover of Apache Beam: 统一批处理和流处理的开源大数据处理框架

BLoRA: 如何利用批处理LoRA技术提升大语言模型推理效率

3 个月前
Cover of BLoRA: 如何利用批处理LoRA技术提升大语言模型推理效率

JAXopt: 硬件加速、可批处理和可微分的JAX优化器

3 个月前
Cover of JAXopt: 硬件加速、可批处理和可微分的JAX优化器

FlexGen: 在单个GPU上高效运行大型语言模型

3 个月前
Cover of FlexGen: 在单个GPU上高效运行大型语言模型

Whisper JAX:让你的语音转文字功能速度快70倍!

2024年08月03日
Cover of Whisper JAX:让你的语音转文字功能速度快70倍!
相关项目
Project Cover

FlexGen

FlexGen通过高效的IO卸载、压缩和大批量处理,实现了在单GPU上高吞吐量运行大语言模型。该系统专为高吞吐量任务设计,如信息提取和数据处理,特别适合成本敏感的环境。虽然FlexGen在小批量任务上速度较慢,但在批量处理和低成本硬件上具有显著优势。

Project Cover

EnumerableAsyncProcessor

EnumerableAsyncProcessor是一个.NET异步任务处理库,提供单线程、批处理、并行和速率限制等多种执行模式。该库能够帮助管理大量异步操作,优化资源利用,并提供精细控制。适用于API请求限流、批量数据处理和并发性能优化等场景,简化了异步编程的复杂性。

Project Cover

jaxopt

JAXopt是基于JAX的优化器库,提供硬件加速、批处理和可微分的优化算法。支持GPU和TPU,可自动向量化多个优化问题实例,并支持优化解的微分。目前正与Optax合并,处于维护模式。适用于机器学习和科学计算领域的优化任务。

Project Cover

BLoRA

BLoRA项目开发了一种新技术,通过在同一批次中处理多个LoRA模型的推理来提高GPU利用率。该技术支持同时加载多个LoRA适配器,并在单一基础模型上进行并行推理。BLoRA不仅优化了计算效率,还为开发者提供了在不同任务间灵活切换模型行为的工具。这一简单而直观的实现为大规模语言模型的应用创造了新机会。

Project Cover

beam

Apache Beam是一个统一的数据处理模型,用于定义批处理和流处理的并行数据处理管道。它提供多语言SDK构建管道,并可在Apache Flink、Spark等分布式处理后端上执行。Beam支持Java、Python和Go等语言,为各类开发者提供灵活的开发环境。该项目采用统一模型处理批处理和流处理数据,支持多种编程语言,并可在多个分布式处理平台上运行。它为不同类型的开发者提供了灵活的工具,简化了大规模数据处理的复杂性。

Project Cover

flink

Apache Flink是开源流处理框架,专注于高性能流处理和批处理。框架提供Java和Scala API,支持高吞吐低延迟的事件处理。主要特性包括事件时间处理、灵活窗口操作和exactly-once语义。Flink还集成了图计算、机器学习库,并可与Hadoop生态系统无缝对接。该框架适用于实时分析和大规模数据处理场景,为企业提供强大的数据处理能力。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号