#批处理

FlexGen - 单GPU高效运行大语言模型的生成引擎
Github开源项目大语言模型批处理FlexGen高吞吐量GPU内存优化
FlexGen通过高效的IO卸载、压缩和大批量处理,实现了在单GPU上高吞吐量运行大语言模型。该系统专为高吞吐量任务设计,如信息提取和数据处理,特别适合成本敏感的环境。虽然FlexGen在小批量任务上速度较慢,但在批量处理和低成本硬件上具有显著优势。
EnumerableAsyncProcessor - 多模式异步任务处理库 灵活控制执行方式和速率
Github开源项目批处理并行处理EnumerableAsyncProcessor异步任务处理速率限制
EnumerableAsyncProcessor是一个.NET异步任务处理库,提供单线程、批处理、并行和速率限制等多种执行模式。该库能够帮助管理大量异步操作,优化资源利用,并提供精细控制。适用于API请求限流、批量数据处理和并发性能优化等场景,简化了异步编程的复杂性。
jaxopt - JAX驱动的高性能优化器库
Github开源项目批处理硬件加速优化器JAXopt可微分
JAXopt是基于JAX的优化器库,提供硬件加速、批处理和可微分的优化算法。支持GPU和TPU,可自动向量化多个优化问题实例,并支持优化解的微分。目前正与Optax合并,处于维护模式。适用于机器学习和科学计算领域的优化任务。
BLoRA - 批量处理多个LoRA模型以提升GPU利用率
Github开源项目语言模型批处理LoRAGPU优化推理
BLoRA项目开发了一种新技术,通过在同一批次中处理多个LoRA模型的推理来提高GPU利用率。该技术支持同时加载多个LoRA适配器,并在单一基础模型上进行并行推理。BLoRA不仅优化了计算效率,还为开发者提供了在不同任务间灵活切换模型行为的工具。这一简单而直观的实现为大规模语言模型的应用创造了新机会。
beam - 统一批处理和流处理的数据并行处理模型
Github开源项目分布式计算数据处理批处理流处理Apache Beam
Apache Beam是一个统一的数据处理模型,用于定义批处理和流处理的并行数据处理管道。它提供多语言SDK构建管道,并可在Apache Flink、Spark等分布式处理后端上执行。Beam支持Java、Python和Go等语言,为各类开发者提供灵活的开发环境。该项目采用统一模型处理批处理和流处理数据,支持多种编程语言,并可在多个分布式处理平台上运行。它为不同类型的开发者提供了灵活的工具,简化了大规模数据处理的复杂性。
flink - 开源流处理框架 实时批处理数据分析利器
Github开源项目批处理数据流Apache Flink流处理框架
Apache Flink是开源流处理框架,专注于高性能流处理和批处理。框架提供Java和Scala API,支持高吞吐低延迟的事件处理。主要特性包括事件时间处理、灵活窗口操作和exactly-once语义。Flink还集成了图计算、机器学习库,并可与Hadoop生态系统无缝对接。该框架适用于实时分析和大规模数据处理场景,为企业提供强大的数据处理能力。