#批处理
FlexGen
FlexGen通过高效的IO卸载、压缩和大批量处理,实现了在单GPU上高吞吐量运行大语言模型。该系统专为高吞吐量任务设计,如信息提取和数据处理,特别适合成本敏感的环境。虽然FlexGen在小批量任务上速度较慢,但在批量处理和低成本硬件上具有显著优势。
EnumerableAsyncProcessor
EnumerableAsyncProcessor是一个.NET异步任务处理库,提供单线程、批处理、并行和速率限制等多种执行模式。该库能够帮助管理大量异步操作,优化资源利用,并提供精细控制。适用于API请求限流、批量数据处理和并发性能优化等场景,简化了异步编程的复杂性。
jaxopt
JAXopt是基于JAX的优化器库,提供硬件加速、批处理和可微分的优化算法。支持GPU和TPU,可自动向量化多个优化问题实例,并支持优化解的微分。目前正与Optax合并,处于维护模式。适用于机器学习和科学计算领域的优化任务。
BLoRA
BLoRA项目开发了一种新技术,通过在同一批次中处理多个LoRA模型的推理来提高GPU利用率。该技术支持同时加载多个LoRA适配器,并在单一基础模型上进行并行推理。BLoRA不仅优化了计算效率,还为开发者提供了在不同任务间灵活切换模型行为的工具。这一简单而直观的实现为大规模语言模型的应用创造了新机会。
beam
Apache Beam是一个统一的数据处理模型,用于定义批处理和流处理的并行数据处理管道。它提供多语言SDK构建管道,并可在Apache Flink、Spark等分布式处理后端上执行。Beam支持Java、Python和Go等语言,为各类开发者提供灵活的开发环境。该项目采用统一模型处理批处理和流处理数据,支持多种编程语言,并可在多个分布式处理平台上运行。它为不同类型的开发者提供了灵活的工具,简化了大规模数据处理的复杂性。
flink
Apache Flink是开源流处理框架,专注于高性能流处理和批处理。框架提供Java和Scala API,支持高吞吐低延迟的事件处理。主要特性包括事件时间处理、灵活窗口操作和exactly-once语义。Flink还集成了图计算、机器学习库,并可与Hadoop生态系统无缝对接。该框架适用于实时分析和大规模数据处理场景,为企业提供强大的数据处理能力。