#并行化

RWKV-LM - 高性能并行化RNN,探索和应用RWKV模型
RWKVRNNTransformer性能并行化Github开源项目
RWKV是一个高性能的并行化RNN,具有变换器级别的性能。该模型实现了快速的推理和训练速度,不依赖于传统的注意力机制,而是通过隐藏状态进行计算,优化了VRAM的使用,并支持处理无限长度的文本上下文。RWKV的这些特点使其在进行句子嵌入和处理复杂文本任务时显示出优越的能力。
ice - 用于语言模型程序的 Python 库和跟踪可视化工具
PythonICE语言模型调试并行化Github开源项目
ICE是专为语言模型程序设计的Python库和可视化工具,支持多人模式、代理定义、快速并行执行等功能,允许在浏览器中调试执行轨迹。适用于Python 3.9及以上版本,支持虚拟环境安装和开发,API可能会发生变动,欢迎社区贡献。
tiny-gpu - 简化GPU实现深入解析并行计算原理
GPU架构并行化内存指令集Github开源项目
tiny-gpu是一个精简的GPU实现项目,旨在帮助学习者理解GPU工作原理。该项目聚焦通用GPU和机器学习加速器的核心原理,包括架构设计、SIMD并行化和内存管理。通过Verilog实现、架构文档和矩阵运算示例,tiny-gpu简化了复杂概念,使学习者能从底层理解现代硬件加速器的关键要素。
QDax - 高效加速质量多样性算法的开源框架
QDax质量多样性神经进化JAX并行化Github开源项目
QDax是一个开源框架,用于加速质量多样性(QD)和神经进化算法。通过利用硬件加速器和大规模并行化,QDax将原本需要数天甚至数周才能在大型CPU集群上完成的QD算法运行时间缩短至几分钟。作为灵活易扩展的研究工具,QDax适用于各类问题设置,支持MAP-Elites、QDPG等多种核心QD算法,并提供多个基准任务实现。该项目由Adaptive & Intelligent Robotics Lab和InstaDeep联合开发维护。