#并行计算
aphros
Aphros是一款高性能不可压缩多相流体模拟求解器。基于C++14开发,可扩展至数千计算节点。主要特点包括SIMPLE或Bell-Colella-Glaz流体求解、PLIC体积流体平流、低分辨率曲率估计、Multi-VOF防聚并技术等。适用于破碎波浪、微流控、无隔膜电解等多相流模拟场景。
pandarallel
Pandaral·lel是一个Python库,通过简单的代码修改实现Pandas操作的并行化处理。它利用多核CPU加速数据处理,并提供进度条显示。适用于Mac、Linux和Windows系统,可优化数据分析工作流程。目前该开源项目正在寻找新的维护者。
accelerated-scan
accelerated-scan是一个Python包,实现了GPU上高效的一阶并行关联扫描。该项目采用分块处理算法和GPU通信原语,能快速处理状态空间模型和线性RNN中的一阶递归问题。支持前向和后向扫描,提供C++ CUDA内核和Triton实现,在不同序列长度下均有出色性能表现。适用于深度学习和信号处理等需要高性能递归计算的领域。
lectures
讲座系列涉及CUDA、PyTorch优化、量化技术和稀疏计算等GPU编程前沿话题。由行业专家授课,内容包括性能分析、内存架构和优化方法。结合理论和实践,帮助学习者掌握并行计算技能,增强GPU编程水平。面向对GPU加速和深度学习优化感兴趣的技术人员。
threadpoolctl
threadpoolctl是一个Python库,专门用于管理科学计算和数据分析库中的线程池资源。它能够精确控制BLAS、OpenMP等常用库的线程数量,有效解决嵌套并行计算中的资源过度分配问题。通过简洁的接口,threadpoolctl允许开发者灵活调整线程使用,从而优化计算效率,提升并行性能。该库支持多种BLAS实现和OpenMP运行时,适用范围广泛,是科学计算领域的实用工具。
dask
Dask是一个开源的灵活并行计算库,专为大规模数据分析设计。它支持多种数据结构和算法,与NumPy、Pandas等Python数据科学工具无缝集成。Dask提供高效的并行计算能力,能处理超出单机内存的大型数据集,适用于数据科学、机器学习等领域。活跃的社区支持进一步增强了其在数据分析中的应用价值。
gtsfm
GTSfM是一个基于GTSAM的开源结构运动恢复(SfM)管线,专为并行计算设计。它利用Dask实现分布式处理,集成了SuperPoint和SuperGlue等先进算法。GTSfM提供Python接口,无需编译即可使用。该项目支持多种场景重建任务,可与Nerfstudio等工具集成,为计算机视觉领域提供了灵活高效的解决方案。
codon
Codon是一个将Python代码编译为本机机器代码的高性能实现。它保持了Python的语法和语义,同时提供媲美C/C++的性能,通常比普通Python快10-100倍。Codon支持原生多线程,实现了顶级性能优化和全面的硬件支持。它可与Python生态系统无缝集成,适用于要求高性能的Python项目。
ElegantRL
ElegantRL是一个云原生的大规模并行深度强化学习框架,支持多种DRL算法和多代理环境。其核心代码少于1000行,具备轻量、高效和弹性特点。通过微服务架构和容器化,支持大规模计算节点扩展,并自动分配云端资源。相比Ray RLlib和Stable Baselines 3,ElegantRL在单GPU、多GPU和云平台测试中更稳定高效。广泛应用于RLSolver、FinRL等项目,并支持Isaac Gym等模拟器。