#并行计算

Modin: 加速你的pandas工作流程的一行代码替换方案

3 个月前
Cover of Modin: 加速你的pandas工作流程的一行代码替换方案

LBANN: 利物莫尔大型人工神经网络工具包

3 个月前
Cover of LBANN: 利物莫尔大型人工神经网络工具包

PGX: 强大的PostgreSQL驱动和工具包

3 个月前
Cover of PGX: 强大的PostgreSQL驱动和工具包

超光速旅行的梦想:曲速引擎的科学探索

3 个月前
Cover of 超光速旅行的梦想:曲速引擎的科学探索

PARL: 高性能分布式强化学习框架

3 个月前
Cover of PARL: 高性能分布式强化学习框架

Neural-Fortran: 一个现代化的深度学习框架

3 个月前
Cover of Neural-Fortran: 一个现代化的深度学习框架

ComfyUI_TiledKSampler: 为ComfyUI提供分块采样功能的强大工具

3 个月前
Cover of ComfyUI_TiledKSampler: 为ComfyUI提供分块采样功能的强大工具

pygmo2: 一个强大的并行优化Python库

3 个月前
Cover of pygmo2: 一个强大的并行优化Python库

pagmo2: 一个强大的并行优化计算平台

3 个月前
Cover of pagmo2: 一个强大的并行优化计算平台

OCL: 开启OpenCL在Rust中的无限可能

3 个月前
Cover of OCL: 开启OpenCL在Rust中的无限可能
相关项目
Project Cover

aphros

Aphros是一款高性能不可压缩多相流体模拟求解器。基于C++14开发,可扩展至数千计算节点。主要特点包括SIMPLE或Bell-Colella-Glaz流体求解、PLIC体积流体平流、低分辨率曲率估计、Multi-VOF防聚并技术等。适用于破碎波浪、微流控、无隔膜电解等多相流模拟场景。

Project Cover

pandarallel

Pandaral·lel是一个Python库,通过简单的代码修改实现Pandas操作的并行化处理。它利用多核CPU加速数据处理,并提供进度条显示。适用于Mac、Linux和Windows系统,可优化数据分析工作流程。目前该开源项目正在寻找新的维护者。

Project Cover

accelerated-scan

accelerated-scan是一个Python包,实现了GPU上高效的一阶并行关联扫描。该项目采用分块处理算法和GPU通信原语,能快速处理状态空间模型和线性RNN中的一阶递归问题。支持前向和后向扫描,提供C++ CUDA内核和Triton实现,在不同序列长度下均有出色性能表现。适用于深度学习和信号处理等需要高性能递归计算的领域。

Project Cover

lectures

讲座系列涉及CUDA、PyTorch优化、量化技术和稀疏计算等GPU编程前沿话题。由行业专家授课,内容包括性能分析、内存架构和优化方法。结合理论和实践,帮助学习者掌握并行计算技能,增强GPU编程水平。面向对GPU加速和深度学习优化感兴趣的技术人员。

Project Cover

threadpoolctl

threadpoolctl是一个Python库,专门用于管理科学计算和数据分析库中的线程池资源。它能够精确控制BLAS、OpenMP等常用库的线程数量,有效解决嵌套并行计算中的资源过度分配问题。通过简洁的接口,threadpoolctl允许开发者灵活调整线程使用,从而优化计算效率,提升并行性能。该库支持多种BLAS实现和OpenMP运行时,适用范围广泛,是科学计算领域的实用工具。

Project Cover

dask

Dask是一个开源的灵活并行计算库,专为大规模数据分析设计。它支持多种数据结构和算法,与NumPy、Pandas等Python数据科学工具无缝集成。Dask提供高效的并行计算能力,能处理超出单机内存的大型数据集,适用于数据科学、机器学习等领域。活跃的社区支持进一步增强了其在数据分析中的应用价值。

Project Cover

gtsfm

GTSfM是一个基于GTSAM的开源结构运动恢复(SfM)管线,专为并行计算设计。它利用Dask实现分布式处理,集成了SuperPoint和SuperGlue等先进算法。GTSfM提供Python接口,无需编译即可使用。该项目支持多种场景重建任务,可与Nerfstudio等工具集成,为计算机视觉领域提供了灵活高效的解决方案。

Project Cover

codon

Codon是一个将Python代码编译为本机机器代码的高性能实现。它保持了Python的语法和语义,同时提供媲美C/C++的性能,通常比普通Python快10-100倍。Codon支持原生多线程,实现了顶级性能优化和全面的硬件支持。它可与Python生态系统无缝集成,适用于要求高性能的Python项目。

Project Cover

ElegantRL

ElegantRL是一个云原生的大规模并行深度强化学习框架,支持多种DRL算法和多代理环境。其核心代码少于1000行,具备轻量、高效和弹性特点。通过微服务架构和容器化,支持大规模计算节点扩展,并自动分配云端资源。相比Ray RLlib和Stable Baselines 3,ElegantRL在单GPU、多GPU和云平台测试中更稳定高效。广泛应用于RLSolver、FinRL等项目,并支持Isaac Gym等模拟器。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号