#DataFrame

DataFrame学习资料汇总 - C++高性能数据分析库

2 个月前
Cover of DataFrame学习资料汇总 - C++高性能数据分析库

Mars: 分布式张量计算框架

3 个月前
Cover of Mars: 分布式张量计算框架

DataFrame: 现代C++中的强大数据分析工具

3 个月前
Cover of DataFrame: 现代C++中的强大数据分析工具
相关项目
Project Cover

DataFrame

DataFrame是一个高效的C++数据分析库,提供类似于Python的Pandas和R的DataFrame功能。它支持数据切片、连接、分组操作,并具备统计、金融及机器学习算法。该库特别适合处理大数据集,拥有优异的性能和多线程支持。通过多种内置算法和可添加的自定义算法,用户可以灵活分析和处理数据。DataFrame还与Polars等工具进行了性能对比,展现了其在大数据处理上的显著优势。

Project Cover

mars

Mars是一种基于张量的统一框架,支持大规模数据计算,兼容Numpy、Pandas、Scikit-learn等多个库。无论是单机还是集群环境,Mars都能简化数据处理工作。它提供了详细的安装指南、架构概览和多种使用模式,并与TensorFlow、PyTorch等库深度集成,显著提升计算效率。更多安装和使用信息,请参阅文档。

Project Cover

great-tables

Great Tables是一个功能丰富的Python库,用于创建和自定义表格。该库支持灵活组合各种表格元素,包括表头、表尾和行标签等,并提供多样的单元格格式化选项。Great Tables可处理Pandas或Polars DataFrame数据,支持在多种环境中渲染表格。其设计注重简洁性和实用性,适用于各类表格展示场景。

Project Cover

pandas

pandas是Python生态系统中的核心数据分析库,提供高性能、易用的数据结构和工具。它支持处理结构化数据,包括数据清洗、转换、合并、分组分析等操作。pandas可读写多种格式的数据源,如CSV、Excel、SQL数据库等。作为开源项目,pandas由活跃社区维护,持续优化以满足数据科学家、分析师和开发者的需求。

Project Cover

datacompy

DataComPy是一个开源的Python数据比较库,支持Pandas、Spark、Polars等多种数据框架。它提供了超越简单equals()的功能,包括统计信息输出和匹配精度调整。该库可通过pip或conda安装,并支持Spark、Dask等额外功能。DataComPy为不同数据处理后端提供统一的比较接口,适用于数据分析和质量控制。

Project Cover

polars

Polars是一个基于Rust开发的高性能数据处理引擎,提供Python、Node.js和R等多语言接口。它采用Apache Arrow列式内存模型,实现惰性/即时执行、多线程和SIMD等技术,高效处理大规模数据。Polars具有强大的表达式API和查询优化能力,支持流式处理超大数据集,在TPC-H基准测试中性能优异。此外,Polars还支持SQL查询和命令行操作,是一款轻量而强大的数据分析工具。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号