Logo

#pandas

Logo of ydata-profiling
ydata-profiling
提供快速一致的探索性数据分析解决方案,支持生成HTML和JSON格式报告,包括时间序列和文本数据。ydata-profiling自动检测数据类型,提供单变量和多变量分析,生成包含缺失数据、重复行和变量交互的可视化报告。支持与多种数据库系统集成,适用于数据集对比和大数据处理。
Logo of pandarallel
pandarallel
Pandaral·lel是一个Python库,通过简单的代码修改实现Pandas操作的并行化处理。它利用多核CPU加速数据处理,并提供进度条显示。适用于Mac、Linux和Windows系统,可优化数据分析工作流程。目前该开源项目正在寻找新的维护者。
Logo of cudf
cudf
cuDF是一个基于GPU的DataFrame库,提供数据加载、连接、聚合和过滤等功能。该库利用libcudf和Apache Arrow列式格式,为开发者提供GPU加速的pandas兼容API。cuDF既可以直接使用,也可以作为pandas的无代码修改加速器,完全支持pandas API,在可能的情况下使用GPU运算,必要时回退到pandas。这使得cuDF在处理大规模数据时表现出色,适合各类数据科学和机器学习项目。
Logo of sketch
sketch
Sketch是一个专为pandas用户设计的AI代码助手,通过理解数据上下文提供相关建议。无需在IDE中添加插件即可快速使用,功能包括数据标注、数据工程和数据分析。支持自然语言界面操作,通过简单导入和扩展,实现数据问答、代码生成及高级数据生成功能。
Logo of python-calamine
python-calamine
Python-Calamine是一个基于Rust的Calamine库的Python绑定,专门用于高效读取Excel和ODF文件。该库支持通过pip和conda安装,提供简单的API来获取工作表名称和读取数据。它具有灵活的数据处理选项,可以跳过空白区域。Python-Calamine还集成了pandas,能作为read_excel()函数的引擎,适用于数据分析任务。对于需要处理大量电子表格数据的开发者来说,这是一个有价值的工具。