Project Icon

modin

轻松实现pandas并行化加速

Modin是pandas的高性能替代方案,通过并行化计算显著提升数据处理速度。只需更改一行导入代码,即可利用全部CPU核心加速pandas工作流,特别适合大型数据集。Modin支持处理超出内存的数据,兼容90%以上pandas API,并支持Ray、Dask和MPI等多种计算引擎。它简化了分布式计算,让用户轻松获得性能提升。

pandarallel - 简化Pandas操作并行化的Python库
GithubPandarallelPython库pandas并行计算开源项目数据处理
Pandaral·lel是一个Python库,通过简单的代码修改实现Pandas操作的并行化处理。它利用多核CPU加速数据处理,并提供进度条显示。适用于Mac、Linux和Windows系统,可优化数据分析工作流程。目前该开源项目正在寻找新的维护者。
dask - 开源灵活的并行计算库 助力大规模数据分析
DaskGithubPython库并行计算开源开源项目数据分析
Dask是一个开源的灵活并行计算库,专为大规模数据分析设计。它支持多种数据结构和算法,与NumPy、Pandas等Python数据科学工具无缝集成。Dask提供高效的并行计算能力,能处理超出单机内存的大型数据集,适用于数据科学、机器学习等领域。活跃的社区支持进一步增强了其在数据分析中的应用价值。
pandas - Python数据分析与处理的开源利器
DataFrameGithubPythonpandas开源开源项目数据分析
pandas是Python生态系统中的核心数据分析库,提供高性能、易用的数据结构和工具。它支持处理结构化数据,包括数据清洗、转换、合并、分组分析等操作。pandas可读写多种格式的数据源,如CSV、Excel、SQL数据库等。作为开源项目,pandas由活跃社区维护,持续优化以满足数据科学家、分析师和开发者的需求。
pandas-ai - 高效数据处理与自然语言交互平台
GithubPandasAIPython开源项目数据分析数据可视化热门自然语言处理
PandasAI是一个强大的Python平台,专为非技术用户设计,通过自然语言轻松查询数据。它不仅帮助技术用户节省时间,还通过Jupyter notebooks或借助FastAPI和Flask轻松部署为REST API。想要了解更多PandasAI Cloud或企业版服务,欢迎联系我们获取详细信息。
cudf - 基于GPU的高性能DataFrame库 实现快速数据处理与分析
GPUGithubRAPIDScuDFpandas开源项目数据处理
cuDF是一个基于GPU的DataFrame库,提供数据加载、连接、聚合和过滤等功能。该库利用libcudf和Apache Arrow列式格式,为开发者提供GPU加速的pandas兼容API。cuDF既可以直接使用,也可以作为pandas的无代码修改加速器,完全支持pandas API,在可能的情况下使用GPU运算,必要时回退到pandas。这使得cuDF在处理大规模数据时表现出色,适合各类数据科学和机器学习项目。
DataFrame - 高效C++数据分析库,支持多种统计和多线程功能
C++DataFrameGithub多线程开源项目数据分析算法
DataFrame是一个高效的C++数据分析库,提供类似于Python的Pandas和R的DataFrame功能。它支持数据切片、连接、分组操作,并具备统计、金融及机器学习算法。该库特别适合处理大数据集,拥有优异的性能和多线程支持。通过多种内置算法和可添加的自定义算法,用户可以灵活分析和处理数据。DataFrame还与Polars等工具进行了性能对比,展现了其在大数据处理上的显著优势。
modulus-makani - 用于天气和气候机器学习模型的大规模并行训练库
GithubMakani天气预报并行训练开源项目机器学习气候模型
Makani是一个基于PyTorch的实验库,用于研发机器学习驱动的天气和气候模型。它支持在100多个GPU上进行大规模并行训练,提供多种模型和数据并行技术,以及异步数据加载等功能。该项目由NVIDIA和NERSC研发,用于训练FourCastNet等深度学习天气预报模型,为下一代天气和气候模型的开发提供支持。
modal-client - Modal Python库实现无服务器云计算按需访问
GithubModalPython库serverless云计算开发工具开源项目
Modal是一个Python库,使开发者能够从本地Python脚本访问无服务器云计算资源。支持Python 3.8至3.12版本,可通过pip快速安装。该项目提供丰富的示例应用、详细的用户指南和API参考文档。开发者可在命令行创建或链接Modal账户,便于使用这一云计算工具。
dask-sql - 分布式SQL查询引擎,结合Python轻松扩展计算
Dask-SQLGPU支持GithubPythonSQL分布式计算开源项目
dask-sql是一个分布式SQL查询引擎,结合Python和SQL,支持无限扩展计算。通过pip或conda安装,可与Jupyter Notebook或BI工具集成,并支持CUDA GPU查询加速。dask-sql支持多种数据格式和存储位置,通过UDFs增强查询能力,适用于本地和云端大规模计算。详细信息请参考官方文档。
fugue - 统一的分布式计算框架 支持多种执行引擎
FugueGithubPySparkSQL分布式计算开源项目数据处理
Fugue是一个统一的分布式计算框架,支持在Spark、Dask和Ray等多种执行引擎上运行Python、Pandas和SQL代码。它可以轻松将现有Python和Pandas代码扩展到分布式环境,并通过FugueSQL在不同数据框架上构建端到端工作流。Fugue提供简洁的API和增强的SQL语法,实现了执行引擎的无缝切换,提高了大规模数据处理的效率和灵活性。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号