RAPIDS Community Notebooks: 加速数据科学工作流的开源工具集

Ray

notebooks-contrib

RAPIDS Community Notebooks 简介

RAPIDS (GPU 加速数据科学) 是一套开源的数据科学库,利用 NVIDIA GPU 加速数据科学和机器学习工作流。RAPIDS Community Notebooks 是一个由社区贡献的 Jupyter notebooks 集合,旨在帮助新用户快速上手和使用 RAPIDS 生态系统。

这个仓库包含了大量由 RAPIDS 团队、生态系统合作伙伴以及 RAPIDS 用户贡献的有用 notebooks。它的主要目的是通过提供学习辅助材料来向新用户介绍 RAPIDS。

社区 Notebooks 的意义

这些 notebooks 是为社区服务的,这意味着:

  1. 任何人都可以贡献工作流示例、技巧和教程供他人使用和分享。
  2. 如果您的 notebook 非常出色,它可能会被特别推荐。

同时,社区也有一些额外的责任:

  • 如果您编写了一个很棒的 notebook,请尽量保持更新。
  • 如果您发现问题,不要只是提交 issue - 请尝试修复它!
  • 如果一个 notebook 存在问题或其最后测试的 RAPIDS 版本已过时,它可能会被移至存档。

RAPIDS 展示 Notebooks

这些 notebooks 由 RAPIDS 团队构建和维护。当我们移除这些 notebooks 时,它们将由社区维护,直到被归档。

RAPIDS 活动 Notebooks

这些是我们在会议或聚会上展示的 notebooks。虽然我们努力使用开源或易于获取的数据,但某些 notebooks 可能需要访问受限的数据集。它们也会随时间冻结,不会随 RAPIDS 的进展而更新。请下载这些工作流构建时使用的适当 RAPIDS 版本,或者预期需要将它们更新到较新的版本。

探索仓库

文件夹结构

  • getting_started_notebooks: "如何开始使用 RAPIDS"。包含展示"Hello World"、RAPIDS 库入门以及 RAPIDS 概念教程的 notebooks。

  • community_tutorials_and_guides: 社区贡献的"如何使用 RAPIDS 完成您的工作流"。包含展示算法和工作流示例、基准测试工具以及一些完整的端到端 (E2E) 工作流的 notebooks。

  • community_archive: 包含已知问题且 45 天或更长时间未修复的 notebooks。包含在博客中提到和使用的展示 RAPIDS 工作流和功能的共享 notebooks。

  • the_archive: 包含来自社区成员的较旧 notebooks,以及 RAPIDS 团队不再更新但对社区有用的 notebooks,如 archived_rapids_blog_notebooksarchived_rapids_event_notebookscompetition_notebooks

  • data: 包含用于纯功能演示的小型数据样本。一些 notebooks 包含从外部网站下载更大数据集的单元格。

入门指南

RAPIDS 提供了丰富的学习资源,帮助用户快速上手:

RAPIDS 库基础

教学 Notebooks 和用户指南

官方速查表

RAPIDS 还提供了各个组件的官方速查表,包括 cuDF、BlazingSQL、cuGraph、RAPIDS-Dask、CLX 和 cyBert、cuSignal 等,可以快速查阅常用功能。

部署 RAPIDS

RAPIDS 可以在多种云平台和环境中部署:

多 GPU 支持

RAPIDS 提供了强大的多 GPU 支持,可以充分利用多个 GPU 加速计算:

入门

示例工作流

Dask 技巧

RAPIDS 和深度学习

RAPIDS 可以与深度学习框架无缝集成:

RAPIDS 数据可视化

RAPIDS 提供了强大的数据可视化能力:

官方 RAPIDS 演示

教程

流数据处理

RAPIDS 支持 GPU 加速的流数据处理:

自然语言处理 (NLP)

RAPIDS 为 NLP 任务提供了 GPU 加速:

图分析和 GIS/空间分析

RAPIDS 提供了强大的图分析和空间分析能力:

基因组学

RAPIDS 为基因组学分析提供了加速:

网络安全

RAPIDS 为网络安全分析提供了工具:

过去的竞赛

RAPIDS 在各种数据科学竞赛中都有应用:

基准测试

RAPIDS 提供了一些基准测试工具:

其他技巧和窍门

生态系统合作伙伴教程

RAPIDS 与多个生态系统合作伙伴合作,提供了丰富的

avatar
0
0
0
相关项目
Project Cover

cucim

cuCIM 是一个开源的高性能多维图像处理和计算机视觉软件库,应用于生物医学、地理空间、材料科学、生命科学和遥感领域。利用基于 GPU 的加速技术,cuCIM 提供了增强的大规模和多维 TIFF 文件处理能力,并且支持简便的 Python 接口和多种图像格式,如 Aperio ScanScope 虚拟切片、Philips TIFF 和多分辨率压缩 TIFF 文件。

Project Cover

cuml

cuML是RAPIDS生态系统中的GPU加速机器学习库,提供与scikit-learn兼容的API。它支持在GPU上执行传统表格机器学习任务,无需深入CUDA编程。对大型数据集,cuML的性能可比CPU实现提升10-50倍。该库还支持多GPU和多节点多GPU操作,并通过Dask实现分布式计算。

Project Cover

notebooks-contrib

notebooks-contrib是RAPIDS社区维护的GPU加速数据科学笔记本库。它涵盖从入门到高级的多个主题,包括多GPU处理、深度学习和各领域应用。该项目提供教程、工作流示例和实用指南,同时鼓励社区贡献。用户可以找到丰富的学习资源,如官方文档、视频教程和部署指南,以便更好地利用RAPIDS进行GPU加速数据分析。

Project Cover

cuvs

cuVS是一个开源的GPU向量搜索和聚类框架,专注于提供高性能的近似最近邻搜索和聚类功能。它支持C、C++、Python和Rust等多种编程语言,实现了CAGRA等先进算法。开发者可以直接使用cuVS,也可将其集成到其他系统中,从而在向量相似度搜索和聚类任务中充分利用GPU加速能力。

Project Cover

cudf

cuDF是一个基于GPU的DataFrame库,提供数据加载、连接、聚合和过滤等功能。该库利用libcudf和Apache Arrow列式格式,为开发者提供GPU加速的pandas兼容API。cuDF既可以直接使用,也可以作为pandas的无代码修改加速器,完全支持pandas API,在可能的情况下使用GPU运算,必要时回退到pandas。这使得cuDF在处理大规模数据时表现出色,适合各类数据科学和机器学习项目。

最新项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号