Project Icon

ogb

OGB开源项目的图机器学习数据集及标准评估工具

OGB项目集成了图机器学习所需的基准数据集、数据加载器和标准化评估工具,兼容PyTorch Geometric和DGL等主流深度学习框架。支持处理节点、链接和图级别的预测任务,数据集广泛涵盖科学、社交网络和异构知识图等领域,并适应从单GPU到多GPU的处理需求。OGB为研究人员提供了简化数据下载、标准化拆分和性能评估的便利工具。


PyPI License

概述

开放图基准(OGB)是一个用于图机器学习的基准数据集集合、数据加载器和评估器。数据集涵盖了各种图机器学习任务和实际应用。 OGB 数据加载器与流行的图深度学习框架完全兼容,包括 PyTorch GeometricDeep Graph Library (DGL)。它们提供自动的数据集下载、标准化的数据集划分和统一的性能评估。

OGB 旨在提供涵盖重要图机器学习任务、具有多样化规模和丰富领域的图数据集。

图机器学习任务: 我们涵盖了三个基本的图机器学习任务:节点、链接和图的级别预测。

多样化规模: 小规模图数据集可以在单个 GPU 内处理,而中等规模和大规模图可能需要多个 GPU 或巧妙的采样/分区技术。

丰富的领域: 图数据集来自各种领域,包括科学领域到社交/信息网络,并且还包括异质知识图。

OGB 是一个持续进行的工作,我们计划未来增加我们的覆盖范围。

安装

你可以使用 Python 的包管理器 pip 安装 OGB。 如果你之前安装了 ogb,请确保更新到版本 1.3.6。 发布说明可以在 这里 找到。

要求

  • Python>=3.6
  • PyTorch>=1.6
  • DGL>=0.5.0 或 torch-geometric>=2.0.2
  • Numpy>=1.16.0
  • pandas>=0.24.0
  • urllib3>=1.24.0
  • scikit-learn>=0.20.0
  • outdated>=0.2.0

Pip 安装

安装 OGB 的推荐方法是使用 Python 的包管理器 pip:

pip install ogb
python -c "import ogb; print(ogb.__version__)"
# 这将打印 “1.3.6”。否则,请更新版本
pip install -U ogb

从源码安装

你也可以从源码安装 OGB。如果你想为 OGB 做贡献,推荐使用这种方式。

git clone https://github.com/snap-stanford/ogb
cd ogb
pip install -e .

包使用

我们强调 OGB 的两个关键特性,即 (1) 易于使用的数据加载器和 (2) 标准化的评估器。

(1) 数据加载器

我们准备了易于使用的 PyTorch Geometric 和 DGL 数据加载器。我们处理数据集下载以及标准化数据集的划分。 下面,在 PyTorch Geometric 上,我们看到几行代码就足以准备和划分数据集!不用说,你也可以享受 DGL 的同样便利!

from ogb.graphproppred import PygGraphPropPredDataset
from torch_geometric.loader import DataLoader

# 下载并处理数据到 './dataset/ogbg_molhiv/'
dataset = PygGraphPropPredDataset(name = 'ogbg-molhiv')

split_idx = dataset.get_idx_split() 
train_loader = DataLoader(dataset[split_idx['train']], batch_size=32, shuffle=True)
valid_loader = DataLoader(dataset[split_idx['valid']], batch_size=32, shuffle=False)
test_loader = DataLoader(dataset[split_idx['test']], batch_size=32, shuffle=False)

(2) 评估器

我们还准备了标准化的评估器,以便轻松评估和比较不同的方法。评估器以 input_dict(其格式在 evaluator.expected_input_format 中指定的字典)作为输入,并返回一个字典,其中存储了适合给定数据集的性能指标。 标准化的评估协议允许研究人员可靠地比较他们的方法。

from ogb.graphproppred import Evaluator

evaluator = Evaluator(name = 'ogbg-molhiv')
# 你可以了解评估器的输入和输出格式规范。
# print(evaluator.expected_input_format) 
# print(evaluator.expected_output_format) 
input_dict = {'y_true': y_true, 'y_pred': y_pred}
result_dict = evaluator.eval(input_dict) # 例如,{'rocauc': 0.7321}

引用 OGB / OGB-LSC

如果你在工作中使用 OGB 或 OGB-LSC 数据集,请引用我们的论文(Bibtex 如下)。

@article{hu2020ogb,
  title={Open Graph Benchmark: Datasets for Machine Learning on Graphs},
  author={Hu, Weihua and Fey, Matthias and Zitnik, Marinka and Dong, Yuxiao and Ren, Hongyu and Liu, Bowen and Catasta, Michele and Leskovec, Jure},
  journal={arXiv preprint arXiv:2005.00687},
  year={2020}
}
@article{hu2021ogblsc,
  title={OGB-LSC: A Large-Scale Challenge for Machine Learning on Graphs},
  author={Hu, Weihua and Fey, Matthias and Ren, Hongyu and Nakata, Maho and Dong, Yuxiao and Leskovec, Jure},
  journal={arXiv preprint arXiv:2103.09430},
  year={2021}
}
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号