datasets

4.5

TensorFlow Datasets tf.data.Dataset MNIST 性能定制化 Github 开源项目

产品介绍：TensorFlow Datasets是一个公共数据集下载和准备的实用库，简化数据集加载与处理。通过其API，用户可以访问和使用多个预构建数据集，优化训练管道性能，并确保数据的确定性与可重复性。详情请参考官方教程、指南及API文档，支持在Colab笔记本中交互式操作。此工具适合快速集成数据集与进行机器学习模型训练的开发者。

访问官网 Github 文档

介绍

TensorFlow 数据集

TensorFlow 数据集提供了许多公共数据集作为tf.data.Datasets。

文档

要安装和使用 TFDS，我们强烈建议从我们的 入门指南开始。可以在 Colab 笔记本中互动尝试。

我们的文档包含：

# !pip install tensorflow-datasets
import tensorflow_datasets as tfds
import tensorflow as tf

# 构建一个 tf.data.Dataset
ds = tfds.load('mnist', split='train', as_supervised=True, shuffle_files=True)

# 构建输入管道
ds = ds.shuffle(1000).batch(128).prefetch(10).take(5)
for image, label in ds:
  pass

TFDS 核心价值

TFDS 是基于以下原则构建的：

简单性：标准用例应开箱即用
性能：TFDS 遵循最佳实践，并能够实现最先进的速度
确定性/可重复性：所有用户都能以相同的顺序获得相同的例子
可定制性：高级用户可以进行细粒度控制

如果这些用例未被满足，请向我们发送反馈。

想要某个数据集？

按照我们指南添加数据集非常简单。

通过打开一个数据集请求 GitHub issue 来请求数据集。

并通过给问题添加点赞的方式为当前的请求集合投票。

引用

在论文中使用 tensorflow-datasets 时，请包含以下引用，并补充任何特定于使用数据集的引用。

@misc{TFDS,
  title = {{TensorFlow Datasets}, A collection of ready-to-use datasets},
  howpublished = {\url{https://www.tensorflow.org/datasets}},
}

免责声明

这是一个下载和准备公共数据集的实用库。我们不 托管或分发这些数据集，不对其质量或公正性进行担保，也不声称您有使用这些数据集的许可证。是否有权使用数据集是您的责任，您需考虑数据集的许可证。

如果您是数据集的所有者，希望更新任何部分（描述、引用等），或者不希望您的数据集包含在此 库中，请通过 GitHub issue 与我们联系。感谢您对 ML 社区的贡献！

如果您有兴趣了解更多关于负责任的 AI 实践，包括 公平性，请参阅 Google AI 的负责任的 AI 实践。

tensorflow/datasets 采用 Apache 2.0 许可证。详见 LICENSE 文件。

相关项目

Project Cover

由 TensorFlow SIG-IO 维护的数据集、流式处理和文件系统扩展

Project Cover

kube-state-metrics

Kubernetes 集群状态监控工具

Project Cover

Rust语言的高性能HTTP/2协议实现库

Project Cover

高性能Flutter NoSQL数据库支持异步和全文搜索

Project Cover

速度提升70倍的Whisper JAX音频转录与翻译解决方案

Project Cover

大规模数据集搜索与推荐的高性能解决方案

Project Cover

漂亮、响应式、无依赖的JavaScript弹窗替代方案

Project Cover

Rust打造的高速Python代码分析工具

Project Cover

variational-autoencoder

变分自编码器参考实现，兼容TensorFlow和PyTorch

Project Cover

AndroidTensorFlowMNISTExample

使用TensorFlow在Android平台上的MNIST手写数字识别示例

Project Cover

快速部署机器学习流水线与算法的实用工具包

Project Cover

快速灵活的跨平台系统信息工具

Project Cover

文本分词处理工具

Project Cover

ChatGPT-System-Prompts

精选ChatGPT系统句提示集锦

Project Cover

现代高性能内存数据存储解决方案

Project Cover

高性能Python内存缓存库支持多种淘汰策略

Project Cover

自然语言检测库，关注简洁高效

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

商汤小浣熊

小浣熊家族Raccoon，您的AI智能助手，致力于通过先进的人工智能技术，为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答，小浣熊都能以快速、准确的响应满足您的需求，让您的生活更加智能便捷。

Project Cover

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

Project Cover

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号