图像文字化:解锁超详细图像描述
arXiv: https://arxiv.org/abs/2405.02793
请访问网页以获取有关IIW项目、数据、可视化和更多信息。数据可以直接从datasets/
文件夹下载,也可以从Huggingface下载(见下文)。
如有想法、反馈、问题或合作意向,请联系iiw-dataset@google.com。
许可证:CC-BY-4.0
其他资源
🤗Hugging Face🤗
from datasets import load_dataset
# `name`可以是以下之一:IIW-400, DCI_Test, DOCCI_Test, CM_3600, LocNar_Eval
# 参考:https://github.com/google/imageinwords/blob/main/datasets/README.md
dataset = load_dataset('google/imageinwords', token=None, name="IIW-400", trust_remote_code=True)
引用
如果您使用我们的数据或引用我们的工作,请包含以下引用:
@misc{garg2024imageinwords,
title={ImageInWords: Unlocking Hyper-Detailed Image Descriptions},
author={Roopal Garg and Andrea Burns and Burcu Karagol Ayan and Yonatan Bitton and Ceslee Montgomery and Yasumasa Onoe and Andrew Bunner and Ranjay Krishna and Jason Baldridge and Radu Soricut},
year={2024},
eprint={2405.02793},
archivePrefix={arXiv},
primaryClass={cs.CV}
}