数据集:

atasoglu/flickr8k-dataset

英文

您必须手动下载数据集文件。您可以访问 this 页面或运行download.sh文件来获取文件。

之后,您可以通过引用目录加载数据集:

import datasets
ds = datasets.load_dataset("atasoglu/flickr8k-dataset", data_dir="data")
print(ds)
DatasetDict({
    train: Dataset({
        features: ['image_id', 'image_path', 'captions'],
        num_rows: 6000
    })
    test: Dataset({
        features: ['image_id', 'image_path', 'captions'],
        num_rows: 1000
    })
    validation: Dataset({
        features: ['image_id', 'image_path', 'captions'],
        num_rows: 1000
    })
})

我不拥有这些图像的版权。请 visit 获取更多信息。