数据集:

eugenesiow/Div2k

计算机处理:

monolingual

语言创建人:

found

批注创建人:

machine-generated

源数据集:

original

许可:

other
英文

Div2k数据集数据卡

数据集概述

DIV2K是一个包含大量内容多样性的RGB图像数据集(分辨率为2K的高质量图像)。

DIV2K数据集分为以下几个部分:

  • 训练数据:基于800个高清高分辨率图像生成相应的低分辨率图像,并提供2、3和4个倍数的高分辨率和低分辨率图像。
  • 验证数据:使用100个高清高分辨率图像生成相应的低分辨率图像,低分辨率图像从挑战开始时就提供给参与者,并用于从验证服务器上获取在线反馈;高分辨率图像将在挑战的最终阶段发布。

通过pip安装:

pip install datasets super-image

使用 super-image 库评估模型:

from datasets import load_dataset
from super_image import EdsrModel
from super_image.data import EvalDataset, EvalMetrics

dataset = load_dataset('eugenesiow/Div2k', 'bicubic_x2', split='validation')
eval_dataset = EvalDataset(dataset)
model = EdsrModel.from_pretrained('eugenesiow/edsr-base', scale=2)
EvalMetrics().evaluate(model, eval_dataset)

支持的任务和排行榜

该数据集通常用于训练和评估图像超分辨率任务。

非官方 super-image 排行榜:

语言

不适用。

数据集结构

数据实例

bicubic_x2的训练示例如下。

{
    "hr": "/.cache/huggingface/datasets/downloads/extracted/DIV2K_valid_HR/0801.png",
    "lr": "/.cache/huggingface/datasets/downloads/extracted/DIV2K_valid_LR_bicubic/X2/0801x2.png"
}

数据字段

所有拆分的数据字段相同。

  • hr:指向高分辨率(HR).png图像的路径的字符串。
  • lr:指向低分辨率(LR).png图像的路径的字符串。

数据拆分

name train validation
bicubic_x2 800 100
bicubic_x3 800 100
bicubic_x4 800 100
bicubic_x8 800 100
unknown_x2 800 100
unknown_x3 800 100
unknown_x4 800 100
realistic_mild_x4 800 100
realistic_difficult_x4 800 100
realistic_wild_x4 800 100

数据集创建

策划理由

请参阅初始数据收集和规范化部分。

源数据

初始数据收集和规范化

分辨率和质量:所有图像均为2K分辨率,即至少一个轴(垂直或水平)具有2K像素。所有图像都使用相同的工具进行处理。为简单起见,在最近的图像超分辨率文献中最常见的放大因子为×2、×3和×4,我们将图像裁剪为12像素的倍数。大部分爬行图像的原始像素数超过2000万。这些图像在美学上和噪音和其他破损(如模糊和色偏)方面都具有高质量。

多样性:作者从数十个网站收集图像。优先选择具有免费共享的高质量摄影作品的网站(例如 https://www.pexels.com/ )。请注意,我们没有使用来自Flickr、Instagram或其他具有法律约束力或受版权限制的图像。我们只偶尔使用关键词来确保数据集的多样性。DIV2K涵盖了各种内容,包括人物、手工制品、环境(城市、乡村)、植物和动物以及包括水下和昏暗光照条件在内的自然景观。

分区:在收集了DIV2K 1000个图像之后,作者计算了图像熵、每像素位数(bpp)PNG压缩率和CORNIA分数(参见第7.6节),并使用双立方下采样×3,然后使用双立方插值(imresize Matlab函数)、ANR [47]和A+ [48]方法进行×3放大。作者随机生成了800个训练、100个验证和100个测试图像的分区,直到在视觉内容、平均熵、平均bpp、平均每个图像的像素数(ppi)、平均CORNIA质量评分以及双立方、ANR和A+方法的平均峰值信噪比差异上取得良好的平衡为止。

本数据集仅包含800个训练图像和100个验证图像。

谁是原始语言生产者?

作者手动从互联网上爬取了1000个彩色RGB图像,特别注意图像质量、来源的多样性(网站和相机)和版权等因素。

注释

注释过程

没有注释。

谁是注释者?

没有注释者。

个人和敏感信息

所有图像均来自互联网,版权属于原始所有者。如果其中任何图像属于您,并且您希望将其删除,请友好地通知作者,他们将立即从数据集中删除。

使用数据的注意事项

数据的社会影响

[需要更多信息]

偏见讨论

[需要更多信息]

其他已知限制

[需要更多信息]

附加信息

数据集策划者

许可信息

请注意,此数据集仅供学术研究目的使用。所有图像均来自互联网,版权属于原始所有者。如果其中任何图像属于您,并且您希望将其删除,请友好地通知作者,他们将立即从数据集中删除。

引用信息

@InProceedings{Agustsson_2017_CVPR_Workshops,
    author = {Agustsson, Eirikur and Timofte, Radu},
    title = {NTIRE 2017 Challenge on Single Image Super-Resolution: Dataset and Study},
    booktitle = {The IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Workshops},
    url = "http://www.vision.ee.ethz.ch/~timofter/publications/Agustsson-CVPRW-2017.pdf",
    month = {July},
    year = {2017}
} 

贡献

感谢 @eugenesiow 添加此数据集。