数据集:
winvoker/lvis
这个数据集是将LVIS数据集实现到Hugging Face datasets中的。请访问原始网站了解更多信息。
这段代码返回训练、验证和测试生成器。
from datasets import load_dataset
dataset = load_dataset("winvoker/lvis")
Objects是一个包含注释信息(如bbox、class)的字典。
DatasetDict({
train: Dataset({
features: ['id', 'image', 'height', 'width', 'objects'],
num_rows: 100170
})
validation: Dataset({
features: ['id', 'image', 'height', 'width', 'objects'],
num_rows: 4809
})
test: Dataset({
features: ['id', 'image', 'height', 'width', 'objects'],
num_rows: 19822
})
})
train = dataset["train"] validation = dataset["validation"] test = dataset["test"]
一个示例行如下所示。
{ 'id': 0,
'image': '000000437561.jpg',
'height': 480,
'width': 640,
'objects': {
'bboxes': [[[392, 271, 14, 3]],
'classes': [117],
'segmentation': [[376, 272, 375, 270, 372, 269, 371, 269, 373, 269, 373]]
}
}