该数据集旨在进行对象检测任务,重点是检测移动UI设计中的元素。目标对象包括文本、图像和组。数据集包含图像和对象检测框,包括类别标签和位置信息。
加载数据集并查看示例:
>>> from datasets import load_dataset
>>>> ds = load_dataset("mrtoy/mobile-ui-design")
>>> example = ds[0]
>>> example
{'width': 375,
'height': 667,
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=375x667>,
'objects': {'bbox': [[0.0, 0.0, 375.0, 667.0],
[0.0, 0.0, 375.0, 667.0],
[0.0, 0.0, 375.0, 20.0],
...
],
'category': ['text',
'rectangle',
'rectangle',
...]}}
数据集包含以下字段:
您可以使用一些内部torch工具在图像上可视化边界框。
import torch
from torchvision.ops import box_convert
from torchvision.utils import draw_bounding_boxes
from torchvision.transforms.functional import pil_to_tensor, to_pil_image
item = ds[0]
boxes_xywh = torch.tensor(item['objects']['bbox'])
boxes_xyxy = box_convert(boxes_xywh, 'xywh', 'xyxy')
to_pil_image(
draw_bounding_boxes(
pil_to_tensor(item['image']),
boxes_xyxy,
labels=item['objects']['category'],
)
)
该数据集可用于各种应用,例如: