数据集:
detection-datasets/fashionpedia_4_categories
这个数据集是基于Fashionpedia数据集的一种变体,有两个主要区别:
这个数据集的目标是通过减少类别数(从完整的Fashionpedia数据集的46个类别减少到4个类别)来简化检测任务。
这个数据集是使用 detection_datasets 库( GitHub , PyPI ) 创建的,您可以在这里查看完整的创建过程( notebook )。
简而言之,应用了以下映射:
mapping = {
'shirt, blouse': 'clothing',
'top, t-shirt, sweatshirt': 'clothing',
'sweater': 'clothing',
'cardigan': 'clothing',
'jacket': 'clothing',
'vest': 'clothing',
'pants': 'clothing',
'shorts': 'clothing',
'skirt': 'clothing',
'coat': 'clothing',
'dress': 'clothing',
'jumpsuit': 'clothing',
'cape': 'clothing',
'glasses': 'accessories',
'hat': 'accessories',
'headband, head covering, hair accessory': 'accessories',
'tie': 'accessories',
'glove': 'accessories',
'belt': 'accessories',
'tights, stockings': 'accessories',
'sock': 'accessories',
'shoe': 'shoes',
'bag, wallet': 'bags',
'scarf': 'accessories',
}
结果是,没有在映射中具有对应类别的注释被删除了。