数据集:
HuggingFaceM4/COCO
预印本库:
arxiv:1405.0312许可:
MS COCO是一个大规模的目标检测、分割和字幕生成数据集。COCO拥有以下几个特点:目标分割、上下文中的识别、超像素物品分割、330K图像(>200K带标签)、150万个物体实例、80个物体类别、91个物品类别、每张图片5个字幕、250,000个人物关键点。
目前只有2014年的子集(带有Karpathy的注释和分割),但欢迎贡献COCO的2017年子集!
[需要更多信息]
[需要更多信息]
每个实例具有以下结构:
{
'image': <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x480 at 0x7F69C1BA8550>,
'filepath': 'COCO_val2014_000000522418.jpg',
'sentids': [681330, 686718, 688839, 693159, 693204],
'filename': 'COCO_val2014_000000522418.jpg',
'imgid': 1,
'split': 'restval',
'sentences': {
'tokens': ['a', 'woman', 'wearing', 'a', 'net', 'on', 'her', 'head', 'cutting', 'a', 'cake'],
'raw': 'A woman wearing a net on her head cutting a cake. ',
'imgid': 1,
'sentid': 681330
},
'cocoid': 522418
}
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
谁是源语言的生成者?[需要更多信息]
[需要更多信息]
谁是注释者?[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
[需要更多信息]
感谢 @VictorSanh 添加了这个数据集。