模型:

microsoft/swin-base-simmim-window6-192

英文

Swin Transformer(基础规模模型)

Swin Transformer 模型在分辨率为192x192的图像网数据集(ImageNet-1k)上使用SimMIM目标进行预训练。该模型由Xie等人在论文 SimMIM: A Simple Framework for Masked Image Modeling 中提出,并在 this repository 首次发布。

预期使用情景

此模型仅进行预训练,旨在在下游数据集上进行微调。

使用方法

详情请参阅 documentation