英文

ResNet

ResNet模型在imagenet-1k上进行了训练。它在论文深度残差学习用于图像识别中首次提出,并首次在此代码库中发布。

声明:发布ResNet模型的团队没有为该模型编写模型卡片,因此此模型卡片由Hugging Face团队编写。

模型描述

ResNet引入了残差连接,它们允许训练具有任意数量层次的网络(最多1000层)。ResNet赢得了2015年ILSVRC&COCO竞赛,这是深度计算机视觉的一个重要里程碑。

预期用途和限制

您可以使用原始模型进行图像分类。请查看模型中心以寻找您感兴趣的任务上的微调版本。

如何使用

以下是使用此模型的方法:

>>> from transformers import AutoFeatureExtractor, ResNetForImageClassification
>>> import torch
>>> from datasets import load_dataset

>>> dataset = load_dataset("huggingface/cats-image")
>>> image = dataset["test"]["image"][0]

>>> feature_extractor = AutoFeatureExtractor.from_pretrained("microsoft/resnet-18")
>>> model = ResNetForImageClassification.from_pretrained("microsoft/resnet-18")

>>> inputs = feature_extractor(image, return_tensors="pt")

>>> with torch.no_grad():
...     logits = model(**inputs).logits

>>> # model predicts one of the 1000 ImageNet classes
>>> predicted_label = logits.argmax(-1).item()
>>> print(model.config.id2label[predicted_label])
tiger cat

有关更多代码示例,请参阅文档