模型:
YeungNLP/bert-from-clip-chinese-1M
该预训练模型的权重是从BertCLIP预训练模型中单独提取的Bert权重。BertCLIP是中文版本的CLIP预训练模型,基于LiT-tuning(锁定图像文本调参)策略,在140万个中文图文对数据上进行多模态对比学习预训练。
Github: CLIP-Chinese
Bolg: CLIP-Chinese:中文多模态对比学习CLIP预训练模型
可以直接使用Huggingface的BertModel加载该预训练权重,进行后续任务。
from transformers import BertTokenizer, BertModel model_name_or_path = 'YeungNLP/bert-from-clip-chinese-1M' tokenizer = BertTokenizer.from_pretrained(model_name_or_path) model = BertModel.from_pretrained(model_name_or_path)