模型:
FredZhang7/distilgpt2-stable-diffusion
DistilGPT2稳定扩散是一个文本生成模型,用于为文本到图像模型生成富有创意和连贯的提示,给定任何文本。该模型在来自 Stable Diffusion discord 、 Lexica.art 和(我手动选择的) Krea.ai 的203万个描述性稳定扩散提示上进行了微调。我根据稳定扩散v1.4的输出结果对手动选择的提示进行了筛选。
与使用GPT2的其他提示生成模型相比,该模型的前向传播速度提高了50%,磁盘空间和RAM使用量减少了40%。
pip install --upgrade transformers
from transformers import GPT2Tokenizer, GPT2LMHeadModel
# load the pretrained tokenizer
tokenizer = GPT2Tokenizer.from_pretrained('distilgpt2')
tokenizer.add_special_tokens({'pad_token': '[PAD]'})
tokenizer.max_len = 512
# load the fine-tuned model
model = GPT2LMHeadModel.from_pretrained('FredZhang7/distilgpt2-stable-diffusion')
# generate text using fine-tuned model
from transformers import pipeline
nlp = pipeline('text-generation', model=model, tokenizer=tokenizer)
ins = "a beautiful city"
# generate 10 samples
outs = nlp(ins, max_length=80, num_return_sequences=10)
# print the 10 samples
for i in range(len(outs)):
outs[i] = str(outs[i]['generated_text']).replace(' ', '')
print('\033[96m' + ins + '\033[0m')
print('\033[93m' + '\n\n'.join(outs) + '\033[0m')
示例输出: