GPT-Neo 2.7B - Shinen

模型描述

GPT-Neo 2.7B-Shinen 是使用EleutherAI的GPT-Neo 2.7B模型进行微调创建的。与GPT-Neo-2.7-Horni相比，这个模型在性内容方面更加重。

警告：此模型不适合未成年人使用。模型将产生X级别的内容。

训练数据

训练数据包含来自sexstories.com的用户生成故事。所有故事都使用以下方式进行标记：

[Theme: <theme1>, <theme2> ,<theme3>]
<Story goes here>

如何使用

您可以直接使用文本生成的管道来使用此模型。下面的示例每次运行时会生成不同的序列：

>>> from transformers import pipeline
>>> generator = pipeline('text-generation', model='KoboldAI/GPT-Neo-2.7B-Shinen')
>>> generator("She was staring at me", do_sample=True, min_length=50)
[{'generated_text': 'She was staring at me with a look that said it all. She wanted me so badly tonight that I wanted'}]

限制和偏见

GPT-Neo被训练为一个自回归的语言模型。这意味着它的核心功能是接收一串文本并预测下一个标记。尽管语言模型广泛用于除此之外的任务，但是对于这项工作仍然存在许多未知。GPT-Neo-Shinen是在已知包含亵渎、淫秽和其他令人不快的语言的数据集上进行训练的。GPT-Neo-Shinen将产生社交上不可接受的文本，而且没有任何警告。GPT-Neo-Shinen会对特定提示作出回应，可能会出现冒犯性的内容，而没有任何警告。我们建议在发布之前让人工对输出进行筛选或过滤，既可以对不希望的内容进行审查，也可以提高结果的质量。

BibTeX 条目和引用信息

该模型是使用以下软件创建的：

@software{gpt-neo,
  author       = {Black, Sid and
                  Leo, Gao and
                  Wang, Phil and
                  Leahy, Connor and
                  Biderman, Stella},
  title        = {{GPT-Neo: Large Scale Autoregressive Language 
                   Modeling with Mesh-Tensorflow}},
  month        = mar,
  year         = 2021,
  note         = {{If you use this software, please cite it using 
                   these metadata.}},
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.5297715},
  url          = {https://doi.org/10.5281/zenodo.5297715}
}

作者:

KoboldAI

数据集大小:

5 GB