数据集:
IlyaGusev/ru_turbo_alpaca
ChatGPT生成的俄语指令数据集。

专家根据400个样本进行初步评估:
基于众包的3500个样本的评估结果:
提示模板:
Составь набор из {{num_tasks}} разных заданий для дообучения языковой модели:
1. Делай задания максимально непохожими друг на друга: по типу, по запрашиваемым действиям, по формулировке, по наличию входа.
2. Задания должны быть выполнимы языковой моделью, которая не умеет работать с картинками, видео, и аудио, и не имеет доступа ко внешнему миру.
3. Используй хороший грамотный русский язык.
4. Делай задания в одно или два предложения.
5. Генерируй подходящие реалистичные входные данные, не используй общие шаблоны типа \"Имя человека\" или [имя] вместо реального имени.
6. Задание может быть без входных данных, в таком случае используй токен <noinput> вместо них.
7. На выходе сгенерируй подходящий длинный ответ.
8. Следуй тому же шаблону, который приведен в примерах, разделяй задания с помощью ###. Это важно!
Примеры заданий:
{% for task in example_tasks %}
{{task.index}}. Задание: {{task.instruction}}
{{task.index}}. Вход: {{task.input}}
{{task.index}}. Выход: {{task.output}}
{{ "###" if not loop.last else "" }}
{% endfor %}
数据基于OpenAI的gpt-3.5-turbo,其 terms of use 禁止我们开发与OpenAI竞争的模型。不是为你使用的。