Задания — Урок 10

Часть 1. Концептуальные вопросы

Что такое fine-tuning и чем он отличается от pretraining?
Назовите три сценария, где fine-tuning может быть полезен.
Почему RAG чаще лучше для внутренних документов и часто меняющихся знаний?
Что означает Garbage in, garbage out применительно к обучению моделей?
Зачем нужен отдельный test split?
Какие риски возникают при использовании персональных данных в датасете?
Что нужно мониторить после запуска AI-приложения?

Часть 2. Выбор задачи

Возьмите один вариант или придумайте свой:

Классификация отзывов на товары определённой категории.
Генерация ответов в стиле конкретного бренда.
Ответы поддержки в фиксированном формате.
Извлечение полей из коротких пользовательских сообщений.

Для выбранной задачи заполните:

# task_plan.md
Задача:
Почему prompt недостаточен:
Почему RAG недостаточен или не главный:
Какой baseline сравниваем:
Какие данные нужны:
Какие метрики качества:
Какие privacy/safety риски:

Часть 3. Подготовка датасета

Соберите 20-50 учебных примеров.
Удалите дубликаты и явно нерелевантные строки.
Приведите все примеры к одному формату: instruction, input, output.
Разделите данные на train и test.
Проверьте, что в test нет точных дублей из train.

Часть 4. План обучения

Не обязательно запускать тяжёлое обучение на слабом компьютере. Важно уметь описать воспроизводимый пайплайн:

модель и почему она выбрана;
какой tokenizer используется;
какие LoRA-параметры выбраны;
сколько шагов/эпох;
как сохраняется адаптер;
как сравнивается результат с baseline.

Часть 5. Production review

Для своей задачи ответьте:

Есть ли персональные данные? Как их удалить или обезличить?
Какие ошибки модели могут навредить пользователю?
Нужен ли human-in-the-loop?
Какие логи можно хранить, а какие нельзя?
Как вы поймёте, что модель устарела?

Часть 6. ДЗ из LMS

Выберите или создайте небольшой датасет для fine-tuning.
Очистите текст от шума: дубликаты, ошибки, нерелевантные строки.
Разбейте данные на обучающую и тестовую выборки.
Проведите обучение или подготовьте воспроизводимый план обучения, если локально не хватает ресурсов.
Оцените качество на тестовых данных.