Теория — Урок 10

Что такое fine-tuning

Fine-tuning — это продолжение обучения уже готовой модели на более узком наборе данных. Базовая модель уже знает язык и общие закономерности, а дообучение показывает ей, как именно нужно отвечать в вашей задаче.

Аналогия из лекции: готовая модель похожа на универсальный веб-шаблон. Он уже работает, но для конкретного проекта вы меняете стиль, тексты и поведение. Fine-tuning делает похожую кастомизацию для модели.

Когда fine-tuning нужен

Сценарий	Почему помогает	Пример
Специализированный домен	Модель привыкает к терминологии, формату и типовым решениям.	Классификация медицинских обращений или юридических формулировок.
Уникальный стиль	Ответы стабильнее совпадают с голосом бренда или стандартом документации.	Техническая документация в строгом корпоративном стиле.
Улучшение конкретной задачи	Модель видит много правильных входов и выходов для одного типа работы.	Сентимент-анализ отзывов о мобильных телефонах.
Формат ответа	Меньше промпта и меньше вариативности в структуре результата.	Всегда возвращать JSON с фиксированными полями.

Когда fine-tuning не нужен

Быстрый прототип: сначала проверьте идею обычной моделью, промптом и несколькими примерами.
Свежие или изменяемые знания: используйте RAG, базу данных или инструменты поиска.
Нет метрик: если нельзя измерить улучшение, fine-tuning легко превратится в дорогое предположение.
Мало качественных примеров: плохой датасет почти всегда хуже хорошего промпта.

⚠️ Современное правило: fine-tuning не должен быть первым способом «добавить факты». Если пользователю нужны ответы по документам компании, начните с RAG из урока 09; fine-tuning подключайте, когда нужно стабилизировать формат, стиль или поведение.

Данные для fine-tuning

Качество входных данных напрямую определяет качество модели. В лекции это сформулировано как Garbage in, garbage out: если данные шумные, предвзятые или противоречивые, модель научится этим же ошибкам.

Проблема данных	Последствие	Что делать
Предвзятость	Модель несправедливо работает с группами пользователей или кейсами.	Проверить покрытие, баланс классов, sensitive attributes, edge cases.
Шум и дубликаты	Модель запоминает случайные ошибки и повторяющиеся ответы.	Дедупликация, нормализация, ручная выборочная проверка.
Малый объём	Переобучение и слабое обобщение.	Собрать больше примеров или снизить цель: prompt/RAG/baseline.
Противоречивые ответы	Модель не понимает, какой стиль или политика правильные.	Единый гайдлайн разметки и ревью спорных примеров.

Шаги подготовки

Определить задачу: что модель должна делать лучше, чем baseline.
Собрать данные: собственные данные, открытые датасеты, синтетические примеры с ручной проверкой.
Очистить: удалить дубликаты, мусор, PII, нерелевантные строки, ошибки формата.
Разметить: добавить правильные ответы, классы, формат JSON или desired output.
Разделить: train для обучения, validation/test для оценки и регрессий.
Оценить baseline: тот же тестовый набор прогоняется на обычной модели.
Обучить и сравнить: fine-tuned модель должна выигрывать по заранее выбранным метрикам.

Инструменты

В исходном коде урока используется Hugging Face ecosystem: datasets, transformers, Trainer, peft и LoRA. Это хороший учебный стек: можно увидеть весь процесс локально и понять, из каких частей состоит обучение.

⚠️ На 2026-06-12 официальная документация Gemini API сообщает, что после выключения Gemini 1.5 Flash-001 fine-tuning в Gemini API и AI Studio больше не поддерживается; Google указывает Enterprise Agent Platform как enterprise-направление. Перед планированием cloud-tuning всегда проверяйте актуальную документацию провайдера.

⚠️ Документация OpenAI описывает supervised fine-tuning и model optimization, но также сообщает, что fine-tuning platform сворачивается и недоступна новым пользователям. Для нового проекта не закладывайте OpenAI fine-tuning как гарантированно доступную опцию без проверки аккаунта и docs.

Лучшие практики AI-приложений

Этика: проверяйте bias, дискриминационные эффекты, прозрачность и explainability.
Приватность: минимизируйте персональные данные, анонимизируйте, шифруйте, соблюдайте GDPR/CCPA и локальные требования.
Безопасность: храните ключи в env/secret manager, валидируйте входы и выходы, делайте red-teaming.
Human-in-the-loop: в медицинских, юридических, финансовых и других high-stakes сценариях человек должен проверять вывод.
Оценка качества: создайте eval set до обучения и используйте его при каждом изменении модели, промпта или retrieval.
Эксплуатация: мониторинг, логирование, rate limits, cost tracking, rollback и регулярное обновление моделей.

Что это значит после курса

Хороший AI-разработчик не просто вызывает модель. Он выбирает архитектуру: prompt, RAG, tools/agents, fine-tuning или их комбинацию; измеряет качество; защищает данные; думает о стоимости и поддержке. Это и есть переход от учебного примера к настоящему ИИ-приложению.

📖 Теория: fine-tuning и production AI

⚡ Суть

Что такое fine-tuning

Когда fine-tuning нужен

Когда fine-tuning не нужен

Данные для fine-tuning

Шаги подготовки

Инструменты

Лучшие практики AI-приложений

Что это значит после курса