Урок 10. Fine-tuning и лучшие практики ИИ-приложений

📁 Блок: Мультимодальность/RAG/Fine-tuning ⏱️ Время изучения: ~90 мин 🎯 Сложность: Средняя+
#finetuning #llm #llm-api #rag

⚡ Кратко: когда нужен fine-tuning

Fine-tuning — это дообучение уже обученной модели на ваших примерах, чтобы она стабильнее выполняла конкретную задачу.

  • Лучше всего подходит для поведения: стиль, формат, классификация, типовые ответы, доменный тон.
  • Для свежих фактов и корпоративной базы знаний чаще начинайте с RAG, а не с fine-tuning.
  • Качество данных важнее количества: мусорные, предвзятые или противоречивые примеры ухудшат модель.
  • Перед обучением нужны train/test split, baseline, метрики, ручная проверка и safety-кейсы.
  • Production AI — это не только модель: приватность, ключи, evals, мониторинг, логирование, стоимость и обновления.
# decision.py — практическое правило
if need_fresh_facts_or_documents:
    use_rag()
elif need_stable_style_or_task_behavior:
    consider_fine_tuning()
else:
    improve_prompt_and_evals_first()

📖 О чём этот урок

Финальный урок курса соединяет всё, что было раньше: NLP, трансформеры, LLM API, токены, эмбеддинги, LangChain, агенты, мультимодальность и RAG. Теперь мы разбираем, когда модель стоит дообучать, как подготовить данные и что нужно учитывать, чтобы ИИ-приложение было безопасным и поддерживаемым.

Идея урока. Fine-tuning — не волшебная кнопка «сделать модель умной». Это инженерный процесс: выбрать задачу, собрать хорошие примеры, измерить baseline, обучить, сравнить результат и решить, окупается ли сложность.

Что изучим

  • Что такое supervised fine-tuning и чем он отличается от prompt engineering и RAG
  • Когда fine-tuning нужен: доменный стиль, формат, классификация, устойчивое поведение
  • Когда fine-tuning не нужен: быстрые прототипы, свежие знания, маленькие задачи без метрик
  • Как подготовить данные: очистка, разметка, формат instruction-response, train/test split
  • Как выглядит учебный пайплайн Hugging Face Trainer + PEFT/LoRA
  • Лучшие практики AI-приложений: этика, приватность, безопасность, evals, мониторинг и масштабирование

📚 Что повторить перед изучением

🎯 Что изучать дальше