Урок 10. Fine-tuning и лучшие практики ИИ-приложений
⚡ Кратко: когда нужен fine-tuning
Fine-tuning — это дообучение уже обученной модели на ваших примерах, чтобы она стабильнее выполняла конкретную задачу.
- Лучше всего подходит для поведения: стиль, формат, классификация, типовые ответы, доменный тон.
- Для свежих фактов и корпоративной базы знаний чаще начинайте с RAG, а не с fine-tuning.
- Качество данных важнее количества: мусорные, предвзятые или противоречивые примеры ухудшат модель.
- Перед обучением нужны train/test split, baseline, метрики, ручная проверка и safety-кейсы.
- Production AI — это не только модель: приватность, ключи, evals, мониторинг, логирование, стоимость и обновления.
# decision.py — практическое правило
if need_fresh_facts_or_documents:
use_rag()
elif need_stable_style_or_task_behavior:
consider_fine_tuning()
else:
improve_prompt_and_evals_first()
📖 О чём этот урок
Финальный урок курса соединяет всё, что было раньше: NLP, трансформеры, LLM API, токены, эмбеддинги, LangChain, агенты, мультимодальность и RAG. Теперь мы разбираем, когда модель стоит дообучать, как подготовить данные и что нужно учитывать, чтобы ИИ-приложение было безопасным и поддерживаемым.
Идея урока. Fine-tuning — не волшебная кнопка «сделать модель умной». Это инженерный процесс: выбрать задачу, собрать хорошие примеры, измерить baseline, обучить, сравнить результат и решить, окупается ли сложность.
Что изучим
- Что такое supervised fine-tuning и чем он отличается от prompt engineering и RAG
- Когда fine-tuning нужен: доменный стиль, формат, классификация, устойчивое поведение
- Когда fine-tuning не нужен: быстрые прототипы, свежие знания, маленькие задачи без метрик
- Как подготовить данные: очистка, разметка, формат instruction-response, train/test split
- Как выглядит учебный пайплайн Hugging Face Trainer + PEFT/LoRA
- Лучшие практики AI-приложений: этика, приватность, безопасность, evals, мониторинг и масштабирование
📚 Что повторить перед изучением
- ← Урок 09: RAG и генерация по внешнему контексту
- Урок 05: цепочки, document loaders, vector stores и prompt templates
- Урок 04: эмбеддинги, cosine similarity, FAISS и качество поиска
- Урок 03: токены, лимиты, API-ключи,
.env, обработка ошибок - Python: виртуальное окружение, pip, списки/словари, функции, pandas basics
🎯 Что изучать дальше
- ← Все уроки курса Python for AI
- Повторите урок 09, если задача про знания, документы, FAQ, политики или часто меняющиеся данные.
- Соберите портфолио-проект: RAG-ассистент с evals, логированием, safety-фильтрами и понятным README.
- ← Вернуться к порталу предметов