Урок 09 — Retrieval-Augmented Generation (RAG)

📖 О чём этот урок

В уроках 04–05 мы уже видели эмбеддинги, FAISS, LangChain и вопрос-ответ по документам. Урок 09 собирает это в целостную архитектуру RAG: как подготовить знания, найти нужные фрагменты и заставить LLM отвечать по этим фрагментам, а не выдумывать.

Идея урока. LLM похожа на сильного автора, но ей нужен «библиотекарь»: компонент retrieval находит актуальные и доменные материалы, а модель формулирует ответ на их основе.

Что изучим

Что такое Retrieval-Augmented Generation и какие ограничения LLM он закрывает
Архитектуру RAG: источники → чанки → эмбеддинги → vector store → retrieval → prompt → LLM
Зачем нужны векторные базы данных и чем семантический поиск отличается от keyword search
Как собрать учебный RAG на LangChain, FAISS и Google Gemini
Что изменилось в современном стеке: LCEL вместо LLMChain, новые модели Gemini и эмбеддингов
Типичные ошибки: плохое разбиение, нет источников, галлюцинации, prompt injection из найденного текста

📚 Что повторить перед изучением

← Урок 08: аудио, видео и мультимодальные pipeline
Урок 05: LangChain, LCEL, Document Loaders и Vector Stores
Урок 04: эмбеддинги, FAISS, семантический поиск
Урок 03: API-ключи, .env, лимиты и обработка ошибок
Python: функции, списки, словари, виртуальное окружение, установка пакетов

🎯 Что изучать дальше

→ Урок 10: Fine-tuning и лучшие практики ИИ-приложений
Связь с fine-tuning: RAG чаще нужен для внешних знаний, fine-tuning — для поведения, формата и доменного стиля.
← Все уроки курса Python for AI
LangChain: Build a RAG agent

Урок 09. Retrieval-Augmented Generation (RAG)

⚡ Кратко: зачем нужен RAG

📖 О чём этот урок

Что изучим

📂 Структура урока

📖 Теория

🔖 Справочник

💻 Примеры

⚖️ Старый vs Новый

📝 Задания

✅ Решения

🐛 Ошибки

🏠 Домашнее задание

🔗 Ресурсы

📚 Что повторить перед изучением

🎯 Что изучать дальше