📝 Задания

← К оглавлению урока

⚡ Что сделать

Объяснить архитектуру RAG своими словами.
Собрать мини-RAG по 4-6 текстовым документам.
Сравнить k, chunk size и качество найденных источников.
Описать 2-3 реальные задачи, где RAG особенно полезен.

Часть 1. Проверка понимания

Что означает Retrieval-Augmented Generation?
Какое ограничение LLM закрывает RAG?
Почему в RAG нужны эмбеддинги?
Чем векторный поиск отличается от поиска по ключевым словам?
Что такое чанк и зачем нужен chunk_overlap?
Почему важно возвращать источники вместе с ответом?
Когда лучше выбрать RAG, а когда fine-tuning?

Часть 2. Практика: свой мини-RAG

Создайте 4-6 коротких документов по одной теме: курс, продукт, FAQ, правила, техническая документация.
Превратите их в Document с метаданными source.
Разбейте на чанки через RecursiveCharacterTextSplitter.
Постройте FAISS vector store с GoogleGenerativeAIEmbeddings.
Соберите LCEL-цепочку, которая отвечает только по найденному контексту.
Проверьте минимум 5 вопросов: 3 с ответом в базе и 2 без ответа в базе.

Часть 3. Эксперименты

Сравните k=1, k=3, k=5. Где ответ стал лучше, а где шумнее?
Сравните два разбиения: маленькие чанки и крупные чанки.
Составьте таблицу: вопрос, ожидаемый источник, найденный источник, качество ответа.
Добавьте вопрос, на который в базе нет ответа. Проверьте, умеет ли модель сказать об отсутствии информации.

Часть 4. ДЗ из LMS

Опишите 2-3 задачи, где RAG был бы особенно полезен, помимо примеров из урока.
Для каждой задачи объясните, какую проблему решает RAG.
Найдите реальные RAG-системы или инструменты: компании, продукты, open-source фреймворки.
Подготовьте короткий вывод: где RAG даёт ценность, а где его недостаточно.