⚡ Что сделать
- Объяснить архитектуру RAG своими словами.
- Собрать мини-RAG по 4-6 текстовым документам.
- Сравнить
k, chunk size и качество найденных источников.
- Описать 2-3 реальные задачи, где RAG особенно полезен.
Часть 1. Проверка понимания
- Что означает Retrieval-Augmented Generation?
- Какое ограничение LLM закрывает RAG?
- Почему в RAG нужны эмбеддинги?
- Чем векторный поиск отличается от поиска по ключевым словам?
- Что такое чанк и зачем нужен
chunk_overlap?
- Почему важно возвращать источники вместе с ответом?
- Когда лучше выбрать RAG, а когда fine-tuning?
Часть 2. Практика: свой мини-RAG
- Создайте 4-6 коротких документов по одной теме: курс, продукт, FAQ, правила, техническая документация.
- Превратите их в
Document с метаданными source.
- Разбейте на чанки через
RecursiveCharacterTextSplitter.
- Постройте FAISS vector store с
GoogleGenerativeAIEmbeddings.
- Соберите LCEL-цепочку, которая отвечает только по найденному контексту.
- Проверьте минимум 5 вопросов: 3 с ответом в базе и 2 без ответа в базе.
Часть 3. Эксперименты
- Сравните
k=1, k=3, k=5. Где ответ стал лучше, а где шумнее?
- Сравните два разбиения: маленькие чанки и крупные чанки.
- Составьте таблицу: вопрос, ожидаемый источник, найденный источник, качество ответа.
- Добавьте вопрос, на который в базе нет ответа. Проверьте, умеет ли модель сказать об отсутствии информации.
Часть 4. ДЗ из LMS
- Опишите 2-3 задачи, где RAG был бы особенно полезен, помимо примеров из урока.
- Для каждой задачи объясните, какую проблему решает RAG.
- Найдите реальные RAG-системы или инструменты: компании, продукты, open-source фреймворки.
- Подготовьте короткий вывод: где RAG даёт ценность, а где его недостаточно.