✅ Решения

← К оглавлению урока

⚡ Кратко

RAG ищет релевантные фрагменты во внешней базе и передаёт их LLM как контекст. Эталонная проверка смотрит не только на ответ, но и на найденные источники.

Часть 1. Ответы

  1. Retrieval-Augmented Generation — генерация ответа с предварительным поиском релевантного внешнего контекста.
  2. RAG закрывает ограничение «замороженных» знаний LLM и отсутствие доступа к вашим документам.
  3. Эмбеддинги превращают текст в векторы, чтобы искать похожие по смыслу фрагменты.
  4. Keyword search ищет совпадение слов, vector search ищет семантическую близость.
  5. Чанк — небольшой фрагмент документа. chunk_overlap сохраняет часть соседнего текста, чтобы смысл не ломался на границе.
  6. Источники нужны для проверки ответа, отладки retrieval и доверия пользователя.
  7. RAG лучше для внешних и обновляемых знаний. Fine-tuning лучше для поведения, формата, стиля и специализированной классификации.

Часть 2. Эталонный код мини-RAG

Базовый рабочий вариант находится на странице Примеры. Для сдачи достаточно адаптировать его под свои документы и добавить таблицу проверки.

# expected_output.txt (пример)
ВОПРОС: Что такое трансформеры?
ИСТОЧНИКИ: ['transformers']
ОТВЕТ: Трансформеры используют механизм внимания...

ВОПРОС: Что такое автоэнкодеры?
ИСТОЧНИКИ: ['gan', 'transformers', 'resnet']
ОТВЕТ: В контексте нет информации.

Часть 3. Таблица экспериментов

ВопросОжидаемый источникkНайденоОценка
Что такое GAN?gan1ganХорошо
Где используется attention?transformers1transformersХорошо
Что такое автоэнкодеры?нет3нерелевантные AI-фрагментыОтвет должен быть fallback.
Как ResNet помогает обучению?resnet3resnet + шумОтвет верный, но контекст длиннее.

Часть 4. Примеры задач для ДЗ

ЗадачаПроблемаКак помогает RAG
Ассистент поддержки SaaSFAQ и тарифы часто меняются.Ищет актуальные статьи базы знаний и отвечает со ссылками.
Поиск по учебным вебинарамСтудент не знает, где в записи нужная тема.Индексирует транскрипты и возвращает ответ с таймкодом.
Юридический помощник по внутренним политикамДокументы объёмные и специфичные.Находит релевантные пункты регламентов и цитирует источник.

Часть 5. Что считать хорошей сдачей

  • Есть описание источников данных и почему они подходят для RAG.
  • Есть схема pipeline: ingestion/indexing отдельно, retrieval/generation отдельно.
  • Есть минимум 5 тестовых вопросов и таблица retrieval-результатов.
  • Есть fallback для вопросов вне базы.
  • Есть ссылки или названия реальных продуктов/инструментов, которые используют retrieval/vector search.