Урок 04 — Запросы, таймауты и эмбеддинги

📖 О чём этот урок

Урок 03 научил отправлять первый запрос к LLM. Но в реальной жизни API ненадёжны: сервер перегружен, есть лимиты на число запросов, сеть рвётся. Сначала научимся писать устойчивый к сбоям код (таймауты, лимиты, повторы). Затем перейдём к эмбеддингам — числовому представлению смысла текста — и построим семантический поиск, который находит похожие тексты, даже если в них нет совпадающих слов.

Что изучим

Проблемы при работе с API: перегрузка, rate limits, нестабильная сеть
Задержки между запросами и установка таймаута
Ошибки API (500 / 403 / 429) и автоповтор запроса с tenacity
Эмбеддинги: что это, зачем, как близость векторов = близость смысла
Семантический поиск и векторные базы данных (FAISS, Pinecone, Weaviate)
Best practices (вне лекции): косинусная близость и нормализация, батчи эмбеддингов

📚 Что повторить перед изучением

← Урок 03: Токенизация и работа с API LLM (клиент Gemini, .env)
Python: функции, декораторы (в общих чертах), try/except
Установленные numpy, tenacity, faiss-cpu (для практики); ключ Gemini

Урок 04. Обработка запросов и таймаутов. Эмбеддинги и векторы

⚡ Кратко: надёжные запросы и эмбеддинги

📖 О чём этот урок

Что изучим

📂 Структура урока

📖 Теория

🔖 Справочник

💻 Примеры

⚖️ Старый vs Новый

📝 Задания

✅ Решения

🐛 Ошибки

🏠 Домашнее задание

🔗 Ресурсы

📚 Что повторить перед изучением

🎯 Что изучать дальше