Урок 02. Большие языковые модели (LLM) и промпт-инжиниринг
⚡ Кратко: LLM и промпты
LLM (большие языковые модели) — нейросети на архитектуре трансформеров, обученные на огромных текстах предсказывать слова по контексту. Содержат от сотен миллионов до триллионов параметров.
- GPT — авторегрессия (генерация: предсказывает следующее слово). BERT — двунаправленный анализ (понимание: предсказывает пропущенные слова).
- Промпт-инжиниринг — навык формулировать запросы, дающие точные ответы.
- Компоненты хорошего промпта: роль/контекст · цель · формат ответа · примеры · ограничения.
Плохой: «Объясни, как работает компьютер». Хороший: «Ты — учитель информатики. Объясни работу компьютера простыми словами для 7-классника. Ответ — список из 3 пунктов».
📖 О чём этот урок
В уроке 01 мы разобрали архитектуру трансформеров. Теперь посмотрим на большие языковые модели (LLM), построенные на ней, и научимся главному прикладному навыку — промпт-инжинирингу: как формулировать запросы, чтобы получать от модели точные и полезные ответы.
Что изучим
- Что такое LLM, как они работают и где применяются
- GPT vs BERT: генерация vs понимание
- Промпт-инжиниринг: зачем нужен и из чего состоит хороший промпт
- Формула промпта: роль · цель · формат · примеры · ограничения
- Практика: деловое письмо, объяснение термина, два промпта для одной задачи
📚 Что повторить перед изучением
- ← Урок 01: NLP и трансформеры (механизм внимания)
- Базовый Python (для опытов из «Примеров» — необязательно)
- Доступ к любой LLM-чат-модели для практики (ChatGPT, Gemini, Claude и т.п.)
🎯 Что изучать дальше
- → Урок 03: Токенизация и работа с API LLM (первый код)
- Гайды по промптам: OpenAI Prompt Engineering