Теория — Урок 02

Что такое LLM

Большие языковые модели (Large Language Models) — нейросети, обученные работать с текстом: генерация, анализ тональности, перевод, программирование. В основе — архитектура трансформеров (урок 01): модель понимает смысл, анализируя текст целиком.

Как работают

Обучение на больших данных: модель анализирует тексты из интернета, книг, статей, учась предсказывать слова по контексту.
Трансформеры: позволяют понимать смысл, анализируя текст целиком, а не по частям.
Генерация: после обучения модель создаёт текст, который выглядит написанным человеком.

Характеристики

Контекст: понимают связь слов во всём тексте, а не только в предложении.
Масштаб: от сотен миллионов до триллионов параметров.
Применение: перевод, чат-боты и ассистенты, анализ и автоматизация работы с текстом, создание контента и кода.

GPT vs BERT

Два семейства трансформеров с разным назначением.

Характеристика	GPT	BERT
Принцип	Генерирует текст, предсказывая следующее слово (авторегрессия)	Анализирует текст, предсказывая пропущенные слова и связи (двунаправленность)
Контекст	Учитывает предыдущие слова, не видит будущие	Анализирует текст с обеих сторон
Применение	Генерация, ответы на вопросы, код	Поиск, тональность, классификация
Пример	ChatGPT	Google Search

Наглядно. GPT: «Напиши продолжение истории…» → сгенерирует текст. BERT: «Какое слово пропущено в 'Я пошёл в [MASK] за хлебом'?» → подставит «магазин». BERT обучается на маскировании слов и предсказании следующего предложения.

Промпт-инжиниринг

Промпт-инжиниринг — процесс создания запросов (промптов), которые помогают эффективно взаимодействовать с LLM. Это навык: его развивают, экспериментируя с формулировками.

Зачем

Повышает точность ответов и снижает вероятность ошибок/неполноты.
Адаптирует модель под задачу: письмо, программирование, анализ данных.

Формула хорошего промпта

Промпт должен быть чётким, структурированным и с контекстом. Ключевые компоненты:

Роль / контекст — кто отвечает и какие детали важны («Ты — преподаватель информатики…»).
Цель — чётко сформулируйте, чего хотите достичь.
Формат ответа — список, таблица, краткое/развёрнутое описание.
Примеры — если нужен определённый стиль, дайте образец.
Ограничения и параметры — длина, тон, что нельзя.

❌ Плохой промпт
«Объясни, как работает компьютер.»

✅ Хороший промпт
«Ты — преподаватель информатики. Объясни, как работает компьютер, простыми словами для ученика 7-го класса. Ответ в виде списка из 3 пунктов.»

Практические советы

Избегайте неоднозначности.
Экспериментируйте с формулировками.
Дробите сложные задачи на простые запросы.

⚠️ Современные приёмы вне лекции: system/role-промпт, few-shot (примеры в промпте), chain-of-thought («рассуждай пошагово»), запрос структурированного вывода (JSON). См. гайд OpenAI / Anthropic.

📖 Теория: LLM и промпт-инжиниринг

⚡ Суть

Что такое LLM

Как работают

Характеристики

GPT vs BERT

Промпт-инжиниринг

Зачем

Формула хорошего промпта

Практические советы