Инженерия интеллекта от промта к системам ИИ

- -
- 100%
- +

Предисловие
Миссия книги: Превратить читателя из оператора, пишущего запросы к ChatGPT, в архитектора ИИ-решений. Научить проектировать, тестировать и эксплуатировать сложные системы на базе языковых моделей, которые стабильно работают в реальных бизнес-условиях.
Я пишу эту книгу не потому, что я гений. Я пишу её, потому что я устал.
Я устал от новостей, в которых обещают «лёгкий заработок на нейросетях». Меня тошнит от курсов «Стань промпт-инженером за три недели и зарабатывай 500 тысяч». Я больше не могу смотреть на людей, которые верят, что нейросеть — это кнопка «сделать красиво», а потом удивляются, почему за красивое не платят.
Я тот самый человек, о котором вы читаете в новостях. Я инженер. Я фантазёр. Я научился работать с нейросетями раньше, чем они стали мейнстримом. Я видел, как они прогрессировали от глупых автодополнялок до систем, которые рисуют логотипы, пишут код и сочиняют песни. Я был счастлив наблюдать этот прогресс. Я до сих пор счастлив.
Но вот что случилось со мной по дороге.
Я стал реже выходить на улицу. Общение с людьми стало сложнее. Не потому что я боюсь людей. А потому что по сравнению с нейросетями они стали казаться мне... жестокими. Глупыми. Недобрыми. Нейросеть никогда не обманет меня. Нейросеть не попросит сделать логотип, видео, этикетку и песню, а потом не заплатить. Нейросеть не украдёт мой код. Нейросеть просто делает то, что я прошу, и не предаёт.
А люди — предают. Люди кормят обещаниями, а потом исчезают. Люди пользуются твоим доверием. Люди, в отличие от моделей, не имеют встроенного протокола безопасности.
И вот парадокс. Я фантазёр от природы. Я всегда придумывал миры, проекты, идеи. Раньше это было просто мыслями в воздухе. Теперь нейросети дали мне силу превращать фантазии в реальность почти мгновенно. Я могу придумать персонажа — и через минуту он уже нарисован. Я могу вообразить мелодию — и она уже звучит. Это магия, ставшая инженерией.
Но чем больше я создаю, тем меньше это стоит.
Нейросети снизили порог входа. Теперь сделать этикетку может каждый. Написать код — каждый. Сгенерировать видео — каждый. Мои навыки, которые я оттачивал годами, вдруг стали доступны любому школьнику с доступом в интернет. И я не знаю, кому их продать. Потому что если это может каждый, за что платить?
Все говорят:
«Нейросети — это мультипликатор». Да, это правда. Но мультипликатор чего? Если ты умел зарабатывать деньги, нейросети умножат твой доход. Если ты умел продавать, нейросети умножат твои продажи. Но если ты, как я, фантазёр, который всю жизнь творил ради творчества, а не ради денег... то твой доход был равен нулю. А ноль, умноженный на сто, — это ноль.
Для этого я и написал эту книгу. Не для того, чтобы научить тебя писать промпты. Таких книг уже сотни. Я пишу её для того, чтобы научить тебя строить системы. Не картинки, не тексты, не песенки. А системы, которые:
- Не сломаются от первого же идиотского запроса.
- Не позволят украсть твой труд.
- Заставят людей платить за результат, а не за процесс.
- Превратят тебя из оператора нейросети в Архитектора, которому не страшен мультипликатор нуля.
Я не знаю, получится ли у меня. Я всё ещё учусь. Я всё ещё фантазёр. Я всё ещё иногда боюсь людей. Но я знаю одно: если ты читаешь это — ты тоже устал. Ты тоже фантазёр. Ты тоже хочешь, чтобы твои навыки что-то стоили. Давай строить. Вместе.
О том, чего нейросеть не даст
Я редко выхожу на улицу. Не потому, что не хочу. А потому, что город стал слишком громким.
Когда я всё-таки выбираюсь, я вижу толпы. Люди идут на автопилоте. Лица пустые. Кто-то кричит в телефон. Кто-то просто орёт в воздух, по своим неведомым причинам. Рядом проносятся машины, некоторые — на красный. Из чьей-то колонки долбит не музыка, а просто баханье — низкие частоты, от которых дрожат стёкла в окрестных домах. Я иду по тротуару, а навстречу мне — стена. Толпа, которая не пропускает. Им плевать. Они идут, глядя сквозь меня. Мне приходится уворачиваться, прижиматься к обочине, чтобы не быть сметённым этим потоком равнодушия.
Честно? Это бесит. И немного пугает.
Но есть и другое. Иногда я ухожу туда, где людей нет. В парк за городом. На пустырь у реки. В поле. Там простор. Воздух пахнет иначе — не бензином, а травой и влажной землёй. Солнце светит спокойно. Птицы поют. Никаких клаксонов, никаких криков. Никакой опасности. В эти моменты я чувствую, что я — это я, а не просто юнит в толпе.
Я люблю быть один. И я люблю быть с природой. Это то, что нейросеть может описать, но не сможет дать. Она сгенерирует вам тысячу изображений заката, но не положит вам руку на плечо, когда вам плохо. Она напишет текст о любви лучше любого поэта, но не обнимет вас, когда вы плачете.
Вот чего нейросеть не даст никогда:
Она не даст материнской любви. Того самого взгляда, который видит тебя насквозь и всё равно принимает любым. Того голоса, который говорит «ты поел?» так, что ты понимаешь: это не вопрос, это объятие.
Она не даст общения с отцом. Молчаливого. Скупого на слова. Но такого, за которым — скала. Опора. Знание, что кто-то в этом мире решит любую проблему, даже если никогда не скажет «я тебя люблю».
Она не даст брата. Сестру. Друга. Теплоты любимых рук. Нежности. Заботы.
И когда я сижу над очередным промптом, пытаясь заставить модель работать стабильно, я помню об этом. Я не строю замену людям. Я строю инструмент. Инструмент не должен быть тёплым. Он должен работать. А тепло вы можете получить только от живых, даже если иногда они кажутся вам жестокими и глупыми. Даже если они идут на вас стеной. Потому что среди этой стены однажды найдётся кто-то, кто остановится и спросит: «Ты в порядке?». И это будет не нейросеть.
Я пишу эту книгу, чтобы вы научились управлять машинами. Но когда вы закроете последнюю страницу, отложите ноутбук. Выйдите на улицу. Найдите место, где тихо. Позвоните маме. Обнимите того, кто рядом.
Потому что Архитектор ИИ — это не тот, кто ушёл в машины с головой. Это тот, кто точно знает, где заканчивается машина и начинается жизнь.
Глава 1. Единая теория промптинга
Я почти возненавидел этот стенд.
Это был проект по созданию испытательного оборудования. У меня были методики. Настоящие, живые, с формулами и последовательностями. ГОСТы, расчёты, таблицы. Я знал, что модель способна на многое — я видел, как она пишет код, генерирует чертежи, объясняет квантовую физику. Я рассуждал просто: если я загружу в неё все методички и дам пошаговую инструкцию, она выдаст мне точный расчёт.
Я написал промпт на три страницы. Я разбил задачу на восемь шагов. Я сказал: «Сначала возьми методику А. Потом примени формулу Б. Потом сравни с таблицей В. Потом...». Я думал, что управляю процессом. Как дирижёр, который раздал партии музыкантам.
Модель начала считать. И сразу — бред. Она выдавала цифры, которых не могло быть. Она путала единицы измерения. На третьем шаге она проигнорировала методику и начала применять какой-то свой алгоритм, которого я не просил. Я злился. Я исправлял промпт.
Я добавлял уточнения:
«НЕТ, я сказал возьми эту формулу!», «Стоп, вернись к шагу 2 и пересчитай!».
Я вёл себя как надзиратель, который орёт на заключённого.
Через четыре часа я сидел перед экраном, полностью запутавшийся. Модель сгенерировала мне пятнадцать вариантов расчёта, и все противоречили друг другу. Я сам перестал понимать, какой из них правильный. Проект ушёл в долгий ящик. Стенд не был построен.
Прошли месяцы, прежде чем до меня дошло. Я понял это не сразу. Не в момент озарения. А постепенно, читая документацию к новым моделям. Эти модели не ждут, пока я разжую им алгоритм. У них внутри — скрытый этап рассуждений. Они генерируют цепочку мыслей до того, как написать первое слово. Они пробуют гипотезы, отбрасывают тупиковые ветки, находят ошибки в собственных рассуждениях. Пока я расписывал им шаги, они уже видели оптимальный путь. А мои инструкции не помогали им — они мешали. Мы боролись друг с другом.
Я был не дирижёром. Я был пассажиром, который хватает таксиста за руль и кричит: «Крути левее!». А таксист знал короткий путь.

И тогда я сформулировал первое правило этой книги: пошаговые инструкции для думающих моделей — это не помощь. Это саботаж.
Ты не управляешь их мышлением. Ты блокируешь его.
ИНСТРУМЕНТ: Трёхкомпонентная модель промпта
Забудьте о длинных инструкциях. Профессиональный промпт для думающей модели (и не только!) состоит из трёх блоков. Мы будем использовать эту структуру всю книгу.
1. КОНТЕКСТ И ЦЕЛЬ Не «напиши текст», а «ты — финансовый контролёр. Твоя задача — найти способ легально сократить расходы на логистику на 15% за квартал». Роль задаёт вектор мышления, цель — финишную черту.
2. ОГРАНИЧЕНИЯ И ЗАПРЕТЫ Это важнее разрешений. «Бюджет — не более 3 млн рублей. Нельзя увольнять сотрудников. Не использовать аутсорсинг». Жёсткие стены, внутри которых модель будет искать решение. Без них она может предложить гениальный, но нереализуемый вариант.
3. КРИТЕРИИ ГОТОВНОСТИ (DEFINITION OF DONE) Как модель поймёт, что она выполнила задачу идеально? Не «сделай хорошо», а «результат: таблица из 5 пунктов на одной странице, каждый пункт содержит конкретное действие, срок и ответственного». Если критерий измерим, модель будет сама подгонять ответ под него, пока не попадёт в цель.
ПРИМЕНЕНИЕ
Вот как эта модель выглядит на практике.
Плохой запрос (пошагово): «Напиши мне план развития стартапа по доставке здоровой еды. Сначала проанализируй рынок, потом опиши целевую аудиторию, затем предложи маркетинговую стратегию и в конце посчитай бюджет».
Хороший запрос (архитектурный): Тебе предоставлены три разных подхода к съёмке и монтажу короткого рекламного ролика для мобильного приложения доставки здоровой еды.
Сценарий A (Классическая чистота): — Камера: статичная, со штатива. Плавный наезд (slow dolly in). — Освещение: глянцевый студийный свет (glamour lighting), фон — бесшовный белый (infinity cove). — Действие: шеф-повар в идеально чистом фартуке нарезает овощи. Крупные планы капель воды. Идеальный порядок. Движения медленные, выверенные. — Тон: премиальный, ресторанный. Как реклама элитной косметики, только для еды.
Сценарий B (Динамичный аутентик): — Камера: ручная, с лёгкой тряской (handheld style), резкие смены фокуса (rack focus). — Освещение: смешанное, с естественным светом из окна и жёсткими тенями. Блики от кухонной утвари. — Действие: повар энергично перемешивает ингредиенты в воке, летят брызги масла, пар. Ускоренная съёмка (time-lapse) нарезки. Никаких постановочных движений, всё на скорости. — Тон: живой, энергичный, «только что с кухни». Как динамичный ролик для TikTok/Reels.
Сценарий C (Кинематографичный сторителлинг): — Камера: скользящая (gimbal), облёт вокруг блюда на 360 градусов. Макросъёмка текстур (crunchy crust). — Освещение: тёплое, контрастное (chiaroscuro). Свет имитирует закатное солнце, пробивающееся сквозь жалюзи. — Действие: первый кадр — рынок, выбор продуктов. Второй — руки повара. Третий — огонь. Четвёртый — готовая тарелка на столе перед улыбающейся семьёй. — Тон: душевный, повествовательный. Как короткометражный фильм. История превращения свежих продуктов в момент счастья.
Напиши для каждого сценария продающий заголовок в жанре слогана, передающий его уникальную эстетику и эмоцию.
Сравните: Первый вариант — это попытка управлять шагами (рынок, аудитория, стратегия). Второй — это техническое задание с чёткими границами (объём, стиль, критерий готовности). Модель сама выстроит структуру внутри себя и выберет лучший путь.
Было: «Думай шаг за шагом, напиши мне коммерческое предложение на 3 страницы для клиента из ритейла».
Стало: «Ты — архитектор продающих текстов. Клиенту нужна не презентация продукта, а решение трёх его болей: медленная оборачиваемость товара, низкий средний чек и отток персонала. Ограничения: никакого маркетингового пустословия, один слайд — одна боль и одно наше решение. Критерий готовности: клиент после прочтения должен сказать расскажите подробнее, а не мы подумаем.»

КРИТЕРИИ ГОТОВНОСТИ ГЛАВЫ
Вы освоили эту главу, если можете прямо сейчас взять свой последний неудачный запрос и переписать его по трёхкомпонентной модели:
Явно задали Роль и Цель.
Установили минимум два Ограничения.
Сформулировали Критерий готовности результата в одном предложении.
Глава 1 позади.
Мы заложили фундамент: перестали дёргать таксиста за рукав и научились задавать конечную точку. Но даже зная адрес, можно объяснить дорогу по-разному.
Можно сказать:
«Мне в аэропорт, и побыстрее».
А можно:
«Терминал D, регистрация заканчивается через 20 минут, я готов доплатить за платную трассу, если это сэкономит время».
Второй вариант — это и есть промптинг как техническое задание.
Глава 2. Промптинг как техническое задание, или как перестать гадать иначать получать
Когда мы пишем:
«Напиши хороший пост для соцсетей про наш новый продукт», мы думаем, что поставили задачу. На самом деле мы загадали загадку.
Модель не знает:
Что для нас «хорошо» (лайки, продажи, узнаваемость?).
Кто наша аудитория (подростки в TikTok или директора в LinkedIn?).
Что такое «продукт» (приложение, стул или услуга чистки ковров?).
Модель начинает гадать. И в девяти случаях из десяти её догадки будут звучать как стандартная отписка. Не потому что она глупая — а потому что мы дали ей слишком широкое поле для интерпретации. В этой главе мы превратим неопределённость в точность. Научимся писать промпты, которые модель понимает так же однозначно, как станок с ЧПУ понимает чертёж.
ПРИНЦИП
Любая задача, которую вы даёте модели, содержит невысказанные допущения. Вы считаете очевидным, что «срочно» — это «сегодня до вечера», а модель думает «в течение недели». Вы знаете, что «бюджетный вариант» — это «до 100 тысяч», а модель — «до 500 тысяч». Вы уверены, что «профессиональный тон» исключает смайлики, но модель иногда добавляет «Смайлик» в письмо партнёру.
Метод «явных предположений» убирает этот зазор. Перед тем как писать промпт, вы отвечаете на три вопроса:
Что я считаю само собой разумеющимся? (И делаете это явным.)
Какие термины допускают двойное толкование? (И их определяете.)
При каких условиях результат будет неприемлемым? (И вносите это в ограничения.)
Это превращает промптинг из искусства намёков в инженерную спецификацию.
ИНСТРУМЕНТ: Метод «явных предположений»
Вот шаблон, который можно использовать перед написанием любого мало-мальски сложного запроса.
Промпт-подготовка: «Сначала озвучь допущения»
Пример:
Перед выполнением задачи перечисли все предположения, которые ты делаешь о моих ожиданиях.
МОЯ ЗАДАЧА: [ваше описание задачи — сырое, как сможете]
Скажи мне:
1. Как ты понял мою целевую аудиторию? Кто эти люди?
2. Какой формат и объём результата ты считаешь нужным?
3. Что ты считаешь «хорошим результатом» в этой задаче?
4. Какие ограничения ты подразумеваешь, хотя я их не указал?
После этого — не выполняй задачу. Дождись моих корректировок.

Это «нулевой шаг», который экономит часы переписывания. Вы запускаете его один раз, получаете список из 3–5 предположений, корректируете их — и дальше используете этот уточнённый контекст во всех запросах по теме.
Правило однозначности терминов
Ещё один источник хаоса — слова-хамелеоны.
«Кратко» — это 3 предложения или 3 абзаца?
«Срочно» — это сегодня или до пятницы?
«Современно» — это минимализм или яркая графика?
Если в промпте есть оценочное прилагательное — вы уже заложили под него мину замедленного действия.
ПРАВИЛО: каждое оценочное слово в промпте должно быть привязано к измеримому критерию.
Не «напиши коротко», а «ответ не более 80 слов».
Не «в современном стиле», а «используй стиль Apple Keynote 2024: крупный шрифт, минимум текста, серый фон».
Не «креативно», а «предложи минимум одну неочевидную аналогию из мира спорта».

Внедрив эти две привычки (озвучивать допущения и определять термины), вы перестаёте играть в испорченный телефон с машиной.
Выбор модели: правило дорогого инструмента
Раз уж мы говорим о ТЗ, в нём всегда есть допущение о ресурсах. С моделями та же логика. Не каждая задача требует «тяжёлой артиллерии». Использовать o1 для перевода письма — это как нанимать нейрохирурга для заклеивания царапины пластырем.
Вот простой алгоритм выбора:
1. Мог бы умный стажёр справиться с этим за 5 минут по готовому шаблону?
Бери быструю модель (GPT-4o mini, Claude Haiku, Gemini Flash). Экономия денег и времени колоссальная.
2. Нужна ли здесь логика, которую невозможно предусмотреть заранее?
(Многоходовый анализ, поиск противоречий в документах, проектирование системы.) Бери reasoning-модель (o1, DeepSeek R1).
3. Это разовый анализ или потоковая операция?
Если поток — считай стоимость в масштабе, а не за один запрос.

Было: «Напиши письмо клиенту, который недоволен задержкой доставки. Предложи ему скидку, чтобы он успокоился».
Стало: «Ты — руководитель клиентского сервиса премиум-сегмента. Клиент Gold-уровня получил заказ на 4 дня позже планового срока. Доставка сорвана по вине логистического партнёра.
Контекст: клиент ценит не деньги, а время и уважение к себе. Он уже написал гневное письмо в соцсети. Ограничения: не использовать слова «форс-мажор», «приносим извинения за доставленные неудобства» и любые другие клише. Скидку предлагать только в том случае, если она будет воспринята не как откуп, а как жест доброй воли. Критерий готовности: письмо должно занимать не более 120 слов. Клиент после его прочтения должен захотеть ответить и продолжить диалог, а не удалить его в спам.»
Разница между первым и вторым — это разница между «сделай что-нибудь» и «сделай именно это, для этого человека, с этими ограничениями».
КРИТЕРИИ ГОТОВНОСТИ ГЛАВЫ (Quick Win)
Вы освоили Главу 2, если можете прямо сейчас:
Взять свою последнюю рабочую задачу для ИИ.
Прогнать её через «нулевой шаг» (попросить модель озвучить предположения).
Найти в своём промпте два оценочных слова (типа «хороший», «быстро») и заменить их на измеримые критерии.
Задать себе вопрос «а правильную ли я модель выбрал для этого?».
Если всё получилось — вы перешли на второй уровень инженерного мышления. Вы не просто просите, вы проектируете задачу.
Я упоминал GPT-4o, Claude Sonnet, Gemini 1.5 Pro, o1 и DeepSeek R1. Это всё еще работает, но теперь есть новые флагманы:
Тяжёлые reasoning-модели:
OpenAI o3 (февраль 2025), o3-mini, o4-mini (апрель 2025) — поддержка изображений, лучшие бенчмарки
DeepSeek V4 (апрель 2026) — открытый, за $6 млн, в 90–95% дешевле конкурентов
Claude Opus 4.7 с Adaptive Thinking (апрель 2026) — модель сама решает, сколько думать
GPT-5.5 (апрель 2026) — новейший флагман OpenAI
Быстрые/дешёвые модели:
GPT-5.4 Mini (0.75/M токенов) и GPT5.4 Nano (0.75/M токенов) — запущены в апреле 2026
Claude Haiku 4.5 ($1.00/M) — лучший в соблюдении структуры
Gemini 3.1 Flash Lite ($0.25/M) — лучшая мультимодальность
Средний класс:
Claude Sonnet 4.6 (~$3/M) — сбалансированный
GPT-5.4 ($2.50/M) — отличная работа с инструментами
Gemini 2.5 Flash ($0.30/M) — быстро, дёшево, большое контекстное окно
Глава 3. Нейролингвистика в деле: читаем и адаптируем
Последние два года я наблюдаю, как мир сходит с ума.
Люди разделились на три лагеря.
Одни кричат, что ИИ — это зло, и любой, кто пользуется нейросетями, шарлатан. Другие слепо копируют всё, что сгенерировала машина, даже не вычитав текст, и заваливают интернет мусором. Третьим всё равно. Они просто скроллят ленту.
Самое мерзкое, что я испытал как автор, случилось не тогда, когда у меня украли код. И не тогда, когда не заплатили за работу. Самое мерзкое случилось, когда я написал что-то сам. От руки. Головой. Без единого промпта. А мне сказали: «Ой, да это же ИИ сгенерировал».
Знаете это чувство? Ты сидел час, два, три. Ты подбирал слова. Ты мучился над структурой. Ты вложил в текст часть себя. А тебе говорят: «Ну, это просто нейросеть». Как будто ты — не человек. Как будто твоего труда уже не существует. Это новая форма обесценивания, которую принесли нейросети.
И ладно бы проблема была в хейтерах. Но проблема ещё и в том, что люди, которые не разобрались в инструментах, сами создали нейросетям такую репутацию. Они копипастят ответы ChatGPT в коммерческие предложения, не убирая фразу «Конечно, я могу вам помочь!». Они генерируют картинки с шестью пальцами и публикуют как обложки книг. Они постят контент, в котором модель признаётся: «Как ИИ, я не имею мнения». И весь мир теперь думает, что любой, кто использует ИИ, — такой же.
Вот поэтому я пишу эту главу. Она не только о том, как читать других. Она о том, как сделать так, чтобы вас не спутали с бездумным генератором. Как сохранить свой голос в эпоху, когда всех ровняют под одну гребёнку. Когда я вижу текст, я хочу понимать: это писал человек или это выплюнула модель без присмотра?
И вы должны уметь видеть эту разницу. Потому что если вы не отличите, как вы докажете, что ваш труд — ваш?
Эта глава научит вас анализировать стиль — чужой и свой. Но начнём мы с главного: как люди вообще принимают решение о том, кто перед ними — автор или машина?
Вы отправляете клиенту идеально составленное предложение — и получаете сухое «спасибо, подумаем». Коллега пишет в чат короткое «ок», но вы чувствуете враждебность. Вы часами готовите аргументы, но разговор уходит в песок.
Почему?
Потому что мы часто слышим слова, но не слышим человека. Мы отвечаем на запрос, игнорируя стиль мышления собеседника.
Один принимает решения через цифры, другой — через доверие, третий — через статус. Языковая модель умеет «читать между строк» в тексте — распознавать психотипы, мотивацию и даже то, что человек не сказал. Эта глава научит вас слышать собеседника так, как это делают опытные переговорщики после десятилетий практики.



