Токенный бюджет: новая строка сметы, которую агентства пока не считают

2026-07-01 16:23:48 Время чтения 9 мин 143

Что такое токенный бюджет

Раньше управленец распределял ресурсы по двум осям: нанять людей или докупить вычислений. Теперь добавилась третья – токены, единицы, которыми модель оплачивает каждое своё слово. Сформулировал это Матан Гринберг, основатель и гендиректор компании Factory, которая делает AI-агентов для Nvidia, Morgan Stanley и Adobe. В апреле 2026 Factory подняла раунд при оценке 1,5 млрд долларов (TechCrunch). Любопытно, на чём построен её бизнес: переключать задачи между разными моделями, чтобы не жечь дорогие токены там, где справятся дешёвые.

Для маркетолога это звучит как чужая айтишная тема. Ровно до того момента, когда смотришь, из чего складывается счёт за AI-кампанию в проде.

Токены дешевеют, а счёт всё равно растёт

Стоимость вычислений падает быстрее почти всего, что я видел в технологиях. Фонд Andreessen Horowitz посчитал: генерация на уровне модели трёхлетней давности подешевела с 60 долларов за миллион токенов в конце 2021 года до 6 центов к концу 2024 – в тысячу раз за три года, примерно вдесятеро в год. Казалось бы, проблема рассасывается сама.

Не рассасывается. Корпоративные расходы на генеративный AI в 2025 году утроились и дошли до 37 млрд долларов, по оценке фонда Menlo Ventures. Gartner считает мировые траты на эту технологию в 644 млрд за тот же год. Цена за единицу падает, а суммарный счёт растёт, потому что падение цены провоцирует рост объёма: дешевле токен – больше задач на него вешают.

Есть и вторая причина. Дешевеют в основном старые, простые модели. Цены на топовые рассуждающие модели, которыми и решают серьёзные задачи, держатся стабильно – это отдельно отмечает исследовательская группа Epoch AI. Так что экономия на токенах – во многом иллюзия масштаба: ты экономишь на копейках и тратишь на рублях.

Почему пилот всегда врёт

Главная ловушка зашита в разрыве между демкой и продакшеном. Пилот на полсотни макетов почти ничего не стоит, поэтому его легко согласовать. Прод на пятьдесят тысяч – уже другая экономика, и её почти никто не моделирует заранее.

Разрыв берётся из устройства агентов. Один запрос пользователя к толковому AI-агенту разворачивается внутри в десяток-другой обращений к модели: воспринять, рассудить, проверить себя, переделать. Каждый шаг – оплаченные токены. Плюс невидимые слои вокруг: оркестрация, кэш, поиск по базе, хранилище. В итоге цена самой модели – меньше половины реального счёта за прод.

Gartner прогнозирует, что больше 40% проектов с AI-агентами свернут к концу 2027 года, и первой причиной называет растущие издержки. McKinsey в своём ежегодном опросе фиксирует другую сторону той же монеты: влияние AI на операционную прибыль видят только 39% компаний, и у большинства из них это меньше 5% прибыли. Деньги в технологию заливают, отдача на дне отчёта пока не проступает.

Куда это бьёт в смете маркетолога

Токены перестают быть строкой айтишников и попадают прямо в себестоимость кампании. Бьёт по нескольким статьям сразу. Самая прожорливая – генерация макетов и роликов, и кейс Coca-Cola тут показателен: 70 тысяч сгенерированных клипов ради одного финального ролика, где каждая отбраковка стоила оплаченных вычислений. Копирайт и персонализация масштабируются линейно, поэтому тысяча писем под сегменты обходится в тысячу раз дороже одного. А дороже всего выходят чат-боты и агенты в поддержке, ведь один диалог разворачивается в десятки внутренних обращений к модели.

В деньгах рынка это уже заметно. Российский рекламный рынок в 2025 году – 981,6 млрд рублей, и больше половины, 510 млрд, ушло в интернет (данные АКАР). AI-генерация откусывает всё большую долю этой digital-части, а значит токенный счёт скоро придётся защищать перед финансовым директором так же, как защищают медиабюджет.

Агентства уже спорят, кто за это платит

На западном рынке дискуссия идёт открыто. Издание Digiday разобрало, как агентства разделились по принципу учёта токенов. Группа Brandtech через свой инструмент Pencil выбила оптовые ставки у поставщиков моделей и перепродаёт клиентам пакеты генераций. Агентство Big Spaceship проводит вычисления отдельной строкой бюджета, по их формулировке – «как кейтеринг или аренду оборудования».

Другие против того, чтобы перекладывать токены на клиента напрямую. Лиза Хердман, старший вице-президент агентства RPA, формулирует жёстко: нельзя выставлять клиенту счёт за то, про что заранее неизвестно, сработает оно или нет. Крис Нефф, директор по AI в агентстве Anomaly, назвал такое ценообразование попыткой залезть в чужой карман.

Рубен Шрёрс, генеральный директор аналитической компании Ebiquity, смотрит дальше: «Расход агентств на токены скоро будут аудировать так же тщательно, как сегодня аудируют закупку медийной рекламы».

Перевожу на язык управленца: тот, кто кладёт токены отдельной видимой строкой, защищён. Тот, кто прячет их внутри ретейнера, незаметно для себя дарит клиенту свою маржу.

Взгляд инвестора: токен-экономика решает судьбу продукта

Когда мы в YellowRocks смотрим на AI-стартап, токен-экономика – один из первых вопросов. Красивая демка ничего не говорит про юнит-экономику, пока не посчитан полный объём. Продукт, который на масштабе сжигает в токенах больше, чем берёт с клиента, дотирует рынок за чужой счёт и бизнесом становится только на бумаге.

Это та же логика, по которой принимаются управленческие решения вообще. У меня есть Пиксель-квест – детское развлекательное пространство, которое я развиваю с партнёром. Когда мы там меняли маркетолога на более дорогого, арифметика на бумаге пугала. Но решение принималось не по принципу «можем себе позволить», а по принципу «иначе никак»: без этой статьи расходов бизнес стоял на месте. Токенный бюджет – из той же породы. Это статья, которую закладывают осознанно, заранее зная цену, и держат на виду.

Где токенный бюджет переоценён

Чтобы не уйти в панику, честная вторая сторона. Для небольших объёмов токен-экономика вообще не ограничение: пара сотен макетов в месяц стоит дешевле одного обеда с клиентом. Старые модели дешевеют так быстро, что часть рутинных задач к концу года станет почти бесплатной. А управляемых рычагов хватает: гонять простые задачи дешёвой моделью, а дорогую звать только на сложное, кэшировать повторяющиеся запросы. На том же принципе роутинга, кстати, и построен бизнес Factory с её оценкой в 1,5 млрд.

Так что паниковать рано. Но и закрывать глаза на новую строку сметы – значит однажды получить счёт, которого не было в плане.

Что с этим делать

Токенный бюджет стоит завести как отдельную, видимую и проверяемую статью – на уровне проекта и на уровне агентства. Считать не цену за токен, а себестоимость за результат: сколько стоит один сгенерированный макет, одно письмо, один диалог бота на реальном объёме, а не на демо. И договариваться с клиентом на входе, кто несёт эту волатильность, пока за вас это не решил его финансовый директор.

Если разбираете экономику AI в маркетинге не первый месяц – подписывайтесь на мой блог, здесь пишу про инвестиции, основательский опыт и то, как новые технологии бьют по конкретным строкам бюджета.