Всем привет! На связи платформа для предиктивного AI маркетинга Sales Ninja.
Каждый рубль, потраченный на рекламу в РСЯ, имеет шанс уйти не к живому человеку, а к боту — и вы об этом, скорее всего, не узнаете из стандартных отчётов. Фрод в контекстной рекламе давно перестал быть примитивным. Современные боты имитируют реальное поведение, проходят стандартные фильтры и незаметно деградируют качество обучения автостратегий. Потери — не только в бюджете, но и в качестве данных, на которых учится алгоритм. В этой статье разбираем природу проблемы и три уровня защиты — от базовой эвристики до кастомной ML-модели, которая понимает специфику именно вашего трафика.
Бот-трафик в контекстной рекламе — это автоматизированные визиты, которые имитируют поведение реальных пользователей. Цель одна — вызвать клик по рекламному объявлению и тем самым израсходовать бюджет рекламодателя или исказить статистику. Есть три основных источника.
Площадки РСЯ с низким качеством трафика. РСЯ объединяет тысячи сайтов-партнёров, которые получают выплаты от Яндекса за показы и клики на своих страницах. У части этих площадок есть прямой экономический стимул накручивать трафик. Больше кликов — больше выплат. Для этого они используют ботов, которые имитируют визиты реальных пользователей: заходят на страницу, проводят время, кликают по рекламе. Яндекс фильтрует часть такого трафика, но не весь — площадок слишком много, а боты постоянно совершенствуются. Для рекламодателя это означает, что часть бюджета систематически уходит на сайты, аудитория которых не существует.
Конкурентное скликивание. Целенаправленная атака на конкретного рекламодателя. Конкуренты или нанятые ими сервисы намеренно кликают по вашим объявлениям, чтобы израсходовать ваш дневной бюджет раньше времени и тем самым убрать вас из аукциона в самые горячие часы суток. Когда ваш бюджет исчерпан, их объявления занимают освободившиеся позиции. Особенно распространено в нишах с высокой стоимостью клика — недвижимость, финансы, юридические услуги, медицина — где один «выбитый» день может стоить десятки тысяч рублей недополученного трафика.
Общий фоновый фрод. Наименее целенаправленный, но самый распространённый вид. Автоматизированные системы — сканеры, краулеры, парсеры — обходят интернет по своим задачам и кликают по рекламным объявлениям как побочный эффект своей работы. Никто специально не нацеливался на ваш бизнес. Вы просто оказались на пути алгоритма, которому всё равно, на чьи объявления кликать. Такой трафик особенно сложно обнаружить — у него нет очевидной мотивации, нет характерного паттерна и нет конкретного источника. Он размыт по десяткам площадок и тысячам визитов.
Первое поколение ботов было примитивным. Заходили на страницу, сразу уходили, оставляли очевидный след в виде нулевого времени на сайте и стопроцентного показателя отказов. Такой трафик легко фильтровался даже базовыми инструментами.
Современные боты работают иначе. Они имитируют реальное поведение пользователя — проводят на сайте несколько минут, скроллят страницу, переходят по ссылкам, иногда даже заполняют формы. Они используют реальные браузеры и реальные IP-адреса, взятые из пулов заражённых устройств обычных пользователей. Их поведенческий профиль практически неотличим от человеческого на уровне стандартной аналитики.
Именно поэтому смотреть на показатель отказов и время на сайте недостаточно. Хорошо обученный бот пройдёт эти фильтры без проблем.
Прямые потери бюджета. Самое очевидное последствие. Каждый ботовый клик — это деньги, списанные со счёта без какой-либо отдачи. В нишах с высокой стоимостью клика — недвижимость, финансы, B2B-услуги — один фиктивный переход может стоить несколько тысяч рублей. При доле фрода в 20–30% каждый третий-четвёртый рубль уходит в никуда. На масштабе месячного бюджета это уже не погрешность. Это дыра.
Искажение обучающей выборки. Это скрытее и опаснее. Современные боты не просто кликают и уходят — они проводят время на сайте, скроллят, иногда заполняют формы. Для Яндекс.Метрики такой визит неотличим от реального. Если бот дошёл до формы, он становится «конверсией». Дальше включается базовая логика машинного обучения: алгоритм начинает искать пользователей, похожих на тех, кто уже сконвертировался. А среди «сконвертировавшихся» — боты. Портрет аудитории незаметно смещается. Качество трафика деградирует. CPL растёт.
Искажение аналитики. Бот-трафик отравляет данные, на которых принимаются стратегические решения. Площадка, которая генерирует много «визитов», выглядит эффективной — хотя за этими цифрами стоят боты. Канал с низким CPL может оказаться каналом с высокой долей фрода, просто потому что боты конвертируются охотнее людей. В результате бюджет уходит туда, где красиво выглядят цифры, а не туда, где есть покупатели.
Яндекс фильтрует фрод на своей стороне. Часть очевидного скликивания система действительно отсекает и возвращает деньги на счёт рекламодателя. Но «часть» — ключевое слово. И это не изменится, потому что у системной защиты есть два структурных ограничения.
Конфликт интересов. РСЯ держится на партнёрских сайтах. Чем больше площадок в сети, тем шире охват и тем привлекательнее продукт для рекламодателей. Слишком агрессивная фильтрация означает, что площадки теряют выплаты и уходят из сети. Яндекс балансирует между интересами рекламодателей и интересами площадок, и этот баланс по определению не может быть настроен исключительно в пользу первых.
Отсутствие контекста вашего бизнеса. Яндекс видит трафик на уровне платформы и понимает, что такое аномалия в среднем по всем сайтам. Но он не знает, что нормально именно для вашей аудитории. Пользователь, который провёл на сайте 25 минут — это подозрительно или нет? Зависит от того, что это за сайт. Яндекс этого различия не делает, и там, где ваша аудитория ведёт себя нестандартно, фильтрация либо пропускает ботов, либо блокирует живых людей.
На рынке существует три инструмента защиты от фрода, и они отличаются друг от друга по точности, скорости и глубине анализа. Эвристика, общая ML-модель и кастомная ML-модель от Sales Ninja. Каждый следующий уровень закрывает то, что не видит предыдущий.
Инструмент первый — Эвристика
Самый доступный уровень защиты. Эвристика — это набор фиксированных правил, основанных на известных признаках ботового трафика. Аномальное время на сайте, подозрительные IP-адреса, нетипичные User-Agent строки, трафик из заведомо некачественных источников. Главное преимущество — стоимость. На этом её преимущества заканчиваются.
Эвристика статична. Её правила написаны один раз и не меняются, а современные боты давно изучили этот набор и научились его обходить. Бот, который ведёт себя в рамках «нормального» времени на сайте, использует чистый IP и реальный User-Agent, пройдёт любую эвристику без проблем.
Но есть и обратная сторона. Работая по жёстким правилам, эвристика регулярно режет живых пользователей. Человек, который зашёл на сайт с корпоративного прокси — заблокирован. Пользователь, который просматривал страницы слишком быстро — заблокирован. Посетитель из региона с нетипичным провайдером — заблокирован. Инструмент, который должен защищать бюджет, начинает отсекать покупателей и искажает выборку в другую сторону.
Инструмент второй — общая ML-модель
Другой принцип — не правила, а обучение. ML-модель находит паттерны, которые человек не способен сформулировать в виде правил. Не «если IP подозрительный — блокировать», а «этот визит похож на 94% ботовых визитов, которые мы видели раньше — вероятность фрода высокая».
Модель анализирует сотни поведенческих признаков одновременно — последовательность действий на сайте, временные интервалы между событиями, паттерны движения мыши, характеристики устройства, сетевые признаки. Ни один из этих признаков по отдельности не является сигналом фрода, но их комбинация в конкретной последовательности характерна. Именно это и улавливает модель — то, что невозможно описать правилом, но возможно распознать статистически.
Главное преимущество перед эвристикой — адаптивность. Когда появляются новые паттерны фрода, модель переобучается и продолжает их ловить. Она не застывает на том, что знала в момент запуска, и значительно реже режет живых пользователей, потому что принимает решение не по одному признаку, а по совокупности сотен.
Ограничение одно, но существенное — модель общая. Она обучена на данных тысяч сайтов и понимает, что такое бот в среднем по рынку. Пользователь, который провёл на сайте 20 минут — это норма для сложного B2B-продукта и аномалия для интернет-магазина. Общая модель этого контекста не знает, и там, где ваша аудитория отклоняется от среднего, её точность падает.
Инструмент третий — Адаптивный антибот Sales Ninja
Это другой класс решения. Для каждого сайта обучается уникальная ML-модель — не универсальное решение, адаптированное под ваш случай, а модель, которая с нуля учится понимать, как ведут себя реальные клиенты на вашем сайте и чем их поведение отличается от ботового.
Обучение происходит в два этапа. С первого дня работает базовая защита — эвристика плюс общая ML, которая ловит очевидный фрод, пока кастомная модель накапливает данные. Примерно через неделю включается полноценная кастомная защита, и с этого момента каждый визит оценивается в контексте именно вашего сайта.
Каждый визит получает фрод-оценку до того, как попадёт в статистику. Если оценка превышает порог, визит помечается в Яндекс.Метрике как фродовый и исключается из обучающей выборки. Алгоритм Директа перестаёт учиться на ботах. Качество оптимизации восстанавливается постепенно, по мере того как данные очищаются.
Кастомная модель Sales Ninja умеет не только выявлять ботов — она умеет не задевать тех, кто действительно важен. В редакторе антибота можно добавить минус-цели, например «Покупка» в ecom или «Заказ оплачен» из CRM. Пользователь, который совершил целевое действие, никогда не получит высокую фрод-оценку, независимо от того, как выглядело его поведение на сайте. Это страховка от ложных срабатываний в самый важный момент — когда человек готов купить, система точно не заблокирует его как бота.
Дополнительно работает функция подавления площадок с низкой покупательной способностью. Не все источники трафика одинаково ценны — некоторые площадки стабильно генерируют клики, но никогда не приводят реальных покупателей, вне зависимости от формально нормального поведения их аудитории. Sales Ninja отслеживает конверсионность каждой площадки в разрезе реальных покупок и автоматически снижает приоритет источников, которые приводят клики, но не приводят клиентов.