Почему нейросети начинают игнорировать 90% сайтов. Эффект Model Collapse и что с этим делать

2026-06-08 11:37:11 Время чтения 10 мин 107

В 2026 году нельзя ограничиваться только классическим SEO и отслеживанием позиций сайта. Все больше пользовательских запросов в Яндексе и Google закрывают ответы их ИИ-моделей прямо в выдаче. Формальная уникальность текста и плотность ключевых слов отошли на второй план. Поисковые системы теперь оценивают то, добавляет ли страница новые факты и смыслы к уже известной информации.

Если у вас не выстроена стратегия попадания в генеративные сводки поисковиков и ИИ-ассистентов, вы фактически платите за позиции, до которых пользователь не дойдет. Бюджет на продвижение сайта нужно перераспределять, направлять часть денег с классического SEO на GEO-продвижение (Generative Engine Optimization). Однако многие по-прежнему мыслят старыми категориями, пытаясь скормить нейросети синтетический контент. А это серьезная ошибка.

Что такое Model Collapse и почему это угроза для бизнеса

В июле 2024 года исследовательская группа из Оксфорда, Кембриджа и ряда других университетов под руководством Ильи Шумаилова опубликовала в журнале Nature работу, которая изменила понимание того, как развивается искусственный интеллект и машинное обучение. Ученые доказали: если нейросети повторно обучать на контенте, который ими же и сгенерирован, они постепенно деградируют. Этот процесс потери качества данных и накопления искажений получил название Model Collapse.

Сейчас значительная часть контента в сети — это генеративный рерайт или вторичная переработка уже существующих текстов. Свежие публикации создаются с одной целью — попасть в ИИ-ответы. Модели обучаются на материалах с низкой практической пользой, бесконечно пересказывая уже сказанное, и эффект деградации накапливается с каждым циклом.

Для поисковых систем это структурная угроза. Алгоритмы ранжирования начали пессимизировать сайты без добавленной информационной ценности. Корпоративный блог или сайт, выпускающий типовые SEO-статьи без первичной аналитики, будет терять видимость в ответах ИИ,  даже если позиции в органическом трафике высокие.

  Читайте также: Алгоритмы не думают, а обрабатывают сигналы. Почему SEO остается фундаментом в эпоху нейровыдачи

По какому принципу алгоритм выбирает источники

За последний год Google усилил вес Information Gain (добавленной ценности контента). Это подтверждают патенты и исследования по AI Overviews. Поисковый бот оценивает содержащиеся в контенте факты, данные, инсайты и сравнивает их с тем, что есть уже на других веб-ресурсах.

Если это те же самые тезисы, переписанные другими словами, страница не будет поднята в видимую зону выдачи. Но если вставлен хотя бы один блок с эксклюзивной информацией (собственные замеры, нестандартная разбивка данных, конкретный эксперимент),  то шансы быть выбранной резко повышаются.

Чтобы собрать более полный и непротиворечивый ответ через механизм query fan-out, алгоритм  разбивает один запрос на множество подзапросов.  Причем, чаще всего он обращается к сайтам не из первой десятки.

Яндекс работает по схожей логике. Но есть одно принципиальное отличие. Его нейросеть Алиса (бывший сервис Нейро, переименованный в мае 2025 года) не берет факты из памяти модели. Каждый раз она заново извлекает их из пяти отобранных документов.

Алгоритм отбора трехступенчатый. Сначала обычный поиск формирует список релевантных страниц. Затем BERT-модель оценивает информативность каждого фрагмента на уровне токенов. И только потом reward-модель выбирает пять документов, которые статистически дают наилучшие ответы.

Если сайта нет в ТОП-5 органической выдачи, но текст структурирован так, что алгоритм может извлечь из него четкий смысловой блок, то он с высокой долей вероятности попадет в нейроответ Яндекса.

По данным Kokoc Group, с начала 2025 года информационные сайты потеряли около 30% органического трафика из-за нейропоиска. В информационных запросах доля нейроответов в Яндексе достигла 68%, в Google — 33,5%. 

Логика отбора у ChatGPT, Perplexity и других ИИ-ассистентов кардинально иная. Они не привязаны к индексу одного поисковика и формируют ответ на основе обучающих данных плюс веб-поиска в реальном времени.

Perplexity, например, использует механизм RAG (Retrieval-Augmented Generation). Модель сначала находит релевантные страницы через поиск, а затем синтезирует ответ, цитируя источники. Попасть в такой ответ сложнее, чем в Яндекс Нейро. Потому что здесь нет фиксированного числа источников и прозрачного принципа отбора. 

Исследование Princeton / IIT Delhi (2025) показало, что сайты с высоким E-E-A-T получают в 3-5 раз больше цитирований в AI-ответах, а неявный трафик с таких упоминаний растет на 115% даже у доменов, не занимающих высоких позиций в классической выдаче.

Исследования фиксируют устойчивый тренд к росту zero-click запросов, когда пользователь получает ответ прямо в поисковике и не переходит на сайты. По разным оценкам, доля таких запросов составляет от 58% до 83% в зависимости от ниши. 

За что берут 300 тысяч в месяц, и почему никто не может проверить результат

GEO-продвижение предполагает усиление присутствия бренда в ответах генеративных нейросетей. Стоит такая услуга 80-300+ тыс. рублей в месяц. Результат технически невозможно проверить, потому что логика скрыта и нельзя измерить влияние определенных действий на конкретный итог. 

Для малого и среднего бизнеса это явный тупик. Для крупного неожиданно удобная ситуация. Он платит за GEO, зная, что большинство более мелких конкурентов не потянут такой бюджет. Ему важно занять места в нейровыдаче раньше остальных. 

Главный аргумент в пользу GEO — высокая конверсия пользователей, которые пришли из нейросетевых ответов. Это понятно. Если человек уже получил краткий ответ на свой запрос, но все равно кликает по ссылке,  значит, он сильно мотивирован. 

Проблема в том, что посчитать конверсию можно только в группе тех, кто перешел на сайт. По разным оценкам, доля таких переходов из ИИ-ответов составляет доли процента от всего поискового трафика. Остальные остаются внутри интерфейса Яндекс Нейро, ChatGPT, Perplexity. Их нет в Метрике.

Высокая конверсия из ИИ-трафика описывает поведение наиболее мотивированного меньшинства, а не всего потока пользователей. Делать на этой выборке выводы об эффективности канала методологически некорректно.

  Читайте также: Агентства продают первое место в нейросети. Технически это невозможно

Как перестроить работу с контентом

Поднять уникальность текста недостаточно. Алгоритм выделяет материалы, которые добавляют новые факты и интерпретации без перефразирования. Достоверную базу для ИИ дают кейсы с прозрачной методологией, реальной выборкой и открытыми источниками.

Работая с клиентскими проектами, мы отмечаем устойчивый рост упоминаний в нейросетях у тех сайтов, которые оптимизированы по этим рекомендациям;

1️⃣ Публикуйте собственные данные. Кейс без описания методологии — это реклама. Исследование с прозрачной фактурой — актив, на который алгоритм опирается. Нейросеть будет обучаться только на пересказах чужих материалов, и ваш сайт станет одним из опорных источников модели.

2️⃣ Давайте прямые ответы. AEO и GEO нужны короткие смысловые блоки по 40–60 слов. Начинайте каждый раздел с четкого ответа на вопрос пользователя. Длинная подводка к нему отторгает. 

3️⃣ Структурируйте данные. Таблицы, блоки FAQ, метрики ROI, сравнения характеристик, пошаговые схемы — то, что алгоритм парсит напрямую.

4️⃣ Подтверждайте экспертность автора. Стоковые фотографии снижают сигналы E-E-A-T . Кастомные графики и инфографика с конкретными данными работают в обратную сторону.

Перераспределяйте  бюджет с быстрых тактик на долгосрочную аналитику. Экспертный контент с реальным Information Gain становится опорным источником для нейросетей. 

Материал подготовлен агентством PRAGMATIX DIGITAL на основе исследований Nature (2024), данных SparkToro, анализа AI Overviews и собственных наблюдений по digital-маркетингу.

Источники

[1] Pagadala, Venkata. "The Disruption of Search Engine Optimization by Large Language Models." SSRN (2026). URL:

[2] Thacker, Drew. "The Zero-Click Paradigm." SSRN (2025 ). URL: