Как AI-платформы выбирает источники: анализ 150000 цитирований в ответах ИИ

2026-01-27 15:27:46 Время чтения 7 мин 398

Вопрос «почему ИИ ссылается именно на эти сайты» перестал быть теоретическим. Нейросети уже формируют отдельный слой информационного трафика, и он живет по своим правилам, отличным от классического SEO и медиа-рейтингов.

В рамках исследования мы, команда Metricore, проанализировали 150 000 цитирований ссылок в ответах ИИ (ChatGPT, YandexGPT, Google AI Overviews, Perplexity и др.).Далее мы:

  1. выделили топ ссылок по количеству цитирований,
  2. собрали пул наиболее часто используемых URL,
  3. проанализировали, что это за сайты, какой там контент, в каком формате он подается и почему именно он используется ИИ.

Результат - довольно четкая и повторяемая картина, которую можно и нужно использовать в маркетинге, PR и контент-стратегиях.

Какие паттерны контента ИИ выбирает чаще всего

Важно сразу зафиксировать:ИИ выбирает не «лучшие сайты», а самые удобные для генерации ответа страницы. Это принципиально другой критерий.

Формат «Рейтинг / ТОП / Сравнение» - абсолютный лидер

Среди самых цитируемых ссылок доминируют:

  1. рейтинги,
  2. подборки,
  3. списки лучших решений,
  4. сравнительные обзоры.

Это касается любых тематик: логистика, финансы, IT, e-commerce, образование, медицина, лайфстайл.

Причины очевидны:

  1. структурированные списки легко парсятся,
  2. каждый пункт уже является готовой смысловой единицей,
  3. ИИ может агрегировать несколько источников без искажения смысла.

Формат рейтинга фактически выступает для ИИ как полу-справочник.

Вывод: если бренд или рынок не представлен в формате сравнений, для ИИ его почти не существует.

Структура важнее глубины текста

При анализе самых цитируемых страниц хорошо видно, что:

  1. сложность темы не играет решающей роли,
  2. решающую роль играет упаковка информации.

Типовые признаки:

  1. четкая иерархия H1-H3,
  2. однотипные блоки (описание, преимущества, функции, стоимость),
  3. таблицы, списки, короткие абзацы.

Даже технические и индустриальные темы выигрывают не за счет аналитической глубины, а за счет логической разметки контента.

По сути, ИИ воспринимает такие страницы как удобные базы знаний.

Практическая польза (How-to) стабильно попадает в ответы

Вторая крупная группа цитируемых ссылок - это:

  1. инструкции,
  2. пошаговые гайды,
  3. калькуляторы,
  4. утилитарные справочные страницы.

Общий признак - они закрывают конкретный вопрос пользователя без дополнительного контекста.

ИИ активно использует такие страницы, потому что они:

  1. минимизируют вероятность ошибки,
  2. дают однозначный ответ,
  3. не требуют интерпретации.

Даже если это массовый или лайфстайл-контент, его прикладная ценность делает его приоритетным источником.

Экспертность важна, но в прикладном виде

Анализ показывает, что ИИ чаще цитирует:

  1. статьи с явным авторством,
  2. материалы, где обозначен опыт или компетенция автора,
  3. тексты без агрессивной рекламной подачи.

При этом личные блоги экспертов нередко цитируются чаще, чем корпоративные сайты, если:

  1. структура сопоставима,
  2. контент решает задачу пользователя.

Вывод: ИИ ценит объясняющую экспертность, а не бренд как таковой.

FAQ - формат, идеально подходящий для ИИ

FAQ-блоки регулярно появляются среди самых цитируемых фрагментов.

Причина проста:

  1. это уже готовая модель «вопрос - ответ»,
  2. минимальный риск смысловых искажений,
  3. высокая универсальность.

Фактически хорошо проработанный FAQ - это уже частично обучающий датасет для языковой модели.

Актуальность по году как машинный сигнал

Многие из часто цитируемых страниц содержат в заголовках указание на 2025-2026 годы.

Важно понимать:это не всегда реальная актуализация, но формальный сигнал свежести, который ИИ учитывает при выборе источника.

Социальные доказательства усиливают доверие

Отзывы, кейсы, упоминания реальных компаний, продуктов и цифр:

  1. повышают вероятность цитирования,
  2. снижают риск «галлюцинаций» для модели.

ИИ явно предпочитает контент, который выглядит проверяемым и прикладным.

Какие типы сайтов доминируют в AI-ответах

На основе анализа топ-цитируемых ссылок распределение выглядит следующим образом:

  1. 63% - корпоративные сайты и блоги компаний Основной источник знаний для ИИ, особенно в B2B и нишевых тематиках.
  2. 17% - UGC-платформы (vc.ru, Habr, DTF, Zen и др.)Используются как площадки для экспертных и обзорных материалов, а не обсуждений.
  3. 11% - отраслевые порталы и агрегаторы Работают как справочники и точки валидации информации.
  4. 5% - Э и лайфстайл-медиа Преимущественно в бытовых и массовых запросах.
  5. 4% - энциклопедии и базы знаний Wikipedia остается источником базовых определений, но не доминирует.

Ключевой вывод

ИИ не ориентируется на статус СМИ. Он предпочитает понятный, структурированный и объясняющий контент, независимо от типа площадки.

Практические выводы для брендов и агентств

Если обобщить результаты исследования, «видимость в ИИ» формируется за счет архитектуры контента, а не отдельных оптимизационных приемов.

Ключевые выводы:

  1. Форматы рейтингов и сравнений должны быть частью контент-стратегии, даже для вендоров и сервисов.
  2. Один хорошо структурированный экспертный материал ценнее десятков новостей.
  3. UGC-платформы работают как слой распределения знаний и усиливают корпоративный контент.
  4. FAQ и How-to - самый быстрый и дешевый способ начать появляться в ответах ИИ.
  5. Видимость в ИИ формирует новый канал PR, который работает параллельно SEO и классическому медиа.

Итог

Ответы нейросетей становятся отдельным информационным интерфейсом между пользователем и рынком.ИИ выбирает не самых известных, а самых удобных для объяснения.

Те компании и агентства, которые начнут системно работать с этим сейчас, получат устойчивое преимущество уже в ближайшие 1-2 года - так же, как когда-то это произошло с SEO.

Скачать полный ТОП ссылок по числу цитирований можно в тг канале Metricore.