Нейросеть называет несуществующий закон, придумывает цитату и ссылается на статью, которой нет. Разбираем, откуда это берётся и можно ли с этим что-то сделать
Слово «галлюцинация» применительно к AI вошло в обиход быстро, но обозначает не совсем то, что в обычном языке. Когда нейросеть «галлюцинирует», она не видит несуществующие образы. Она генерирует уверенное и грамматически правильное утверждение, которое оказывается фактически неверным. Разница принципиальная: человек в галлюцинации осознаёт нечто несуществующее, языковая модель просто выдаёт следующий статистически вероятный текст, не имея механизма отличить правду от правдоподобия.
Для маркетолога это важно по практической причине, нейросети уже являются каналом, через который потребители получают информацию о брендах. И если нейросеть «галлюцинирует» про конкретную компанию, продукт или событие, это влияет на реальные решения реальных людей.
Чтобы понять, откуда берутся галлюцинации, нужно сначала понять, что происходит с запросом с момента отправки до появления ответа. Большинство современных AI-ассистентов (ChatGPT с веб-поиском, Алиса, Perplexity) работают не напрямую «запрос - ответ», а через многоступенчатый конвейер.
Шаг первый. Декомпозиция запроса.
Пользователь пишет «как улучшить видимость бренда в нейросетях». Модель не ищет эту фразу буквально. Она анализирует интент и генерирует несколько целевых подзапросов, каждый из которых покрывает отдельный аспект темы, что такое GEO, какие инструменты существуют, кейсы брендов, последние новости. Это и называется query fan-out (разветвление запроса)
Google в своём официальном руководстве по GEO описывает это так: query fan-out, набор параллельных связанных запросов, которые модель генерирует, чтобы получить дополнительную информацию и дать более полный ответ. Пользователь задаёт один вопрос, а нейросеть за кадром обрабатывает несколько. Microsoft в документации Azure AI поясняет: «LLM анализирует вопрос и генерирует несколько целевых подзапросов, разбивая сложные вопросы на более конкретные, с параллельным выполнением по источникам знаний».
Практическое следствие для маркетинга: попасть в ответ нейросети по широкому запросу сложнее, чем кажется. Нейросеть не ищет вашу страницу, она ищет ответы на несколько вопросов сразу, и ваш контент должен покрывать каждый из них.
Шаг второй. Поиск и извлечение контекста (RAG).
Большинство современных нейросетей с веб-доступом используют архитектуру RAG (retrieval-augmented generation, генерация с расширением через поиск). Перед тем как сформировать ответ, модель запрашивает поисковый индекс, получает фрагменты релевантных страниц и включает их в контекст генерации. Проще говоря: нейросеть читает несколько источников и строит ответ на основе прочитанного.
Именно здесь кроется одна из причин нестабильности AI-ответов. Если с момента вашего последнего контента прошло время и конкурент опубликовал новый материал, он может попасть в выдачу и изменить контекст ответа, без каких-либо изменений на вашем сайте.
Шаг третий. Генерация ответа.
Получив контекст из поиска и обработав подзапросы, модель генерирует ответ. И вот здесь происходит то, что многих удивляет: нейросеть не «знает» ответ в том смысле, в каком человек знает, что Земля круглая. Она статистически предсказывает, какой следующий токен (фрагмент текста) является наиболее вероятным продолжением. Это не поиск в базе данных и не логический вывод. Это генерация по вероятностным весам, накопленным во время обучения.
Именно из этого механизма и вырастают галлюцинации.
В сентябре 2025 года OpenAI опубликовал исследовательскую статью «Why Language Models Hallucinate» (авторы Адам Калаи, Офир Нахум, Сантош Вемпала, Эдвин Чжан). Главный вывод: галлюцинации не случайная ошибка и не технический баг. Они возникают из фундаментального устройства того, как модели обучаются и оцениваются.
Логика такая. Во время обучения модель поощряется за правильные ответы и штрафуется за неправильные. Но текущие системы оценки вознаграждают угадывание точно так же, как правильный ответ, если результат совпадает. В итоге модель обучается угадывать, когда не знает, а не говорить «я не знаю». Это ведёт к тому, что при неопределённости она производит уверенно звучащие, грамматически корректные, но фактически неверные утверждения.
Исследователи OpenAI сравнили это со студентом на экзамене: когда не знаешь ответа, лучше написать что-то, чем оставить пустое место. Модели ведут себя так же, потому что их именно так поощряли.
Дополнительные причины галлюцинаций, на которые указывают разные источники:
1. Пробелы в обучающих данных. Если модель обучалась на данных с ошибками, устаревшей информацией или малым количеством материала по конкретной теме, она с большей вероятностью будет галлюцинировать именно в этой области. Stanford HAI (2023) зафиксировал 15-20% галлюцинаций на фактических запросах для моделей без внешнего контекста.
2. Актуальность данных. У любой модели есть дата отсечки обучения (knowledge cutoff). Всё, что произошло после неё, модель не знает из своих весов. Если она не может обратиться к актуальным источникам через RAG, она будет заполнять пробелы правдоподобными, но устаревшими или выдуманными фактами.
3. Давление на уверенность. Языковые модели обучены отвечать уверенно. Фразы типа «я не уверен» и «не могу точно сказать» в обучающих данных встречаются редко. Поэтому модель, сталкиваясь с неопределённостью, продолжает генерировать уверенный текст вместо того, чтобы остановиться.
4. Системный стимул к угадыванию. Lakera в анализе 2026 года формулирует это так: «Обучающие цели и бенчмарки вознаграждают уверенное угадывание, а не откалиброванную неопределённость». Это системная проблема, а не проблема конкретной модели.
Цифры зависят от задачи, модели и наличия дополнительного контекста. Несколько верифицированных данных из открытых источников:
По данным Stanford HAI (2023), без внешнего контекста (RAG) LLM галлюцинируют в 15-20% фактических запросов. Исследование sqmagazine.co.uk (апрель 2026), обобщившее данные по 37 моделям, зафиксировало частоту галлюцинаций от 15% до 52% в зависимости от модели и задачи. IBM (2024) установил, что 72% сбоев AI в корпоративных внедрениях связаны не с ограничениями модели, а с недостаточным контекстом данных, то есть проблема не в «плохом AI», а в плохо настроенном окружении.
При этом RAG существенно снижает частоту галлюцинаций: по данным Algorcomp (2026), правильно настроенный RAG снижает количество галлюцинаций с ~15% (голый GPT-4o) до 3-7%. Сочетание RAG, верификационных агентов и выходных ограничений даёт снижение на 40-60%.
Это советы для тех, кто пользуется нейросетями каждый день.
Просите источники. Самый простой приём: после любого фактического утверждения спросите «откуда эта информация?» или «приведи источник». Нейросеть с веб-доступом (Perplexity, Поиск с Алисой, ChatGPT с поиском) покажет ссылки. Если источников нет или они выглядят сомнительно, это сигнал перепроверить.
Перепроверяйте важное в обычном поиске. Нейросеть удобна как первый шаг, но для принятия решений (медицина, юриспруденция, финансы, важные факты о компаниях) стоит проверить информацию в поиске Яндекса или Google. Несколько минут могут сэкономить репутацию или деньги.
Используйте нейросети с включённым веб-поиском. Perplexity, «Поиск с Алисой», ChatGPT с включённой функцией поиска галлюцинируют заметно реже, чем модели, отвечающие только из своих весов без доступа к актуальному интернету. Если стоит выбор, берите версию с поиском.
Задавайте уточняющие вопросы. Если что-то кажется неточным, не принимайте первый ответ как истину. Спросите: «ты уверен в этом?», «эта информация актуальна на 2026 год?», «есть ли другие точки зрения?». Нейросеть нередко сама поправляет себя при повторном вопросе.
Задайте контекст в начале разговора. Фраза «отвечай только если уверен, при неопределённости говори об этом» реально меняет поведение модели. Это не гарантия, но снижает вероятность уверенных выдумок.
Для критических задач: не один источник. Если вы принимаете важное решение на основе ответа нейросети, спросите то же самое в двух разных нейросетях. Если ответы расходятся, это повод для дополнительной проверки.
Это особый угол, который важен для маркетологов и владельцев бизнеса. Что сделать, чтобы нейросети говорили о вашей компании точно.
Логика здесь прямая. Нейросеть берёт информацию из того, что есть в открытом доступе. Если про ваш бренд написано мало или информация устарела, у модели просто нет хорошего контекста и она заполняет пробелы догадками. Чем больше свежего, точного, структурированного контента о вас существует в авторитетных источниках, тем меньше у нейросети поводов что-то выдумывать.
1. Регулярно обновляйте собственные ресурсы. Сайт, страница «О компании», описания продуктов, раздел FAQ. Если у вас изменились цены, появились новые функции или поменялось позиционирование, обновите это везде. Нейросети индексируют актуальный контент, и свежие данные вытесняют устаревшие.
2. Публикуйте структурированный контент о бренде. Статьи, экспертные разборы, кейсы, интервью на авторитетных площадках. Sostav, vc.ru, Habr, отраслевые издания. Нейросети охотно цитируют такие источники. Причём важен не объём, а конкретика: чёткие факты, цифры, позиции лучше помогают модели сформировать правильный ответ, чем расплывчатые маркетинговые тексты.
3. Отвечайте на типичные вопросы. Если вы знаете, что клиенты часто спрашивают «сколько стоит X», «чем Y отличается от конкурента», «как работает Z», напишите об этом прямо и публично. Нейросеть с большей вероятностью найдёт и процитирует прямой ответ, чем будет его реконструировать из косвенных источников.
4. Следите за тем, что о вас говорят нейросети. Самый надёжный способ узнать, есть ли галлюцинации о вашем бренде в AI-ответах, это регулярно проверять. Можно делать это вручную (задать 15-20 вопросов в ChatGPT, Алисе, GigaChat), а можно автоматизировать через специализированные инструменты. brandfound, например, отслеживает упоминания бренда в девяти нейросетях одновременно и показывает, в каком контексте и с какой тональностью вас упоминают, а также какие источники нейросети используют при ответах о вас. Именно это позволяет выявить галлюцинации и целенаправленно их исправлять через обновление контента.
Всё описанное выше становится проблемой для бренда, когда галлюцинация касается не абстрактного факта, а конкретной компании, продукта или события.
Нейросеть может назвать несуществующую функцию продукта. Может процитировать цену, которая устарела. Может приписать бренду позицию, которую он никогда не занимал. Может перепутать компанию с конкурентом. И всё это она скажет уверенным тоном, без единого намёка на сомнение.
Пользователь, который спрашивает у ChatGPT или Алисы «расскажи про компанию X», получает этот ответ и принимает его как факт. По данным Rithum (март 2026, 1046 респондентов), 58% потребителей теряют доверие к бренду, если нейросеть даёт о нём ошибочную рекомендацию. 16% после этого отказываются от покупки.
Это значит, что галлюцинации нейросетей, это не только техническая проблема для разработчиков, но и репутационный риск для бизнеса. Причём риск, который невозможно увидеть без целенаправленного мониторинга.
Нет, по крайней мере при текущем подходе к обучению моделей. OpenAI в исследовании 2025 года прямо указывает, что пока системы обучения вознаграждают угадывание, галлюцинации будут существовать. Но их можно существенно снизить: с 15% до 3-7% при правильной настройке RAG и grounding. Для высокоставочных задач (медицина, юриспруденция, финансы) применяются дополнительные механизмы верификации.
Потому что у неё нет механизма различать «я знаю» и «я не знаю» в том смысле, в каком это понимает человек. Она генерирует следующий токен по вероятности. Уверенный тон, это не индикатор правды, а стилистическая характеристика обучающих данных: большинство текстов, на которых обучалась модель, написаны уверенно. Академическую неопределённость в виде «возможно» и «по некоторым данным» модели воспроизводят хуже.
RAG снижает галлюцинации там, где есть качественный актуальный контент для извлечения. Если про бренд написано мало или информация устарела, модель заполняет пробелы интерполяцией, что ведёт к ошибкам. Отсюда практический вывод: чем больше структурированного актуального контента про бренд в авторитетных источниках, тем меньше нейросети «придумывают».
В обычном поиске запрос пользователя идёт напрямую в поисковик «как есть». При query fan-out нейросеть сначала анализирует запрос, затем самостоятельно формулирует несколько связанных подзапросов и выполняет их параллельно. Пользователь задаёт один вопрос, а нейросеть за кадром задаёт пять. Именно поэтому оптимизация под AI-поиск отличается от классического SEO: нужно покрывать не одну ключевую фразу, а целый кластер связанных интентов.
Галлюцинации нейросетей, это не баг, который скоро починят. Это фундаментальное следствие того, как устроено статистическое обучение языковых моделей. OpenAI прямо говорит об этом в исследовании 2025 года: пока модели обучаются угадывать, а не признавать неопределённость, галлюцинации будут существовать.
Для разработчиков это задача архитектуры: RAG, grounding, цитирование, мониторинг. Для маркетологов это другая задача: знать, что нейросеть говорит о бренде, и работать с информационной средой так, чтобы у модели было достаточно качественного контекста для корректного ответа. Галлюцинация про бренд, это не проблема нейросети. Это информационный gap, который можно и нужно закрывать.