Ученые нашли способ сделать искусственный интеллект ближе к человеческому мышлению

2025-11-12 22:10:28 Время чтения 3 мин 161

Американские исследователи нашли способ сделать искусственный интеллект более эффективным и ближе к человеческому мышлению.

Нейросети превосходят людей в скорости обработки данных, но часто терпят неудачу в задачах, где требуется здравый смысл и интуиция. Исследователи из Института Стивенса (США) проверили, как языковые модели справляются с классическим тестом на «теорию сознания» — когнитивную способность понимать, что другие люди обладают собственными мыслями и знаниями.

В эксперименте участникам показывали короткий сюжет: человек кладет шоколадку в коробку и выходит из комнаты, после чего другой перекладывает ее в ящик стола. Мы сразу понимаем, что, вернувшись, первый человек будет искать шоколадку в коробке — ведь он не видел, как ее переложили. Для людей это мгновенная интуитивная реакция, но для искусственного интеллекта — сложная задача.

Оказалось, что с большими языковыми моделями ИИ ситуация иная. Они обучаются на основе шаблонов и огромных объемов данных, а также работают с использованием математических функций. Как показало исследование профессоров Дэнхуэй Чжан и Чжаочжуо Сюй, подход нейросетей и человеческого мозга в решении таких простейших задач кардинально отличается. Ключевое преимущество ИИ — скорость обработки гигантских массивов данных — в решении таких простейших задач оборачивается недостатком в эффективности. 

Мозг человека решает такие задачи энергоэффективно, задействуя небольшой специализированный набор нейронов, малую часть. Языковые модели задействуют практически все возможности, пытаясь понять простые вещи. ИИ проводит масштабные вычисления, большая часть которых избыточна для конкретного запроса. Это требует колоссальных вычислительных ресурсов и энергии.

Однако исследователи обнаружили одну обнадеживающую закономерность. Оказывается, для решения таких задач — таких как та самая «задача с шоколадкой» — нейросеть использует специализированный набор внутренних связей. Способность модели к подобным рассуждениям тесно связана с тем, как она кодирует позиции слов в тексте (метод RoPE). 

Это открытие прокладывает путь к повышению эффективности ИИ. При масштабировании ИИ важно создать модели, которые, подобно человеческому мозгу, активируют только те параметры, что отвечают за конкретную задачу. Это не только снизит затраты, но и приблизит нас к созданию более адаптивного и «здравомыслящего» искусственного интеллекта.

По материалам gen.new