«Яндекс» заявил о существенном росте эффективности обучения больших языковых моделей, что позволило добиться годовой экономии в 4,8 млрд руб. Об этом сообщает «Коммерсантъ» со ссылкой на пресс-службу компании.
Ключевым технологическим решением стала разработка собственной библиотеки YCCL, вдвое ускорившей обмен данными между графическими процессорами. Она позволила сократить объем передаваемой информации и перенести управление вычислениями на центральные процессоры.
Дополнительный прирост производительности обеспечил переход на формат вычислений FP8, который дал ускорение примерно на 30%. Коммуникации между процессорами сократились вдвое, а увеличение объема передаваемых данных (батча) до 16−32 млн токенов не замедляет обучение, позволяя использовать ресурсы графических процессоров с минимальным простоем.
В компании отметили, что совокупность мер — от оптимизации кода и архитектуры до повышения стабильности инфраструктуры — позволила существенно снизить издержки без ухудшения качества моделей.
Ранее «Яндекс» отчитался о финансовых результатах за четвертый квартал и весь 2025 год. Годовая рекламная выручка компании приблизилась к 450 млрд руб. «Яндекс» тестирует «разные модели монетизации» искусственного интеллекта в чате с «Алисой AI» в приложении, веб-версии и «Поиске». В 2025 году выручка от экспериментальных форматов превысила 2 млрд руб.
