TechCrunch поднимает очень интересную тему.
Переходим ли мы на ступень, где достаточно просто хороших иишек?
Чекнем предпосылки:
✅ расходы на ИИ становятся бесконтрольными
✅ финансовые директора требуют объяснений, куда уходят деньги
✅ многие компании обнаруживают (не может быть!), что для большинства задач им не нужен самый дорогой ИИ
✅ более дешёвые модели становятся настолько хорошими, что разница в качестве уже не оправдывает многократную разницу в цене
Самые важные цитаты из статьи.
1. Брайан Армстронг, генеральный директор и сооснователь Coinbase.
Спрос на интеллект практически бесконечен, но 80% рабочих нагрузок будут выполняться моделями, которые на 99% дешевле, уже в течение 12–18 месяцев. Оставшиеся 20% задач продолжат использовать модели последнего поколения там, где критически важен максимум интеллектуальных возможностей
Армстронг предполагает, что дорогие модели, безусловно, останутся, но станут нишевым инструментом, а основная масса работы перейдёт на дешёвые модели.
2. Гейб Перейра, сооснователь Harvey (юридическая ИИ-платформа).
Качество всегда стоит на первом месте, особенно в юридической сфере. Однако само понимание качества меняется: вместо того чтобы использовать самую мощную модель для всего подряд, мы всё чаще выбираем модель, которая наиболее эффективно даёт правильный ответ
Качество будет означать правильный ответ при разумных затратах.
И, к слову, Harvey уже проверила свою гипотезу: совместно с Fireworks AI они комбинировали Claude Opus и GLM 5.1.
Наиболее сложные задачи шли в Opus, а для всех остальных случаев использовали более дешёвую модель.
По итогу расходы на инференс снизились в 3 раза, а качество результатов осталось на прежнем уровне.
🧠 Говорит ли это всё о том, что ИИ входит в стадию зрелости, когда от покупки лучшего из возможного мы переходим к вопросу, а можно ли получить похожий/приемлемый результат намного дешевле?
На самом деле, да. Представьте, что для генерации креативов для мобилки вам не нужно качество изображения 4К.
😑 Как вам такой тейк?Для большинства корпоративных задач требуются классификация документов, извлечение данных, написание типового кода и ответы на стандартные вопросы сотрудников.
Почти всегда здесь достаточно небольших моделей. И местами это даже не уровень агентов, а простых ассистентов, чат-ботов.
👽 OpenAI, Anthropic, Google будут решать задачи полёта в космос, а небольшие модели будут возить вас на автобусе каждый день.
Это как с персональными компьютерами: для массового сегмента нужны просто хорошие, дешёвые и удобные.
P. S. Недавно в Forbes у Андрея Себранта вышла хорошая статья Малы, да удалы: почему важны ИИ-модели, которые совсем не на слуху