искусственный интеллект бенчмарки оценка ИИ AI-инструменты дью-дилидженс маркетинговые технологии запуск ИИ DeepSWE

0 материалов
Роман Белодед
2026-05-29 20:06:57
Бенчмаркам ИИ нельзя верить: как выбирать инструмент на своих задачах
26 мая стартап Datacurve выпустил бенчмарк DeepSWE и показал неприятное: популярный лидерборд ИИ-кодинга ошибался в оценке примерно в трети случаев, а одна из ведущих моделей местами подсматривала готовый ответ. Для бизнеса это прежде всего вопрос о том, на какие цифры вы опираетесь, когда покупаете ИИ. подробнее
106