Тут крайне уважаемый мной Андрей Себрант читал лекцию про всякий ИИ. По его версии, в будущем победившего ИИ нас ждёт:
Мультимодальность — использование и чата, и картинки, и звука, и видео, и 3D-сцен. Подобные разработки уже есть у многих, например GigaChat Сбера.
Embodiment — помещение сложных мультимодальных моделей в «железки», например в человекоподобного робота.
Платформенность — когда генеративный ИИ становится платформой для подключения различных модулей. Например, уже сейчас можно попросить ChatGPT решить математическую задачу с помощью сервиса Wolfram. А BingChat от Microsoft даёт ссылки на источники своих ответов.
Дистилляция — с языковыми моделями можно будет всё лучше работать на локальных слабых устройствах без подключения к интернету и с меньшим углеродным следом.
Демократизация — технологии будут доступнее тем, кто о них особо не задумывается. Например, я в будущем вполне представляю такую картину: человек выходит из бара на Рубинштейна в Петербурге, кричит фонарному столбу слово «домой» и за ним приезжает такси по нужному адресу.
И конечно, будут сюрпризы.Например, уже разработанный Apple Vision Pro сравним с игровым ноутбуком. Я уверен, что с горизонтом в два года человек сможет смотреть с помощью этой технологии генеративный мультик по своему запросу — без подключения к интернету, в глухой тайге. Возможно, ещё и в 3D. Это всё Андрея прогнозы, не мои, если что. Но факт публикации их тут как бы намекает на то, что я разделяю его представление о векторе.
Другие полезные тексты я чаще публикую в своих каналах: Полезный Парфун | Presentopia | Поло с крокодильчиком