Американская корпорация Google представила новый сервис Gemini 3.5 Live Translate, предназначенный для синхронного перевода живой речи более чем на 70 языков. Технология обеспечивает перевод практически в реальном времени и сохраняет тембр, темп и высоту голоса говорящего.
В компании отмечают, что система автоматически определяет язык и генерирует естественно звучащую речь без необходимости ждать окончания фразы. В отличие от традиционных решений последовательного перевода, Gemini 3.5 Live Translate работает непрерывно и отстает от оригинальной речи лишь на несколько секунд.
Функцию начали внедрять в онлайн-сервис Google Translate для устройств на Android и iOS. Также предварительный доступ к технологии получили разработчики через Gemini Live API и Google AI Studio, а в течение месяца решение появится в сервисе видеоконференций Google Meet для корпоративных клиентов.
По данным Google, модель способна работать в «шумных и непредсказуемых условиях», что делает ее пригодной для международных переговоров, онлайн-встреч, лекций, учебных занятий и трансляций. Одним из первых партнеров, тестирующих технологию, стала малайзийская компания Grab, которая использует ее для общения между водителями и пассажирами.
Для пользователей Android Google также запускает специальный режим прослушивания, позволяющий получать перевод через разговорный динамик смартфона без использования наушников. Кроме того, весь аудиоконтент, созданный моделью, маркируется цифровыми водяными знаками SynthID для идентификации материалов, сгенерированных искусственным интеллектом.
