«Google Перекладач» навчився перекладати живі розмови без затримок
Технологія Gemini 3.5 Live Translate трансформує формат спілкування, зберігаючи емоції, інтонацію та природний темп мовлення
Компанія Google представила нове покоління системи машинного перекладу – Gemini 3.5 Live Translate. Інноваційна технологія вже почала інтегруватися в мобільний застосунок «Google Перекладач», а згодом з’явиться і в корпоративному сервісі відеодзвінків Google Meet. Про це повідомляє «Главком» з посиланням на Google.
На відміну від класичних систем перекладу, які «чекають паузи» у мовленні користувача, Gemini 3.5 Live Translate працює в режимі безперервного потокового аналізу. Модель формує переклад у реальному часі – фрази обробляються ще до того, як співрозмовник повністю завершує речення. Система розпізнає звуковий потік, миттєво аналізує контекст і одразу генерує озвучений результат.
Серед особливостей ключовим стало те, що система підтримує понад 70 мов, включаючи українську, англійську та іспанську. Модель не просто механічно перекладає слова, а намагається зберегти оригінальну інтонацію, темп і навіть емоційне забарвлення мовлення, що наближає штучну озвучку до живої розмови. Переклад формується поступово, завдяки чому діалог стає плавним, без незручних тривалих пауз між репліками.
У найближчі місяці оновлення поступово стане доступним у мобільних версіях «Google Перекладача» для операційних систем iOS та Android. Наступним кроком стане впровадження інструмента в Google Meet, де переклад відбуватиметься безпосередньо під час живих відеоконференцій.
Це означає, що міжнародні телефонні дзвінки, глобальне онлайн-навчання, подорожі та бізнес-комунікація з іноземними партнерами стануть доступними кожному навіть без знання мови співрозмовника. Технологія фактично стирає мовні кордони для щоденного спілкування.
В основі Gemini 3.5 Live Translate лежать прогресивні мультимодальні можливості нової лінійки моделей Gemini від Google. Розробникам вдалося об'єднати розпізнавання мовлення, обробку складного контексту та високоякісну генерацію голосу в єдину, миттєво реагуючу систему.
Крім того, компанія вирішила не обмежувати технологію лише власними продуктами. Google уже відкрила доступ до інструмента через Gemini Live API та Google AI Studio у форматі попереднього тестування. Це дозволить стороннім розробникам інтегрувати живий безшовний переклад у власні застосунки, сайти та сервіси.
Нагадаємо, штучний інтелект може змінити звичний світоустрій у стократ сильніше та швидше за будь-які попередні винаходи в історії. Творці передових технологій попереджають: часу на адаптацію суспільства та держав до нової реальності майже не залишилося.
Коментарі — 0