fbpx
Технологии

Google показал Translatotron — новый способ перевода речи

Особенность технологии в том, что перевод происходит без преобразования речи в текст.

Новый исследовательский проект Google берёт произнесённые фразы на одном языке и пересказывает их на другом. Но в отличие от других привычных способов перевода, технологии не нужен промежуточный текст — всё работает только с аудио. Таким образом перевод происходит быстрее, а ещё можно передать даже интонацию речи.

Проект носит грозное название Translatotron. Над ним работают уже несколько лет, но это всё ещё скорее эксперимент. Исследователи Google годами искали возможность реализовать подобную технологию перевода, и только сейчас их работала показала первые результаты.

В привычной нам технологии перевод работает так: программа улавливает голос, преобразует устную речь в текст, затем переводит этот текст на другой язык и произносит то, что получилось. Такой подход работает, но он далёк от идеального. На каждом этапе программа может допустить ошибки и в итоге исказить перевод — от лёгких неточностей до полного изменения смысла.

Чтобы изменить подход, исследователи стали изучать возможности человеческого мозга в переводе с одного языка на другой прямо на ходу. Хотя нет точного ответа на вопрос, как мы сами это делаем, учёные проекта Translatotron придумали строить специальные спектрограмы. Они разделены на части, которые программа визуализирует сразу с помощью другого языка и произносит готовый текст.

Избавившись от дополнительного шага в переводе, Translatotron стал работать гораздо быстрее. Внутренним процессам требуется гораздо меньше операционной мощности. Но самое важное — программа может передать интонацию, с которой говорил человек, в отличие от полной безэмоциональности роботизированного голоса сейчас. И это один из самых больших прорывов в искусственной речи за последнее время.

Точность перевода, как отмечают исследователи, пока не дотягивает до традиционной технологии. Но здесь нужно просто время и много тренировок. Если у Google всё получится с этой технологией, теоретически мы наконец сможем «заговорить» на любых языках мира без особых усилий.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

52580509