С 11 октября в одном из самых популярных сервисов видеосвязи Skype заработала поддержка синхронного голосового перевода с русского языка и на русский. Microsoft пока не рекомендует использовать переводчик в бизнес-целях, однако, по нашим наблюдениям, даже предварительная версия Skype Translator справляется с синхронным переводом лучше многих доморощенных переводчиков.

900_450_crop

Русский стал девятым языком, поддерживаем Skype Translator в видеозвонках. Кроме него доступны английский, испанский, китайский (мандарин), итальянский, французский, португальский (бразильский), немецкий и арабский.

Пользователям Windows 10 Anniversary Edition делать ничего не требуется, обновление придет к ним само. Предпочитающим более ранние версии операционных систем придется зайти на сайт и скачать приложение Skype Translator. Оно встраивается в основной Skype и добавляет закладку «Переводчик Skype». А у контактов появляется иконка глобуса, где можно выбрать режим перевода.

Изначально система будет работать только на ПК (настольных и ноутбуках) с Windows 7 и выше, однако в будущем можно ожидать и апгрейда для мобильных платформ.

Как работает Skype Translator?

Если вы когда-то наблюдали за синхронным переводом, использование Skype Translator не вызовет никаких вопросов. После установки соединения вы начинаете говорить, а Skype, в свою очередь, слушать. Для собеседника ваш голос немного приглушается, потому что, как предполагается, особой пользы от него (голоса) нет. Когда вы сделаете паузу, Skype Translator начнет произносить все сказанное на понятном вашему собеседнику языке. Объем сказанного не ограничивается, и, как показывает опыт, не оказывает влияние на качество перевода. Но лучше, конечно, не зачитывать «Войну и мир» главами, чтобы собеседник не заскучал.

Перевод возможен в любом из девяти «направлений», то есть вполне можно беседовать с китайцами и португальцами, даже если вы не знаете ни слова по-китайски и по-португальски. Лучше, если в помещении будет тихо, а вообще Microsoft советует использовать гарнитуру с микрофоном. Коллективные беседы, в принципе, поддерживаются, но всем придется говорить строго по очереди. Два голоса вызовут у облачного мозга лишь недоумение.

В каждой стране Microsoft стремится учесть все местные произношения и диалекты. К сожалению, у меня не было возможности протестировать переводчик на пермских и воркутинских присказках да поговорках, но они поставят в тупик и живого переводчика, заехавшего в эти прекрасные города из Москвы. И если робот не справится, винить его не стоит. Тем не менее, словарный запас внушителен. На уровне простой беседы «за жизнь» проблем не возникает никаких, да и спорные конструкции типа «целую ваши мысли» запинок у Skype не вызывают. Единственный, наверное, забавный момент возник, когда я стал читать Skype Translator текст песню Бориса Гребенщикова «Электрический пес». Строчку «А этот пес вгрызается в стены» облачный мозг услышал, как «пёс-грузовик», тут же породив новый мем. Впрочем, до гуртовщиков мыши все равно далеко.

Важный момент: в настоящее время «стыковка» языков происходит через английский. То есть при разговоре с французом русский сначала будет переведен на английский, и только потом на французский. Это не влияет на скорость перевода, но, конечно, вносит определенную погрешность.

Наверное, доверять Skype Translator серьезный деловой или даже личный разговор я бы не стал. Но барьер общения действительно исчезает на глазах. Пусть с огрехами, но ты действительно понимаешь человека, говорящего на незнакомом языке. И это удивительно.

Нейронные сети в Skype Translator

В основе платформы лежит технология глубинных нейронных сетей (Deep Neural Networks) и методы статистической обработки данных.

Нейросети — это система машинного обучения более высокого порядка. Разница состоит в том, что в машинном обучении программа следует алгоритму, который создал человек, а нейросети способны самостоятельно поставить себе задачу и найти решение, проанализировав определенный массив данных.

Такие системы функционируют за счет системы слоев, каждый из которых отвечает за одну характеристику распознавания. К примеру, контур, текстура и т. д. Чем слоев больше, тем легче их обучать, и тем больше у технологии появляется возможностей. Обычные развлекательные сервисы (типа графических редакторов — яркий пример приложение Prisma) строятся на нейросетях из шести-семи слоев. Microsoft разработала платформу глубинного обучения со 152 слоями (глубинную остаточную сеть), благодаря которой стало возможным появление такой функциональности, как синхронный речевой перевод в Skype Translator.

Skype Translator объединяет возможности распознавания речи и машинного перевода, что обеспечивает трансформацию текста в понятный для машины формат, его распознавание и перевод, и переход от распознанного текста к его голосовому воспроизведению. Сервис самостоятельно совершенствуется по мере использования, и чем больше людей работают с ним в процессе общения друг с другом, тем выше качество перевода. Пользователи Skype по всему миру совершают 3 млрд минут видеозвонков в день. Если даже всего один процент будет пользоваться переводом, обучение окажется довольно быстрым.

Поговорить с будущим

Альтернатив у Skype Translator довольно много, однако все они (пока) заточены под короткие фразы, и не очень хорошо относятся к длинным задушевным разговорам, где реплики собеседников длятся по несколько минут.

Возможность общения с носителями других языков (и культур) — совершенно потрясающий опыт. И с годами я прихожу к мысли, что иностранные языки были единственным, на что действительно стоило тратить время в детстве, потому что остальные навыки (хорошо, большинство из них) нарабатываются на порядки быстрее.

Skype Translator не пропитает вас историей и культурой стран, где живут носители языка, как это происходит при стандартной модели обучения. Но это можно сделать в освободившееся от изучения дополнительных языков время. И на сэкономленные деньги.

И, похоже, теперь в России начинается отсчет гибели еще одной профессии. Переводчика. Как ни крути, но самое надежное сегодня — учить детей программированию.