На первый взгляд это представляется идеальным готовым решением. Однажды запущенная программа работает бесконечно долго без особой дополнительной работы, так? Ну не совсем, говорят разработчики. Алгоритмы нуждаются в непрерывной подстройке под постоянно меняющиеся языки. Например, китайский термин для СПИДа —

(айцзы бин). Его первая часть, айцзы, — транслитерация английского AIDS, а вторая — классификатор, соответствующий названиям болезней. Но у китайцев в ходу и неофициальные названия вроде
, и
, которые произносятся одинаково, но означают «болезнь, порожденная любовью», «болезнь любви к капитализму» и «болезнь любви к себе». Система GPHIN должна опознавать и правильно переводить и эти неофициальные термины, а это возможно лишь под постоянным присмотром специалистов.

Или возьмем статью под названием «Желтая лихорадка» (Yellow Fever), опубликованную в Tampa Tribune в 2003 г. Вот выдержка из нее: «Эпидемия наказаний пресекла множество атак и привела к последовательности из трех проигранных игр подряд, что практически ввергло “Баксов” в кому в этом сезоне» [Примеры из Tampa Tribune можно посмотреть здесь: http://www.nationalacademies.org/hmd/~/media/Files/Activity%20Files/PublicHealth/MicrobialThreats/Mawudeku.pdf.]. Заметим, что здесь полно терминов, которые должны заставить систему GPHIN забить тревогу. Однако если алгоритмам хватит изощренности, чтобы учесть и входящие в ту же фразу спортивные термины, то GPHIN не поднимет тревогу автоматически, а направит публикацию аналитику, который быстро оценит контекст.

Поэтому, когда в следующий раз вы будете возмущаться найденными в Сети «идиотскими» машинными переводами, вспомните, что при определенных условиях машинный перевод спасает жизни. Тем самым перевод ограждает нашу жизнь от защитных костюмов и политических катастроф, отдавая их на откуп Голливуду.

Помощь спасателям на Гаити

Иногда перевод помогает предотвратить катастрофы, однако некоторые из них трудно предвидеть. В условиях таких катастроф жизненно важным может стать устное сообщение. Возможность сказать на другом языке простую фразу вроде «если вы меня слышите, постучите три раза» позволит обнаружить и спасти пострадавшего, даже если он не способен говорить из-за ужасной боли, усталости или истощения. При спасательных операциях на счету каждая секунда, но языковые барьеры все замедляют. Язык может сыграть роковую или спасительную роль при бедствиях как местного, так и международного масштаба. К счастью, новейшие технологии ускоряют и облегчают доступ к жизненно важной языковой поддержке.

Когда 12 января 2010 г. на Гаити разразилось землетрясение, между пострадавшими районами и остальным миром оборвались практически все линии связи, кроме одной: можно было обмениваться эсэмэс. Имевшаяся горячая линия перестала работать, но Digicel, крупнейший оператор мобильной связи на Карибах, немедленно предоставил бесплатный номер группе организаций, создавших платформу для обмена информацией. Техническое решение для сбора и пересылки тысяч сообщений было реализовано быстро, однако они были в основном на гаитянском креольском, а большинство спасателей его не знали. Относительно небольшая группа местных профессиональных переводчиков уже и так была полностью загружена и не могла справиться с наплывом дополнительной переводческой работы.

И тут за дело взялся лингвист Роб Мунро, который тогда был аспирантом Стэнфордского университета и занимался методами обработки больших объемов эсэмэс на малораспространенных языках. А еще он работал на краудсорсинговых проектах. Эти две его специализации стали прекрасной основой для создания нового проекта под названием «Миссия 4636» (4636 — номер бесплатной телефонной линии, по которой обменивались сообщениями). Мунро начал с создания команды для работы над проектом. Только за первую неделю ему удалось собрать больше тысячи добровольцев из сорока девяти стран.

Онлайновый чат и позволял вводить в курс дела новичков, и давал возможность переводчикам общаться между собой и с координаторами. Это онлайновое сотрудничество оказалось жизненно важным. Сообщения зачастую были полны разговорных выражений, смысл которых выявлялся в ходе обсуждения, а многие переводчики обладали специфическими для данного региона знаниями, которыми делились со спасателями на местах. К системе была подключена и картографическая информация: она позволяла переводчикам, знавшим местность, удаленно помогать спасателям находить нужное место и оперативно действовать. Вот пример реального обмена сообщениями между переводчиками и спасателями:

...

М.: Привет! Что такое «аквотаб»? Сокращение для питьевой воды? Спасибо.

М.К.: «Аквотаб» — это такие таблетки, которые кладут в воду для обеззараживания.

Р.: @М — больше похоже на «акватаб» — дайте чуть больше контекста, чтоб уж наверняка [Примеры эсэмэс, которыми обменивались спасатели и переводчики на Гаити, можно прочесть здесь: www.robertmunro.com/research/Munro_AMTA.pdf.].

За первые шесть недель работы было получено, переведено и отправлено обратно более сорока тысяч сообщений; примерное время реакции составляло не более десяти минут. Один американский морпех, работавший тогда в Гаити, так описывал роль системы:

...

Пользу от работы [ «Миссии 4636»] нельзя переоценить. Она ежедневно спасает жизни. Сотни случаев [успешной] деятельности. Морская пехота ежесекундно обращается к вашему проекту для оказания помощи тем, кто нуждается в ней больше всего [Цитаты из интервью, которое Роб Мунро дал авторам в мае 2011 г.].

Через месяц после начала стодневного проекта «Миссия 4636» добровольцы стали постепенно передавать свои функции наемным работникам-гаитянам, благодаря чему в регионе, где землетрясение усугубило безработицу, появились новые рабочие места.

Один из отчетов о своей деятельности Мунро завершает такими словами:

...

Слишком многих следует поблагодарить, так что я ограничусь выражением благодарности гаитянам, присылавшим сообщения. Их самоотверженность в условиях кризиса такого масштаба заслуживает огромного уважения. Они делились информацией не только о критических ситуациях, но и обо всем, что, по их мнению, могло помочь спасателям. Несмотря на окружавшие их несчастья, слово mèsi («спасибо») было одним из самых частых в отчетах.

Мунро рассказывал нам: «Поскольку спасателями были в основном военные, большая часть конкретных случаев засекречена. Но в открытых публикациях они заверяли нас, что “Миссия” спасала жизни ежедневно» [Слова морпеха Кларка Крейга об успехе «Миссии 4636» можно прочесть здесь: www.mission4636.org/some-positive-feedback.]. Программа действовала около ста дней, так что и спасено было не менее ста человек.

...
Трудности перевода креольских языков

Креольским языком называется естественная «помесь» двух языков. Такой язык считается сформировавшимся, если есть дети, которые говорят на нем как на родном. Чтобы лучше понять, как формируются креольские языки, давайте сравним их с другими языками. По данным профессора лингвистики из Массачусетского технологического института (МТИ) Мишеля Деграффа, в гаитянском креольском 90 % слов имеют французское происхождение, тогда как в английском — германском — языке лишь 35 % слов происходят от германских предков [См.: Peter Dizekes. A Champion of Creole // MITnews. 2001. May 12; http://web.mit.edu/newsoffice/2011/profile-degraff-0512.html.]. Миллионы носителей 80 креольских языков всего мира борются за право причислить свои языки к «настоящим». Их дискриминация часто сокращает ресурсы для развития этих языков, для их носителей и для переводчиков.