Размер шрифта
Новости Спорт
Выйти
ПМЭФ-2026Война США и Израиля против Ирана
Технологии

Из России — в Мордор

Почему Google Translate назвал Россию пристанищем Саурона

Онлайн-переводчик Google Translate в очередной раз привлек к себе внимание пользователей и СМИ благодаря тому, что перевел «Российская Федерация» с украинского языка на русский как «Мордор». Это далеко не первый случай оскорбления чувств пользователей машинными алгоритмами. Отдел технологий «Газеты.Ru» разобрался в механике их возникновения.

Во вторник, 5 января, соцсети пестрили публикациями скриншотов, на которых Google Translate переводит словосочетание «Російська Федерація» с украинского на русский как «Мордор», а фамилию «Лавров» — «грустная лошадка».

В Google объяснили, почему Россия, по мнению сервиса-переводчика, вдруг превратилась в вымышленную страну и сосредоточие зла в Средиземье из легендариума Дж. Р.Р. Толкина. В компании заверили, что Google Translate — это автоматический переводчик, работающий без участия людей, но при помощи алгоритмов. Для создания наиболее качественного перевода алгоритмы анализируют огромные массивы документов и публикаций, как оригиналов, так и их переводов, сделанных людьми. О принципе работы переводчика Google подробно рассказывается в данном видео.

В случае если у Google Translate появляется грубая ошибка в переводе, то компания старается незамедлительно справиться с ней, рассказал представитель компании.

Что касается конкретно данной ошибки, из-за которой Россия стала Мордором, то в интернете можно найти множество статей, где «Мордор» и «Россия» используются в одном контексте. Здесь подразумевается и сомнительная теория, согласно которой в образе пристанища Саурона Дж. Р.Р. Толкин изобразил СССР, впоследствии же «титул» перешел к России.

Также тема стала широко обсуждаться, когда в Москве планировалось установить инсталляцию «Око Саурона». Что также вызвало широкий резонанс в СМИ. Журналист Леонид Бершидский в статье для Bloomberg, например, назвал Россию Мордором, а Украину — Широм, родиной хоббитов.

<2>

Фамилия «Лавров», наиболее часто упоминающаяся в публикациях СМИ о министре иностранных дел России Сергее Лаврове, могла получить столь странный перевод по схожей причине. Так, ранее в Запорожье был установлен памятник, который представляет российского государственного деятеля в образе лошади. Об этом писали украинские издания, что и привело к тому, что переводчик Google запутался именно в этих двух языках.

Таким образом, алгоритмы Google Translate просто-напросто сбились, анализируя украинские и российские источники. А на фоне обострившихся российско-украинских отношений подобные казусы привели к достаточно нелепым переводам.

Тем не менее сервисы Google уже не раз попадали впросак с использованием собственных алгоритмов.

Одним из самых громких роботизированных оскорблений Google стали запросы «nigger house» и «nigga house», которые выдавали в результатах поиска на Google Maps резиденцию президента США Барака Обамы в Вашингтоне. Причиной таких результатов поиска стала социальная сеть Google+, записи в которой использовались для нанесения и уточнения информации об объектах на картах. В большом количестве из них встречались эти словосочетания.

Поднятая волна критики в СМИ и со стороны обычных американских пользователей заставила компанию оперативно сделать заплатки в алгоритмы, и Белый дом перестал выводиться по этим запросам. Но внимательные пользователи на этом не остановились и нашли еще один запрос — «nigga king», который также указывал на резиденцию Барака Обамы.

врез №
skin: article/incut(default)
data:
{
    "_essence": "test",
    "incutNum": 3,
    "picsrc": "Причиной ассоциации Белого дома с оскорбительными запросами стали пользователи Google+",
    "repl": "<3>:{{incut3()}}",
    "uid": "_uid_8009987_i_3"
}

Ранее Google пришлось закрыть функцию добавления пользователями объектов на Google Maps после того, как по определенным географическим координатам на них появилось изображение логотипа Android, справляющего малую нужду на логотип конкурента — Apple.

врез №
skin: article/incut(default)
data:
{
    "_essence": "test",
    "incutNum": 4,
    "picsrc": "Этот «географический объект» был добавлен на Google Maps пользователями.",
    "repl": "<4>:{{incut4()}}",
    "uid": "_uid_8009987_i_4"
}

Таким образом, пользователи зачастую сами препятствуют развитию сервисов Google на основе пользовательского контента, и сторонние картографические сервисы, такие как созданная российскими разработчиками Wikimapia.org, получают преимущества на рынке перед таким гигантом, как Google.

Зачастую ляпы алгоритмов выглядят как шутки разработчиков или даже попытки «потроллить». Например, в начале 2010 года Google Translate переводил одну и ту же словесную конструкцию «is to blame» (англ. «виноват») по-разному в контексте России и российского президента и США и американского президента. Для России и Медведева перевод был «виноват», для США и Обамы — «не виноват». Позже различие в переводах в разном контексте было убрано.

В конце 2010 года появился знаменитый перевод фразы: «Доброе утро, Дмитрий Анатольевич!», которая в английском варианте у Google Translate превращалась в «Good morning, Mr President».

врез №
skin: article/incut(default)
data:
{
    "_essence": "test",
    "incutNum": 5,
    "picsrc": "Иногда результат работы алгоритмов похож на шуточки разработчиков",
    "repl": "<5>:{{incut5()}}",
    "uid": "_uid_8009987_i_5"
}

Версия с баловством разработчиков, конечно, имеет место быть, но за пять лет подобных случаев транснациональная корпорация, чьи миллиардные прибыли могут быть поставлены под угрозу подобными действиями сотрудников, должна была внести соответствующие изменения в работу с персоналом. Однако «шуточки алгоритмов» продолжают появляться с завидной регулярностью.

В декабре 2015 года Google Translate по-прежнему допускал «дискриминацию» в переводе в зависимости от контекста.

Так, «Россия присоединила» переводилось как «Russia joined», а «россия присоединила» (со строчной буквы «р») — как «Russia annexed», то есть «Россия аннексировала».

При этом для слова «Америка» в той же конструкции заглавная или строчная «а» значения не имела. Можно предположить, что те пользователи интернета, которые считали ситуацию с Крымом «аннексией», могли писать «россия» со строчной «р», выражая тем самым свое неуважение.

Также подобные различия в переводе «joined» в сервисе можно было наблюдать для Франции, Норвегии и Шотландии.

Еще одним уязвимым для действий пользователей сервисом является Google Street View. Google регулярно обновляет снимки городских улиц в разных городах, чтобы изменения местности отражались и в панорамах. Если сейчас курьезы и скандалы чаще связаны с местным колоритом и случайно попавшими на камеру сценами секса на улице, то постепенно сервис становится ареной для самовыражения пользователей и проявления определенной гражданской позиции. Так, австралийские женщины начали демонстрировать машинам Google обнаженную грудь как протест против вторжения корпорации в личную жизнь жителей.

Тем не менее в череде случайностей есть если не позитивные, то полезные примеры. В ноябре прошлого года благодаря Google Street View был обнаружен автомобиль с телом человека, считавшегося пропавшим без вести в течение девяти лет.

 
Удар по автобусу, запрет на выезд для чиновников и выходной для родителей выпускников. Что нового к утру 3 июня
На сайте используются cookies. Продолжая использовать сайт, вы принимаете условия
Ok
1 Подписывайтесь на Газету.Ru в MAX Все ключевые события — в нашем канале. Подписывайтесь!