У меня давно уже зрела идея: попробовать проанализировать существующие в интернете переводчики с лингвистической точки зрения. Недавний пост Presbyter'a о «Google Переводчике», наконец-то, подвиг меня на это дело.
Практика выискивания разных смешных моментов в работе онлайн-переводчиков — весьма популярное развлечение. Но почему получаются такие ошибки и с чем они связаны? Попытаюсь рассмотреть их на примере «Google Переводчика» (далее — просто «Переводчик»). В качестве исходного языка беру русский, тексты буду переводить на банальный английский.
Начнем с самого простого.
1. Притяжательные конструкции.
Первое, что поражает, — структура словосочетания напрямую зависит от входящих в него слов. Возьмем, например, простое словосочетание типа «нечто (принадлежащее кому-то)». На практике выходит следующее:
комната Ивана — Ivan's room, мечта Ивана — Ivan's dream
сестра Ивана — sister of Ivan, память Ивана — memory of Ivan
душа Ивана — the soul of Ivan
квартира Ивана — apartment Ivana
друг Ивана — friend Ivan, преступление Ивана — crime Ivan
рука Ивана — Ivan hand
При этом конструкции, включающие даже слова, близкие по значению (например, термины родства), переводятся совершенно по-разному. Ср.:
мать Ивана — Ivan's mother
отец Ивана — father Ivan, сын Ивана — son Ivan
жена Ивана — wife of Ivan, дочь Ивана — daughter of Ivan
А теперь заменим Ивана, скажем, на Джона. Что получается?
мать Джона — John's mother
отец Джона — John's father, сын Джона — son of John
жена Джона — John's wife, дочь Джона — daughter of John.
Уже лучше! Теперь заменим Ивана с Джоном, например, на Татьяну. Получается следующее:
мать Татьяны — Tatiana's mother
отец Татьяны — Tatiana's father, сын Татьяны — son of Tatiana
муж Татьяны — husband of Tatiana, дочь Татьяны — daughter, Tatyana (!)
Какая-то логика, вроде бы, начинает прослеживаться, пока дело не доходит до последнего перевода!
Но вернемся к «комнате Ивана» и попытаемся также поменять имена. Получается:
комната Ивана — Ivan's room, комната Мэри — Mary's room
комната Джона — room John, комната Абдуллы — room Abdullah
комната Петра — Peter room, комната Сергея — Sergei room
Итак, сделаю первый вывод. А он таков: грамматические правила в «Переводчик» не заложены (или заложены неверно). Лингвист, если бы ему пришлось анализировать порожденные «Переводчиком» тексты, впал бы либо в буйный восторг (обнаруживая в английском языке диковеннейшие языковые категории), либо в прострацию.
Второй вывод: даже простейшие синтаксические структуры «Переводчик» переводит очень ненадежно.
Это только первая моя заметка об онлайн-переводчиках. В будущем планирую это дело продолжить.