(первая часть здесь)
Турецкие шутники организовали «налет» на перевод интерфейса Facebook, заменив часто используемые сообщения на ругательства.
(источник)
На сайте TranslatorsTraining опубликованы видеоролики, демонстрирующие перевод одного и того же документа Word в 20 переводческих средах. О существовании некоторых я узнал только оттуда :-)
Вместе с текстом на перевод вы можете получить результат анализа повторяющихся сегментов. Или захотите его сделать самостоятельно. Ну, со 100 %-ными совпадениями и новыми сегментами вроде бы все понятно, но как считаются fuzzy matches?
Авторы блога GlobalVision приводят интересный пример. Какой процент совпадения будет у этих двух сегментов:
The lazy brown fox jumped over the quick brown dog.
The lazy brown dog jumped over the quick brown fox.
В строке из 50 символов 46 остались неизменными, что соответствует совпадению в 92%. Но мы переводим не посимвольно! Для переводчика в исходном сегменте поменялись два слова из 10 — величина 80 % выглядит более реалистичной. И это еще без учета возможных изменений во флексиях других слов.
Это (наряду с возможностью обсчета) следует помнить при предварительной оценке времени, которое потребуется на выполнение проекта. На 95 %-ное совпадение уйдет в два, а не в двадцать раз меньше времени, чем на новый сегмент :-)
Выкладываю давно обещанные материалы с переводческой конференции в Лиссабоне.