По сравнению с предыдущими версиями Trados в Studio существенно расширена поддержка пользовательских форматов структурированных данных. Необходимость их перевода периодически возникает, но цельного руководства по добавлению новых типов файлов я не нашел, а встроенная справка Студии объясняет этот процесс весьма путано. Попробую устранить этот пробел.
О чем вообще речь?
Речь о переводе любых разновидностей XML или текстовых файлов со структурированными данными. То есть файл для перевода может выглядеть так:
Или так:
В первом примере нужно перевести слова Video wall, а во втором — все слова внутри кавычек. Разница между этими примерами в том, что в XML-подобных форматах переводимый текст всегда заключен в определенные теги, что облегчает его изолирование.
Что же делать?
Чтобы переводить файлы таких форматов в Trados, нужно выполнить квест пройти мастер добавления новых типов файлов. В версии 2007 это тоже можно было сделать, но возможности Студии намного шире. Я опишу порядок действий для текстовых файлов (процедура для XML немного проще).
В меню Tools выбираем Options > New… > Regular Expression Delimited Text. В открывшемся окне указываем название формата и расширение соответствующих файлов, в этом примере — YAML:
Сохраняем изменения, формат YAML появляется в списке поддерживаемых. Открываем раздел Structure Patterns. Нам требуется изолировать весь в текст в кавычках, а все, что не входит в кавычки, сделать непереводимым. В поле Opening Pattern вводим регулярное выражение, выделяющее текст до первого символа кавычки: .*?(“), а в поле Closing Pattern — выражение для текста от кавычки до конца строки: (“).*$. Не забудьте нажать кнопку Add и, если необходимо, установить флажок Multiline.
Для проверки регулярных выражений можно использовать программу RegexBuddy или сайт Regex Tester. Без этого сложно отладить регулярные выражения: пока не откроешь файл нового типа в Студии, не узнаешь, что в указанном регулярном выражении есть ошибка.
Все сохраняем и открываем YML-файл в Студии. Файл со второго скриншота открылся таким образом:
Ура, мы выделили переводимый контент! Помимо удобства перевода правильная обработка таких файлов также позволит точно подсчитать объем работы. Примерно по такой же схеме добавляются XML-подобные форматы файлов, только вместо открывающего и закрывающего выражения нужно указать открывающий и закрывающий теги.
P.S. Я не смог бы написать эту инструкцию без информации из блога Пауля Филкина — рекомендую подписаться всем пользователям SDL.
Спасибо! Вы как раз вовремя. Я с этим сталкиваюсь, и даже сейчас – сижу копаюсь. И за наводку на интересный блог тоже спасибо xDDD
Рад помочь :-)
Pingback: Studio 2014: три практических примера | Тетради переводчика