ABBYY SmartCAT — перспективная среда перевода

О том, что компания ABBYY предлагает бесплатную браузерную среду перевода под названием SmartCAT, я слышал еще в середине 2014 года. Меня уже несколько раз спрашивали, что я о ней думаю, но всё никак не доходили руки внимательно посмотреть, что же это за штуковина. Наконец, свободное время нашлось.

Это не первая браузерная САТ-среда и не первая бесплатная. Я немного знаком с ее прямыми конкурентами — бесплатными онлайновыми версиями Memsource Cloud (далее — MSC) и Wordfast Anywhere (WFA) — вот с ними и буду сравнивать SmartCAT при обзоре. Мой любимый Trados стоит особняком: некорректно напрямую сравнивать онлайновые и офлайновые «кошки», офлайновый перевод имеет свои преимущества и недостатки, на которые я здесь отвлекаться не хочу.

Я не пытаюсь описать абсолютно все возможности SmartCAT, но попробую ответить на два вопроса: как SmartCAT выглядит на фоне конкурентов и в какой степени современная онлайновая «кошка» может заменить десктопную программу.

Отдельно подчеркну, что я рассматриваю переводческие программы с фрилансерской колокольни: возможности управления проектами, групповую работу и т. п. я пропускаю.

Начальный экран SmartCAT

Создание нового проекта

На первый взгляд, SmartCAT очень удобен для случаев, когда нужно быстро открыть файл и начать перевод. Зачастую просто нет времени на создание проекта: выбрал файл для перевода — и вперед. По этому параметру SmartCAT находится вровень с «Традосом», Wordfast Anywhere немного отстает, а в Memsource или, например, в MemoQ начало работы занимает заметно больше времени.

smartcat-new

Но здесь нас поджидают заботливо подложенные разработчиками грабли: если начать перевод без подключения ТМ, при попытке подтвердить сегмент получаем следующее:

smartcat-undefined

Почему в этом случае SmartCAT не создает временную ТМ с настройками по умолчанию, как это сделано в WFA? Непонятно.

Если же в диалоге «Новый проект» нажать не «Готово», а «Далее», можно будет добавить ТМ, глоссарий и движки машинного перевода. Здесь лежат другие грабли: при попытке импортировать ТМХ объемом в скромные 80 000 сегментов я получил сообщение об ошибке. Разумеется, в этой ТМ были «инвалидные» сегменты — это не тестовая, а реальная память — но программа должна импортировать все, кроме ошибок, а не переводить стрелки на invalid format. Все конкуренты импортировали этот ТМХ без осложнений.

Между прочим, на TFR-2014 Антон Воронов, представитель ABBYY, заявлял, что на очень больших ТМ онлайновая система может работать быстрее десктопной. И как же это проверить без импорта ТМХ?

Поддержка файловых форматов

Большая часть моей работы приходит в форматах XML, XLIFF и TTX. Вот что сказал мне SmartCAT при попытке добавить файл XML:

Следующие файлы не поддерживаются в системе:
– test_en-US.xml
Поддерживаемые типы файлов: bmp, dcx, pcx, png, jp2, jpc, jpg, jpeg, jfif, tif, tiff, gif, pdf, djvu, djv, jb2, docx, doc, txt, rtf, odt, xlsx, xls, ppt, pptx, potx, pps, ppsx, odp, ttx, sdlxliff, xlf, xliff, srt.

Впрочем, WFA тоже не работает с файлами XML, зато в MSC имеются обширные настройки для этого формата.

Напротив, в работе с ТТХ-файлами SmartCAT — безусловный лидер: WFA и MSC отказались работать с неразмеченным (unsegmented) файлом, в то время как у SmartCAT это не вызвало никаких затруднений.

С файлами XLIFF все три онлайновые «кошки» работают примерно одинаково, хотя в SmartCAT недостает настроек импорта, имеющихся в MSC.

Процесс перевода

smartcat-editor

Здесь SmartCAT находится примерно на одном уровне с MSC и заметно превосходит WFA. Пожалуй, главный изъян области редактирования по сравнению с MSC и офлайновыми «кошками» — отсутствие автоподстановки, позволяющей очень удобно вставлять термины в перевод. Зато SmartCAT автоматически сохраняет неподтвержденные сегменты в процессе работы. Если вдруг зависнет браузер или пропадет интернет, работа не потеряется.

В целом, интерфейс SmartCAT похож на MSC и заметно удобнее WFA. В редакторе очень не хватает горячей клавиши для удаления перевода из текущего сегмента. Вообще, современные программы слишком ориентированы на мышь: переназначить клавиатурные сочетания не получится ни в SmartCAT, ни в MSC (хотя это и можно реализовать сторонними средствами).

В правой части окна редактора есть вкладка «Словари», где можно (бесплатно!) поискать что-нибудь в словарях ABBYY Lingvo. Не скажу, что такая реализация удобнее, чем отдельная программа на компьютере, но ни одна конкурирующая «кошка» не предлагает переводчикам ничего подобного.

Жаль, что не реализовано исправление нечетких совпадений из ТМ: это дало бы SmartCAT хороший козырь.

Я не могу назвать работу в SmartCAT совершенно гладкой (вот, где-то прав не хватило), но проблем должно быть не больше, чем с десктопными аналогами.

Работа с терминами

В SmartCAT можно загрузить термбазу и проверять перевод на соответствие глоссарию. Изюминка в том, что такая проверка делается с учетом русской морфологии! То есть если в глоссарии есть соответствие white белый, перевод white bookбелая книга при проверке будет распознан как корректный. Какие еще САТ-программы умеют это?

Импортировать термины можно только из файлов Excel без каких-либо настроек. Здесь не помешала бы поддержка термбаз в формате TBX. Извлечение терминов из исходного текста тоже не поддерживается.

Средства проверки качества

В этом отношении MSC и WFA выглядят аутсайдерами на фоне SmartCAT. Возможность исправлять опечатки по щелчку правой кнопкой мыши уже ставит SmartCAT выше двух других кошек, а еще его QA-модуль проверяет соответствие пунктуации в оригинале и в переводе, умеет находить смесь латиницы и кириллицы в одном слове и, кажется, вообще является одним из лучших в отрасли.

Сохранение результата

smartcat-save as

SmartCAT (впрочем, как и MSC, и WFA) позволяет по завершении работы сохранить проектную ТМ в виде ТМХ и в виде двуязычного файла Word (вне зависимости от формата исходного документа). В «Традосе» это тоже можно получить, но намного менее удобно!

Потребление ресурсов

Надеюсь, в 2015 году этот параметр перестал быть актуальным. На моем компьютере ни одна «кошка» не тормозит, и SmartCAT не исключение. Скорость перехода между сегментами в SmartCAT и в десктопных «кошках» тоже одинаковая. Браузер с переводом, открытым в SmartCAT, занимает около 150 МБ памяти — это совсем немного.

В качестве нагрузочного теста я открыл SmartCAT на Android-устройстве (4 х 1,8 ГГц, 2 ГБ памяти). Увы, это тест SmartCAT не прошел: любые действия, будь то подтверждение сегмента или выбор варианта из памяти, занимают не меньше секунды; возможно, в этом виновата андроидная версия Chrome, а не SmartCAT. Надеюсь, в этом направлении будут какие-то улучшения, ведь работа на мобильных устройствах— одно из перспективных применений для браузерной среды перевода.

Документация

У SDL есть отличная справка и онлайновая база знаний, у Memsource — документация на вики-сайте, а у SmartCAT… нет ничего. Несколько обучающих видеороликов выглядят издевательством: это же не компьютерная игра, а профессиональный инструмент! Если нет ресурсов, чтобы создать и поддерживать подробное руководство пользователя, могли бы написать хотя бы краткую инструкцию.

Субъективные ощущения

В целом, SmartCAT мне понравился. По большинству критериев он находится на уровне MSC и заметно превосходит WFA, а благодаря богатой проверке качества я готов его поставить на первое место среди онлайновых систем. Хочется верить, что разработчики сделают ручку грабель помягче починят работу с ТМ.

Резюме

Готов ли я сделать SmartCAT своей основной САТ-системой? Нет, Trados 2014 неизмеримо функциональнее. В нем я перевожу файлы XML, я могу сам добавить поддержку новых типов файлов, я активно пользуюсь Autosuggest и слежу за появлением новых модулей OpenExchange. Более того, я не думаю, что добавление подобных функций в SmartCAT целесообразно: ими пользуется слишком мало людей.

Тем не менее, могу ли я порекомендовать SmartCAT начинающему переводчику-гуманитарию, для которого Trados кажется слишком сложным? Да, конечно. SmartCAT имеет хорошую перспективу стать тем, чем стал Google Docs в области текстовых процессоров: быстрой, бесплатной онлайновой средой для выполнения несложной работы. Те же, кому не хватает базовой функциональности, могут купить Microsoft Office для редактирования текстов или Trados для перевода.

11 thoughts on “ABBYY SmartCAT — перспективная среда перевода

  1. Sergey Andreev

    Максим, здравствуйте!

    Я представитель компании ABBYY, являюсь менеджером продукта SmartCAT.
    С удовольствием прочитали ваш обзор. Спасибо за обратную связь по положительным и особенно по отрицательным моментам. Над граблями работаем :) Например, создание временной ТМ с настройками по-умолчанию появится уже на следующей неделе.
    Поддержка XML также есть в недалеких планах. Кроме того идёт работа над удобной документацией и общим повышением юзабилити продукта.

    Если вас что-то ещё интересует – спрашивайте, с удовольствием расскажу.

    Reply
    1. Maxim Post author

      Здравствуйте, Сергей.
      Спасибо за комментарий.

      Скажите, а fuzzy match repair планируется реализовать, хотя бы в отдаленной перспективе?

      Reply
  2. Pingback: ABBYY SmartCAT — перспективная среда перевода | Альянс ПРО

  3. Alex

    Отвратительный CAT_инструмент, который не только не помогает в работе, а даже чуть-чуть вредит. Ни в какое сравнение не идет с традосом, мемок.

    Reply
  4. Рауль

    SmartCAT на заре своего появления была чудо как хороша – удобный, бесплатый, простой и быстрый инструмент. Затем начали появляться значительные глюки: один раз она мне не экспортировала файл, т.к. не смогла в конечном файле осуществить сборку таблиц и графиков, затем неоднократно пропадали переведенные, но не подтвержденные сегменты, причем пропадали десятками за раз. А сейчас она просто тормозит, причем неважно, с какого компьютера и из какого браузера я захожу: при переходе к следующему сегменту на отображение записей глоссария и памяти (а зачастую и на сам переход к следующему сегменту) уходит от 1 до 5 секунд, изредка и больше. Сдается мне, что на перелопачивание интерфейса где-то ближе к середине этого года у Эбби нашлись ресурсы, а на дополнительные серверные мощности – нет. Пришлось от этого инструмента отказаться, ибо тормоза раздражают (ей-богу, громоздкие мультфункциональные комбайны MemoQ и Across на моем компе тормозят куда меньше!)

    Reply
  5. Wisemouse

    А теперь я вам рассказываю, что значит SmartCat для переводчика:

    1. Кривая работа с ТМ: TU с совпадением 95-97% он ставит на 6-7-ое место (т.е. уже за пределами экрана), а на первое место ставит термины из TB (и это при том, что совпадение 100-процентное!). В 6 случаях из 10 не находит в ТМ совпадения 99-100%. ВООБЩЕ. Мне элементарно приходится искать в уже переведённых docx-файлах, что я там переводил. О какой автоматизации перевода вообще тогда может идти речь?
    2. TM и TB свалено в одну кучу, нет элементарного разделения по цветам. В Традосе у меня было два отдельных окна и я мог быстро понять, это термин из ТВ или кусок из ТМ. Даже в Мемсорсе есть разделение по цветам. Также к столбце оригинала нет удобного подсвечивания терминов, как в Традосе.
    3. Конкорданс ужасен. Находит через раз. А то и вовсе не находит.
    4. При вставке из Мультитрана при включённом Punto Switcher вставка дублируется (вставляется термин, а потом вставляется перенос на новую строку и термин вставляется ещё раз). Всё приходится удалять вручную и тратить на это время.
    5. Отсутствуют множественные переводы на один TU. Когда документ распознан из PDF и термины разорваны переносом, то переводы разных терминов, заканчивающихся, скажем, на «device», превращаются в ужас. Приходится править готовый файл, выискивая множественные ошибки.
    6. Смарткат постоянно ставит оранжевые восклицательные знаки по поводу и без. То ему точка, не нравится, то пунктуация в оригинале точка, а у меня, видите ли, точка с запятой; то ему не нравится, что предложение у меня начинается с маленькой буквы. В итоге 80% сегментов, будучи абсолютно корректными для перевода, сопровождаются восклицательными знаками. Это не позволяет понять, где там на самом деле ошибки есть.
    7. Отсутствует проверка орфографии на человеческий манер. Т.е. Смарткат предлагает искать вручную сегменты с восклицательными знаками и выискивать среди сотен «ошибок» орфографические ошибки. А учитывая то, что я написал в п.6, проверку орфографии я не делаю, потому что нереально, ибо отнимает массу времени.
    8. Даже такую элементарную вещь, как выделение текста они умудрились сделать плохо. Зажимаешь мышиную кнопень и начинаешь выделять: выделение прерывается то в середине, то в конце. Приходится выделять заново.
    9. Нельзя оставить переведённый сегмент с пробелом (например, когда от предложения переносом строки «оторвалась пара слов»). В Традосе это позволяло не оставлять мусора в переведённом файле. В Смарткате нужно воткнуть точку, например.

    В Смарткате 8 страниц я делаю то же время, за которое в Традосе успеваю сделать 13-14 благодаря человеческой автоматизации и корректной работе с ТМ и ТВ. И это при том, что в Традосе качество перевода выходит выше и не требует исправления выгруженного файла.

    Я обращался в саппорт Смартката и на всё это получил две категории ответов:
    а) «мы работает над улучшением» и
    б) «попробуйте не использовать функцию повторов» (ага, всенепременно, а зачем тогда вообще CAT-системы то нужны?).

    Почитайте выше сообщение от e.sekirov – в его посте нет НИ СЛОВА о качестве перевода. Только сплошные «менеджерские» плюсы.

    Так что, друзья, коллеги и сочувствующие, что я хочу сказать: для пользователей Смартката качество перевода стоит на одном из последних мест. На практике переводы в этой среде приводят лишь к головной боли на ровном месте и переделыванию итогового (выгруженного) файла. А если файл большой, то отловить все ошибки не получается.

    Всем своим заказчикам, желающим работать в SC, я сделал наценку +50%, предварительно продемонстрирован последствия SC-перевода. Здравый смысл взял вверх, сейчас их моих клиентов никто этим уродцем не пользуется.

    На крайний случай среди нормальных облачных систем есть MemSource. В сравнении с SC это земля и небо.

    Reply
    1. Wisemouse

      Это я скопипастил свой пост на ГП (trworkshop.net/forum/viewtopic.php?f=192&t=60599&start=20)

      Reply
    2. Maxim Post author

      Вы комментируете запись от 2015 года. За пять лет много воды утекло.

      Reply

Leave a Reply

Your email address will not be published.