Пара слов об автоматическом извлечении терминов

Меня спросили, пользуюсь ли я средствами автоматического извлечения терминов. Вот, отвечаю.

«Извлечение терминов» — это рекламное выражение; на самом деле, автоматические средства просто составляют список слов в документе, сортируют его по частоте использования, а под видом терминов представляют наиболее часто встречающиеся слова. Конечно, большинство из них будут обычными общеупотребительными словами, которые нет смысла заносить в термбазу. Специфические термины обычно в верх частотного списка не попадают, так как встречаются реже общей лексики (хотя, конечно, тексты разные бывают).

Тем не менее такую процедуру иногда полезно выполнить перед началом работы с новым клиентом или новой темой: среди общих слов вы получите список имен, товарных знаков, артикулов продукции и т. п. Уточните у клиента, что из этого нужно переводить, а что следует оставить в оригинальном написании, и тогда этот перечень можно будет добавить в термбазу или в автотекст.

В Trados Studio для извлечения терминов служит отдельный модуль Multiterm Extract, но я не понимаю, зачем устанавливать отдельный (платный!) модуль, когда работу со списками гораздо удобнее вести в Excel. Когда-то я потратил полчаса, чтобы написать нехитрый макрос, и теперь я просто открываю исходный файл в Excel, выполняю макрос и получаю частотный список слов в столбце С. Вот такой макрос. Этот список уже можно как угодно редактировать и заносить в САТ-программу.

Палажченко о политической топонимике

На сайте Павла Палажченко опубликована крайне познавательная статья об использовании топонимов в политических целях. Оказывается, Западная Германия какое-то время называлась Германская Федеральная Республика и Федеративная Республика Германии.

Всем читать Павла Руслановича >

ABBYY SmartCAT — перспективная среда перевода

О том, что компания ABBYY предлагает бесплатную браузерную среду перевода под названием SmartCAT, я слышал еще в середине 2014 года. Меня уже несколько раз спрашивали, что я о ней думаю, но всё никак не доходили руки внимательно посмотреть, что же это за штуковина. Наконец, свободное время нашлось. Continue reading

История о ценообразовании

История c anekdot.ru, мораль которой полезно держать в голове начинающим фрилансерам.

Вот история, свидетелем которой я был в Западной Германии в 80-х годах прошлого века. Один немецкий профессор (я был на стажировке в одном немецком университете) решил быстро продать свой автомобиль за 2000 марок и выставил его по этой низкой цене на местном автомобильном блошином рынке. К нему довольно долго подходили потенциальные покупатели, осматривали машину, задавали вопросы, но все эти контакты были безрезультатными. И тут к ему подходит один довольно бойкий человек, покупает, как говорится, не глядя машину, меняет на ней ценник и тут же на глазах изумленного профессора перепродает ее за 4000 марок… Этот перекупщик мог правильно оценить стоимость подержанного автомобиля и понимал, что заниженная цена так же плоха для торга, как и завышенная.

Где проверить сочетаемость русских слов?

Коллеги, как вы проверяете сочетаемость слов в русском тексте?

Скажем, мне нужно выяснить, говорят ли по-русски «доставка услуги» (не предлагайте другие варианты — я хочу узнать, является ли сочетание этих слов нормативным, причем с опорой на источник). Может, есть какой-нибудь ресурс на эту тему? В словаре сочетаемости Денисова и Морковкина ничего подобного нет; качество корпуса русского языка тоже не впечатляет.

SDL Trados Studio 2014 SP2: прощай, Java!

SDL наконец-то пристрелила старую клячу: вышел второй пакет обновлений к Studio 2014, где Java больше не используется. Ура! Более того, работа с терминами теперь полностью интегрирована в Studio: появились функции Quick Add New Term (Ctrl+Shift+F2) и Delete this Entry (Ctrl+Shift+Alt+D). По идее, теперь можно обойтись вообще без установки Multiterm.

Другие новшества в SP2: при поиске в ТМ результаты теперь сортируются по дате добавления; буквенно-цифровые сочетания типа ABC-123_M10X30 распознаются как местозаполнители (потребуется переиндексировать старые ТМ); для большинства форматов поддерживается редактирование исходного текста по Alt+F2. Полный список изменений приведен здесь.

Я рекомендую всем пользователям Studio 2014 побыстрее загрузить и установить SP2 — затем «джаву» можно отключить или удалить, так как иметь ее на компьютере небезопасно.

Fresh Eye: автоматизация стилистической проверки текста

Коллеги, вы проверяете свои переводы на отсутствие паронимов и тавтологий? Конечно, для интерфейсных строк в ИТ-проектах это неактуально, но для связных текстов, особенно маркетингового характера, такая проверка очень полезна. И программными средствами такие ошибки искать намного легче. Continue reading