Поиск в Интернете для переводчиков — часть 2

Первая часть здесь.

Стратегия поиска

Движение к заранее намеченной цели, очевидно, эффективнее бесцельного блуждания. Это же применимо к интернет-поиску. Перед тем как нажать Enter в поисковой строке, хорошо бы представить себе, что в итоге вы хотите найти:

  • определение термина?
  • узус — выяснить, где используется термин А, а где — термин Б?
  • общее описание незнакомой технологии или процесса?
  • просто ответ на конкретный вопрос?

Подумайте, на сайте какого типа может найтись нужная вам информация: то ли в словаре, то ли на форуме, то ли на официальном сайте. Это ускоряет фильтрацию ненужных результатов и помогает выстроить стратегию поиска.

  • Народный метод «русское ищем в “Яндексе”, английское — в “Гугле”» может сработать для простых поисковых запросов, а вот для поиска чего-то более сложного (иначе зачем вы всё это читаете?) потребуется более сложный подход. Например, майкрософтовскую терминологию очень качественно ищет Bing.
  • Поиск по конкретному сайту (отраслевому, корпоративному, по словарю и т. п.) намного эффективнее поиска по всему Интернету. Скажем, термины в области телекоммуникационного оборудования можно искать на сайте Nag.ru, а страховую лексику — на insur-info.ru.
  • На сайте Onelook.com есть великолепный обратный словарь, помогающий составить список терминов по нечетким критериям. Как вы будете искать певчих птиц с синим оперением? Сравните запрос songbird blue plumage в Onelook и в Google: «Уанлук» нашел несколько десятков птиц, а «Гугл» на первой странице показал только bluebird и blue jay. 
  • Кстати, о птичках. Названия животных, растений и вообще любых биологических видов традиционно переводились через латынь: нужно было выяснить научное биномиальное название искомого вида, а потом найти русское общеупотребительное соответствие этому латинскому названию. Сейчас этот метод вытеснен «Википедией»: вы просто открываете иноязычную статью о животном и через блок ссылок «На других языках» переходите к русскоязычной версии этой статьи. Это не исключает проверки через латинское название — оно присутствует во всех энциклопедических статьях об организмах.
  • Когда в переводимом документе встречается незнакомый механизм (вообще, любая материальная вещь), поиск по картинкам помогает быстро в нем разобраться. Как там говорится в пословице: лучше один раз увидеть, чем сто раз прочитать непонятное описание. Если вы хорошо знаете русскоязычную терминологию в какой-то области, но «плаваете» в иноязычной, поиск незнакомого термина по картинкам сразу позволит понять, что за штуку имеет в виду автор текста. Нечасто, но встречается и обратная задача: по картинке понять, что же на ней изображено и как это называется. В этом случае поможет обратный поиск по картинкам: в «Яндексе», «Гугле» или TinEye.
  • Чтобы найти сайты, аналогичные уже известному, воспользуйтесь SimilarSiteSearch или поисковым оператором related.
  • Языковые корпусы — как конкорданс в ТМ — позволяют искать по базе параллельных двуязычных текстов. Если вам нужно узнать узус или выяснить различия между контекстами, начните с поиска не по всему Интернету, а по корпусам:
    • TAUS — ветеран интернет-корпусов. В последнее время его вытесняют более удобные системы, но для некоторых технических отраслей база TAUS не имеет аналогов.
    • Linguee — мой любимый корпус, быстро растущий в объеме. По общественно-политическим темам текстов больше, по техническим — меньше, но есть, например, коллекция инструкций по эксплуатации.
    • НКРЯ — это гигантский объем художественных и публицистических текстов и очень мало всего остального. Есть параллельные тексты современных англоязычных писателей.
    • Reverso — сравнительно новый сайт, объединяющий корпус, материалы по изучению языков и что-то еще. Объем технических текстов приближается к Linguee.

Если в результате запроса найдено слишком мало страниц:

  • В первую очередь, проверьте правописание и синтаксис запроса.
  • Возможно, в запросе слишком много терминов. Удалите несколько слов из поискового запроса.
  • Возможно ваш поисковый запрос — окказионализм. Уберите кавычки или переформулируйте запрос с использованием синонима.

Пример: в тексте встретилось выражение advanced tenacious threat. Запрос в кавычках дает три ссылки на один сайт — что-то здесь не так. А запрос без кавычек на пятом месте выдает статью «Википедии» Advanced persistent threat, что и является правильным написанием термина.

Если в результате запроса найдено слишком много нерелевантных страниц:

  • Ограничьте область поиска, добавив уточнение. Например, по запросу semaphore будут, в первую очередь, найдены сайты по флажковой (семафорной) сигнализации, а запрос semaphore computing или semaphore programming сразу выводит на понятие семафора в программировании.
  • Ограничьте область поиска, исключив определенные области. Хороший пример — приведенный выше запрос сальса -музыка -танец.
  • Поставьте искомые слова в кавычки. Запрос quality criteria” более узок, чем quality criteria, так как во втором случае слова могут располагаться в разных частях страницы.
  • Просмотрите вторую, третью, четвертую страницу результатов, особенно если поиск был в пределах информационного пузыря.

Переведи то, не знаю что

Самый сложный случай — это когда в документе без контекста встречается какая-то неведомая ерунда. В этом случае вначале полезно оценить, чем она может быть: устойчивым словосочетанием, свободным словосочетанием, опечаткой или именем собственным. Погуглите целиком непонятное выражение в кавычках:  если точное совпадение не встречается совсем или дает очень мало результатов — значит, это окказионализм, свободное словосочетание; если нашлось много релевантных результатов — значит, это устойчивое терминологическое выражение; если «Гугл» предлагает исправить ошибку — оцените это предложение (часто предлагается исправить правильное на неправильное). Наконец, названия компаний и прочие имена собственные можно выявить по контексту страниц, на которых эти слова находятся поиском.

Для поиска перевода терминологических словосочетаний очень эффективен метод «плюс и»: иноязычное словосочетание заключается в кавычки, после чего в запрос добавляется . Таким образом, выполняется поиск страниц, на которых встречается искомый термин в русском контексте, — с большой вероятностью там найдется перевод этого термина. Можно также искать иноязычные слова в зоне ru (site:.ru) или на русских страницах с суффиксом &lr=lang_ru. Мне «плюс и» нравится больше.

Если вы знаете, как перевести одно из слов в терминологическом словосочетании, вставьте этот перевод вместо «и». Например, в выражении key agreement первое слово — точно «ключ». Попробуйте выполнить запрос “key agreement” +ключ. На первой же странице вы увидите несколько вариантов перевода: «соглашение о ключах», «согласование ключей», «выработка общего ключа» и даже просто «обмен ключами».

Для выбора из ряда правдоподобных вариантов каждый из них нужно отдельно поискать (уже без оригинального выражения) и оценить контексты, достоверность и надежность сайтов, использующих русский термин. Допустим, вы хотите выбрать один из вариантов перевода key agreement из предыдущего примера. Для этого воспользуемся поиском по сайту одного из крупнейших российских криптопровайдеров cryptopro.ru. Видно, что запрос соглашение о ключах site:cryptopro.ru выдает лицензионные соглашения и прочие нерелевантные страницы, а запрос согласование ключей site:cryptopro.ru возвращает именно то, что нужно. Это хороший аргумент за использование этого термина.

Достоверность

  • Не забывайте, что ранжирование сайтов на странице результатов не отражает уровень их надежности или достоверности. Первым результатом поиска, полностью соответствующим поисковому запросу, может оказаться полная чушь.
  • Количество результатов совершенно не гарантирует правильности словоупотребления или написания. Сколько найдется результатов по запросу исчо?
  • Оцените надежность источника, хотя бы бегло. Если вы ищете узус по теме потребительского кредитования, сайт «Сбербанка» — более достоверный источник, чем «Ответы Mail.ru».
  • Оцените качество сайта, особенно если это узкоспециализированный ресурс. Кривая верстка и орфографические ошибки на главной странице чаще всего означают, что и содержимое здесь соответствующего качества.
  • Старайтесь формулировать запросы так, чтобы в них не содержался ответ. Например, запрос height of tallest man was 7.5 feet плох тем, что поисковик легко найдет вам подтверждение самых невероятных фактов. Намного лучше искать просто height of tallest man или хотя бы height of tallest man was *  feet.
  • Если при поиске английского узуса на первых позициях появляются англоязычные тексты на русских сайтах — значит, вы ищете русизм.

Наконец, термин, найденный в Интернете, не стоит сразу вставлять в перевод. Проверьте его корректность другими запросами: убедитесь, что он используется в контекстах, аналогичных переводимому документу, и что вы выбрали лучший из найденных кандидатов.

Пара слов о безопасности

  • Не переходите бездумно подряд по всем сайтам в выдаче. Если аннотация (blurb) на странице результатов выглядит подозрительно, эту ссылку лучше пропустить.
  • Рекламные сети сравнительно слабо защищены: были случаи, когда вредоносный код вставлялся прямо в объявление, которое показывали сотни и тысячи партнерских сайтов. Отключение рекламы и скриптов повышает и скорость, и защищенность браузера. Хорошей практикой будет использование отдельного браузера для регулярного поиска, и отдельного — для банков, почты и подобных доверенных сайтов. В этом случае в браузер для поиска стоит установить расширение-блокировщик: NoScript, uBlock Origin или их аналог.

Рекомендуемые ссылки

Ищите и найдете!

4 thoughts on “Поиск в Интернете для переводчиков — часть 2

  1. Katya Filatova

    Вот же спасибо тебе, добрый человек Максим! (И привет, кстати.))

    Reply

Leave a Reply

Your email address will not be published.