Поиск в Интернете для переводчиков

Это не первое руководство по интернет-поиску и не первое для переводчиков. Однако, посмотрев разные материалы по этой теме, я обнаружил, что где-то рассказывается про тактику поиска, где-то про стратегию, и нигде обо всем вместе. Попробую свести в единый материал все рекомендации по использованию интернет-поиска в работе переводчика.

Опытным интернетчикам многое здесь покажется разжевыванием прописных истин. Не забывайте: нет старых анекдотов, а есть старые люди: для новорожденного каждый анекдот новый.

Как это все работает

Интернет — мощнейший инструмент переводчика. Никакая коллекция офлайновых словарей, не говоря уже о бумажных, не заменит грамотный поиск по Сети. При этом не забывайте, что:

  • не все сайты в Интернете индексируются поисковиками. Некоторые сайты запрещают индексацию, некоторые защищены паролем на вход;
  • не все страницы на сайте индексируются: например, содержимое, встраиваемое с других сайтов, в индекс не попадет;
  • не все слова на странице индексируются: у каждого поисковика есть список стоп-слов, которые не включаются в индекс. О британской группе The the ничего было нельзя найти в Интернете, пока «Гугл» не добавил для нее отдельное исключение в алгоритм индексации.

Поиск внутри и снаружи пузыря

Все крупные поисковики выдают разным пользователям разные результаты поиска. Страница результатов формируется на основе того, что поисковик знает о вас, вашем расположении, истории поиска и истории переходов по страницам. Таким образом, вам показывают не объективную картину мира, а то, что, по мнению системы, вам будет интересно увидеть. Поскольку людям свойственно чаще переходить не по случайным ссылкам, а по тем, что их заинтересовали, это формирует замкнутый круг: на странице результатов все чаще появляется то, что вам и так уже интересно, а все остальное уходит в гетто невидимости. Такая практика адаптивных результатов получила название «информационный пузырь» (filter bubble). Деление информации на «свою» и «чужую» применяется при поисковых запросах на любую тему, но особенно хорошо заметно на общественно-политических материалах.
Как же выполнить поиск за пределами своего пузыря? Для «Гугла» можно добавить в конец поисковой строки суффикс &pws=0, например так (да, pws означает personalized web search). Для «Яндекса» такой параметр мне неизвестен, но, если открыть браузер в режиме инкогнито, любая персонализация сбрасывается — как будто вы впервые зашли на поисковик.

Локализация, то есть учет языка браузера и IP-адреса, оказывает на гугловские результаты не меньшее, а то и большее влияние, чем персонализация. Поиски на google.ru  и google.com существенно разнятся. Поиск английских терминов и контекстов в «русском» Гугле малоэффективен — чтобы перейти на международную версию поисковика, наберите google.com/ncr (no country redirect). В то же время Bing почти не подмешивает русские сайты в общую выдачу, может быть, просто из-за того, что их очень немного в индексе «Бинга».

Оперируем операторами

По умолчанию поисковые системы просто выводят список страниц, содержащих искомые слова. Для управления выдачей у каждой системы есть свой набор команд, или поисковых операторов, которые можно добавить к запросу. Подробное руководство по синтаксису поиска ищите на сайте самих поисковых систем, а я перечислю те операторы, которые могут быть полезны в переводческом поиске.

  • “Текст в кавычках” — наверно, самый известный оператор, выполняющий дословный поиск фразы: слова в найденных страницах будут располагаться в том же порядке и той же форме, что и в запросе. Изначально кавычки были предназначены для поиска цитат, но со временем им нашлось множество применений.
  • Минус (-) удаляет результаты, содержащие указанное слово. Обратите внимание, что перед минусом должен стоять пробел, а между минусом и исключаемым словом пробела быть не должно. Этот оператор удобен для отфильтровывания омонимов: сальса рецепт -музыка -танец. Таким же образом можно исключать из результатов поиска определенные сайты. Например, на сайте Aliexpress/Alibaba.com широко используется машинный перевод — добавьте в запрос -alibaba.com, чтобы убрать его из поисковой выдачи.
  • Звездочка (*) заменяет одно или несколько пропущенных слов во фразе. Этот оператор незаменим в проверке фразовых глаголов при переводе на английский: A quick brown fox jumps * the lazy dog.
  • Оператор site: выполняет поиск по определенному сайту или на сайтах определенной зоны (между site: и адресом сайта не должно быть пробела). Пример: Trados Studio site:slovotolk.com. Это один из самых полезных операторов, способный сократить временные затраты на поиск в разы. Вы переводите на английский и нужно проверить разницу между британским и американским словоупотреблением? Выполните поиск сомнительного слова с фильтром site:.uk. Ищете иноязычные термины на русских сайтах? Site:.ru вам в помощь.
  • Оператор related: перед URL-адресом найдет сайты с похожим содержимым. Скажем, вам нужны сайты на тему защиты информации, а вы знаете только «Касперского»? Попробуйте запрос related:kaspersky.ru.
  • Тильда (~) означает поиск не только по заданному термину, но и по всем его синонимам. Это может быть полезно в сочетании с поиском по сайту (site:). Скажем, вы переводите текст по консалтингу и хотите найти разные рекламные материалы на клиентском портале — попробуйте запрос site:example.com ~consulting.
  • Оператор define: возвращает или, по крайней мере, пытается вернуть словарное определение слова или выражения в запросе: define:horse.
  • Восклицательный знак (!) работает только в «Яндексе» и позволяет искать только точную словоформу, указанную в запросе. Например, по запросу
    !лукоморья найдется только родительный падеж.

Продолжение следует.

Leave a Reply

Your email address will not be published.