среда, 7 ноября 2012 г.

Как искать кандидатов в Google. Boolean Search

Наконец, настало время вспомнить старую тему про использование логических операторов в поисковых системах и чем они могут помочь рекрутеру. Эту тему я начал в одном из своих самых первых постов и посвятил поиску в системе Яндекс. Новый пост расскажет о возможностях поиска в самой популярной поисковой системе мира - Google.

Напомню принцип Boolean search для поисковых машин: с помощью определенных символов, так называемых логических операторов, возможен очень точный поиск, его использование позволяет проработать огромное количество информации, размещенное в сети Интернет, и получить релевантные результаты. Для рекрутеров Boolean search - еще один инструмент поиска кандидатов. Это мы уже проходили.
Основные трудности, с которыми мы столкнемся при изучении Google Boolean Search, станет желание использовать логические операторы, используемые для поиска в Яндексе (или другой поисковой системе). Да, символы в Google и Яндекс отличаются, некоторые идентичные будут подталкивать использовать неправильные операторы для поиска. Ниже я приведу таблицу по операторам в двух наиболее популярных поисковых системах в России.


Поисковая система Google по умолчанию использует некоторые свои правила, чтобы представить наиболее релевантные результаты. С одной стороны, это хорошо, так можно избежать проблем “глупых запросов”. С другой стороны, результаты могут быть неподходящими как раз из-за этих правил. Часто употребляемые артикли, предлоги, союзы игнорируются, на странице результатов могут присутствовать не все написанные в запросе слова (слова, которые Google посчитает незначительными, будут исключены), поиск может проводится по синонимам, как правило, знаки препинания и символы игнорируются. Лишь некоторые из символов (#, @, _ и другие) относительно недавно стали равноправными со словами.
 
А теперь перейдем к простейшим операторам. Как и в Яндексе кавычки “” показывают поисковой системе, что вы хотите найти точное слово (не синоним) или точную фразу (не текст, где встречаются все указанные в запросе слова). Так лучше всего искать уникальные фразы, к примеру, чтобы узнать имя пользователя LinkedIn вне вашего круга: копируем название должности и компании (то, что мы видим в профиле пользователя) и заключаем их в кавычки.


Оператор OR позволяет задавать поиск по синонимам, при использовании оператора AND мы получаем страницы с наличием всех указанных слов. Если мы хотим найти инженера, знакомого с одной из систем мониторинга, мы забиваем в поисковую строку Nagios OR Zabbix OR Cacti. Чтобы выполнить поиск по одной из необходимых фраз, заключите их в кавычки: “инженер по системам мониторинга” OR “системный инженер”. Если мы хотим найти инженера, работавшего со всеми этими системами, пишем Nagios AND Zabbix AND Cacti и в результатах получаем документы, в которых встречаются все эти слова.


Чтобы исключить возможность присутствия слова на страницах результатов поиска следует поставить перед этим словом знак минуса -. Это может быть полезно, когда слово имеет несколько значений. Этот оператор можно использовать также и для исключения результатов с определенного сайта. Нужно просто поставить знак минуса перед другим оператором без пробела (он аналогичен с оператором в Яндексе): -site:moikrug.ru. Так вы не найдете страницы с сайта Мой круг в результатах поиска.


Оператор site:, как я уже сказал, отвечает за то, чтобы поиск проводился исключительно в рамках определенного сайта. Мы помним, как можно узнать полное имя контакта в LinkedIn. При возникновении трудностей простое указание site:linkedin.com позволяет получить необходимый результат. Проводить поиск можно и по определенным  доменным зонам. Домены верхнего уровня .org, .edu, .gov или страновые домены .ru, .de, .uk и другие. Ограничение по доменам помогает, к примеру, проводить географически привязанный поиск.


Еще один оператор - inurl: - позволяет искать веб-страницы, в адресе которых используется определенное слово. Часто пользователи при создании своего персонального сайта загружают свое резюме, а адрес страницы вполне может содержать слово resume или cv. Таким образом, мы пишем запрос так: inurl:resume “системный инженер”.


Очень важным оператором является звездочка *. Звездочка помогает заполнить пустые места в запросе, если вы не помните необходимую фразу или намеренно даете поисковой системе варианты результатов. С оператором, однако, следует быть осторожным (как и с другими, впрочем) - на запрос с цифрами 44 * 26 Google выдаст результаты операции умножения и не будет использовать звездочку для заполнения пустых мест.


Как и в Яндексе, скобки () позволяют сгруппировать слова в запросе.
Парными операторами являются intitle: и intext:. Использование первого позволяет искать по слову в поле названия веб-страницы. Второй оператор показывает веб-страницы, на которых искомое слово находится в самом тексте документа. Опять же по опыту можно сказать, что часто кандидаты озаглавливают свои резюме словом “Резюме” или “Curriculum Vitae”, что можно использовать при их поиске: intitle:резюме.


Наконец, очень полезным для поиска резюме является оператор filetype:. Он позволяет проводить поиск документов определенного формата. Нам скорее всего будут интересны файлы DOC и PDF, форматы, в которых чаще всего сохраняют резюме кандидаты.


Я перечислил далеко не все логические операторы, используемые в Google, но это основные, которые могут быть полезными именно специалистам по поиску персонала. А теперь обещанная таблица сравнения некоторых операторов в Яндексе и Google с комментариями.

ЗначениеGoogleЯндекс
Поиск по точной фразе“”“”
Поиск по любому из словOR или ||
Исключение слова из результатов поиска-
Может использоваться в т.ч. и для исключения сайтов
~~
Ограничение по слову в заголовке документа.intitle:title:
Ограничение по конкретному сайту.site:site:
Поиск по домену осуществляется с помощью оператора domain:
Ограничение по URL. Поиск ограничивается группой страниц, URL которых содержит заданный фрагмент.inurl:inurl:
Оператор url: требует полного URL
Поиск с пропущенным словом*
Может использоваться в т.ч. и для пропущенных элементов URL
*
Ограничение по типу файла:
  • PDF (Adobe Portable Document Format),
  • DOC (MS Word),
  • PPT (MS PowerPoint),
  • XLS (MS Excel),
  • RTF (Rich Text Format).
filetype:
mime:

Совершенно случайно наткнулся на видеоредактор от Google, который компилирует видео по поисковым запросам, и вот, что у меня получилось.
В видео показаны рассмотренные мной примеры работы операторов, последний пример - простейший запрос для поиска резюме специалистов по системам мониторинга.

И последнее. Как и в Яндексе, в Google есть страница расширенного поиска, позволяющая производить поиск без знаний логических операторов. С одной стороны, функция очень полезная, с другой стороны, страница расширенного поиска не дает возможностей поиска через обычную поисковую строку с использованием логических операторов. Посмотрите сами.


Страница расширенного поиска находится по этому адресу. Ссылку Advanced search можно найти вверху страницы результатов первоначального поиска в функциях поиска или внизу страницы результатов первоначального поиска, под номерами страниц.




Расширенный поиск позволяет применить поисковые фильтры по ключевым словам, языку страницы, региону, времени обновления, сайту, месту расположения ключевого слова, типу файла и другие.
Этого вполне достаточно, чтобы заменить логические операторы. Однако я бы рекомендовал все же работать именно с операторами хотя бы потому, что они пригодятся для работы в LinkedIn и других ресурсах, в которых внутренний поиск позволяет применить технику Boolean.

Отличной поисковой выдачи!
Blog Widget by LinkWithin

4 комментария:

  1. Попробовал - действительно мощный и полезный инструмент. Буду теперь пользоваться!

    Про LinkedIn не знал, что там работают логические операторы. Это большущий плюс AND улучшение качества выдачи.:)

    Максим, очень жду новых постов про boolean search. Открываешь глаза!

    ОтветитьУдалить
    Ответы
    1. Спасибо, Лёша! В LinkedIn Boolean search работает отлично - эта тема одного из следующих постов. А в целом такой поиск уже должен был стать стандартным инструментом.

      Удалить
  2. Ответы
    1. Надеюсь, в положительном смысле) Спасибо за комментарий, Александр!

      Удалить