вторник, 10 июля 2012 г.

Как искать кандидатов в Яндексе. Boolean Search

Boolean search - это поиск по базам данных с использованием логических операторов (символов), свое название получил от английского математика XIX века Джорджа Буля. К сожалению, что это такое, в России, кажется, мало кто знает среди рекрутеров, и еще меньше специалистов пользуется этой техникой.

Пару лет назад я нашел интереснейший блог Ирины Шамаевой, работающей в Соединенных Штатах, которая писала и пишет заметки об альтернативном виде поиска. В прошлом году мне посчастливилось ознакомиться с русскоязычным блогом Виктора Сороки, которому, среди прочего, была интересна та же тема. Наконец, Виктор поделился ссылкой на блог Boolean Black Belt еще одного специалиста по поиску - Глена Кэти. Тем не менее тема довольно новая именно для России, а ведь этот инструмент может не только разнообразить монотонный процесс поиска кандидатов, но и стать полезным источником поступления новых кандидатов на актуальные вакансии. В своих постах я постараюсь почаще поднимать тему поиска с помощью логических операторов, давать новые примеры и задачи.

Итак, представьте, вы работаете корпоративным менеджером по подбору персонала или работаете рекрутером IT-практики в кадровой компании. Задача подбора консультантов SAP должна быть вам знакома, и вы знаете, как сложно их искать. Из любого источника вы должны выжимать максимум, чтобы найти кандидатов. В данном посте я покажу, как найти консультантов SAP в поисковой системе Яндекс.

Давайте начнем! Начнем с самых простых операторов.


Если вы хотите найти какое-либо слово, имеющее много синонимов, то вас выручит оператор | - прямая черта, окруженная пробелами. Пробуем: забиваем в поисковую строку erp | sap | oracle и получаем в результате страницы, на которых присутствует хотя бы одно из этих слов.


Идем дальше. Вы, наверно, замечали, что при обычном поиске словосочетания без использования операторов в результатах отображались страницы, где эти слова просто присутствовали, т.е. они могли быть несогласованны между собой, а для Яндекса было важным простое наличие этих слов в тексте. При поиске словосочетания могут помочь кавычки - “”. Пожалуй, кавычки являются наиболее известным оператором, которым пользуются многие, даже те, кто не знает про Boolean search.  Например, мы ищем консультант erp, ставим запрос в кавычки и получаем в выдаче страницы, где есть это словосочетание. Действий произведено минимум. На скриншотах можно увидеть разницу в результатах выдачи, и при этом нужно учесть, что с каждой последующей страницей разница становится все показательней.



Если вам важно, чтобы искомые слова находились в рамках одного предложения, то следует использовать другой оператор - & (амперсанд, в английском языке означающий союз “и”). В ответ на запрос консультант & erp (через пробелы) будут получены страницы, в которых эти два слова встречаются в рамках одного предложения.

Исключить ненужные слова из поискового запроса можно с помощью оператора ~~ (символ называется тильда). Поисковый запрос будет выглядеть как консультант erp ~~ oracle, а в результате будут показаны страницы, где есть слова консультант erp и не будет встречаться слово oracle. Часто требуется, чтобы слово встречалось не в том же предложении, что и главные искомые слова, а в другой части документа. В этом случае следует использовать одиночную тильду. Смешной пример из Яндекса гласит: если вы ищете информацию о некой госпоже Кузькиной, то более релевантные результаты даст запрос Кузькина ~ мать, который ищет страницы, включающие такие предложения со словом Кузькина, в которых одновременно нет слова мать.


Чтобы строить сложные запросы вам просто необходимо знать оператор круглые скобки - (). Скобками следует выделять группу элементов, относящихся к одному параметру поиска. Чтобы найти страницы, ни в одном предложении которого слова не встречаются рядом, но при этом могут быть в соседних предложениях, напишите запрос так: консультант ~~ (консультант & oracle).


Кроме поиска по содержанию страниц-документов, Яндекс предоставляет возможность атрибутивного поиска. Под атрибутами понимаются внешние данные документа - домен, на котором он расположен, тип документа, язык, на котором он написан, его дату и другое. В таблице можно увидеть основные элементы атрибутивного поиска, которые используются чаще всего.


ОператорЗначениеПример запроса
title:Ограничение по слову в заголовке документа.erp title:резюме
site:Ограничение по конкретному сайту.консультант sap site:narod.ru
inurl:Ограничение по URL. Поиск ограничивается группой страниц, URL которых содержит заданный фрагмент.консультант erp inurl:yandex
mime:Ограничение по типу файла:
  • PDF (Adobe Portable Document Format),
  • DOC (MS Word),
  • PPT (MS PowerPoint),
  • XLS (MS Excel),
  • RTF (Rich Text Format).
резюме sap mime:doc
lang:Ограничение по языку документа:
  • русскому (ru),
  • английскому (en),
  • французскому (fr),
  • немецкому (de).
erp lang:en

При использовании данных операторов нужно учесть, что после двоеточия ставится сам параметр, и не должно быть никакого пробела.

На самом Яндексе вы можете найти список других логических операторов и примеры их использования. Я же показал основные логические операторы, которыми пользуюсь чаще всего, и теперь можно попробовать написать первый сложный поисковый запрос. Вы помните, нам необходимо найти консультантов SAP.


Мы знаем, что многие кандидаты используют в качестве названия документа слова Резюме, CV, Curriculum Vitae, Resume. Так же знаем, что нам нужно найти консультантов SAP. Разумеется, самыми распространенными типами файлов резюме являются Word и PDF. Создаем простой сложный запрос title:резюме консультант sap (mime:doc | mime:pdf). Мы хотим увидеть файлы в форматах Word и PDF с названием документа Резюме и встречающимися словами консультант и SAP, и Яндекс находит для нас первые три резюме.

И еще несколько слов об общих правилах поиска в Яндексе (да и во всех поисковиках). Нужно помнить, что все слова, которые вы пишете в поисковой строке, по умолчанию находятся во всех морфологических формах, то есть в любом склонении и числе. Чтобы найти точную формулировку слова, вам необходимо просто поставить восклицательный знак перед словом (без пробела). Например, при поиске слова рекрутер вы получите страницы, на которых есть это слово в разных формах - рекрутер, рекрутеру, рекрутеры и т.д. Если же в поисковой строке вы наберете !рекрутер, в результатах можно будет увидеть страницы со этим словом в именительном падеже единственного числа. Если одна из форм слова совпадает с одной из форм другого слова, то для исключения лишних результатов нужно поставить перед искомым словом два знака восклицания. Пример из самого Яндекса: запрос !!день найдет все формы слова — дня, дню, днем и др., и не найдет форм слова деть (одна из которых совпадает со словом день). Так же не надо забывать, что по умолчанию Яндекс не ищет предлоги из вашего запроса и не учитывает регистр (т.е. с большой или маленькой буквы вы написали свой запрос) слова. Пожалуй, все для первого поста.


В Яндексе вы сможете найти готовые резюме далеко не любых специалистов, конечно, а специалистов, хорошо знакомых с компьютером, имеющих свой собственный сайт или хранилище, где они хранят открытыми свои документы (тот же Google Docs). При поиске других документов ограничений практически нет. Со временем результатов поиска будет все больше и больше. Я уверен, что владение техникой Boolean search должно стать одним из главных навыков рекрутеров и HR-разведчиков, таким же важным, как скорость печати для секретарей или владение Excel для бухгалтера.
Blog Widget by LinkWithin

7 комментариев:

  1. Максим, безуспешно ищу кнопки "Like" и "Share":)
    Добавите?

    ОтветитьУдалить
  2. Спасибо, Виктор! А кнопки от AddThis разве не отображаются у вас? Они под постом и блока linkwithin. И на главной странице должны быть в общей ленте постов.

    ОтветитьУдалить
  3. Сообразил. Вы смотрите с мобильного, на нем внешние гаджеты не хотят отображаться. Не хотел я бардак из кнопок устраивать, но, видимо, придется. Подумаю. Спасибо!

    ОтветитьУдалить
  4. Здраствуйте! Спасибо большое за ценнейшую информацию!:)
    Один небольшой вопрос по приведенному Вами примеру: "Чтобы найти страницы, ни в одном предложении которого слова не встречаются рядом, но при этом могут быть в соседних предложениях, напишите запрос так: консультант ~~ (консультант & oracle)" - в данном случае разве двойная тильда не исключает слова "консультант & oracle" из запроса? то есть консультант останется, так как в начале запроса указан, а часть в скобках же просто исключается? Я правильно понимаю?

    ОтветитьУдалить
    Ответы
    1. Jozephine, вы не учитываете оператор скобки. Двойная тильда в этом случае исключает не отдельные слова "консультант" и "oracle", а возможность появления этих слов рядом в пределах одного предложения. Чтобы исключить несколько слов из поиска нужно ставить двойную тильду перед каждым из них консультант ~~ sap ~~ oracle
      Спасибо за комментарий!

      Удалить
  5. Максим, спасибо огромное за полезную информацию!
    Хотелось бы у Вас уточнить, возможен ли поиск резюме кандидатов, проживающих в США. Если да, как это отобразить в формуле?
    Заранее спасибо :)

    ОтветитьУдалить
    Ответы
    1. Диана, в США специалисты гораздо чаще размещают свое резюме в открытом доступе, количество резюме должно быть гораздо больше. Разумеется, для поиска по США лучше использовать Google или Bing, операторы поиска там немного отличаются.
      Рекомендую обратиться к группе Boolean strings в LinkedIn, там вы найдете очень много примеров подобных запросов. И не всегда можно будет создать работающий запрос простой заменой на нужные слова.

      Удалить