В свое время в разделе помощи Яндекса, посвященной Яндекс.Серверу (приложению для поиска в корпоративных сетях и поиска по сайту), содержался многостраничный документ «Яндекс.Сервер. Руководство по установке и эксплуатации» (до сих пор отдельные версии этого документа для различных сборок, закачанные на сторонние сайты, можно найти в глубинах сети). Там довольно подробно описывался язык запроса, который был несколько шире задокументированного языка запросов для большого поиска по вебу. Но что самое интересное, многие операторы из руководства Яндекс.Сервера работали (и до сих пор работают) в большом поиске. Рассмотрим самые, на мой взгляд, интересные из них.
Оператор intext.
Пожалуй, наиболее интересный оператор. Выдача с его использованием не пустая и отличается от выдачи без его использования:
Заявлено, что этот оператор используется для поиска только в текстах документов. И это действительно похоже на правду. Например, документы, найденные по ссылке, этим оператором, не ищутся:
То есть, при ранжировании по сути игнорируется анкор-файл. Этот оператор может быть весьма полезен при исследовании текстовой релевантности документов.
Оператор inlink.
Заявлено, что оператор используется для поиска в ссылках на документы. Однако, к большому сожалению, если этот оператор применять целиком ко всей поисковой фразе, выдача пуста:
Выдача становится непустой, если хотя бы одно слово запроса вынести из-под данного оператора:
Однако трудности с интерпретацией полученных результатов сводят к минимуму полезность этого оператора.
Оператор inpos.
Выдержка из руководства: «Специальное имя атрибута для указания точного диапазона позиций, в которых должен находиться предыдущий лист или скобка. Имеет синтаксис inpos:N1..N2, где N1 и N2 — целые положительные числа». Применение различных интервалов к запросу дает любопытные эффекты. Например, при достаточно малом диапазоне выдача сужается до документов, содержащих ключевые слова только в адресе документа:
Оператор linkint.
Сильно ужатая версия былого оператора link, осуществляющая поиск внутренних ссылок на определенный документ. Однако может быть полезен при решении определенных задач.
Оператор anchorint.
Аналогичным образом ужатая на внутренние ссылки версия отмененного оператора anchor. Осуществляет поиск по документам, содержащих ключевую фразу в текстах своих ссылок, ведущих на внутренние страницы того же сайта. Любопытна конструкция, объединяющая операторы linkint и anchorint (аналогичным образом в свое время можно было объединить в одном запросе операторы link и anchor), и позволяющая найти все внутренние страницы сайта, ссылающиеся на данную страницу заданной ключевой фразой:
Менее любопытны, но на мой взгляд, заслуживают упоминания операторы, позволяющие искать по определенным фрагментам текста документов:
• address – поиск внутри текстов, заключенных в теге
• quote - поиск внутри текстов, заключенных в теге