Начнём с важности тега для Ваших посетителей. Как мы уже говорили в прошлых статьях, для получения выгоды от оптимизации и продвижения, сайт, в первую очередь, должен быть интересным людям, а не поисковым роботам. Говоря проще, title должен отображать суть страницы и в 15 словах рассказывать о чём эта страница. Title отображается в результатах поиска, а значит должен привлекать посетителя. Конкретный пример.
Компания, занимающаяся продажей пластиковых окон. Title “Главная страница” совершенно не отражает суть деятельности и не мотивирует человека нажать именно на эту ссылку. Другой пример гораздо лучше. Кроме краткого описания своей деятельности компания оставила телефон. Пользователь, увидев такой результат в выдаче Яндекса, обязательно посетит сайт.
Ещё лучше работает включение в тег названия компании или сайта. Многие пользователи пробегают глазами страницу выдачи в поиске трастовых слов. Приведём пример. Вы ищите пластиковые окна, которые хотели бы установить в Вашей квартире. Вы не ищите сайты, рассказывающие о процессе изготовления этих окон, о материалах из которых готовится стекло и о истории популяризации этих самых пластиковых окон. Вам нужна компания, которая занимается их установкой. Какой из сайтов Вы выберете из поисковой выдачи?
- Пластиковые окна
- Википедия – Пластиковые окна
- Пластиковые окна. Компания Окна.Ру
Очевидно, что третий сайт наиболее подходящий под наши запросы. Название компании или сайта даёт пользователю понять куда именно он переходит, что впоследствии может поднять процент возвратов.
Ключевые слова
Оптимизируя страницу под определённые ключевые слова и фразы, в первую очередь включите их в тег title. О важности ключевиков в теге заголовка говорилось уже сотни раз. Напомним лишь некоторые важные моменты, которые многие почему-то упускают.
1. Поисковые системы уделяют наибольшее внимание тем словам, которые указаны в теге title страницы. Таким образом, повышается её релевантность. Что, в свою очередь, даёт больше шансов на эффективное продвижение без лишних финансовых затрат.
2. Используйте разные теги title для различных страниц. Для разделения похожих страниц используйте названия разделов, страниц, каталогов и т.д. Например, лучше использовать title “Изготовление пластиковых окон, сраница 2 из 10“, чем просто “Изготовление пластиковых окон“. В первую очередь, это необходимо в целях борьбы с дублированием контента и попаданием сайта в “Дополнительные результаты” поисковой системы Google.
3. Не переусердствуйте с ключевыми словами. Придерживайтесь нормы. Длинное описание в теге title не только приведёт к определённым мерам со стороны поисковиков, но и будет раздражать Ваших посетителей. Используйте в теге 1-2 ключевые фразы. Если есть необходимость в большем – создайте ещё одну страницу и прооптимизируйте её. Запомните – title должен быть, в первую очередь, удобно читаемым для пользователей.
4. Старайтесь не использовать в теге слова-мусор. Это предлоги, частицы – о, об, я, не, до, нет, и… Их использование не критично (поисковые системы их игнорируют), но всё же лучше от них отказываться.
Немного теории
В 1970 и 1980 годах Стивен Робертсон и Карен Спарк Джоунс и другие ученые разработали вероятностную модель, которую в будущем доработали и стали использовать ведущие поисковые системы. Модель была доработана до функции ранжирования в информационном поиске и применялась для упорядочивания документов по их релевантности (впрочем, она применяется поисковиками и в наши дни). Функция получила название Okapi BM25, по названию английской поисковой системы Okapi.
Okapi BM25, как и все её модификации, базируется на TF-IDF функциях ранжирования, которые в различных своих модификациях широко применяется как Google, так и Яндексом.
TF-IDF можно описать следующим образом:
TF-IDF (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален количеству употребления этого слова в документе, и обратно пропорционален частоте употребления слова в других документах коллекции.
Объясним на примере. Если на странице 1000 слов, из которых 30 – слово “хомяк”, то получаем, что частота слова “хомяк” в документе равно 0,03 (30/1000). DF определяется как количество страниц, содержащих слово “хомяк” разделенное на количество всех страниц. То есть, если страниц, содержащих слово “хомяк”, 2 000 000, а всего страниц 5 000 000 000 (подразумевается количество страниц в интернете в целом), то DF = 0,0004 (2 000 000/5 000 000 000). Окончательный расчёт веса слова подразумевает разделение TF на DF (или умножение на IDF). В нашем случае вес слова “хомяк” TF-IDF равен 75 (0,03/0,0004).
Вернёмся к функции BM25. Наиболее распространённую форму этой функции можно описать следующим способом:
Пусть дан запрос Q, содержащий слова q1,…,qn. Релевантность документа D запросу Q высчитывается следующим образом:
где f(qi,D) есть частота слова (TF), qi в документе D, | D | есть длина документа (количество слов в нём), а avgdl — средняя длина документа в коллекции. k1 и b — свободные коэффициенты, обычно их выбирают как k1 = 2.0 и b = 0.75. IDF(qi) есть обратная документная частота (IDF) слова qi.
Функция BM25 в её классическом виде оценивает “важность” страницы, исходя из встречаемости ключевых слов без учёта взаимоотношений между страницами (то есть ссылок). В настоящее время поисковыми системами используется модификация этой функции под названием BM25F. Она учитывает другие параметры, такие как заголовки, околоссылочный текст, количество ссылок и т.д. Каждому из этих параметров присваивается своя степень значимости, которая влияет на итоговый результат функции ранжирования.