Как провести аудит контента сайта

В этой статье представлена процедура, используемая для проведения аудита контента. Возможно, она не слишком подходит для постоянного аудита, но мы постарались сделать ее достаточно гибкой с точки зрения выбора способа анализа и интерпретации данных и предоставления рекомендаций на их основе. Для различных типов веб-сайтов, независимо от их бизнес-целей, основные этапы процесса остаются примерно теми же: собрать все URL контента сайта и выбрать необходимые вам данные о каждом URL. Затем проанализировать данные и предоставить рекомендации для каждого URL контента. Теоретически это просто. На практике, однако, это может быть обескураживающим занятием, если у вас нет плана или отлаженной процедуры. Мы надеемся, что к концу этой статьи у вас появится хороший задел в обоих направлениях.

 

Содержание

Цели аудита контента

Пример аудита контента

Краткий обзор процедуры

Наши документы

Сценарии аудита контента

Электронная таблица-панель управления аудитом контента

Контентная стратегия

Рекомендуемые источники для экспорта данных

Пошаговый пример применения нашей процедуры

Шаг 1: оценка ситуации и выбор сценария

Шаг 2: сканирование сайта

Шаг 3: импорт адресов и запуск инструмента

Шаг 4: импорт результатов работы инструмента в панель управления

Шаг 5: импорт данных Google Инструментов для веб-мастеров (GWT)

Шаг 6: проведение исследования ключевых слов

Шаг 7: связывание данных ключевых слов

Шаг 8: время провести анализ и принять какие-нибудь решения!

Шаг 9: анализ «пробелов» в контенте и прочие полезные процедуры

Шаг 10: завершение написания стратегического документа аудита контента

Ресурсы, ссылки и постскриптумы…

 

Цели аудита контента

Аудит контента может помочь в самых различных ситуациях, а его технология может быть адаптирована для любого заданного сценария. Ниже я подробнее напишу о возможных «сценариях» и о том, как с ними работать. А сейчас — перечень того, чего можно достичь с помощью аудита контента.

  1. Определить наиболее эффективный способ избежать наказания Panda
  2. Определить, какие страницы нуждаются в написании контента/редактировании
  3. Определить, какие страницы необходимо обновить и сделать более актуальными, а также определить их приоритет
  4. Определить, какие страницы необходимо консолидировать в связи с частично совпадающими темами
  5. Определить, какие страницы необходимо удалить с сайта и каким образом
  6. Задать приоритеты контента, исходя из различных показателей (например, посещения, уровень конверсии, авторитетность страницы, оценка риска Copyscape…)
  7. Определить «пробелы» в контенте, что позволит найти новые идеи контента и составить тематический план
  8. Определить, какие страницы получают поисковый рейтинг и по каким ключевым словам
  9. Определить, какие страницы «должны» получать поисковый рейтинг и по каким ключевым словам
  10. Найти самые сильные страницы домена и разработать стратегию их эффективного использования
  11. Раскрыть потенциал контент-маркетинга
  12. Провести аудит и создать перечень контент-активов при покупке/продаже веб-сайта
  13. Определить контент-активы нового клиента (т. е. то, с чем вы должны работать)
  14. И многое другое…

 

Пример аудита контента

Предыдущая версия процедура аудита контента использовалась специалистом Inflow в области технической SEO Риком Рамосом при выполнении в прошлом году аудита контента для Phases Design Studio, которые любезно позволили поделиться информацией об этом. После инвентаризации всех URL контента в домене Рик составил план по ускорению индексирования (noindex/follow) и удалению из файла sitemap их сайта многих старых постов блога, которые уже не являются актуальными и не стали кандидатами на участие в обновленном контенте. На сайте также имелся ряд посадочных страниц кампаний, которые создавались с 2006 года. Жизненный цикл этих страниц, как правило, не превышает нескольких месяцев, но они не были удалены с сайта или из индекса Google. Рик порекомендовал заменить эти страницы на переадресацию 301 на несколько постоянных посадочных страниц, которые будут обновляться каждый раз, когда стартует новая кампания — эта тактика особенно хорошо подходит для сезонных страниц сайтов электронной торговли (например, покупки «Новогодние обещания»-2014). Однако еще много страниц осталось кандидатами на обновление или иное улучшение.

 

Результаты

Вскоре после реализации рекомендаций позвонил клиент и спросил, не знаем ли мы, почему они вдруг обнаружили восьмикратный рост количества лидов по сравнению с тем, что они привыкли видеть за последние месяцы.

 

 

График трафика после аудита контента

01

 

Почему мы думаем, что это сработает

 

Есть несколько возможных объяснений, почему этот подход помог нашему клиенту. Вот лишь некоторые из них.

  1. Соотношение полезного, актуального, уникального и невнятного, неактуального, дублированного контента было значительно улучшено.
  2. PageRank десятков посадочных страниц уже закончившихся кампаний был консолидирован в относительно небольшое число постоянных страниц (посредством переадресации 301 и консолидации внутренних ссылок).
  3. Лимит сканирования теперь используется более эффективно.

 

Это позволило улучшить общее впечатление клиентов от сайта, а также органические поисковые рейтинги для консолидированных важных тематических областей.

С тех пор мы усовершенствовали и улучшили процедуру и с большим успехом применяли ее для различных сайтов. Особенно хорошие результаты были достигнуты при восстановлении после «репрессий» Panda показателей сайтов с большим количеством контента и при определении очередности редактирования рекламных текстов сайтов электронной торговли.

 

Краткий обзор процедуры

Процедура аудита контента, применяемая Inflow, меняется в зависимости от целей, потребностей и бюджета клиента. Наш подход в общих чертах приведен ниже.

 

1. Соберите все доступные URL сайта

◦      Используйте Screaming Frog (или другую программу сканирования), CMS Exports, Google Analytics и Google Инструменты для веб-мастеров

2. Импортируйте URL в программу, которая собирает для каждого URL ключевые показатели эффективности (КПЭ) и другие данные

◦      Используйте URL Profiler, специальную десктопную программу или другие ресурсы для сбора данных

▪      Информация для сбора: Moz Metrics, КПЭ Google Analytics, данные GWT, показатели SEO от Magestic, названия, описания, число слов, теги canonical…

3. Проанализируйте контент

◦      Выберите: оставить как есть, улучшить, удалить или консолидировать.

▪      Напишите подробные стратегии для каждого случая.

4. Проведите исследование ключевых слов

◦      По желанию: для каждого ключевого слова приведите оценку релевантности, тематическую область и этап (-ы) покупки

◦      Сопоставьте ключевые слова со страницами, которые уже имеют поисковый рейтинг, в матрице ключевых слов

◦      Сопоставьте ключевые слова без рейтинга с лучшей страницей, чтобы иметь ориентир при внесении изменений в страницу

5. Проведите анализ «пробелов» в контенте

◦      Используйте ключевые слова, которые не имеют сопоставления с соответствующей страницей, для ввода на вкладке «Пробелы в контенте» (Content Gap).

▪      По желанию: включите циклы покупки в анализ «пробелов» в контенте

6. Напишите контент-стратегию

◦      Обобщите результаты и изложите стратегию оптимизации существующих страниц, создания новых страниц для заполнения «пробелов» в контенте, объясните, сколько страниц будут удалены, перенаправлены и т. д….

 

Каждая часть процедуры может быть адаптирована к нуждам конкретного сайта.

 

Например, при аудите сайта с очень большим объемом контента, в котором есть множество проблем, связанных с дублированием, неубедительным или частично совпадающим контентом, мы можем пропустить полностью этапы исследования ключевых слов и анализа «пробелов» в контенте и сосредоточиться на чистке сайта от таких типов страниц и улучшении оставшихся. Или другой случай — на сайте с не очень большим объемом контента, возможно, следует сосредоточиться на исследовании ключевых слов и анализе «пробелов» в контенте. Для других сайтов может понадобиться определить контент-активы, которые можно улучшить, повторить в новом изложении или эффективно использовать для нового контента. Одним из примеров очень специфической цели может быть определение возможности использования перекрестных ссылок между эффективными старыми страницами и перспективными новыми. На данный момент достаточно знать, что при необходимости структура может быть изменена таким образом, который может существенно повлиять на то, сколько вы тратите времени на эту процедуру или даже какие этапы вы можете полностью пропустить.

 

Наши документы

Процедура аудита контента включает несколько основных этапов, которые требуют наличия различных документов. Хотя я не даю ссылки на нашу внутреннюю документацию стандартной операционной процедуры (СОП) (в основном потому, что она все еще меняется), я опишу каждый документ и приведу снимки экрана и ссылки на примеры/шаблоны, так что у вас будет база для настройки их для своих нужд.

 

Сценарии аудита контента

Для облегчения работы мы ведем список рекомендаций для часто применяемых сценариев аудита контента. Хотя аудит каждого сайта сам по себе уникален, мы обнаружили, что список помогает нам гораздо быстрее пройти 90% пути в реализации соответствующей стратегии для каждого клиента. Позднее мы обсудим это более подробно, но если вы хотите взглянуть сейчас, нажмите здесь.

 

Электронная таблица-панель управления аудитом контента

Поначалу мы работали в Google Docs, однако, поскольку мы начали брать данные из нескольких источников и выполнять больше функций VLOOKUP (ВПР), таблица на больших сайтах загружалась бы очень медленно, что сделало бы выполнение аудита практически невозможным. По этой причине мы недавно перевели всю процедуру в Excel, хотя этот шаблон мы предоставляем в формате Google Docs. Ниже приведены некоторые из вкладок, которые могут вам понадобиться в этой таблице…

 

Вкладка «Аудит контента» (Content Audit)

В этой вкладке панели управления производится большая часть работы. Другие вкладки получают данные из этой вкладки с помощью функции VLOOKUP (ВПР). Независимо от того, извлекаются ли данные с помощью API и компилируются одним инструментом (например, URL Profiler) или экспортируются вручную из многих инструментов и компилируются вручную же (с помощью VLOOKUP), в конечном счете вы должны свести все показатели, необходимые для каждого URL, в одном месте, так что вы можете начать сортировку по различным показателям для определения шаблонов, отыскания возможностей и вынесения обоснованных решений в отношении того, как поступать с каждой частью контента и контент-стратегией сайта в целом.

02

 

Вы можете изменить процедуру, чтобы включить элементы, которые хотите использовать. Ниже представлены те элементы, на которых мы остановились после ряда экспериментов, а также источники данных:

 

  • Действие

◦      Оставить как есть

◦      Улучшить

◦      Консолидировать

◦      Удалить

  • Стратегия

◦      Более детализированная версия «действия». Пример: Удалить и заменить переадресацией 301 на [другая страница].

  • Тип страницы (с помощью шаблонов URL или экспорта CMS)

◦      Это необязательный этап (для определенных ситуаций). Пример: Статья, Товар, Категория…

  • Источник (исходный источник URL, например Google Analytics, Screaming Frog)
  • Оценка риска CopyScape (copyscape API)
  • Тег заголовка (Screaming Frog)
  • Длина заголовка (Screaming Frog)
  • Мета-тег Description (Screaming Frog)
  • Количество слов (Screaming Frog)
  • Входы GA (Google Analytics API)
  • Входы в результате органического поиска GA (Google Analytics API)
  • Moz Links (Moz API)
  • Авторитетность страницы Moz (Moz API)
  • MozRank (Moz API)
  • Ценность внешних ссылок Moz (Moz API)
  • Stumbleupon (Social Count API)
  • «Лайки» Facebook (Social Count API)
  • Репосты в Facebook (Social Count API)
  • Google Plus One (Social Count API)
  • Твиты (Social Count API)
  • Pinterest (Social Count API)

 

03

 

Наши рекомендации, как правило, относятся к одной из четырех категорий «Действие»: «Оставить как есть», «Удалить», «Улучшить» или «Консолидировать». Более подробная информация (например, удалить и поставить страницу с ошибкой 404 или удалить и поставить переадресацию 301? Если используется переадресация, то куда переадресовывается трафик?) содержится в колонке под названием «Стратегия». Некоторые URL (важные) будут иметь в достаточной степени индивидуализированные стратегии, в то время как другие могут обрабатывается пакетно, т. е. к тысячам страниц может применяться одна и та же стратегия (например, переписать текст дублирующегося описания товара). Колонка «Действие» может принимать ограниченное количество значений, поэтому мы можем эффективно сортировать данные (например, просмотреть все страницы, помеченные как «Удалить»), а значение колонки «Стратегия» может принимать более произвольную форму и адаптироваться к URL (например, консолидировать страницы [покупка-синих-штучек] в страницу [купить-синие-штучки] и переадресацию 301 этих страниц к этой консолидированной странице, чтобы избежать дублирования одной и той же темы).

 

Вкладка «Исследование ключевых слов» (Keyword Research)

Эта вкладка содержит ключевые слова, собранные из различных источников, в том числе результаты мозгового штурма по определению потенциальных ключевых слов, данные Google Инструментов для веб-мастеров, кампаний платной рекламы,Планировщика ключевых слов AdWords и нескольких других инструментов. Объем поиска (Search Volume) и уровень конкуренции ключевых слов (не показаны на скриншоте) берутся из Планировщика ключевых слов Google. Средняя позиция в рейтинге берется из GWT, как и страница с самым высоким рейтингом. Оценка релевантности — это то, что мы, как правило, просим сделать клиента сразу после того, мы уберем большую часть очевидных нежелательных ключевых слов.

04

 

 

Вкладка «Матрица ключевых слов» (Keyword Matrix)

Эта вкладка содержит адреса важных страниц и страниц, которые имеют высокий рейтинг благодаря важным темам или в наибольшей степени подходят для этого. Здесь фактически сопоставляются ключевые слова с наиболее подходящей страницей, что служит нам ориентиром при написании текстов и внутренней оптимизации.

Иногда вкладка «Матрица ключевых слов» (Keyword Matrix, МКС) играет важную роль в процедуре, например, когда работа ведется с относительно новым или неоптимизированным сайтом. С точки зрения стратегической важности эта вкладка большую часть времени занимает второстепенное положение по сравнению с другими вкладками.

 

Вкладка «Пробелы в контенте» (Content Gaps)

Здесь мы размещаем идеи по поводу контента для генерирующих большой объем трафика ключевых слов с высокой релевантностью, для которых не смогли найти соответствующую страницу. Зачастую это касается ключевых слов, которые представляют этапы цикла покупки или лестницы узнавания, которые были упущены из вида компанией. Иногда это весьма важно, например, с работе с новыми и/или небольшими сайтами. Большую часть времени эта вкладка играет второстепенное значение по сравнению с более важными вопросами, такими как удаление.

 

Вкладка «Удаление» (Prune)

Если что-то помечено «Удалить» или «Консолидировать», это должно находиться на этой вкладке: предполагается ли удалить это и заменить на переадресацию 301, канонизировать в другом месте, консолидировать в другой странице, оставить на прежнем месте, добавить мета-тег robots с CONTENT=»NOINDEX», удалить и вставить код 404/410… или другие «стратегии», какие вы можете придумать, — это страницы, которые не будут существовать после реализации ваших рекомендаций. Я считаю, это очень полезная вкладка. Например, кто-нибудь может экспортировать эту вкладку, отправить ее разработчику (или компании, например WP Curve), и это позволит другому начать реализацию части задач или всех мероприятий в целом. Наш лозунг по отношению к низкокачественному недостаточно эффективному контенту сайтов, которые могут столкнуться с падением трафика вследствие наказаний Panda: «Улучшите или удалите».

 

Вкладки «Импортированные данные» (Imported Data)

Кроме рассмотренных выше вкладок у нас также есть вкладки данных, которые используются в электронной таблице для размещения данных, экспортированных из различных источников, благодаря чему мы можем выполнить VLOOKUP по URL для заполнения данными других вкладок. Эти вкладки данных включают:

  • популярные страницы из GWT
  • популярные запросы из GWT
  • оценки CopyScape (как правило, до 1000 адресов)
  • данные по ключевым словам

 

Чем больше данных может быть получено с помощью таких инструментов, как URL Profiler, тем меньше вам потребуется вкладок данных и тем быстрее будет протекать весь этот процесс. До создания внутреннего инструмента для автоматизации части процесса у нас также имелись вкладки для данных Google Analytics, Moz и первичного экспорта Screaming Frog.

Если вы не знаете, как пользоваться функцией VLOOKUP, вам поможет множество онлайн-учебников для Excel и таблиц GoogleDocs. Вот один из них для Excel, по-моему мнению, достаточно полезный. Как вариант, вы можете импортировать все данные во вкладки и попросить кого-то из своей команды, кто более подкован в работе с электронными таблицами, выполнить ВПР. Наш местный гуру электронных таблиц —Цезарь Барба (у него классные волосы). Ниже приведен пример простой функции VLOOKUP, которая используется для выполнения «Действия» (Action) на вкладке «Аудит контента» (Content Audit) для адресов из вкладки «Матрица ключевых слов» (Keyword Matrix)…

 

 

Контентная стратегия

Панель управления аудитом контента — это именно то, что нам нужно: таблица набита данными, которые можно анализировать вдоль и поперек таким количеством полезных способов, что мы всегда можем вернуться к ним для получения дополнительной ценной информации и новых идей. Некоторым клиентам понравятся и эти возможности, однако большинство из них увидит гораздо большую пользу в нашей финальной контент-стратегии, которая включает в себя обобщенный обзор наших рекомендаций, разработанных в ходе аудита.

 

 

Рекомендуемые источники для экспорта данных

Есть много вариантов сбора необходимых данных в одном месте, что позволит вам сразу получить широкое представление о всей ситуации с контентом, а также увидеть конкретные показатели для каждого адреса. Для сбора URL мы используем Screaming Frog иGoogle Analytics. Данные мы экспортируем из Google Инструментов для веб-мастеров (GWT), Google Analytics (GA), Social Count (SC), Copyscape (CS), MozCMS, а также при необходимости используем ряд других источников данных.

Кроме того, чтобы значительно ускорить сведение данных из всех этих источников вместо нашего внутреннего инструмента мы попробовали использовать URL Profiler. URL Profiler стоимостью несколько сотен баксов является очень мощным инструментом. Также придется помучиться при первоначальной настройке, так что будьте готовы потратить несколько часов на копание в ключах API, прежде чем вы получите все нужные данные.

Независимо от того, как вы в конечном итоге сведете все данные вместе, первые несколько раз вполне допустимо сделать это самостоятельно в Excel.

 

Пошаговый пример применения нашей процедуры

Ниже описана пошаговая процедура для «среднестатистического» клиента (что бы это ни значило). Допустим, это компания средних размеров, занимающаяся электронной коммерцией, имеющая примерно 800-900 проиндексированных Google страниц, в том числе страницы категорий, описаний продукта, посты блога и прочие. В настоящее время, насколько нам известно, к ней не применяются штрафные санкции, но, безусловно, она может подвергаться риску наложения штрафа Panda из-за наличия на сайте какого-либо неубедительного, частично или полностью совпадающего, устаревшего и неактуального контента.

 

Шаг 1: оценка ситуации и выбор сценария

 

Все ситуации разные, однако мы нашли общие черты, исходя из двух главных факторов: размера сайта и риска получения штрафа из-за контента. Ниже представлен снимок экрана с нашим списком рекомендуемых стратегий для распространенных сценариев аудита контента, которые можно найти здесь, на GoInflow.com.

 

05

 

Каждое из цветных полей при нажатии раскрывается, и вы можете получить более подробную информацию о стратегии для этого сценария.

Благодарим Яна Лурье (Ian Lurie) за идею, вдохновившую на создание этого дизайна.

 

Вышеуказанный сайт можно отнести ко второму полю в фиолетовой колонке (Приоритет: аудит контента с последующим Улучшением и(или) Удалением при составлении МКС для ключевых страниц). Ниже описана мотивация этого решения.

Сайт находится в зоне риска получения санкций (хотя, по-видимому, пока их не имеет), поэтому мы следуем лозунгу Panda:улучшить или удалить. Размер сайта определяет, на каком из этих двух вариантов (улучшить или удалить) сделать более сильный акцент. Более мелкие сайты нуждаются в небольшой чистке (скальпель), в то время как более крупные сайты требуют гораздо большего (топор). Более мелкие сайты часто нуждаются в проведении некоторого исследования ключевых слов, позволяющего определить, покрывают ли они все тематические области различных этапов цикла покупки, в то время как более крупные сайты, как правило, имеют противоположную проблему — слишком много страниц с пересекающимися тематическими областями, с низкокачественным (неубедительным, дублирующим, неактуальным, устаревшим, плохо написанным…) контентом. Такой сайт не потребует исследования ключевых слов, и поэтому в таком случае мы не будем создавать матрицу ключевых слов или проводить анализ пробелов контента, а уделим внимание в первую очередь чистке сайта.

В данном примере мы будем проводить аудит контента, при этом сосредоточимся на улучшении и/или удалении неэффективно работающих страниц с проведением исследования ключевых слов и составлением матрицы ключевых слов для основных страниц, в том числе для главной страницы, страниц категорий, главной страницы блога и страниц основных продуктов, а также для некоторых других тематических посадочных страниц.

Оказывается, на этом гипотетическом сайте имеется много предоставленных производителями описаний продуктов. Теперь нам требуется определить приоритет при переписывании страниц, потому что у клиента нет достаточно средств, чтобы переписать их все сразу. Когда возникает вопрос бюджета и сроков, мы зачастую пользуемся правилом 80/20: сразу написать качественный контент для 20% самых приоритетных страниц, а для остальных 80% — в течение 6-12 месяцев, как позволят сроки/бюджет.

Поскольку в отношении этого сайта нет действующих санкций, мы рекомендуем продолжить индексировать все страницы. Если на сайт наложены санкции, мы рекомендуем поставить остальным 80% страниц «noindex,follow», постепенно переводя их обратно в разряд индексируемых по мере переписывания. Возможно, вы в этой ситуации поступите по-другому, и это допустимо. Идея состоит в том, что при определении относительного «приоритета» вы можете легко отсортировать страницы по любому числу показателей. Чем больше сайт и меньше бюджет, тем важнее определить, с чем работать в первую очередь.

 

Причины наложения санкций, связанных с контентом

Так как мы занимаемся аудитом контента, нас интересуют только санкции, связанные с контентом (в отличие от санкций из-за ссылок и других проблем, не связанных со страницей), которые, как правило, делятся на три основные категории: качество, дублирование и релевантность. Далее они могут быть дополнительно разбиты на другие подкатегории, которые включают в себя, помимо прочего, следующие:

  • обычный низкокачественный контент

◦      плохая грамматика, текст написан в первую очередь для поисковых систем (в том числе переполненность ключевыми словами), бесполезный, неточный контент…

  • полностью нерелевантный контент

◦      в небольших объемах вполне допустимо, однако зачастую блоги целиком заполнены таким контентом

◦      типичным примером могут служить материалы со «ссылкой-приманкой», появлявшиеся в районе 2010 года

  • неубедительный/краткий контент

◦      невнятно сформулированная тема, слишком мало слов, весь контент построен вокруг изображений…

  • сборный контент, не добавляющий стоимости

◦      контент практически полностью состоит из фрагментов контента, который уже присутствует на других сайтах

  • оптимизация, вводящая в заблуждение

◦      названия или ключевые слова, ориентированные на запросы, которым контент не соответствует или в отношении которых контент не заслуживает получения поискового рейтинга

◦      как правило, не предоставляет информацию, которую посетитель ожидает найти

  • дублирующий контент
  • внутренний дубликат других страниц (например, страницы категорий, вариантов продукта, архивы, технические вопросы…)
  • внешние дубликаты (например, описания продукта, предоставленные производителем, описания продуктов, продублированные в других каналах, таких как Amazon, сайтах сравнения товаров и eBay, контент-плагиат…)
  • страницы-заглушки (например, «Здесь пока нет никакого контента, но если вы зарегистрируетесь и вставите собственный контент, то нам будет что показать другим посетителям». Кстати, не хотите ли подписаться на нашу новостную рассылку? Щелкните на рекламе!)
  • индексируемые результаты внутреннего поиска
  • слишком много индексируемых тегов блога или страниц категорий блога
  • и так далее, и тому подобное…

 

Если вы не можете оценить масштаб проблем в контенте сайта, начните с шага 2 до принятия решения о сценарии…

 

Шаг 2: сканирование сайта

 

Для этого этапа мы используем Screaming Frog, однако вы можете адаптировать этот процесс к тому поисковому боту, который вам нравится. Вот наши настройки на вкладке «Basic» поискового бота…

06

 

Обратите внимание, что у «crawl all subdomains» (сканировать все поддомены) стоит галочка. Эта опция не является обязательной, она зависит от того, аудит чего вы проводите. При этом мы принимаем во внимание «meta name=»robots» content=»noindex»», «rel=»canonical»» и содержимое robots.txt. Также обратите внимание, что мы не сканируем изображения, CSS, JS, Flash, внешние ссылки… Обработка этих видов ресурсов привела бы к ненужному усложнению аудита контента, поэтому мы занимаемся ими в техническом SEO-аудите. Что нам нужно сейчас? Все индексируемые HTML-страницы, которые могут привести посетителя на сайт из страницы результатов поиска, несмотря на то, что это, конечно же, может привести к обнаружению технических проблем.

 

Экспортируйте полный список адресов и связанных с ними данных из Screaming Frog в файл CSV.

 

Шаг 3: импорт адресов и запуск инструмента

У нас имеется свой собственный «Инструмент аудита контента», который берет адреса и данные из Screaming Frog и Google Analytics, устраняет в них дублирование и вытягивает для каждого адреса данные из Google Инструментов для веб-мастеров, Moz, Social Count и Copyscape. Инструмент порой немного глючит, поэтому я попробовал URL Profiler, который по существу позволяет достичь той же цели с меньшим количеством шагов и с меньшим объемом технической поддержки. Для этих целей нам подойдет версия «Agency», которая стоит около 400 долларов в год плюс налог. Не так уж и плохо, учитывая, что к тому времени, когда Гарет Браун представил публике URL Profiler, мы уже потратили несколько тысяч на разработку собственного инструмента. :-/

Ниже приведен скриншот того, что вы увидите после загрузки этого инструмента. Я выделил прямоугольниками наши текущие настройки. Вообще-то, они зависят от инструментов/API, на которые вы подписаны, и для каждого пользователя они будут разными. Мы только начали работать с uClassify, чтобы частично автоматизировать процесс группировки страниц по тематическим областям, но мне пока не о чем рассказать (можете оставить комментарий с советом)…

07

Щелкните правой кнопкой мыши над полем «URL List» (Список адресов) и выберите «Import From File» (Импорт из файла), затем выберите файл экспорта из ScreamingFrog или какой-либо другой список адресов. Есть также возможность импортировать из буфера обмена или XML-файла sitemap. Полную документацию URL Profiler можно найти здесь. Ниже приведены два снимка экрана с результатами, которые дадут вам представление о том, что вы получите в конечном итоге…

08

Выходные данные могут меняться в зависимости от того, какие поля вы выбрали и доступ к каким API у вас есть.

 

 

Шаг 4: импорт результатов работы инструмента в панель управления

 

Как было описано выше в кратком обзоре, у нас есть шаблон электронной таблицы с несколькими вкладками, одна из которых — «Аудит контента» (Content Audit). Результаты работы инструмента передаются во вкладку «Аудит контента» (Content Audit) панели управления. Наш внутренний инструмент автоматически добавляет колонки «Действие» (Action), «Стратегия» (Strategy), «Тип страницы» (Page Type) и «Источник» (Source) (адреса). Вы также можете добавить их на вкладку после импорта результатов работы URL Profiler. «Тип страницы» (Page Type) и «Источник адреса» (URL Source) — необязательны, однако «Действие» (Action) и «Стратегия» (Strategy) — ключевые элементы процедуры.

Наш гипотетический клиент требует создания матрицы ключевых слов. Однако, если ваш «сценарий» не подразумевает проведения исследования ключевых слов (например, если это большой сайт с риском наложения санкций), вы можете пропустить шаги 5—7 и переходить прямо к «Шаг 8 — время провести анализ и принять какие-нибудь решения».

 

Шаг 5: импорт данных GWT

 

Соотносим существующие адреса из аудита контента с ключевыми словами, для которых они уже имеют рейтинг в Google Инструментах для веб-мастеров

Наверное, это можно сделать с помощью URL Profiler. Даже если это так, я пока не нашел способ. Ниже описаны наши действия для получения из Google Инструментов для веб-мастеров информации о посадочной странице и о связанных с ней ключевых словах/поисковых запросах, которую мы затем вставляем в две вкладки («Популярные запросы из GWT» (GWT Top Queries) и «Популярные страницы из GWT» (GWT Top Pages)). Эти вкладки полезны при заполнении матрицы ключевых слов, так как указывают, какие страницы Google уже сопоставил с каждым ключевым словом, имеющим рейтинг. На деле этот шаг можно целиком пропустить при работе с крупными сайтами со значительными проблемами с контентом, поскольку основное внимание уделяется очистке сайта от контента низкого качества, а не какому-нибудь исследованию ключевых слов или анализу пробелов контента.

 

Инструкции по импорту информации о популярных страницах из GWT

 

  • Войдите в GWT в браузере Chrome
  • Перейдите «Поисковый трафик» — > «Поисковые запросы»
  • Перейдите на вкладку «Популярные страницы» (по умолчанию — «Популярные запросы»)
  • Измените временной диапазон, чтобы обрабатывались как можно более ранние данные (т. е. 3 месяца)
  • Увеличьте количество строк, чтобы отображалось до 500 строк

◦      Это установит в URL параметр s=500. Измените s=500 на s=10000 или на нужное количество строк данных

  • См. на нижнюю часть страницы GWT (например, 1-500 из ####).
  • В меню Chrome выберите «Дополнительные инструменты» —> «Консоль JavaScript»
  • Скопируйте и вставьте следующий скрипт в окно консоли и нажмите Enter.
  • Это должно раскрыть все выпадающие списки и показать ключевые слова под каждым URL «страницы», а затем открыть диалоговое окно, в котором вам будет предложено сохранить файл в формате CSV: (более подробная информация здесь издесь).
  • Скрипт также доступен в виде букмарклета (закладурки) на Lunametrics.com

 

Игнорируйте любые всплывающие диалоговые окна.

Чтобы отключить их, вы можете активировать «Предотвратить создание дополнительных диалоговых окон на странице».

 

◦      Импортируйте итоговый файл download.csv из GWT во вкладку «Популярные страницы из GWT» панели управления аудитом контента.

 

Инструкции для импорта информации о популярных запросах из GWT

 

  1. В GWT перейдите обратно на «Популярные запросы».
  2. Установите дату, чтобы захватить как можно больший промежуток времени.
  3. Увеличьте количество строк, чтобы отображалось до 500 строк
    1. Это установит в URL параметр s=500. Измените s=500 на s=10000 или нужное количество строк данных
  4. См. на нижнюю часть страницы GWT (например, 1-500 из ####).
  5. Выберите «Загрузить эту таблицу» в виде файла CSV
  6. Импортируйте итоговый файл TopSearchQueries.csv из GWT во вкладку «Популярные запросы из GWT» панели управления аудитом контента.

 

 

Шаг 6: проведение исследования ключевых слов

Это еще один необязательный шаг, зависящий от направленности/цели аудита. Этот шаг также можно как угодно подстраивать под нужды вашего собственного процесса исследования ключевых слов. Используйте для составления списка ключевых слов любые нравящиеся вам методы (например, мозговой штурм, EMRush, Google Trends, Uber Suggest, GWT, GA…). Убедитесь, что все «мусорные» и нерелевантные ключевые слова удалены из списка, и прогоните остаток через один инструмент, который собирает информацию о статистике запросов и показателях конкуренции. Мы используем Планировщик ключевых слов Google Adwords, который описан ниже.

  1. Зайдите в свой аккаунт электронной почты Google, связанный с AdWords, затем перейдите по адресу www.google.com/sktool/.
  2. Выберите «Получить статистику запросов для списка ключ. слов или сгруппировать их по гр. объявлений», вставьте свой список ключевых слов и нажмите «Узнать количество запросов».
    1. Примечание: к этому моменту вы должны уже были увеличить список настолько, насколько вам нужно или хочется, чтобы сейчас просто провести сбор данных и организовать их.
    2. Примечание. Метод «скопировать»/«вставить» ограничен 1000 (тысячей) ключевых слов. Вы можете довести это количество до 3000, загружая текстовый файл с ключевыми словами.
  3. Перейдите на вкладку «Варианты ключевых слов» на следующем экране и выберите «Добавить все» ключевые слова к плану.
  4. Перейдите на вкладку «Варианты групп объявлений» и выберите «Добавить все» группы объявлений к плану.
  5. Загрузите план, как показано ниже на снимке экрана.
  6. Импортируйте данные на вкладку «Данные AdWords» (AdWords Data) панели управления аудитом контента

 

Используйте при загрузке плана приведенные ниже настройки:

11

 

Шаг 7: связывание данных ключевых слов

 

Опять-таки, вам не нужно выполнять этот шаг, если вы работаете с большим сайтом и акцент при этом делается на зачистке низкокачественного контента. Шаги получения информации о запросах из GWT и проведения исследования ключевых слов необходимы для разработки матрицы ключевых слов (МКС), в чем нет нужды, если в вашу задачу входит также и внутренняя оптимизация и переписывание текста ключевых страниц. Иногда нужно просто вывести клиента из-под действия санкций или устранить опасность наложения таковых. МКС оказывается полезной при работе с важными страницами с пометкой «Улучшить» на вкладке «Аудит контента» (Content Audit) как раз для того, чтобы человек, пишущий текст, понимал, какие ключевые слова важны для этой страницы. Это азы SEO, и вы можете выполнить эту задачу тем способом и тем инструментом, какие вам нравятся.

Google Adwords дал вам ключевое слово, статистику запросов и показатели конкуренции. Google Инструменты для веб-мастеров дали вам для каждого ключевого слова ранжируемую страницу, среднюю позицию, показы, клики и показатель CTR. Сведите все это вместе на вкладку «Исследование ключевых слов» (Keyword Research), используя функцию VLOOKUP. Вы должны в конечном итоге получить что-то вроде этого:

12

 

 

Цель этих последних шагов — помощь в составлении МКС, пример которой показан ниже:

13

 

Шаг 8: время провести анализ и принять какие-нибудь решения!

Все данные прямо перед вами, и ваш путь был проложен с использованием инструмента сценариев аудита контента. С этого момента фактическая пошаговая процедура становится гораздо более подготовленной для внесения изменений, обусловленных интерпретациями и вашим собственным опытом/интуицией. И поэтому не рассматривайте ее как линейный набор инструкций, которые должны выполняться одна за другой. Вы можете реализовать некоторые из них, а другие — пропустить. Вы можете выполнить их немного по-другому. Все это приемлемо, пока вы продвигаетесь к цели — определению того, что делать (или не делать) с каждым элементом контента сайта.

 

  • Отсортируйте по оценке риска Copyscape

◦      Какие из этих страниц следует переписать?

▪      переписывайте ключевые/важные страницы, такие как страницы категорий, основных продуктов, главная страница;

▪      переписывайте страницы с хорошими показателями с точки зрения ссылок и социальных сетей;

▪      переписывайте страницы с большим трафиком;

▪      после выставления «Улучшить» в столбце «Действие» уточните в колонке «Стратегия»:

  • «Улучшить эти страницы, написав уникальный, полезный контент, что позволит повысить оценку риска CopyScape».

◦      Какие из этих страниц следует удалить?

▪      удаляйте гостевые посты, которые были опубликованы в другом месте;

▪      удаляйте все, что было заимствовано клиентом (плагиат);

▪      удаляйте контент, который не имеет смысла переписывать, например:

  • контент, у которого отсутствуют внешние ссылки, ссылки из социальных сетей и очень мало или совсем нет входов/посещений;

▪      после выставления «Удалить» в столбце «Действие» уточните в столбце «Стратегия»:

  • «Удалить с сайта для устранения дублирующего контента. Этот адрес не имеет никаких ссылок или ссылок из социальных сетей и привлекает очень мало трафика. Мы рекомендуем возвращать для этого адреса коды состояния 404 или 410. Удалить все внутренние ссылки, в том числе из файла sitemap».

◦      Какие из этих страниц следует консолидировать в другие?

▪      предположительно никакие, так как контент уже дублирован снаружи;

◦      Какие из этих страниц следует пометить «Оставить как есть»?

▪      важные страницы, контент которых был украден;

  • в столбце «Стратегия» поместить ссылку на отчет CopyScape и инструкции для подачи в Google жалобы в связи с нарушением DMCA/авторского права;
  • Отсортируйте по количеству входов или посещений (отфильтровываются все завершенные)

◦      Какие из этих страниц следует пометить «Улучшить»?

▪      страницы с большим количеством посещений/входов, но при этом с небольшим показателем конверсией, длительности пребывания на сайте, количеством просмотров страниц за одну сессию…

▪      ключевые страницы, требующие улучшения по результатам ручной проверки страницы.

◦      Какие из этих страниц следует пометить «Консолидировать»?

▪      страницы с пересекающимися темами, которые сами по себе не обладают достаточно уникальной ценностью, но могли бы стать отличным ресурсом после объединения;

  • Пометьте страницу с лучшими среди них показателями «Улучшить» и в столбце «Стратегия» перечислите, какие страницы вы собираетесь консолидировать в нее. Это будет каноническая страница.
  • Пометьте страницы, которые должны быть консолидированы в каноническую страницу, «Консолидировать» и в столбец «Стратегия» внесите подробные инструкции, например:

◦      Использовать часть этого контента для дополнения [канонической страницы], а затем поставить на эту страницу переадресацию 301 на [каноническую страницу]. Обновить все внутренние ссылки.

  • Страницы кампаний или сезонные страницы, которые можно консолидировать в единую «постоянную» посадочную страницу (например, «Бестселлеры 2012 г.» и «Бестселлеры 2013 г.» — > «Бестселлеры»).

◦      Какие из этих страниц следует пометить «Удалить»?

▪      Страницы с плохим показателями в области ссылок, трафика и социальной значимости из-за низкокачественного контента, который не стоит переделывать

  • Как правило, здесь будут выдаваться коды состояния 404/410.

▪      Нерелевантный контент

  • В зависимости от ссылочной ценности и трафика стратегия будет сводиться либо к переадресации, либо к простому удалению.

▪      Устаревший контент, который не имеет смысла обновлять или консолидировать

  • В зависимости от ссылочной ценности и трафика стратегия будет сводиться либо к переадресации, либо к простому удалению.

◦      Какие из этих страниц следует пометить «Оставить как есть»?

  • Страницы с хорошими показателями в области трафика, уровня конверсии, длительности пребывания на сайте, и т. д…, которые при этом также имеют неплохой контент.
    • Они могут иметь или не иметь какие-либо приличные внешние ссылки

 

Попробуем взглянуть с другой стороны…

Для больших сайтов лучше всего по максимуму использовать «топор», а закончить «скальпелем». В противном случае вы будете тратить слишком много времени на проект, который будет снижать рентабельность капиталовложений (ROI).

 

Это не тот процесс, который можно расписать пошагово. Хотя для иллюстрации приведем несколько примеров применения «топора» и ситуаций, когда можно рассматривать его использование.

 

  • Адреса с использованием параметров, которые не следует индексировать

◦      Отложить для проведения технического аудита, если это возможно. В противном случае, используйте свой здравый смысл:

  • например, /?sort=color, &size=small
    • Если исходить из того, что технический аудит как вариант не рассматривается, то эти страницы можно обработать все одним махом. Ниже представлен «пример» действия и «пример» стратегии для такой страницы:

◦      Действие = Консолидировать

◦      Стратегия = использовать «rel=»canonical»» к базовой странице без параметра

  • Результаты внутреннего поиска

◦      Отложить для проведения технического аудита, если это возможно. В противном случае, используйте свой лучшее суждение :

  • например, /search/<фраза с ключевым словом>/
    • Если исходить из того, что технический аудит как вариант не рассматривается:

◦      Действие = Удалить

◦      Стратегия = Применить «meta name=»robots» content=»noindex»». После того, как они будут удалены из индекса, запретите /search/ в файле robots.txt.

  • Страницы тегов блога

◦      Отложить для проведения технического аудита, если это возможно. В противном случае…

  • например, /blog/tag/green-widgets/, blog/tag/blue-widgets/…
    • Если исходить из того, что технический аудит как вариант не рассматривается:

◦      Действие = Удалить

◦      Стратегия = Применить «meta name=»robots» content=»noindex»». После того, как они будут удалены из индекса, запретите /search/ в файле robots.txt.

  • Страницы товаров сайта электронной торговли с описаниями, предоставленными производителем
  • В случае если «Тип страницы» (Page Type) известен (т. е. он есть в адресе или предоставлен в ходе экспорта CMS), а оценка риска указывает на дублирование…
  • например, /product/product-name/
    • Если исходить из того, что технический аудит как вариант не рассматривается:

◦      Действие = Улучшить

◦      Стратегия = Переписать, улучшив описание товара и избегая дублирования контента

  • Страницы категорий сайта электронной торговли с динамическим контентом

◦      Если «Тип страницы» (Page Type) известен…

  • например, /category/category-name/ или category/cat1/cat2/
    • Предполагая, что НИ ОДНА из страниц категорий не имеет контента…

◦      Действие = Улучшить

◦      Стратегия = Напишите 2-3 предложения с уникальным полезным контентом, в котором объясняются варианты, следующие шаги или выгоды для посетителя, раздумывающим над выбором товара из этой категории.

  • Устаревшие посты блога, статьи и другие посадочные страницы

◦      В тех случаях, когда тег <title> включает дату или…

◦      В тех случаях, когда адрес указывает на дату публикации…

▪      Действие = Улучшить

▪      Стратегия = Обновить пост, чтобы сделать его более актуальным, если это применимо. В противном случае измените действие на «Удалить» и адаптируйте стратегию, исходя из количества ссылок и трафика (т. е. 301 или 404)

 

Шаг 9: Анализ «пробелов» в контенте и прочие полезные процедуры

 

Хотя большинство из перечисленного ниже можно рассматривать в качестве необязательных пунктов исследования ключевых слов, я предпочитаю оставить их напоследок, потому что заранее невозможно сказать, сколько времени останется после решения более неотложных вопросов.

 

Пробелы в контенте

 

Если вы прошли трудный этап определения ключевых слов и страницы уже получили рейтинг для этих слов, то совсем несложно сделать еще один шаг и выяснить, какие ключевые слова могут подсказать, как заполнить пробелы контента.

22

 

Мы в Inflow предпочитаем использовать «Лестницу осведомленности о проблеме» (Awareness Ladder), разработанную Беном Хант (описана в его книге «Convert!»). Подробности можно узнать здесь.

 

Уровни контента

 

Если позволяет время или требуют обстоятельства, мы также можем добавить столбец во вкладку «Матрица ключевых слов» (Keyword Matrix) или «Аудит контента» (Content Audit). Этот столбец будет указывать, какой уровень контента страницы будет необходим для конкуренции в этой области ключевых слов. Наш обычный набор: «Базовый» (Basic), «Стандартный» (Standard) и «Премиум» (Premium). Это значительно облегчает клиенту распределение ресурсов при написании контента, выделяя их туда, где они нужны больше всего (т. е. лучшие авторы создают контент премиум-класса).

 

Тематические области посадочных страниц или ключевых слов

 

Если позволяет время или требуют обстоятельства, мы можем провести группировку по тематическим областям посадочных страниц и/или ключевых слов. Неоднократно в результате этого давались рекомендации добавить или изменить существующую таксономию, что приводило к отличным результатам. Наиболее часто примеры этого можно видеть в области «Практические руководства» (How To) или «Ресурсы» (Resources) для любой рассматриваемой ниши.

 

Показатель релевантности ключевого слова

 

Это хороший повод заручиться поддержкой клиента, особенно в случае сложных ниш, где используется большое количество жаргона. Иногда над этим вопросом может работать клиент, а стратег делает аудит контента.

 

Шаг 10: завершение написания стратегического документа аудита контента

 

Контент-стратегия (или как вы предпочитаете это называть) должна составляться одновременно с проведением аудита контента и должна обобщать результаты, рекомендации и последующие шаги аудита. Она должна начаться с краткого обзора, а затем в каждом из имеющихся разделов должна быть представлена развернутая информация.

 

Вот реальный пример краткого обзора из одной из стратегий аудита контента, проведенного Inflow:

 

В результате проведенного нами комплексного аудита контента мы рекомендуем следующие мероприятия (более подробно они будут рассмотрены ниже):

 

  • Удаление примерно 624 страниц из индекса Google посредством удаления или консолидации:

◦      203 страницы были помечены для удаления с выдачей кода состояния 404 (переадресация не требуется)

◦      110 страниц были помечены для удаления с переадресацией 301 на другую страницу

◦      311 страниц были помечены для консолидации контента в другие страницы

▪      За этим следует переадресация на страницу, в которую эти страницы были консолидированы

  • Переписывание или улучшения 668 страниц

◦      605 страниц товаров должны быть переписаны из-за использования описаний, предоставленных производителем (дублированный контент), во время аудита контента будет определен приоритет страниц при переписывании.

◦      63 «прочие» страницы необходимо переписать из-за низкокачественного или дублированного контента.

  • 26 страниц оставлены в неизменном виде, без переписывания или усовершенствования, если страница включена в Матрицу ключевых слов, она потребует внутренней оптимизации, лучшие методы будут рассмотрены/применены.
  • Внутренняя оптимизация — приоритет для 25 страниц с ключевыми словами, содержащимися на вкладке «Матрица ключевых слов» (Keyword Matrix).

 

Эти изменения отражают насущную потребность в «улучшении или удалении» контента, чтобы избежать очевидного получения штрафа Google из-за контента (например, со стороны Panda) из-за неубедительного, низкокачественного и дублированного контента, особенно в отношении страниц «Представительства и дилеры», также обладающие определенным дополнительным риском страницы «Стиль».

 

Контент-стратегия должна завершаться рекомендацией касательно последующих шагов, в том числе действий консультанта и клиента. Вот реальный пример из одного из наших документов:

 

Рекомендуем предпринять следующие действия (отсортированы по срочности и/или потенциальной рентабельности инвестиций в сайт):

 

  1. Удалить или консолидировать все страницы, указанные на вкладке «Удаление» (Prune) панели управления аудитом контента
    1. Подробные инструкции для каждой страницы можно найти в столбце «Стратегия» (Strategy) на вкладке «Удаление» (Prune)
  2. Начните работы по переписыванию с улучшения/переписывания контента страниц «Стиль», чтобы получить уникальный, эффективный контент и надлежащую направленность ключевых слов.
    1. В зависимости от бюджета и других факторов Inflow может помочь вашим авторам или может использовать своих копирайтеров. В рамках этого процесса необходимо решить следующие вопросы.
      1. Улучшить/переписать все страницы, присутствующие в Матрице ключевых слов для обеспечения соответствия назначенным ключевым словам.
  3. Провести внутреннюю оптимизацию страницы (например, название, описание, атрибуты ALT, использование ключевых слов и т. д.)
    1. См. столбец «Стратегия» (Strategy) для получения более полных инструкций касательно каждой страницы.
    2. Улучшите/перепишите все оставшиеся страницы со вкладки «Аудит контента» (Content Audit), для которых указано «Улучшить» (Improve).

 

Ресурсы, ссылки и постскриптумы…

 

Пример панелиуправления аудитом контента

Скопируйте эту таблицу Google Docs, которая является базовой версией оформления документации в Inflow.

 

Стратегии аудита контента для распространенных сценариев

Эта страница/инструмент поможет вам определить, с чего начать и на что обратить внимание в большинстве ситуаций, с которыми вы столкнетесь при выполнении сложных аудитов контента.

 

How to Conduct a Content Audit on Your Site Нейла Пателя из QuickSprout

Хотя постойте, я не могу отправить вас на страницу, которая для просмотра контента заставляет посетителя двигаться сквозь лабиринт всплывающих окон, в том числе при выходе. Так что забудьте…

 

How to Perform a Content Audit Кристины Кледзик из Distilled

Эта статья в основном посвящена категоризации страниц по стадиям цикла покупки.

 

Expanding the Horizons of eCommerce Content Strategy Дэна Крена из Inflow

Дэн написал недавно фантастическую статью о контент-стратегиях для компаний, занимающихся электронной коммерцией. В ней есть несколько отличных примеров контента для различных типов страниц, ориентированных на различные стадии цикла покупки.

 

Epic Content Guide от Distilled

См. раздел, посвященный инвентаризации и аудиту контента (Content Inventory and Audit).

 

The Content Inventory is Your Friend Кристины Халворсон на BrainTraffic

Гимн во славу качественным инвентаризации и аудиту контента, меняющим жизнь.

 

How to Perform a Content Marketing Audit Темпла Старка на Vertical Measures

Темпл написал отличную статью: он создал детальное руководство, в котором проанализировал процесс инвентаризации контента, оценил его эффективность и сделал выводы касательно последующих шагов.

 

Why Traditional Content Audits Aren’t Enough Ахавы Лейбтаг в блоге Content Marketing Institute

Хотя это и не пошаговое руководство, как моя статья, обращение Ахавы к маркетологам-аналитикам с призывом рассматривать эти проекты в двух плоскостях: количественной (инвентаризация контента) и качественной (аудит качества контента), сразу же тронуло мое сердце и частично повлияло на мой подход к описанному выше процессу.

 

Источник