Мультиязычные сайты и структура URL

Многоязычный веб-сайт отображает содержание на нескольких языках. В качестве примера многоязычного сайта можно привести сайт канадской компании, которая имеет версии для английского и французского языков, либо латиноамериканский блог, доступный на испанском и португальском языках.

Мультирегиональный веб-сайт явным образом ориентирован на пользователей из разных стран. Некоторые сайты являются как мультирегиональными, так и многоязычными (например, содержание на сайте может быть представлено для США и Канады с двумя версиями канадского содержания - для английского и французского языков).

Расширение веб-сайта для пользователей из нескольких регионов, говорящих на различных языках, может оказаться достаточно сложной задачей. Наличие нескольких версий сайта может привести к тому, что одни и те же проблемы придется решать в каждой из версий. Это требует очень тщательной проверки оригинального сайта и наличия инфраструктуры для работы с таким сайтом. Ниже приведены некоторые советы и рекомендации, которых следует придерживаться при создании многоязычных и/или мультирегиональных сайтов.

Управление многоязычными версиями сайта Подробнее...
Таргетинг содержания сайта на определенную страну Подробнее...
Дублирующееся содержание и многоязыковые сайты Подробнее...

Управление многоязычными версиями сайта

Следующие советы помогут добиться отображения локализованного содержания в результатах поиска на соответствующем языке.

Убедитесь в том, что язык страницы определяется однозначно

Для определения языка страницы Google использует только видимое ее содержание. Никакая информация о языке на уровне кода, например атрибуты lang, не используется. Вы можете помочь Google правильно определить язык, используя на всех страницах один и тот же язык для содержания и для навигации и избегая параллельных переводов. Если на сайте переведен только стандартный текст, а основное содержание остается на исходном языке (такое часто встречается, если содержание создается пользователями), это может привести к тому, что одно и то же содержание будет появляться в результатах поиска многократно, отнесенное к разным языкам. Это не очень нравится пользователям.

В файле robots.txt заблокируйте поисковым системам доступ к тем страницам на своем сайте, которые переводятся автоматически. Автоматический перевод далеко не всегда имеет смысл и может быть рассмотрен как спам. Немаловажно также и то, что плохой или машинный перевод может негативно сказаться на восприятии вашего сайта пользователями.

Убедитесь, что версия для каждого из языков легко определяется

Выдавайте содержание для каждого из языков по отдельным URL. Не используйте файлы cookie для отображения переведенных версий страницы. Постарайтесь на каждой странице размещать перекрестные ссылки для других языков. Тогда, к примеру, франкофон, попавший на версию страницы для немецкого языка, сможет за одно нажатие выбрать понятный ему язык.

Избегайте автоматического перенаправления по языку пользователя. Это может привести к тому, что пользователи и поисковые системы не смогут просмотреть все версии вашего сайта.

Продумайте выбор URL

Google использует для определения языка страницы ее содержание, но сам по себе URL дает пользователям полезную информацию об ее содержании. Например, в следующих URL для канадских пользователей в качестве субдомена или подкаталога используется fr, что достаточно ясно указывает на французский язык: http://example.ca/fr/vélo-de-montagne.html http://fr.example.ca/vélo-de-montagne.html.

Указание языка в URL может также помочь в обнаружении проблем с многоязычным содержанием сайта.

Неплохой идеей может оказаться перевод слов в URL или использование доменных имен с использованием символов национальных алфавитов (IDN). Убедитесь, что URL передается в кодировке UTF-8 (рекомендуется использовать UTF-8 везде, где это возможно), и обеспечьте правильное экранирование в ссылках по этому URL. (В Интернете можно найти множество кодировщиков URL.)

Таргетинг содержания сайта на определенную страну

Если указать Google страну, на которую осуществляется таргетинг, мы сможем использовать эту информацию для повышения эффективности поиска для различных стран. Как правило, Google использует для определения страны таргетинга сайта следующие элементы.

  • ccTLD (национальные домены верхнего уровня). Они привязаны к конкретным странам (например, .de - Германия, .cn - Китай) и поэтому являются сигналом как для пользователей, так и для поисковых систем, указывающим на то, что ваш сайт явным образом ориентирован на определенную страну. (В некоторых странах имеются ограничения на использование кодов ccTLD, поэтому сначала разберитесь в этом вопросе.)
  • Настройки геотаргетинга. С помощью Инструмента геотаргетинга в Инструментах для веб-мастеров можно указать Google, что ваш сайт предназначен для конкретной страны. Пользуйтесь этим методом только в том случае, если ваш сайт имеет код gTLD (общий домен верхнего уровня). Не пользуйтесь этим инструментом, если сайт имеет таргетинг на несколько стран. Например, таргетинг на Канаду может иметь смысл для сайта о ресторанах в Монреале, однако совершенно бессмысленно задавать этот таргетинг для франкофонов во Франции, Канаде и Мали.

    Примечание. Поскольку региональные TLD (такие как .eu или .asia) не относятся к отдельной стране, Google рассматривает их как gTLD.

  • Местоположение сервера (определяется по его IP-адресу). Если сервер расположен в физической близости к вашим пользователям, то это часто может быть сигналом того, что данная аудитория является целевой для вашего сайта. Некоторые сайты используют распределенные сети доставки данных (CDN) или размещаются в странах с более высоким уровнем развития инфраструктуры, поэтому это не является определяющим сигналом.
  • Другие сигналы. Другие сигналы, указывающие на целевую аудиторию вашего сайта, могут включать указанные на странице местные адреса и номера телефонов, использование местного языка и валюты, ссылки с других местных сайтов и/или использование Google Мест на карте (там, где доступно).

Google не использует для геотаргетинга ни метатеги расположения (например, geo.position или distribution), ни атрибуты HTML.

Структуры URL

Постарайтесь создать такую структуру URL, которая позволит выделить фрагменты, относящиеся к геотаргетингу для различных регионов. В следующей таблице приведены доступные варианты.

Структура URL Пример Достоинства Недостатки
ccTLD example.ie
  • Геотаргетинг определяется однозначно.
  • Местоположение сервера не играет роли.
  • Простота разделения сайтов.
  • Дороговизна (и, возможно, ограниченная доступность).
  • Требует более высокого уровня развития инфраструктуры.
  • Строгие требования ccTLD (иногда).
Субдомены с gTLD de.example.com
  • Простота настройки.
  • Возможность использования геотаргетинга в Инструментах для веб-мастеров.
  • Возможность расположения серверов в разных местах.
  • Простота разделения сайтов.
  • Пользователи не смогут распознать геотаргетинг только по URL (de - это язык или страна?).
Подкаталоги с gTLD example.com/de/
  • Простота настройки.
  • Возможность использования геотаргетинга в Инструментах для веб-мастеров.
  • Простота поддержки (один хост).
  • Пользователи не смогут распознать геотаргетинг только по URL.
  • Сервер размещается в одном месте.
  • Сложности в разделении сайтов.
Параметры URL site.com?loc=de
  • Не рекомендуется.
  • Сложность сегментирования на основе URL.
  • Пользователи не могут распознать геотаргетинг только по URL.
  • Нельзя использовать геотаргетинг в Инструментах для веб-мастеров.

Геотаргетинг - не точная наука, тут важно решить, что делать с пользователями, пришедшими не на ту версию страницы. Как вариант, можно разместить на всех страницах ссылки, по которым пользователь выберет нужный язык и регион.

Повторяющееся содержание и международные сайты

На веб-сайтах, которые предоставляют содержание для различных регионов и на разных языках, иногда возникают ситуации, когда создается одинаковое (или очень похожее) содержание, но для страниц с различными URL. В общем случае это не является проблемой, пока это содержание предназначено для пользователей в различных странах. Настоятельно рекомендуется выдавать для разных групп пользователей разное содержание (понятно, что на практике это не всегда возможно). Как правило, дубликаты не требуется "скрывать" блокировкой сканирования в файле robots.txt или с помощью метатега noindex. Однако если по разным URL одним и тем же пользователям выдается одно и то же содержание (например, если и example.de/ и example.com/de/ показывают содержание для Германии и немецкого языка), имеет смысл выбрать предпочтительную версию и произвести перенаправление (или указать в ссылке элемент rel="canonical").