Файл Google Sitemap и SEO: полное руководство по SEO

  1. Все о файлах карты сайта
  2. определение
  3. Стандарт sitemaps.org
  4. Имя файла Sitemap
  5. Что такое индекс карты сайта?
  6. Максимальное количество URL в карте сайта
  7. Какая кодировка для файла?
  8. Есть полные или относительные URL?
  9. Какие поисковые системы управляют этим стандартом?
  10. Есть ли карта сайта XML или простой текстовый файл?
  11. Интерес файлов Sitemap
  12. Должен ли я создать файл карты сайта?
  13. Каков интерес Sitemap для SEO?
  14. Специализированные карты сайта: изображения, новости, видео, мобильные
  15. Советы по использованию файлов Sitemap
  16. Сделайте карты сайта по языку и / или стране!
  17. Есть ли конкретная карта сайта на сайте HTTPS?
  18. Как создать файл карты сайта?
  19. Как отсортировать URL-адреса в карте сайта?
  20. Файлы Sitemap в консоли поиска Google (GSC)
  21. Отчет об ошибках Sitemap
  22. Должны ли вы регулярно возвращать свою карту сайта?
  23. Чтобы получить еще больше помощи

Статья обновлена ​​10/01/2018, первоначально опубликована 06/06/2014

Все о файлах карты сайта

Я пишу «файл карты сайта», чтобы не путать его с картой сайта, это веб-страница для пользователей Интернета, позволяющая им находиться на сайте и понимать логику его дерева (эта HTML-страница редко нужна) ...

определение

Карта сайта - это файл со списком URL сайта, который вы хотите сканировать (и обычно индексировать). В формате sitemaps.org он должен быть объявлен поисковым системам. Это помогает сделать расширенный анализ SEO.

После того, как движки просмотрят файл, если все пойдет хорошо, они будут исследовать (сканировать) указанные URL-адреса. И поэтому, если все (все еще) хорошо, они должны проиндексировать известные URL.

Статья обновлена ​​10/01/2018, первоначально опубликована 06/06/2014   Все о файлах карты сайта   Я пишу «файл карты сайта», чтобы не путать его с картой сайта, это веб-страница для пользователей Интернета, позволяющая им находиться на сайте и понимать логику его дерева (эта HTML-страница редко нужна)

Пример XML-файла карты сайта (на elysee.fr). Формат XML не требуется.

Аудит карты сайта

Если вы хотите проверить свои карты сайта и открыть для себя множество возможностей улучшить SEO, благодаря расширенному аудиту карты сайта, откройте для себя мой инструмент RM Sitemaps , Доступный в моей SEO-платформе «Мои рейтинговые метрики», он включает в себя несколько инноваций и автоматизирует большую часть работы. Быть более эффективным и обнаружить в несколько кликов оптимизации, которые остались бы незамеченными ...

Стандарт sitemaps.org

Sitemaps - это протокол, предлагаемый крупнейшими поисковыми системами, позволяющий веб-мастерам перечислять URL-адреса, которые необходимо сканировать для индексации.

История:

  • Все началось с Sitemaps версии 0.84, выпущенной Google в июне 2005 года.
  • В декабре 2006 года 2 других ведущих движка на данный момент (Microsoft с Live Search переименовали в Bing и Yahoo) объявляют о поддержке Sitemaps 0.90 (см. пресс-релиз ). Стандарт родился, описано на официальном сайте sitemaps.org ,
  • В апреле 2007 года Ask объявляет о поддержке карт сайта. Также с этой даты можно указывать URL карты сайта в файле robots.txt.

Теперь следующие поисковые системы поддерживают протокол sitemaps.org:

Имя файла Sitemap

Вы можете выбрать имя, которое вы хотите для файла карты сайта, имя не навязывается.

Кстати, вы можете создать столько файлов Sitemap, сколько захотите (или почти). Если у вас их много, вы можете создать индексный файл карты сайта, в котором просто перечислены URL-адреса файлов карты сайта.

Лучше выбрать имя файла, трудно угадать, чтобы избежать предоставления информации вашим конкурентам (они не знают, какие страницы вы хотите проиндексировать в приоритетном порядке). Прекратите называть это sitemap.xml или хуже укажите это в вашем файле robots.txt (перейдите непосредственно к консоли поиска Google)

Что такое индекс карты сайта?

Если у вас есть несколько файлов Sitemap, вы можете использовать индексный файл Sitemap для их одновременной отправки. Формат XML файла индекса карты сайта очень похож на формат XML файла карты сайта. Файл индекса карты сайта использует следующие теги XML:

  • sitemapindex - родительский тег в начале и конце файла
  • карта сайта: родительский тег для каждой карты сайта, указанной в файле (дочерний узел sitemapindex);
  • loc: sitemap location (дочерний узел sitemap)
  • lastmod: дата последнего изменения карты сайта (необязательно)

Внимание: файл индекса карты сайта не может перечислять другие файлы индекса карты сайта. В нем должны быть указаны только файлы карты сайта.

Чтобы узнать больше о синтаксисе, посетите страницу, посвященную Протокол Sitemap ,

Вот пример индекса файлов Sitemap в формате XML. В этом индексе перечислены 2 файла Sitemap:

<? xml version = "1.0" encoding = "UTF-8"?> <sitemapindex xmlns = "https://www.sitemaps.org/schemas/sitemap/0.9"> <карта сайта> <loc> http: //www.example .com / sitemap-Categories.xml.gz </ loc> <lastmod> 2015-01-01T18: 23: 17 + 00: 00 </ lastmod> </ sitemap> <sitemap> <loc> http: // www. example.com/sitemap-products.xml.gz </ loc> <lastmod> 2015-01-01 </ lastmod> </ sitemap> </ sitemapindex>

Создав и сохранив индексный файл, вы можете объявить его в консоли поиска, как и другие файлы Sitemap. Если вы объявляете индексный файл, бесполезно объявлять дочерние файлы, перечисленные в этом индексном файле (кстати, если вы это сделаете, у вас будут дубликаты файлов Sitemap, что не является проблемой, кроме искаженных цифр в консоли поиска).

Вы можете отправить до 500 файлов индекса Sitemap для каждого сайта в своей учетной записи.

Максимальное количество URL в карте сайта

Какое максимальное количество файлов Sitemap и URL-адресов в файлах Sitemap?

Вот ограничения по объему:

  • файл может содержать до 50 000 URL-адресов
  • индекс Sitemap может содержать до 50 000 файлов Sitemap (но без файла индекса Sitemap)
  • Вы можете отправить до 500 файлов индекса Sitemap для каждого сайта
  • после распаковки (поскольку вы можете отправить его сжатым), размер файла не должен превышать 50 МБ (52 428 800 байт). Для информации: ограничение в 50 МБ относится к ноябрю 2016 года, до того, как оно составило 10 МБ.

Это ограничение в 1 250 000 000 000 URL должно подходить большинству из вас ;-)

Какая кодировка для файла?

Кодировка файла должна быть UTF-8 (подумайте об этом для файлов сайта TXT).

Есть полные или относительные URL?

URL должны быть полными (абсолютными) и не относительными. Ясно, что они должны начинаться с «http» (или «https», если у вас есть HTTPS сайт Я расскажу об этом позже).

Какие поисковые системы управляют этим стандартом?

Все основные поисковые системы управляют этими файлами карты сайта. Разумеется, при условии указания URL-адреса вашего файла, потому что, как я уже сказал, в отличие от файла robots.txt, имя которого является фиксированным и указывается местоположение (в корне соответствующего субдомена), вы Можно выбрать имя файла карты сайта.

Есть ли карта сайта XML или простой текстовый файл?

Файл может быть в текстовом формате (строка = URL, обязательное расширение .txt) или XML (стандартный sitemaps.org ). Я никогда не находил полезным возиться с XML, текстовый формат работает нормально, за исключением следующих случаев:

  • Индексы Sitemap должны быть в формате XML
  • карты сайта для новости
  • к списку образность или видео находится на странице HTML
  • предоставлять информацию для мобильных устройств ( мобильный URL-адрес эквивалентен URL-адресу рабочего стола, подробности здесь )
  • обеспечить языковые аннотации (когда вы управляете несколькими и / или странами)

Невозможно использовать карту сайта для обозначения канонического URL-адреса, но объявление URL-адресов в карте сайта говорит Google о том, что это важный URL, понимают «канонический». Напоминание: канонический URL-адрес объявляется на самой HTML-странице или через HTTP-заголовок X-Robots-Tag ; если нужно будет прочитать мой учебник по каноническому URL ,

На мой взгляд, формат XML не нужен, если вы хотите предоставить только один или несколько элементов ниже:

  • lastmod: как ни удивительно, Google обычно не учитывает дату последней модификации! ( источник )
  • changefreq: вы действительно дадите точное значение частоты изменения содержания каждой из ваших страниц? Если это приблизительное значение, дайте Google самостоятельно определить, как часто вы обновляете свои страницы!
  • Приоритет: если у вас очень маленький сайт (например, максимум 30 страниц), я сильно сомневаюсь, что вам удастся отсортировать все страницы строго и разумно. Бесполезно отдавать один и тот же приоритет целому множеству страниц! Кроме того, Джон Мюллер (из Google) заявил, что этот параметр не учитывается Google ( источник )!

Поделитесь информацией в Твиттере:

Интерес файлов Sitemap

Продвигает ли файл карты сайта SEO?

Быстрый ответ НЕТ!

Не путайте индексацию и позиционирование. Лучше работать с внутренними ссылками, чем с файлом карты сайта!

Скажи это в Твиттере:

В итоге: вам НЕ нужен файл карты сайта для индексирования ваших страниц. В противном случае это означает, что ваш сайт плохо спроектирован: ему не хватает внутренних ссылок, или количество уровней в дереве слишком важно.

Другими словами: если некоторые страницы вашего сайта недоступны по ссылкам (например, единственный способ получить к ним доступ - выполнить поиск по форме), даже если вы можете проиндексировать их с помощью файла карты сайта, они будет иметь очень низкую видимость в Google, так как они не имеют обратных ссылок. Если вы в этом случае, гораздо сложнее определить, проиндексированы ли эти страницы через карту сайта или по внутренним ссылкам. Вот почему я часто советую начинать БЕЗ карты сайта (чтобы проверить дизайн сайта) и затем добавлять, если это необходимо (см. Мои пояснения ниже).

Должен ли я создать файл карты сайта?

Для большинства сайтов я рекомендую его (подробности см. В следующем уроке). Еще более важно, что ваш сайт большой; И наоборот, если на вашем сайте всего несколько страниц, это действительно не является приоритетом.

Для больших сайтов, которые генерируют много новых страниц каждый день, очень полезно быстро обнаружить их в Google.

Каков интерес Sitemap для SEO?

Карта сайта полезна в SEO:

  • ускорить сканирование и, следовательно, индексацию новых URL-адресов, размещенных в Интернете
  • сделать расширенный анализ и найти оптимизации
  • найти сиротские страницы
  • облегчить редизайн сайта с изменениями URL
  • чтобы понять, какие страницы Google хочет проиндексировать
  • оценить эффективность SEO по типам страниц
  • ускорить деиндексацию определенных URL
  • и т.д.

Еще одна веская причина создать карту сайта и сообщить Google: получите более надежную информацию об индексации ваших страниц. Это гугл говорит это официально ( источник )

Отчет об охвате индекса работает еще лучше для сайтов, которые отправляют файлы Sitemap.

Специализированные карты сайта: изображения, новости, видео, мобильные

Есть и другие случаи, когда карты сайта могут быть полезны: это конкретный контент, для которого Google разработал производную от классического формата XML. Это образность , из новости , из видео и контент для мобильных устройств.

В этих случаях формат XML является обязательным, но я вернусь к этому позже.

Советы по использованию файлов Sitemap

Сделайте карты сайта в соответствии с типами страниц!

Для больших сайтов, которым нужен файл карты сайта, вы можете сделать 2 типа:

  • 1 список последних созданных страниц (чтобы попытаться увеличить скорость индексации)
  • 1 на тип страницы (чтобы попытаться измерить скорость индексации по типам страниц, например, листам продуктов, категориям, редакционным статьям и т. Д.)

Помните, что для доступа к статистике файла карты сайта вам необходимо проверить свою учетную запись Google Search Console.

Вот пример с 3 файлами Sitemap для 3 типов страниц (категории, статьи и страницы в WordPress)

Пример с 3 сайтами, для 3 типов страниц

В общем случае мы помещаем файлы Sitemap в корень соответствующего субдомена, но вы можете организовать себя по-другому. Вы можете ссылаться в карте сайта на URL-адреса из других поддоменов, но ваша учетная запись Google Search Console должна владеть этими другими поддоменами.

Сделайте карты сайта по языку и / или стране!

Если у вас многоязычный сайт, рекомендуется разделить карту сайта (или карты сайта) на несколько: по одному на каждый язык. Если у вас есть несколько файлов Sitemap (по типам страниц), перерисовывайте по языкам.

Если у вас есть сайт, ориентированный на несколько стран, существует также интерес к их разделению.

В обоих случаях идея состоит в том, чтобы облегчить изучение скорости индексации страниц по типам страниц, языкам и странам.

Есть ли конкретная карта сайта на сайте HTTPS?

Если ваш сайт доступен для некоторых страниц HTTP / HTTPS / тем для других, вы должны объявить каждую версию отдельно в консоли поиска (столько раз, сколько у вас есть поддоменов).

Я советую вам объявить файл Sitemap в консоли поиска (а не в файле robots.txt), поэтому объявляйте файлы sitemaps для URL-адресов HTTPS в свойствах HTTPS и файлов с URL-адресами HTTP в свойствах HTTP.

Возьмите пример сайта example.com, на котором есть HTTP-блог в поддомене http://blog.example.com, а остальные - в HTTPS https://example.com. Необходимо:

  • объявите эти 2 веб-ресурса в консоли поиска
  • по возможности также объявите другие версии (HTTP / HTTPS) этих же поддоменов
  • предоставить файл robots.txt для каждого
  • планировать карты сайта для каждого

Как создать файл карты сайта?

Многие из вас спрашивают, какие самые лучшие бесплатные инструменты для создания карты сайта. Все просто: вам нужно самостоятельно создать скрипт, который генерирует карту (-ы) сайта, или использовать плагин sitemap, если вы когда-либо использовали CMS. Этот скрипт очень похож на тот, который генерирует RSS-канал из других источников. Вы можете сделать столько скриптов (или опций), сколько есть типов страниц на вашем сайте (если вы следуете моей идее создания файла карты сайта по типу страниц).

Конечно, вы можете использовать скрипты, которые полностью адаптированы к вашей CMS. Например для WordPress их много.

Благодаря этому решению ваша карта сайта будет постоянно обновляться. Вам никогда не потребуется загружать его куда-либо (кроме как объявить его в Google, см. Ниже). При необходимости управляйте кэшем, чтобы не создавать этот файл каждый раз, когда он обращается к сканеру.

Вот три главные причины, по которым вам никогда не следует использовать генератор карты сайта для сканера (генератор карты сайта ):

  • зачем использовать инструмент сканирования, а не доверять бизнесу Google? Вы действительно думаете, что выбранный вами инструмент превзойдет сканер Google? И кроме того, почему вы хотите сделать работу Google?
  • запустив сканер на вашем сайте, вы запрашиваете сервер. Если используемый вами инструмент плохо спроектирован или настроен, он может перегрузить ваш сервер, запрашивая слишком много страниц в секунду.
  • Это решение не автоматизировано: вам придется подумать о запуске инструмента, экспорте сгенерированного файла и загрузке его на свой сервер. В то время как с сценарием вы сделали, карта сайта всегда будет в курсе.

К минусам, если вы используете сканер для других анализов своего сайта, например, для экспорта карты сайта, он все равно может вам помочь.

Как отсортировать URL-адреса в карте сайта?

Не нужно их сортировать, порядок не имеет значения. Важно то, что ваши карты сайта являются исчерпывающими (все URL-адреса указаны в списке).

Файлы Sitemap в консоли поиска Google (GSC)

Как объявить Sitemap в Google?

Интерфейс GSC позволяет объявлять новую карту сайта и просматривать связанную статистику.

Интерфейс GSC позволяет объявлять новую карту сайта и просматривать связанную статистику

GSC перечисляет карты сайта и их статистику

Чтобы отправить новый файл Sitemap, перейдите в раздел «Оптимизация»> «Карты сайта» и нажмите красную кнопку «Добавить / проверить файл Sitemap». Введите имя файла и подтвердите его, чтобы просто проверить файл или напрямую отправить его.

Это будет немедленно проанализировано Google, который быстро скажет вам, соответствует ли формат файла или нет.

Если вы используете индекс карты сайта, просто объявите его, не нужно объявлять каждый из файлов Sitemap.

Отчет об ошибках Sitemap

Затем вам нужно немного подождать (от нескольких часов до нескольких дней), чтобы получить статистику: Google указывает, сколько URL-адресов вы нашли в своем файле (это то, что странно называется «Дата отправки») и сколько он «решил» проиндексировать его (названный «В индексе»). Google не обязательно индексирует все URL в файле карты сайта, потому что:

Если Google находит ошибки в вашем файле, это указывает на них. Постарайтесь исправить их как можно быстрее.

Нажав на название карты сайта, вы получите некоторые детали. Затем, щелкнув тип связанного контента (по умолчанию «Веб-страницы»), вы получите кривую, показывающую, как день ото дня Google находит URL в вашем файле («Дата отправки») и сколько он проиндексировал. («В указателе»):

(«В указателе»):

Ежедневная статистика файла карты сайта в GWT

Должны ли вы регулярно возвращать свою карту сайта?

Нет, в общем, это не обязательно, я уверен, что вы найдете другие полезные вещи для вашего SEO! Google регулярно просматривает вашу карту сайта, и нет необходимости загружать ее снова. Проверьте сводную страницу Sitemap в GSC, и вы увидите дату, когда Google последний раз просматривал каждый из ваших файлов Sitemap.

Очевидно, это работает только в том случае, если ваша карта сайта динамическая (создается на лету при просмотре) или очень часто обновляется (автоматическим процессом дома).

Чтобы получить еще больше помощи

У вас есть несколько способов:

У вас есть несколько способов:

Файл карты сайта для Google, полезный для SEO? В этой папке содержатся объяснения и советы по использованию файлов сайтов XML или TXT для вашего SEO.

Источник заголовка изображения: Shutterstock (по лицензии)

Вам понравилась эта статья?

Есть полные или относительные URL?
Какие поисковые системы управляют этим стандартом?
Есть ли карта сайта XML или простой текстовый файл?
Каков интерес Sitemap для SEO?
Есть ли конкретная карта сайта на сайте HTTPS?
Как создать файл карты сайта?
Как отсортировать URL-адреса в карте сайта?
Encoding = "UTF-8"?
Есть полные или относительные URL?
Какие поисковые системы управляют этим стандартом?