Как создавать и отправлять файлы Sitemap. Файлы Sitemap Sitemap где разместить

Создать sitemap.xml

Лимит страниц: 1200
Цена: Бесплатно!
Подход: Профессиональный!

Основное назначение sitemap.xml указать системам для поиска, какие страницы нуждаются в индексации в первую очередь. Некоторые не знают об этой роли карты сайта, а другие просто этим пренебрегают и не придают ей какого-то особого значения. Файл, который имеет более распространенное название , считается важным инструментом, можно сказать, основным, для того, чтобы указать поисковикам, какие страницы ресурса нуждаются в обязательном индексировании, хотя сам файл посетители вашего проекта видеть не будут.

Карта сайта содержит важную информацию, которая закладывается в него, для чего используется специальный синтаксис. Здесь перечисляются страницы для поисковиков, а также указывается какова степень их важности , как часто и когда последний раз они обновлялись. Все это непонятно и не нужно ни посетителям, ни владельцу сайта. Это предназначено только для поисковых машин.

Не имея этого файла, или если он неправильно заполнен, владелец сайта рискует тем, что его ресурс может быть поврежден или сайт не сможет раскрыть все свои возможности. Страницы, которые имеют важное значение, могут не индексироваться продолжительное время, а это отражается на посещении сайта, а соответственно и на его рейтинге. Это могут подтвердить специалисты, которым известна статистика множества проектов, создатели которых пренебрегали sitemap.xml . При одном показательном и интересном исследовании были выявлены самые популярные причины, из-за которых проекты продвигаются очень медленно. Если карта сайта, которая имеет расширение xml, не соответствует нужному формату или просто отсутствует, является причиной медленного продвижения, которая находится на втором места из десяти причин после некачественного контента. Эти факты могут убедить в важности карты больше, чем простые слова.

Чтобы быть уверенным, что проект правильно проиндексирован поисковиками создать файл sitemap мало. Можно его иметь, но поисковые машины могут его не увидеть. Нужно чтобы поисковики знали о его существовании. Для этого нужно правильно его создать и выбирать именно те страницы, которые считаются наиболее важными. Для правильно поиска нужно сделать определенные настройки, которые позволят не включать в поиск весь материал, находящийся на сайте, чтобы не замедлить работу робота.

В этом может помочь инструмент . Кроме того, что этот инструмент поможет в создании карты, он будет уведомлять поисковики о появлении нового материала, тем самым как бы давая понять, что они нуждаются в скорейшей индексации. Чтобы спрятать карту от любопытных, с помощью инструмента можно даже изменить ее название.

Где находится sitemap.xml поисковикам можно указать с помощью двух способов. В директиве ничего не опуская указать полный путь к файлу.

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить к нему доступ роботам Google.

Создание и отправка файлов Sitemap

Форматы файлов Sitemap

Google поддерживает несколько форматов файлов Sitemap, описанных ниже. Во всех форматах следует использовать стандартный протокол . Google в настоящее время не учитывает атрибут В файлах Sitemap.

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать файл индекса Sitemap , перечислив в нем все файлы Sitemap, и отправить их в Google все сразу.

Пример URL, в котором содержится символ, не относящийся к кодировке ASCII (ü), а также символ, требующий экранирования (&):
http://www.example.com/ümlat.html&q=name
Тот же URL в кодировке ISO-8859-1 (для размещения на сервере, использующем эту кодировку) и с примененным экранированием:
http://www.example.com/%FCmlat.html&q=name
Тот же URL в кодировке UTF-8 (для размещения на сервере, использующем эту кодировку) и с примененным экранированием:
Тот же URL с экранированной последовательностью вместо символа амперсанда:
http://www.example.com/%C3%BCmlat.html&q=name

  • Помните, что мы не гарантируем сканирование каждого URL в файле Sitemap. Такие файлы лишь помогают Google определить, какие страницы вы считаете важными.
  • Значения priority и changefreq игнорируются, поэтому их не нужно добавлять.
  • Google считывает значение lastmod , но только если оно указано корректно.
  • Как сделать файл Sitemap доступным для Google

    Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был обработан повторно, вам необходимо сообщить нам о том, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько раз одинаковые файлы Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не новый.

    Предоставить роботам Google доступ к файлу Sitemap можно несколькими способами:

    • Отправьте его в Google с помощью специального инструмента в Search Console
    • Вставьте в любом месте файла robots.txt строку, указывающую на расположение файла Sitemap:
      Sitemap: http://example.com/sitemap_location.xml
    • Воспользуйтесь запросом ping. Отправьте HTTP-запрос GET:
      http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap >
      Пример:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

    Файл sitemap.xml, так же, как и обычная карта сайта представляет из себя набор страниц, оформленных в XML-теги. С помощью данного файла, поисковые системы понимают, какие страницы вашего сайта следует индексировать в первую очередь.

    Обычная HTML карта сайта:

    Карта сайта в формате XML:

    У каждого варианта есть свои плюсы и минусы. Ключевое преимущество карты сайта в формате XML — исключение возможности размытия статического веса страниц внутри сайта.

    В этой статье я расскажу вам как составить корректный файл Sitemap.xml.

    Если вы уже знаете все про составление Sitemap, сразу переходите к последней главе, которая называется «Фишки».

    1. Директивы файла sitemap.xml

    Существуют 3 обязательных директивы, которые должны быть заполнены в любом случае, это теги:

    • < urlset>
    • < url>
    • < loc>

    А также 3 необязательных тега:

    • < lastmod>
    • < changefreq>
    • < priority>

    Вот памятка по расшифровке каждого тега из официального сайта http://www.sitemaps.org/ru/protocol.html :

    Атрибут

    Статус

    Описание

    обязательный

    Инкапсулирует этот файл и указывает стандарт текущего протокола.

    обязательный

    Родительский тег для каждого URL-адреса. Остальные теги подчинены этому тегу.

    обязательный

    Сам URL-адрес страницы. Всегда начинается с префикса (например, HTTP) и заканчиваться косой чертой (если сервер вашего сайта требует этого).

    Внимание: длина URL-адреса не должна превышать 2048 символов.

    необязательный

    Дата последнего изменения файла. Указывается строго в формате W3C Datetime. Он позволяет при необходимости не учитывать сегмент времени и использовать формат ГГГГ-ММ-ДД.

    необязательный

    Позволяет указать как часто меняется информация на странице.

    Это значение устанавливается приблизительно.

    Допустимые значения:

    • always
    • hourly
    • daily
    • weekly
    • monthly
    • yearly
    • never

    Если страница изменяется каждый раз, когда ее открывают — используем значение «always» (всегда). Если это архивная страница — ставьте never (никогда).

    Учтите, что этот атрибут служит для поискового робота подсказкой, а не правилом. Поэтому зависимости между ним и реальной частотой посещения страницы поисковым роботом нелинейная.

    необязательный

    Позволяет указать приоритет одних страниц вашего сайта перед другими.

    Диапазон значений — от 0,0 до 1,0.

    По умолчанию каждой странице отдается приоритет 0,5.

    Значение атрибута работает для сравнения приоритета страниц только внутри вашего сайта. То есть оно не влияет на сравнение вашего сайта с сайтами конкурентами в поисковой сети. Более того, выставлять всем страницам максимальный приоритет тоже бессмысленно. Потому что тогда значения будут одинаковыми для робота и атрибут просто не сработает. Так что не ищите лазеек, а указывайте объективные приоритеты для страниц.

    Сохраните эту памятку. Она обязательно пригодится вам в первое время. Стоит отметить еще один плюс XML-карты сайта - это гибкость. Гибкость заключается в сочетании разных необязательных директив.

    Теперь, когда у вас есть ясность, что такое XML-карта сайта и вы узнали основные директивы этого файла, можно перейти к его составлению.

    2. Составление файла sitemap.xml

    Составлять карту сайта можно 3 способами:

    • Вручную;
    • Автоматически, с помощью специальных сервисов;
    • Автоматически, с помощью готовых решений в виде плагинов к CMS и т.п.

    Процесс приготовления карты сайта следующий:

    • Составляем карту сайта одним из способов, перечисленных выше;
    • Проверяем на валидность с помощью сервисов поисковых систем (https://webmaster.yandex.ru/sitemaptest.xml);
    • Размещаем файл на сайте;
    • Указываем путь к карте сайта для поисковых роботов в файле robots.txt (Кстати, есть отдельная статья о том, );
    • Указываем Sitemap в панели вебмастеров Яндекс и Google.

    Итак, как составлять файл карты сайта?

    Разберем пример составления файла вручную. Если вы хотите добавить в карту сайта 5 страниц вашего сайта:

    Вот так должна выглядеть карта сайта в формате XML:

    http://site.ru/url-o_kompanii/

    http://site.ru/url-uslugi/

    http://site.ru/url-produkty/

    http://site.ru/url-dostavka/

    http://site.ru/url-kontakty/

    При необходимости добавляем необязательные теги из памятки, которую я привел выше. Дополнительные теги прописываются в контейнере , после указания URL-адреса страницы в теге . Например:

    http://site.ru/

    2005-01-01

    monthly

    0.8

    Приведенный выше код, указывает поисковой системе, что страница http://site.ru/

    в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).

    Особенно удобен функционал подсветки парных тегов.

    Сервисы для генерации Sitemap

    В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:

    Таких сервисов много. Я использую https://www.xml-sitemaps.com/ .

    Поясню вкратце все настройки:

    Плагины для CMS

    Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:

    Плагин

    Валидность

    После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml

    После успешной проверки заливаем наш файл на сайт.

    Расположение файла

    В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:

    Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:

    После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt () в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:

    Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap.

    Search Console и панель Яндекс.Вебмастера

    Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.

    • Настройка индексирования
    • Файлы Sitemap
    • «Проверить» и «Добавить»

    Следует отметить ограничения в XML-карте сайта:

    • В одном файле можно указать не более 50000 URL-адресов
    • Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора.gzip.
    • Кодировка файла только в UTF-8

    На этом основные этапы завершены. Следуйте всем описанным простым правилам и ошибок у вас не будет. Вторая часть статьи посвящена более детальной настройке, тонкостям и особенностям sitemap.xml эти знания потребуются вам для составления профессиональной карты сайта для интернет-магазинов.

    3. Группировка файлов Sitemap

    В случае превышения лимита в 50000 URL-адресов, нужно использовать вложенную структуру и создать группу из нескольких Sitemap. То есть создавать карты сайта в карте сайта!

    Для обычного сайта (не крупного портала или интернет-магазина) такой объем страниц редкость, поэтому группировку Sitemap большинство SEO-специалистов используют для удобства, например, для группировки страниц товаров или разделов.

    Синтаксис выглядит следующим образом:

    http://site.ru/sitemap1.xml.gz

    2004-10-01T18:23:17+00:00

    http://site.ru/sitemap2.xml.gz

    2005-01-01

    Определение XML-тегов:

    Атрибут


    Описание

    обязательный

    Инкапсулирует информацию о всех файлах Sitemap в этом файле.

    обязательный

    Инкапсулирует информацию об отдельном файле Sitemap.

    обязательный

    Указывает местоположение файла Sitemap.

    необязательно

    Указывает время изменения соответствующего файла Sitemap. Робот использует эту информацию, чтобы понять в каких файлах Sitemap произошли изменения. Косвенно, этот тег позволяет роботу быстрее обнаружить новые страницы сайта.

    Таким образом составляется сгруппированная карта сайта. Все остальные процедуры те же, что описаны выше. Не забываем указывать в файле robots.txt, в директиве Sitemap, корректную ссылку на ваш файл.

    4. Исследование

    В конце 2014 года я провел небольшое исследование по анализу эффективности наличия на сайте файла sitemap.xml.

    Наблюдалась проблема индексации товарной группы на сайте интернет-магазина (товаров порядка 10000). При этом, ничего не препятствовало их индексации. Был составлен файл карты сайта, состоящий только из ссылок на товары сайта. Карта сайта обновлялась автоматически. За 2 месяца в индексную базу поисковой системы Яндекс попало более 70% URL-адресов. Большая доля страниц, попавших в индекс, это страницы из карты сайта. Отмечу, что в данный период не проводились другие мероприятия по ускорению индексации сайта (например, простановка ссылок).

    Вот сами результаты:

    Вывод: карта сайта до сих пор влияет на индексацию вашего сайта. Необходимо регулярно обновлять и актуализировать данный файл.

    5. Фишки

    Чтобы статья не получилась скучной для опытных SEO-специалистов, предлагаю вам ознакомиться со следующими «фишками».

    Картиночный сайтмап

    Для привлечения дополнительного трафика из поисковых систем (возможно не совсем конверсионного) вы можете составить дополнительный Sitemap для картинок.

    Синтаксис для картиночной карты сайта выглядит так:

    xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

    http://example.com/primer.html

    http://example.com/kartinka.jpg

    http://example.com/photo.jpg

    Памятка по XML-тегам:

    Обязательно?

    Описание

    Содержит всю информацию об одном изображении. Каждый URL (тег ) может включать до 1000 тегов .

    URL изображения.

    В отдельных случаях домен URL изображения может отличаться от домена, используемого основным сайтом. Если оба домена подтверждены в Search Console, проблем при этом не возникнет. Но если картинки размещены с помощью системы управления контентом, например, сервиса Google Сайты, вам необходимо подтвердить сайт хостинга в Search Console. Кроме того, файл robots.txt не должен запрещать сканирование содержания, которое необходимо индексировать.

    Подпись к изображению.

    Место съемки. Например, Поронайск, о. Сахалин .

    Название изображения.

    URL лицензии изображения.

    Лайфхак для тех, кто дочитал

    Многие SEO-специалисты генерируют файлы Sitemap один раз на старте проекта. Дальше про карту сайта забывают. Проиндексировались страницы — хорошо. Нет — а что поделать?! Новые страницы вообще забывают вносить в sitemap.

    В ходе своего исследования я выяснил, что наиболее удобным способом решения этой проблемы является отдельный файл sitemap.xml, в котором будут только те страницы сайта, которые еще не попали в индекс.

    И именно это позволило вогнать в индекс Яндекса более 70% новых URL-адресов.

    Use the Sitemap file to inform Yandex about the current structure of the site: specify a special directive in robots.txt or add it in Yandex.Webmaster.

    With Yandex.Webmaster, you can:

    Uploading Sitemap

      Choose the site from the list.

      Enter the file URL. For example, https://example.com/sitemap.xml .

      Click the Add button.

    The file is put into the processing queue. The robot will download it within two weeks. Every added file, including the ones listed in the Sitemap index file , is handled by the robot separately.

    Once the file is downloaded you will see one of the statuses:

    Status Description Note
    “OK”
    “Redirect” Remove the redirect and
    “Error” File is formed incorrectly inform the robot about the update
    “Not indexed.”

    Server response check

    Disallow directive Allow access to Sitemap and inform the robot about the update
    Status Description Note
    “OK” The file is formed correctly and loaded into the robot"s database.

    The date of the last download is displayed next to the file.

    Indexed pages appear in the search results within two weeks.

    “Redirect” The URL redirects to another address. Remove the redirect and inform the robot about the update
    “Error” File is formed incorrectly Click the Error link to view the details. Edit the file and inform the robot about the update
    “Not indexed.” When the robot tries to download the Sitemap file, the server returns HTTP status other than 200

    Check if the file is available to the robot. To do it, use the Server response check tool. Specify the full path to the file.

    If the file is unavailable, contact the site or the hosting server administrator.

    The access to the file is denied in robots.txt with the Disallow directive Allow access to Sitemap and inform the robot about the update

    Updating Sitemap

    If you changed Sitemap file added to Yandex.Webmaster, there is no need to delete it and upload it again. The robot regularly checks the file for updates and errors.

    To speed up the file indexing, click the icon. If you use the Sitemap index file , you can launch the processing of each file listed in it. The robot will download the data within two weeks. You can use this function up to 10 times for each host.

    When you run out of all attempts, you will be able to try again 30 days after the first try. The exact date is shown in Yandex.Webmaster.

    Removing Sitemap

    Files added on the Sitemap files page can be removed from Yandex.Webmaster.If the Sitemap directive was added in the robots.txt file , delete it. After making changes, information about Sitemap disappears from the robot database and Yandex.Webmaster within a few weeks.

    FAQ

    Sitemap is displayed in the service as an excluded page with the “Invalid document format” status.

    The Sitemap file (and other XML files) is displayed as excluded pages. This is, however, only for information purposes and doesn"t affect the site indexing or the Sitemap processing.

    The Sitemap file can be displayed in a group of excluded pages if the robot tried to index it as a regular page, while the XML files aren"t indexed in the Yandex search engine and aren"t included in the search results.

    The “Unknown tag” error occurred while processing Sitemap

    The Sitemap file may contain only certain XML elements . If Yandex.Webmaster finds other elements in the file (for example, a reference to the mobile or multilingual version, image URLs), it displays the \"Unknown tag\" error. The robot ignores unsupported elements when processing Sitemap and takes into account the data from the supported elements. Therefore, you don"t need to change the Sitemap file.

    If the file content is changed, the information in Yandex.Webmaster is updated within two weeks.

    The Sitemap file has the “Not indexed” status.

    The Sitemap file may be not indexed for several reasons:

      The robot crawled the Sitemap file recently and didn"t process it yet. Wait for two weeks. If you use the Sitemap index file with multiple files, they may take longer to process than a single Sitemap file.

    Файл sitemap.xml - это инструмент, который позволяет вебмастерам информировать поисковые системы о страницах сайта, доступных к индексации. Также, в XML карте можно указывать дополнительные параметры страниц: дата последнего обновления, частота обновлений и приоритет относительно других страниц. Информация в sitemap.xml может влиять на поведение поискового краулера и, в целом, на процесс индексации новых документов. Sitemap содержит в себе директивы включения страниц в очередь на обход и дополняет robots.txt, содержащий директивы исключения страниц.

    В этом руководстве вы найдете ответы на все вопросы, касающиеся использования sitemap.xml.

    Нужен ли мне sitemap.xml

    Поисковые системы используют sitemap для поиска новых документов на сайте (это могут быть html-документы или медиа-контент), которые недоступны через навигацию, но их необходимо просканировать. Наличие ссылки на документ в sitemap.xml не гарантирует его сканирование или индексацию, но чаще всего файл помогает большим сайтам индексироваться лучше. К тому же, данные из XML карты используются при определении канонических страниц, если это специально не указано в теге rel=canonical.

    Sitemap.xml важен для сайтов, где:

    • Некоторые разделы недоступны через навигационное меню.
    • Имеется множество изолированных страниц или плохо связанных между собой.
    • Используются технологии, слабо поддерживаемые поисковыми системами (например, Ajax, Flash или Silverlight).
    • Присутствует очень много страниц и есть вероятность, что поисковый краулер пропустит новый контент.

    Если это не ваши случаи, то скорей всего sitemap.xml вам не нужен. Для сайтов, где каждая важная для индексации страница доступна в пределах 2х кликов, где для отображения контента не используются технологии JavaScript или Flash, где при необходимости используются канонические и региональные теги, и свежий контент появляется не чаще, чем на сайт заходит робот, в файле sitemap.xml нет необходимости.

    Для небольших проектов при наличии проблемы лишь большого уровня вложенности документов, ее легко решить с помощью HTML карты сайта, не прибегая к использованию XML карты. Но если вы решили, что sitemap.xml вам все-таки нужен, то прочитайте это руководство полностью.

    Техническая информация

    • Sitemap.xml является текстовым файлом формата XML . Однако, поисковые системы также поддерживают текстовый формат (см. следующий раздел).
    • Каждый сайтмап может содержать максимум 50 000 адресов и весить не более 50Мб (10Мб для Яндекса).
    • Можно использовать gzip-сжатие для уменьшения размера файла sitemap.xml и увеличения скорости его передачи. В таком случае используйте расширение gz (sitemap.xml.gz). При этом, ограничения по весу остаются для несжатых сайтмапов.
    • Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Карта, содержащая адреса страниц всего сайта, должна располагаться в корне. Если сайтмап располагается в папке, то и все URL в этом сайтмапе должны располагаться в этой папке или глубже ().
    • Адреса в sitemap.xml должны быть абсолютными.
    • Максимальная длина URL - 2048 символов (1024 символа для Яндекса).
    • Спецсимволы в URL (типа амперсанда "&" или кавычек) должны маскироваться в HTML-сущности.
    • Указанные в карте страницы должны отдавать 200 http-код статуса.
    • Перечисленные в карте адреса не должны быть закрыты в файле robots.txt или в meta-robots.
    • Sitemap не должен быть закрыт в robots.txt, иначе поисковая система его не просканирует. Сам файл может находиться в индексе, это нормально.

    Форматы XML карт

    Поисковые системы поддерживают простой текстовый формат карты сайта, где просто списком перечислены URL-адреса страниц без дополнительных параметров. В таком случае файл должен иметь кодировку UTF-8 и иметь расширение .txt .

    Также поисковиками поддерживается стандартный XML-протокол . Google дополнительно поддерживает сайтмапы для изображений, видео и новостей.

    Пример файла Sitemap, содержащий только один адрес.

    https://сайт/ 2018-06-14 daily 0.9

    XML-теги
    urlset
    url (обязательный) - родительский тег для каждого URL-адреса.
    loc (обязательный) - URL-адрес документа, должен быть абсолютным.
    lastmod - дата последнего изменения документа в формате Datetime .
    changefreq - частота изменения страницы (always, hourly, daily, weekly, monthly, yearly, never). Значение этого тега является рекомендацией поисковым системам, а не командой.
    priority - приоритетность URL относительно других адресов (от 0 до 1) для очередности сканирования. Если не указывается, то по умолчанию равна 0.5.

    XML карта для изображений

    Некоторые оптимизаторы вставляют в sitemap.xml ссылки на изображения аналогично ссылкам на html-документы. Так можно делать, но лучше для Google использовать расширение стандартного протокола и вместе с урлами отправлять дополнительную информацию об изображениях. Создавать XML карты изображений полезно, если картинки необходимо сканировать и индексировать, и при этом, они напрямую не доступны боту (например, используется JavaScript).

    Пример карты сайта, содержащей одну страницу и принадлежащие ей изображения

    http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

    XML-теги
    image:image (обязательно) - информация об одном изображении. Максимум может использоваться 1000 изображений.
    image:loc (обязательно) - путь к файлу изображения. Если используется CDN, то допустимо ссылаться на другой домен, если он подтвержден в панели для вебмастеров.
    image:caption - подпись к изображению (может содержаться длинный текст).
    image:title - название изображение (обычно короткий текст).
    image:geo_location - место съемки.
    image:license - URL лицензии изображения. Используется при расширенном поиске по картинкам.

    XML карта для видео

    Подобно карте для изображений, Google также имеет расширение sitemap протокола для видео, где можно указывать подробную информацию о видео-контенте, влияющую на отображение в поиске по видео. Видео-сайтмап необходим, когда на сайте используются видео, которые хостятся локально, и когда индексация этих видео затруднена из-за используемых технологий. Если вы на сайте внедряете видео из YouTube, то video-sitemap здесь не нужен.

    Файл Sitemap для новостей

    При наличии на сайте новостного контента и участии в Google Новостях полезно использовать Sitemap для новостей, так Google будет быстрей находить ваши свежие материалы и индексировать все новостные статьи. В этом случае Sitemap должен содержать только адреса страниц, опубликованных за последние 2 дня и содержать не более 1000 урлов.

    Использование нескольких карт

    При необходимости можно использовать несколько карт сайтов, объединяя их в один индексный сайтмап. Несколько sitemap.xml используются в случаях, когда:

    • На сайте используется несколько движков (CMS).
    • На сайте больше 50 000 страниц.
    • Необходимо настроить удобное отслеживание ошибок в разделах.

    В последнем случае каждый большой раздел сайта имеет свой sitemap.xml и все они добавляются в панель для вебмастеров, где удобно наблюдать, в каком из разделов больше всего ошибок (см. раздел поиска ошибок в карте сайта).

    Если у вас 2 и более сайтмапа, их необходимо объединить в индексный сайтмап, который выглядит также как обычный (за исключением наличия тегов sitemapindex и sitemap вместо urlset и url), имеет аналогичные ограничения и может ссылаться только на обычные XML карты (не на индексные).

    Пример Sitemap Index:

    http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

    sitemapindex (обязательный) - указывает стандарт текущего протокола.
    sitemap (обязательный) - содержит информацию об отдельном sitemap.
    loc (обязательный) - местоположение sitemap (в формате xml, txt или rss для Google).
    lastmod - время изменения сайтмапа. Позволяет поисковикам быстро обнаруживать новые URL на сайтах больших размеров.

    Как создать sitemap.xml

    Методы создания XML Sitemap:

    • Внутренние средства CMS. Многие CMS уже поддерживают создание карты сайта. Чтобы это выяснить, почитайте документацию к вашей CMS, посмотрите пункты меню в администраторской панели или обратитесь в техподдержку движка. Загрузите на вашем сайте файл https://вашсайт.com/sitemap.xml , возможно он уже существует и динамически формируется.
    • Внешние плагины. Если в CMS нет функционала генерации карты сайта, и она поддерживает плагины, погуглите, какой из плагинов закрывает вопрос sitemap.xml для вашего движка и установите его. В некоторых случаях необходимо обратиться к программистам, чтобы они написали вам подобный плагин.
    • Отдельный скрипт на сайте. Зная протокол XML карты и технические ограничения, можно создать sitemap.xml самостоятельно, добавив скрипт генерации в CRON. Если вы не программист, используйте другие пункты этого списка.
    • Генераторы Sitemap. Существует множество генераторов sitemap.xml, которые сканируют ваш сайт и дают скачать готовую карту. Недостаток здесь в том, что при каждом обновлении сайта необходимо вручную генерировать сайтмап.
    • Парсеры. Десктопные программы, предназначенные для технического анализа сайта, обычно предоставляют возможность скачать sitemap.xml, сгенерированный на основе просканированных страниц. Работает аналогично генераторам sitemap, только запускается локально на своей машине.

    Популярные онлайн-генераторы карты сайта

    XML-Sitemaps.com

    Позволяет получить sitemap.xml в несколько кликов. Поддерживает форматы XML, HTML, TXT и GZ. Удобно использовать для небольших сайтов (до 500 страниц).

    Похожий генератор, но имеет чуть больше настроек и позволяет создать карту до 2000 страниц бесплатно.

    Имеет множество настроек, позволяет импортировать URL-адреса из CSV-файла. Бесплатно сканирует до 500 урлов.

    Не имеет лимитов на количество страниц для сканирования. Но для больших сайтов процесс генерации может подвисать на несколько десятков минут.

    Локальные программы для генерации XML Sitemap

    G-Mapper Sitemap Generator

    Бесплатная десктопная версия генератора карты сайта под Windows.

    Screaming Frog SEO Spider

    Гибкий инструмент генерации карты сайта с множеством настроек. Удобно, если вы уже пользуетесь скримин фрогом для других SEO-задач. После сканирования сайта используйте пункт меню Sitemaps -> Create XML Sitemap.

    Netpeak Spider

    Менее гибкое, но тоже удобное решение для быстрой генерации sitemap.xml. После сканирования сайта необходимо использовать пункт меню Инструменты -> Генерация Sitemap.