QRkoder

sitemap.xml

sitemap.xml — XML-карта сайта для Googlebot и Yandexbot. Структура urlset/lastmod/changefreq, лимиты 50 000 URL, sitemap index.

sitemap.xml — XML-файл, в котором сайт перечисляет все свои страницы для поисковых роботов. Googlebot и Yandexbot читают его при каждом обходе и узнают о новых или изменившихся URL значительно быстрее, чем при обычном краулинге по ссылкам. Файл размещают в корне домена и указывают в robots.txt и в панелях Search Console / Yandex Webmaster.

Определение

sitemap.xml — протокол обмена данными о структуре сайта между вебмастером и поисковыми роботами, разработанный Google, Yahoo и Microsoft в 2005 году и стандартизированный на sitemaps.org. Файл описывает список URL, которые владелец сайта считает значимыми для индексирования. Каждая запись может содержать метаданные: дату последнего изменения (lastmod), предполагаемую частоту изменений (changefreq) и относительный приоритет страницы в структуре сайта (priority).

Наличие sitemap не гарантирует индексирование каждого URL — поисковик оставляет за собой право пропустить страницу. Однако карта сайта ускоряет обнаружение новых публикаций и помогает ботам не тратить краулинговый бюджет на угадывание ссылок. Это особенно важно для молодых сайтов с небольшим числом внешних ссылок. Для правильного закрытия служебных страниц от индексирования sitemap работает в паре с canonical URL и файлом robots.txt.

Структура и пример

Базовый sitemap состоит из корневого элемента <urlset> с пространством имён sitemaps.org и дочерних элементов <url>. Обязательный элемент внутри <url> — только <loc>; остальные необязательны.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/page</loc>
    <lastmod>2026-05-28</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.8</priority>
  </url>
  <url>
    <loc>https://example.com/about</loc>
    <lastmod>2026-01-10</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.5</priority>
  </url>
</urlset>

Значения changefreq: always, hourly, daily, weekly, monthly, yearly, never. Значение priority — число от 0.0 до 1.0, которое задаёт приоритет только внутри одного сайта и не влияет на ранжирование относительно других сайтов. Главная страница обычно получает 1.0, ключевые разделы — 0.8–0.9, вспомогательные страницы — 0.3–0.5.

Файл обязательно сообщают поисковикам: директива Sitemap: https://example.com/sitemap.xml в robots.txt — наиболее распространённый способ. Дополнительно URL карты сайта добавляют вручную в Google Search Console и Yandex Webmaster. Для структурированных данных о страницах сайта используйте также Schema.org-разметку.

Типы и лимиты

Один файл sitemap.xml вмещает не более 50 000 URL и не должен превышать 50 МБ в сжатом виде (gzip). При превышении любого из лимитов файл разбивают на части и создают sitemap index — сводный XML, который перечисляет все дочерние карты.

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap-pages.xml</loc>
    <lastmod>2026-05-28</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-blog.xml</loc>
    <lastmod>2026-05-28</lastmod>
  </sitemap>
</sitemapindex>

Помимо базового urlset, стандарт поддерживает расширения для специального контента:

  • Image Sitemap — добавляет теги <image:image> с URL изображений, помогает попасть в Google Images.
  • Video Sitemap — описывает видеофайлы: длительность, миниатюра, дата публикации.
  • News Sitemap — для новостных изданий, включённых в Google News; содержит заголовок, дату и ключевые слова статьи.
  • Hreflang Sitemap — перечисляет языковые/региональные альтернативы страниц для многоязычных сайтов.

Сайт qrkoder.ru публикует карту по адресу https://qrkoder.ru/sitemap.xml — в ней собраны статьи блога, термины глоссария и страницы генератора QR-кодов.

Частые вопросы

Обязателен ли sitemap.xml для каждого сайта?

Формально нет. Небольшой сайт с 10–20 страницами, хорошо связанными внутренними ссылками, Google и Яндекс обойдут и без карты. Однако sitemap.xml практически всегда ускоряет индексирование: поисковик узнаёт о новых страницах в течение нескольких часов после обновления карты, а не ждёт следующего планового обхода. Для сайтов с динамическим контентом (блог, каталог, глоссарий) и для молодых доменов с небольшим ссылочным профилем карта сайта является стандартом качества SEO, а не опцией.

Как sitemap.xml влияет на краулинговый бюджет?

Краулинговый бюджет — количество страниц, которые Googlebot готов обойти за единицу времени. Если в sitemap включены только важные, индексируемые страницы без дублей и служебных URL, поисковик тратит бюджет на них, а не на случайные параметры или pagination. Включать в sitemap нужно только страницы с тегом canonical на самих себя и без директивы noindex. Страницы с noindex в sitemap создают сигнальное противоречие и могут снижать доверие к карте в целом.

Нужно ли обновлять sitemap при каждом изменении контента?

Для блогов и каталогов рекомендуется автоматическая генерация карты при публикации новой страницы или обновлении существующей. Поле lastmod должно содержать реальную дату изменения — Google замечает, если она не меняется месяцами, и начинает игнорировать сигнал. Дата в lastmod должна соответствовать фактическому изменению контента, а не автоматически проставляться «сегодня» при каждом рендере страницы. Современные CMS (WordPress, Next.js, Nuxt) умеют генерировать sitemap динамически.

Чем sitemap.xml отличается от robots.txt?

Это разные инструменты с противоположными функциями. robots.txt запрещает или разрешает роботам обходить определённые разделы сайта — он управляет доступом. sitemap.xml, напротив, активно сообщает роботам, какие страницы существуют и когда обновлялись — он управляет обнаружением. Хорошая практика: в robots.txt добавить строку Sitemap: https://example.com/sitemap.xml, чтобы любой бот при первом визите сразу получил ссылку на карту.

Как связаны sitemap.xml и QR-коды?

QR-коды в маркетинговых материалах ведут на посадочные страницы сайта. Если эти страницы включены в sitemap.xml и правильно проиндексированы, они не только доступны по прямой ссылке из QR-кода, но и находятся через органический поиск Google и Яндекс. Это умножает охват кампании: пользователь, видевший QR-листовку, может позже найти ту же страницу в поиске по брендовому запросу. Для динамических QR-кодов важно, чтобы целевой лендинг имел canonical URL на чистой версии без UTM-параметров, и именно этот URL был прописан в sitemap.

Создавайте QR-коды бесплатно

Динамические QR-коды с аналитикой, дизайном и без ограничений по сканированиям.

Начать бесплатно