sitemap.xml
sitemap.xml — XML-карта сайта для Googlebot и Yandexbot. Структура urlset/lastmod/changefreq, лимиты 50 000 URL, sitemap index.
sitemap.xml — XML-файл, в котором сайт перечисляет все свои страницы для поисковых роботов. Googlebot и Yandexbot читают его при каждом обходе и узнают о новых или изменившихся URL значительно быстрее, чем при обычном краулинге по ссылкам. Файл размещают в корне домена и указывают в robots.txt и в панелях Search Console / Yandex Webmaster.
Определение
sitemap.xml — протокол обмена данными о структуре сайта между вебмастером и поисковыми роботами, разработанный Google, Yahoo и Microsoft в 2005 году и стандартизированный на sitemaps.org. Файл описывает список URL, которые владелец сайта считает значимыми для индексирования. Каждая запись может содержать метаданные: дату последнего изменения (lastmod), предполагаемую частоту изменений (changefreq) и относительный приоритет страницы в структуре сайта (priority).
Наличие sitemap не гарантирует индексирование каждого URL — поисковик оставляет за собой право пропустить страницу. Однако карта сайта ускоряет обнаружение новых публикаций и помогает ботам не тратить краулинговый бюджет на угадывание ссылок. Это особенно важно для молодых сайтов с небольшим числом внешних ссылок. Для правильного закрытия служебных страниц от индексирования sitemap работает в паре с canonical URL и файлом robots.txt.
Структура и пример
Базовый sitemap состоит из корневого элемента <urlset> с пространством имён sitemaps.org и дочерних элементов <url>. Обязательный элемент внутри <url> — только <loc>; остальные необязательны.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/page</loc>
<lastmod>2026-05-28</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<lastmod>2026-01-10</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
Значения changefreq: always, hourly, daily, weekly, monthly, yearly, never. Значение priority — число от 0.0 до 1.0, которое задаёт приоритет только внутри одного сайта и не влияет на ранжирование относительно других сайтов. Главная страница обычно получает 1.0, ключевые разделы — 0.8–0.9, вспомогательные страницы — 0.3–0.5.
Файл обязательно сообщают поисковикам: директива Sitemap: https://example.com/sitemap.xml в robots.txt — наиболее распространённый способ. Дополнительно URL карты сайта добавляют вручную в Google Search Console и Yandex Webmaster. Для структурированных данных о страницах сайта используйте также Schema.org-разметку.
Типы и лимиты
Один файл sitemap.xml вмещает не более 50 000 URL и не должен превышать 50 МБ в сжатом виде (gzip). При превышении любого из лимитов файл разбивают на части и создают sitemap index — сводный XML, который перечисляет все дочерние карты.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-pages.xml</loc>
<lastmod>2026-05-28</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-blog.xml</loc>
<lastmod>2026-05-28</lastmod>
</sitemap>
</sitemapindex>
Помимо базового urlset, стандарт поддерживает расширения для специального контента:
- Image Sitemap — добавляет теги
<image:image>с URL изображений, помогает попасть в Google Images. - Video Sitemap — описывает видеофайлы: длительность, миниатюра, дата публикации.
- News Sitemap — для новостных изданий, включённых в Google News; содержит заголовок, дату и ключевые слова статьи.
- Hreflang Sitemap — перечисляет языковые/региональные альтернативы страниц для многоязычных сайтов.
Сайт qrkoder.ru публикует карту по адресу https://qrkoder.ru/sitemap.xml — в ней собраны статьи блога, термины глоссария и страницы генератора QR-кодов.
Частые вопросы
Обязателен ли sitemap.xml для каждого сайта?
Формально нет. Небольшой сайт с 10–20 страницами, хорошо связанными внутренними ссылками, Google и Яндекс обойдут и без карты. Однако sitemap.xml практически всегда ускоряет индексирование: поисковик узнаёт о новых страницах в течение нескольких часов после обновления карты, а не ждёт следующего планового обхода. Для сайтов с динамическим контентом (блог, каталог, глоссарий) и для молодых доменов с небольшим ссылочным профилем карта сайта является стандартом качества SEO, а не опцией.
Как sitemap.xml влияет на краулинговый бюджет?
Краулинговый бюджет — количество страниц, которые Googlebot готов обойти за единицу времени. Если в sitemap включены только важные, индексируемые страницы без дублей и служебных URL, поисковик тратит бюджет на них, а не на случайные параметры или pagination. Включать в sitemap нужно только страницы с тегом canonical на самих себя и без директивы noindex. Страницы с noindex в sitemap создают сигнальное противоречие и могут снижать доверие к карте в целом.
Нужно ли обновлять sitemap при каждом изменении контента?
Для блогов и каталогов рекомендуется автоматическая генерация карты при публикации новой страницы или обновлении существующей. Поле lastmod должно содержать реальную дату изменения — Google замечает, если она не меняется месяцами, и начинает игнорировать сигнал. Дата в lastmod должна соответствовать фактическому изменению контента, а не автоматически проставляться «сегодня» при каждом рендере страницы. Современные CMS (WordPress, Next.js, Nuxt) умеют генерировать sitemap динамически.
Чем sitemap.xml отличается от robots.txt?
Это разные инструменты с противоположными функциями. robots.txt запрещает или разрешает роботам обходить определённые разделы сайта — он управляет доступом. sitemap.xml, напротив, активно сообщает роботам, какие страницы существуют и когда обновлялись — он управляет обнаружением. Хорошая практика: в robots.txt добавить строку Sitemap: https://example.com/sitemap.xml, чтобы любой бот при первом визите сразу получил ссылку на карту.
Как связаны sitemap.xml и QR-коды?
QR-коды в маркетинговых материалах ведут на посадочные страницы сайта. Если эти страницы включены в sitemap.xml и правильно проиндексированы, они не только доступны по прямой ссылке из QR-кода, но и находятся через органический поиск Google и Яндекс. Это умножает охват кампании: пользователь, видевший QR-листовку, может позже найти ту же страницу в поиске по брендовому запросу. Для динамических QR-кодов важно, чтобы целевой лендинг имел canonical URL на чистой версии без UTM-параметров, и именно этот URL был прописан в sitemap.