Проверка xml карты сайта на ошибки

XML Sitemap помогает роботам поисковых систем ориентироваться в структуре и страницах сайта. Некорректно составленная карта может привести к проблемам с индексированием. Наш инструмент анализирует Sitemap: проверяет валидность, находит ошибки.

Для чего используют валидатор Sitemap

Карта сайта содержит важную для поисковиков информацию:

список всех URL;

общая структура, иерархия, приоритетность;

информация о проиндексированных картинках и видеодокументах.

Сервис «Анализ XML-карты сайта» анализирует корректность составления Sitemap, находит ошибки, проверяет количество ссылок, проиндексированных страниц и изображений, размер файла. Отдельная опция — проверка кода ответа каждого документа.

Принцип работы онлайн-инструмента

Программа анализирует загруженный файл или онлайн-документ:

  • 1

    Читает файл, переходит по ссылкам, находит ошибки.

  • 2

    Считает количество документов, проиндексированных Яндексом и Google.

  • 3

    Взвешивает файл, проверяет, не превышает ли вес рекомендованный порог.

Вариативность онлайн-проверки

Для удобства можно менять настройки, для этого нужно отметить нужные опции:

Инструмент позволяет указать URL для анализа или загрузить файл.

При необходимости валидатор анализирует коды ответа указанных URL.

Можно скачать результаты в виде CSV-файла.

Получение результатов анализа в виде CSV‑файла

Для удобства анализа и работы с выходными данными имеется возможность выгрузить результаты в формате CSV, как перед процессом проверки, так и после неё. Файл с источниками открывается в Excel для дальнейшей работы.

Как пользоваться инструментом

Если карта уже загружена на сайт, укажите ссылку. Если нет, передвиньте переключатель и загрузите файл в сервис.

Отметьте нужные опции: анализ кодов ответа сервера, скачивание результатов.

Нажмите на кнопку «Анализировать».

Анализ sitemap.xml - фото 1

Анализ выполняется в фоне, проверка может продолжаться несколько минут.

Анализ sitemap.xml - фото 2

Если карта сайта содержит ошибки, сервис указывает на них. А также показывает, какие URL отдают некорректный ответ. Эта информация помогает настроить Sitemap так, чтобы она ускоряла индексацию, способствовала SEO-продвижению сайта, росту поискового трафика.

Результаты проверок сохраняются в сервисе.

Инструмент работает на PRO-тарифах. Можно запускать до 5 параллельных проверок. За проверку списываются лимиты: 25 лимитов за каждую анализируемую XML карту. Опция «Анализировать коды ответа указанных URL» — 1 лимит за каждый URL из XML Sitemap.

Преимущества сервиса

Быстро и точно проверяет корректность Sitemap.

Проводит более подробный анализ, чем Яндекс.Вебмастер: проверяет наличие ошибок, размер файла, количество ссылок, считает документы в Яндексе и Google.

Анализирует коды ответа сервера, находит коды, отличные от 200.

Сохраняет предыдущие результаты проверки карты.

Инструмент полезен вебмастерам и SEO-специалистам при настройке нового или действующего сайта. Проверить карту необходимо при проблемах с индексацией сайта. Это обязательная часть технического аудита.

Дополнительные инструменты

Другие сервисы Пиксель Тулс, которые могут быть вам полезны:

Сервис для проверки ответа сервера. Инструмент для мониторинга работоспособности и определения веса страниц, которые продвигаются через рекламу или SEO.

Поиск зеркал для домена. Программа находит зеркала и проверяет каждое из них на корректность настройки.

Узнайте, как увеличить SEO‑трафик сайта в 3+ раза?

Укажите домен вашего сайта, приоритетные регионы продвижения и получите самый
полный список точек взрывного роста трафика и заявок с вашего сайта

Выберите ваш сайт
 

укажите сайт, регион и близких вам конкурентов

Немного магии поисковой
оптимизации —

мы подготовим для вас не менее 25 персональных рекомендаций

Отслеживайте прогресс
 

и получайте регулярные советы, рост трафика и продаж

Введите адрес XML Sitemap здесь:

1. Введите URL-адрес sitemap.xml в текстовое поле

Gunzip (.GZIP) файла Sitemap также будет работать

2. Нажмите на оранжевую кнопку «Проверить»!

Мы проверим, все ли ссылки, содержащиеся в вашем файле Sitemap, работают правильно

3. Проверьте ошибки

Что такое Sitemap?

Как понятно из названия, Sitemap (карта сайта) отображает ваш веб-сайт. Это веб-страница, в которой описывается структура вашего сайта, включая разделы и ссылки. Это значительно упрощает навигацию по вашему сайту. И очень важно иметь обновленный Sitemap для поисковых запросов и результатов пользовательского опыта.

Почему вашему сайту необходим файл Sitemap?

Проще говоря – вашему веб-сайту нужен Sitemap, чтобы его можно было найти на странице результатов поиска. XML Sitemap помогает поисковым системам, таким как Google и Bing, при сканировании легко понять структуру вашего сайта. И в случае, если ваш сайт имеет сложную структуру, или он недавно был создан или имеет динамические страницы, Sitemap значительно улучшит его рейтинг. Кроме того, у вас будет список всех URL-адресов вашего сайта, и вы получите приоритет сканирования поисковыми системами. Хотя вам и не обязательно иметь XML Sitemap, это важная часть любого SEO-продвижения. Наша проверка карты сайта абсолютно бесплатна и без каких-либо скрытых платежей.

Как ошибки файла Sitemap влияют на ваш рейтинг?

Ошибки файла sitemap включают ошибку сжатия, пустой файл sitemap, ошибку HTTP или некорректное пространство имен. Эти ошибки могут «загрязнить» файл sitemap, что затруднит сканирование вашего сайта. Если некоторые страницы не могут сканироваться должным образом, они не могут быть проиндексированы. Если ваши страницы не проиндексированы, вы не сможете получить высокий рейтинг Google и потеряете много органического трафика.

167280

167280

Нравится этот инструмент? Оцените его!

4.7
(Проголосовало 1559 пользователей)

Вы уже проголосовали! Отменить

Воспользуйтесь этим инструментом, чтобы оценить его

Лимитов нет. Авторизуйтесь!

Популярные вопросы по работе инструмента

Как это работает

Инструмент обходит те файлы карты сайта, которые вы ему подаете и находит в них ссылки на новые файлы карты сайта, а также на страницы. Затем он проверяет нет ли в файлах карты сайта ссылок на страницы, которые не смогут попасть в поиск.

Что именно проверяется

У страниц в карте сайта сервис проверяет код ответа сервера, дублирование Title (в сравнении с другими страницами в карте), а также не закрыты ли страницы директивой X-Robots-Tag и мета-тегом robots от индексации.

Всегда ли сервис подходит

Нет. Сервис не предназначен для проверки деиндексирующего файла карты сайта (который содержит ссылки на страницы отдающие 404 или закрытые от индексации). Такие файлы sitemap используют для ускорения исключения страниц из поискового индекса.

Рейтинг одобрения

5 из 5, на основе 7 отзывов пользователей

Инструмент помогает проверить корректность настройки файла XML карты сайта (чаще всего называется sitemap.xml). Если на вашем сайте часто появляются новые продвигаемые в поиске страницы, документы, изображения или видео, то для вас критически важна правильная настройка данного файла.

Sitemap.xml — это карта сайта для поисковых роботов, которая находится в корне сайта и содержит рекомендации того, какие страницы необходимо обходить в первую очередь и с какой частотой. Это ускоряет и упрощает процесс индексации. Создание sitemap.xml не является обязательным правилом. Такая карта должна быть на сайтах, которые имеют большое количество страниц, и в тех случаях, когда контент на страницах часто обновляется.

Sitemap, как правило, формирует программное обеспечение сайта по всем страницам, которые на нем есть. Однако не все системы администрирования сайтов знают, какие страницы запрещены для индексирования директивами в robots.txt или другим способом, и поэтому в Sitemap попадают закрытые от индексации страницы, а также страницы, созданные, но не добавленные в меню и т. д. Эти ошибки приносят массу проблем с поисковыми системами.

Разные поисковые системы обрабатывают правила в sitemap по-разному. Например, Яндекс скорей всего проиндексирует все страницы, которые есть в sitemap. Google чаще всего индексирует только те страницы, до которых можно дойти краулером переходом по ссылкам на сайте с учетом всех правил. То есть Google использует sitemap только для определения частоты сканирования страниц, а Яндекс берёт из sitemap страницы для индексации. Это является одной из причин, почему число страниц в Яндекс и Google может отличаться.

Анализ sitemap на сервисе Labrika помогает найти следующие виды ошибок:

Есть в sitemap, но не найдены при обходе сайта

Содержание отчета:

Содержание отчета Есть в sitemap, но не найдены при обходе сайта

  1. Адреса страниц.
  2. Код ответа страницы. Ошибка 404 — это стандартный код ответа HTTP о том, что страница не может быть найдена.
  3. Количество входящих ссылок, ведущих на страницу.
  4. Наличие блокировки страницы от индексации при помощи атрибута noindex.
  5. Наличие блокировки ссылок на страницу при помощи атрибута nofollow.
  6. Наличие блокировки страницы от индексации в Яндексе посредством директивы в robots.txt.
  7. Наличие блокировки страницы от индексации в Google посредством директивы в robots.txt.
  8. После нажатия кнопки «Скачать исправленный sitemap.xml» Labrika самостоятельно исправит все обнаруженные ошибки и сохранит правильную обновленную версию sitemap.xml на ваш компьютер.

Этот отчёт помогает найти так называемые страницы-сироты. Про этот термин в России знают далеко не все оптимизаторы. На Западе же он широко используется.

Страницы-сироты (бесхозные страницы) — это страницы веб-сайта, на которые нет ссылок с других страниц вашего сайта. Если такая страница даже проиндексируется поисковой системой, то PageRank (ссылочный вес) у этих страниц будет равен нулю, а значит позиции по конкурентным запросам будут сильно занижены. B интернете можно найти исследования, которые указывают на то, что несмотря на отказ от расчёта PageRank на сайт поисковые системы используют PageRank или аналогичные алгоритмы для оценки веса страниц внутри сайта. А это значит, что если посадочная страница попала в этот отчёт, то это требует срочного исправления ошибок.

отчёт помогает найти страницы-сироты

Причины ошибки могут быть следующие:

  1. На страницу ведет ссылка с документа, который сам закрыт для индексации, либо закрыты ведущие на него страницы. В результате паук поисковой системы, передвигаясь от главной страницы, доходит до закрытых страниц и не может пройти дальше, чтобы проиндексировать следующие документы.
  2. Заблокированы ссылки на нужную страницу, например, через атрибут rel=nofollow. То есть паук видит ссылку на страницу, но не переходит по ней, так как это запрещено.
  3. На страницу нет и, возможно, никогда не было ссылок.
  4. Страницу удалили в редакторе сайта и из меню, а html-файл на сайте остался.
  5. Закрыта сама страница, которая есть в sitemap. Поэтому она и не была найдена при индексации.

Чтобы исправить ошибку необходимо проверить блокировки страниц и ссылок на более низких уровнях, начиная с главной страницы сайта. Чаще всего ошибка возникает из-за того, что страницу сделали, но не добавили в меню или из-за того, что закрыли от индексации пагинацию в каталоге товаров (или в разделе блога – для информационных страниц).

Есть в sitemap, но закрыты от индексации

Здесь отображаются страницы, которые запрещены для индексации, но есть в sitemap.

То есть страницы по каким-то причинам закрыли от индексации, но не убрали из sitemap.

Это может привести к утечке конфиденциальной информации, появлению закрытых от индексации дублей страниц в индексе поисковых систем (+снижение позиций из-за этого) или потере краулингового бюджета в Яндексе. Google, как правило, не индексирует такие страницы. Их следует удалить из карты сайта. Если же по ошибке оказалась закрыта от индексирования страница, которая должна попасть в результаты поиска, необходимо снять блокировку индексации.

Нет в sitemap, но разрешены для индексации

Содержание отчета:

Содержание отчета Нет в sitemap, но разрешены для индексации

  1. Адреса страниц.
  2. Код ответа страницы. Код 200 говорит об успешной обработке запроса (страница доступна).
  3. Количество входящих ссылок, ведущих на страницу.
  4. После нажатия кнопки «Скачать исправленный sitemap.xml» Labrika самостоятельно исправит все обнаруженные ошибки и сохранит правильную версию карты сайта на ваш компьютер.

Здесь отображаются страницы, которые разрешены для индексации, но отсутствуют в sitemap. Эта ошибка самая безобидная из всех. Тем не менее, наличие страницы в sitemap даёт возможность управлять краулинговым бюджетом. Краулинговый бюджет — это лимит страниц, который поисковый робот может просканировать за определенный период времени. Важно, чтобы он расходовался на приоритетные посадочные страницы. Для этого они должны быть прописаны в sitemap.

В случае появления данной ошибки добавьте нужные страницы в карту сайта, а также проверьте, включено ли её автоматическое обновление и все ли необходимые разделы обрабатываются при формировании sitemap.

Внимание! Отчёты по sitemap будут доступны в том случае, если было выставлено достаточно лимитов, чтобы просканировать весь сайт. Иначе Labrika только определит, какие страницы включены в карту сайта, но не сможет установить весь список существующих на сайте страниц и сравнить его с содержимым sitemap.

Понравилась статья? Поделить с друзьями:
  • Проверка windows 7 на ошибки dism
  • Проверка gpt диска на ошибки
  • Проверка gge файла на ошибки
  • Проверка gerber файлов на наличие ошибок
  • Проверка gcode на ошибки