Как проверить файл sitemap xml на ошибки

Введите адрес XML Sitemap здесь:

1. Введите URL-адрес sitemap.xml в текстовое поле

Gunzip (.GZIP) файла Sitemap также будет работать

2. Нажмите на оранжевую кнопку «Проверить»!

Мы проверим, все ли ссылки, содержащиеся в вашем файле Sitemap, работают правильно

3. Проверьте ошибки

Что такое Sitemap?

Как понятно из названия, Sitemap (карта сайта) отображает ваш веб-сайт. Это веб-страница, в которой описывается структура вашего сайта, включая разделы и ссылки. Это значительно упрощает навигацию по вашему сайту. И очень важно иметь обновленный Sitemap для поисковых запросов и результатов пользовательского опыта.

Почему вашему сайту необходим файл Sitemap?

Проще говоря – вашему веб-сайту нужен Sitemap, чтобы его можно было найти на странице результатов поиска. XML Sitemap помогает поисковым системам, таким как Google и Bing, при сканировании легко понять структуру вашего сайта. И в случае, если ваш сайт имеет сложную структуру, или он недавно был создан или имеет динамические страницы, Sitemap значительно улучшит его рейтинг. Кроме того, у вас будет список всех URL-адресов вашего сайта, и вы получите приоритет сканирования поисковыми системами. Хотя вам и не обязательно иметь XML Sitemap, это важная часть любого SEO-продвижения. Наша проверка карты сайта абсолютно бесплатна и без каких-либо скрытых платежей.

Как ошибки файла Sitemap влияют на ваш рейтинг?

Ошибки файла sitemap включают ошибку сжатия, пустой файл sitemap, ошибку HTTP или некорректное пространство имен. Эти ошибки могут «загрязнить» файл sitemap, что затруднит сканирование вашего сайта. Если некоторые страницы не могут сканироваться должным образом, они не могут быть проиндексированы. Если ваши страницы не проиндексированы, вы не сможете получить высокий рейтинг Google и потеряете много органического трафика.

167280

167280

Нравится этот инструмент? Оцените его!

4.7
(Проголосовало 1559 пользователей)

Вы уже проголосовали! Отменить

Воспользуйтесь этим инструментом, чтобы оценить его

С помощью отчета о файлах Sitemap вы можете сообщить Google о появлении новых карт вашего сайта, посмотреть историю отправки файлов Sitemap, а также узнать об ошибках, с которыми столкнулась наша система при анализе файла Sitemap.

Открыть отчет о файлах Sitemap

Что такое файл Sitemap? Будет ли мне полезен этот отчет?

Файл Sitemap содержит информацию о страницах сайта, на котором он размещен, и помогает Google определять, какие страницы нужно просканировать.

  • Если вы пользуетесь сервисом веб-хостинга (Squarespace, Wix и т. п.), то в нем файл Sitemap может формироваться автоматически. В таком случае вам не нужно создавать его вручную или прибегать к помощи отчета, о котором идет речь. Поищите сведения о файлах Sitemap в справочных материалах своего хостинг-провайдера.
  • Если у вас небольшой сайт (меньше 100 страниц), а по его ссылкам можно перейти от главной страницы к любой другой на нем, то файлы Sitemap и отчет о них вам не нужны. Достаточно запросить индексирование главной страницы. При использовании сервиса веб-хостинга, как уже было сказано выше, никакие действия не требуются.

Подробнее о файлах Sitemap…

Управление файлами Sitemap

Sitemaps API

Также для управления файлами Sitemap можно использовать Search Console Sitemaps API. Этот API поддерживает те же функции и позволяет получать ту же информацию, что и отчет.

Как отправить файл Sitemap

«Отправить» файл Sitemap в Google – значит сообщить нам, где найти его на вашем сайте. Сам файл в Google не загружается.

Инструкции

  1. Вы сможете отправить файл Sitemap с помощью отчета, только если у вас есть права владельца ресурса. Если таких прав у вас нет, добавьте ссылку на файл Sitemap в файл robots.txt.
  2. Опубликуйте файл Sitemap на своем сайте.
    • Файл должен быть создан в одном из подходящих форматов. Придерживайтесь рекомендаций относительно синтаксиса, расположения файла и т. д.
    • Советуем разместить файл Sitemap на корневом уровне вашего сайта. Если же вы используете сервис веб-хостинга (например, Blogger, Wix или GoDaddy), изучите справочные материалы этого сервиса, чтобы узнать, куда и как добавить файл и есть ли в нем необходимость.
    • Проверьте файл Sitemap на наличие синтаксических ошибок с помощью XML-генератора.
  3. Проверьте, есть ли у Google доступ к файлу Sitemap. Убедитесь, что доступ робота Googlebot к файлу Sitemap не заблокирован и для него не требуется авторизация. Чтобы проверить, так ли это, воспользуйтесь инструментом проверки URL. В поле Получение страницы должно быть указано «Успешно».
  4. Откройте отчет о файлах Sitemap, скопируйте URL, который проверяли на этапе 3, вставьте его в окно Добавьте файл Sitemap и нажмите Отправить.
  5. Файл Sitemap сразу же будет получен, однако сканирование перечисленных в нем URL может занять некоторое время. Возможно, что из-за трафика, размера сайта и других факторов его не удастся обработать полностью.
  6. Если статус файла Sitemap отличен от Успешно, нажмите на строку в отчете, чтобы посмотреть сведения о сбое. Также рекомендуем ознакомиться с информацией об ошибках ниже.

Время от времени проверяйте, может ли Google получать и обрабатывать ваши файлы Sitemap.

Как повторно отправить в Google файл Sitemap

Если файл Sitemap был успешно просканирован, то его повторная обработка будет выполняться вне обычного расписания.

Если вы внесли в файл Sitemap значительные изменения, которые необходимо немедленно обработать, вы можете отправить его в Google повторно, подав новый запрос. В противном случае он будет обрабатываться в соответствии с обычным расписанием сканирования сайта.

Если файл Sitemap не удается получить при первом запросе или позже при запланированном повторном сканировании, то Google продолжает попытки в течение нескольких дней, а затем прекращает их, если файл по-прежнему недоступен или содержит критические ошибки. В этом случае вы должны устранить проблему и отправить файл повторно, подав новый запрос. В отчете показывается статус последнего сканирования для каждого запроса.

Как удалить файл Sitemap

Если вы удалите файл Sitemap, он исчезнет из отчета, но Google запомнит его и все перечисленные в нем URL. Если вам нужно, чтобы роботы Google перестали посещать ваши веб-страницы, запретите им это с помощью правила в файле robots.txt.

Чтобы удалить файл Sitemap, выполните следующие действия:

  1. В основной таблице отчета найдите файл, который нужно удалить, и нажмите на него.
  2. На странице сведений о файле нажмите на значок в виде трех точек Ещё.
  3. Выберите Удалить файл Sitemap.
  4. Чтобы роботы Google больше не обращались к файлу Sitemap и перечисленным в нем страницам, воспользуйтесь любым из приведенных ниже способов.
    • Запретите доступ к файлу Sitemap и страницам с помощью правила в файле robots.txt.
    • Удалите файл Sitemap или страницу с сайта.
    • Добавьте правило noindex или заголовок ответа. Для файла Sitemap необходимо использовать заголовок ответа, для веб-страницы – метатег или заголовок ответа.

Расписание сканирования файлов Sitemap

Google попытается обработать файл Sitemap, как только вы его отправите. В случае успеха повторная обработка будет выполняться вне обычного расписания, в соответствии с которым сканируется ваш сайт.

Если при получении или обработке файла Sitemap произойдет сбой, то Google продолжит попытки в течение нескольких дней. Если проблема не будет устранена, Google прекратит попытки просканировать этот URL. Проблемы, затрагивающие отдельные URL в файле Sitemap, не помешают Google продолжить обработку файла, если он в принципе может быть получен и обработан.

Как интерпретировать отчет

  1. На странице отчета о файлах Sitemap можно посмотреть статусы запросов Google для всех файлов Sitemap, отправленных с помощью этого отчета или API. В отчете отображается статус последнего запроса для каждого файла Sitemap. Каждому файлу Sitemap будет присвоено одно из следующих значений, которое показывает статус последнего запроса:
    1. Успешно – файл Sitemap получен и обработан без ошибок.
    2. Не получено – Google не удалось получить файл Sitemap.
    3. Обнаружены проблемы (X) – файл Sitemap получен и частично обработан, однако содержит некоторые ошибки.
  2. Нажмите на отдельный файл Sitemap, чтобы открыть страницу сведений, на которой указана информация о файле Sitemap и запрос.
    • Если на странице сведений указано Не удалось обработать файл Sitemap, значит, получить файл не удалось по одной из этих причин. Разверните раздел, который расположен под ошибкой, чтобы посмотреть сведения о ней. Устраните проблему и отправьте файл Sitemap ещё раз. Если получить файл Sitemap не удастся, Google попытается ещё несколько раз, но в конечном итоге прекратит попытки обработать его.
    • Если на странице сведений указано При обработке файла Sitemap обнаружены ошибки, появится список этих ошибок. Разверните раздел под ошибкой, чтобы посмотреть сведения о ней. В этом разделе приводятся описания ошибок и рассказывается, как их исправить.

Важно!

  • В отчете видны только файлы Sitemap, отправленные с помощью этого отчета или специального API, а не обнаруженные по ссылкам в файле robots.txt или другими способами. Тем не менее, если мы уже получили ваш файл Sitemap из другого источника, вы все равно можете отправить его нам через этот отчет, чтобы следить за тем, как мы сканируем ваши страницы.
  • В отчете показаны только файлы Sitemap, относящиеся к текущему ресурсу. Если вы не можете найти конкретный файл, убедитесь, что не перепутали ресурсы с префиксами http и https или с элементом www и без него.
  • Если файл Sitemap не удастся получить с нескольких попыток, Google в конечном итоге прекратит их. Вы должны исправить ошибки и отправить файл ещё раз.
  • Если Google удалось обработать файл Sitemap, информация об этом будет сохранена. Дальнейшие удачные или неудачные обработки не приведут к тому, что Google «забудет» о предыдущих обработках. Однако новая информация о том или ином URL будет перезаписана поверх старой информации об этом URL.
  • В файле Sitemap можно указывать URL изображений, видео и новостных статей. Однако в настоящее время в отчете не отображаются сведения о таких URL.
  • В отчете будет не более 1000 отправленных запросов (причем не в хронологическом порядке), даже если вы добавите запросы сверх этого количества. Сейчас в Search Console нет возможности посмотреть запросы, не вошедшие в первую тысячу.

Для каждого файла Sitemap указывается следующая информация:

URL файла Sitemap
Точный URL, который указывается при отправке файла Sitemap. Переадресация не выполняется. Здесь показываются только файлы, отправленные с помощью этого отчета или API.
Тип
Тип файла Sitemap. Возможные значения:

  • Sitemap – текстовый файл или файл в формате XML.
  • Файл индекса Sitemap – файл с информацией о других файлах Sitemap.
  • RSS – RSS-фид.
  • Atom – фид Atom.
  • Неизвестно – файл имеет неизвестный формат или ещё не обработан.
Отправлен
Дата, когда файл Sitemap был последний раз отправлен в Google.
Дата последней обработки
Дата, когда файл Sitemap был последний раз обработан инструментами Google. Указывается, только если мы получили файл.
Статус
Статус последнего сканирования. Возможные значения:

  • Успешно – файл Sitemap загружен и обработан без ошибок. Все URL добавлены в очередь на сканирование.
  • Обнаружены проблемы – файл Sitemap содержит ошибки, однако все URL, которые удалось из него извлечь, добавлены в очередь на сканирование. Нажмите на файл в таблице, чтобы увидеть список ошибок. Полный список ошибок при обработке приведен ниже.
  • Не получено – не удалось получить файл Sitemap. Узнайте, как устранить ошибки при получении.
Количество выявленных страниц
Количество URL страниц, перечисленных в файле Sitemap. Если это файл типа «индекс Sitemap», то здесь указывается общее количество URL во всех включенных в него файлах. Повторяющиеся URL засчитываются только один раз. Мы не гарантируем, что эти URL были или будут просканированы или проиндексированы Google. Отфильтруйте Отчет об индексировании страниц по файлу Sitemap, чтобы узнать, сколько URL страниц было проиндексировано.
Количество выявленных видео
Количество URL видео, перечисленных в файле Sitemap. Мы не гарантируем, что эти URL были или будут просканированы или проиндексированы Google. Отфильтруйте Отчет об индексировании страниц с видео по файлу Sitemap, чтобы узнать, сколько URL страниц содержат видео, которое было проиндексировано. Обратите внимание, что в Search Console не указано, был ли на странице проиндексирован URL видео, отличный от URL видео в файле Sitemap. Файл Sitemap, указанный здесь, будет ссылаться на Отчет об индексировании страниц с видео, если он содержит проиндексированные страницы, на которых были обнаружены видео при сканировании Google.
Посмотреть отчет об индексировании
При нажатии на этот значок открываются сведения о покрытии всех URL в отчете. В случае с индексом Sitemap указываются все URL, перечисленные в его дочерних файлах Sitemap.

Моего файла Sitemap нет в отчете

Вот несколько причин, по которым файл Sitemap может отсутствовать в отчете:

  • Он относится к другому ресурсу. Файлы Sitemap, связанные с одним ресурсом, не видны при выборе другого. Например, файлы, предназначенные для сайта http://example.com, не будут представлены в отчете о ресурсе http://m.example.com или https://example.com. Убедитесь, что вы добавили все версии URL своего сайта.
  • Вы не отправляли файл Sitemap с помощью интерфейса отчета или Search Console API. Файлы, обнаруженные или добавленные другим способом, не показываются в отчете, даже если Google может находить и использовать их.

Ошибки в файлах Sitemap

В отчете по файлам Sitemap может появляться информация об ошибках, перечисленных ниже. Этот список не является полным, но он достаточно длинный и охватывает большинство ошибок, с которыми вы можете столкнуться.

Ошибки при получении файлов Sitemap

Если у файла Sitemap статус Не получено, это означает, что Google не удалось его получить. Это могло произойти по следующим причинам:

  • Файл Sitemap заблокирован с помощью файла robots.txt. Google учитывает информацию из файла robots.txt. Удалите правило, которое препятствует получению файла Sitemap.
  • В отношении вашего сайта действуют меры, принятые вручную. В этом случае файлы Sitemap не обрабатываются. Изучите отчет о мерах, принятых вручную. Устраните проблему и отправьте файл Sitemap ещё раз.
  • Для файла Sitemap предоставлен неверный URL (ошибка HTTP 404: файл Sitemap не найден по указанному адресу). Попробуйте открыть URL в браузере, чтобы проверить, существует ли он.
  • Другие общие ошибки. Иногда Google не удается получить файл Sitemap с вашего сайта из-за других ошибок, например недоступности сервера. Некоторые проблемы могут носить краткосрочный характер. Подождите немного и посмотрите, будет ли эта ошибка повторяться при следующих попытках сканирования.

Отладка ошибок при получении

  1. Нажмите на файл Sitemap в списке, чтобы посмотреть сведения о последнем запросе на получение.
  2. Нажмите на название ошибки, чтобы посмотреть сведения о ней.
  3. Подтвердите ошибку в инструменте проверки URL.
    1. Скопируйте URL файла Sitemap со страницы сведений отчета о файлах Sitemap.
    2. Вставьте URL в инструмент проверки URL и нажмите Ввод.
    3. Нажмите Выполнить проверку.
    4. Разверните раздел Доступность страницы, чтобы узнать, почему Google не удалось получить файл Sitemap. Информацию обо всех полях можно найти на этой странице. Для вас важно, чтобы в поле Сканирование разрешено? было указано «Да», в поле Получение страницы – «Успешно» и в поле Индексирование разрешено? – «Да».

Ошибки при обработке файлов Sitemap

Ниже перечислены ошибки, которые могут произойти при обработке полученных файлов Sitemap.

URL недоступны

Google не удалось просканировать адреса из файла Sitemap. Проверьте, доступны ли URL в нем нашему роботу, с помощью этого инструмента.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • При переходе по URL слишком много раз выполняется переадресация, и поисковые роботы Google останавливаются, не достигая цели. Рекомендуем заменить все URL переадресации на адреса непосредственно тех страниц, которые нужно просканировать.
    • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, для перехода на другую страницу своего сайта указывайте URL https://www.example.com/mypage.html, а не просто mypage.html.

Нельзя использовать URL

Некоторые из перечисленных вами URL находятся в другом домене или на более высоком уровне по сравнению с файлом Sitemap.

Более высокий уровень. Если файл расположен по адресу http://www.example.com/mysite/sitemap.xml, то недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в соседнем каталоге (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все URL начинаются с того же домена, в котором хранится ваш файл Sitemap. Например, если файл расположен по адресу http://www.example.com/sitemap.xml, то недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан префикс протокола https вместо http.

Ошибка сжатия

Произошла ошибка при попытке восстановить сжатый файл Sitemap. Выполните повторное сжатие файла (например, с помощью gzip), после чего загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Исправьте это.

Превышен максимальный размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе Sitemap, а затем отправьте нам этот индекс.

Неверное значение атрибута

У атрибута в теге XML недопустимое значение. Проверьте файлы Sitemap и убедитесь, что в них есть все необходимые атрибуты с действительными значениями (согласно техническим требованиям к таким файлам), а также что отсутствуют опечатки.

Неправильно введена дата

Как минимум одна дата в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Введите все даты в одном из допустимых форматов W3C:

2005-02-21 
2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако, если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или ошибки, например имеет префикс htp:// вместо http://.

Убедитесь, что URL в файле Sitemap указаны в правильной кодировке и должным образом экранированы. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, будет ли загружена страница.

Неполные URL в файле индекса Sitemap

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится индекс. Например, если индекс расположен по адресу http://www.example.com/folder1/sitemap_index.xml и указывает на файл sitemap.xml (без символа / впереди), то Google ищет этот файл Sitemap по адресу http://www.example.com/folder1/sitemap.xml. Если найти его не удается, показывается сообщение об ошибке.

Добавьте в индекс Sitemap полные URL всех нужных файлов Sitemap и отправьте его ещё раз.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег <loc> повторяется в ней дважды:

<url>
  <loc>http://www.example.com/</loc>
  <loc>http://www.example.com/page1.html</loc>
  <lastmod>2005-01-01</lastmod>
  <changefreq>monthly</changefreq>
  <priority>0.8</priority>
</url>

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и отправьте файл Sitemap ещё раз.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки, с которой связана проблема. Сведения об обязательных тегах можно найти в этой статье.

Отсутствует URL значка видео

В некоторых записях о видео нет ссылки на значок. Убедитесь, что в тегах <video:thumbnail_loc> указаны URL всех значков видео.

Отсутствует название видео

В некоторых записях о видео отсутствует название. Убедитесь, что в тегах <video:title> указаны названия всех видео.

Вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Зачастую это происходит из-за неэкранированных символов в URL. Во всех файлах XML в любых значениях данных (включая URL) необходимо экранировать символы &, ‘, «, <, > и некоторые другие. Проверьте, правильно ли выполнено экранирование в URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться даже через несколько часов, отправьте файл Sitemap ещё раз.

Слишком много файлов Sitemap

В файле индекса упомянуто более 50 000 файлов Sitemap. Разделите его на несколько, в каждом из которых должно быть указано не более 50 000 файлов Sitemap.

Слишком много URL

В файле Sitemap упомянуто более 50 000 URL. Разделите его на несколько, в каждом из которых должно быть указано до 50 000 адресов. Для удобства можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если файл содержит информацию о видео, заголовок должен быть следующим:
    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9).
  • Все атрибуты XML нужно заключать в одинарные (‘) или двойные («) кавычки, которые должны быть только прямыми. Обратите внимание, что текстовые редакторы, например Microsoft Word, могут автоматически менять кавычки на фигурные.

Несоответствующий путь: отсутствует префикс www

В пути к файлу Sitemap нет префикса www (пример: http://example.com/sitemap.xml), однако этот префикс есть в URL, которые перечислены в файле (пример: http://www.example.com/myfile.html).

Удалите префикс www из всех URL внутри файла.

Несоответствующий путь: имеется префикс www

В пути к файлу Sitemap есть префикс www (пример: http://www.example.com/sitemap.xml), однако этого префикса нет в URL, которые перечислены в файле (пример: http://example.com/myfile.xml).

Добавьте префикс www во все URL внутри файла.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Ниже приведены примеры.

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap: <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  • Другие типы файлов Sitemap

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с объявления пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.

Указанная проблема не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандарту XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP [код ошибки]

При попытке скачать файл Sitemap произошла ошибка HTTP уровня 400. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Общая ошибка HTTP

Произошла ошибка HTTP, которую невозможно отнести ни к одной из приведенных в этом списке. Разверните сведения, чтобы узнать тип ошибки. Это также может быть вызвано ошибкой 404 (страница отсутствует), которая является ошибкой при выполнении запроса.

Слишком большой значок видео

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Слишком маленький значок видео

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Адреса видео и страницы воспроизведения совпадают

URL видео и страницы проигрывателя, указанные в файле Sitemap для видео, не должны совпадать. Если используются одновременно тег <video:player_loc> и тег <video:content_loc>, то URL в них должны различаться. Подробнее о том, как добавить в файл Sitemap информацию о видео…

URL видео указывает на страницу воспроизведения

URL в теге <video:content_loc> в файле Sitemap для видео указывает на страницу, где размещен проигрыватель. Подробнее о том, как добавить в файл Sitemap информацию о видео…

Слишком много URL новостей

Количество URL в файле Sitemap превышает максимально допустимое значение (1000). Подробнее о том, как добавить в файл Sitemap информацию о новостях…

Отсутствует тег <publication>

Для каждого URL в файле Sitemap для Google Новостей должен быть указан тег <publication>. Подробнее о том, как добавить в файл Sitemap информацию о новостях…

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt. Воспользуйтесь инструментом проверки URL, чтобы выяснить, на какой именно файл влияет блокировка доступа, и внесите в директивы robots.txt необходимые изменения.

Эта информация оказалась полезной?

Как можно улучшить эту статью?

XML Sitemap помогает роботам поисковых систем ориентироваться в структуре и страницах сайта. Некорректно составленная карта может привести к проблемам с индексированием. Наш инструмент анализирует Sitemap: проверяет валидность, находит ошибки.

Для чего используют валидатор Sitemap

Карта сайта содержит важную для поисковиков информацию:

список всех URL;

общая структура, иерархия, приоритетность;

информация о проиндексированных картинках и видеодокументах.

Сервис «Анализ XML-карты сайта» анализирует корректность составления Sitemap, находит ошибки, проверяет количество ссылок, проиндексированных страниц и изображений, размер файла. Отдельная опция — проверка кода ответа каждого документа.

Принцип работы онлайн-инструмента

Программа анализирует загруженный файл или онлайн-документ:

  • 1

    Читает файл, переходит по ссылкам, находит ошибки.

  • 2

    Считает количество документов, проиндексированных Яндексом и Google.

  • 3

    Взвешивает файл, проверяет, не превышает ли вес рекомендованный порог.

Вариативность онлайн-проверки

Для удобства можно менять настройки, для этого нужно отметить нужные опции:

Инструмент позволяет указать URL для анализа или загрузить файл.

При необходимости валидатор анализирует коды ответа указанных URL.

Можно скачать результаты в виде CSV-файла.

Получение результатов анализа в виде CSV‑файла

Для удобства анализа и работы с выходными данными имеется возможность выгрузить результаты в формате CSV, как перед процессом проверки, так и после неё. Файл с источниками открывается в Excel для дальнейшей работы.

Как пользоваться инструментом

Если карта уже загружена на сайт, укажите ссылку. Если нет, передвиньте переключатель и загрузите файл в сервис.

Отметьте нужные опции: анализ кодов ответа сервера, скачивание результатов.

Нажмите на кнопку «Анализировать».

Анализ sitemap.xml - фото 1

Анализ выполняется в фоне, проверка может продолжаться несколько минут.

Анализ sitemap.xml - фото 2

Если карта сайта содержит ошибки, сервис указывает на них. А также показывает, какие URL отдают некорректный ответ. Эта информация помогает настроить Sitemap так, чтобы она ускоряла индексацию, способствовала SEO-продвижению сайта, росту поискового трафика.

Результаты проверок сохраняются в сервисе.

Инструмент работает на PRO-тарифах. Можно запускать до 5 параллельных проверок. За проверку списываются лимиты: 25 лимитов за каждую анализируемую XML карту. Опция «Анализировать коды ответа указанных URL» — 1 лимит за каждый URL из XML Sitemap.

Преимущества сервиса

Быстро и точно проверяет корректность Sitemap.

Проводит более подробный анализ, чем Яндекс.Вебмастер: проверяет наличие ошибок, размер файла, количество ссылок, считает документы в Яндексе и Google.

Анализирует коды ответа сервера, находит коды, отличные от 200.

Сохраняет предыдущие результаты проверки карты.

Инструмент полезен вебмастерам и SEO-специалистам при настройке нового или действующего сайта. Проверить карту необходимо при проблемах с индексацией сайта. Это обязательная часть технического аудита.

Дополнительные инструменты

Другие сервисы Пиксель Тулс, которые могут быть вам полезны:

Сервис для проверки ответа сервера. Инструмент для мониторинга работоспособности и определения веса страниц, которые продвигаются через рекламу или SEO.

Поиск зеркал для домена. Программа находит зеркала и проверяет каждое из них на корректность настройки.

Узнайте, как увеличить SEO‑трафик сайта в 3+ раза?

Укажите домен вашего сайта, приоритетные регионы продвижения и получите самый
полный список точек взрывного роста трафика и заявок с вашего сайта

Выберите ваш сайт
 

укажите сайт, регион и близких вам конкурентов

Немного магии поисковой
оптимизации —

мы подготовим для вас не менее 25 персональных рекомендаций

Отслеживайте прогресс
 

и получайте регулярные советы, рост трафика и продаж

Sitemap.xml (сайтмап) — это системный файл, в котором перечислены все страницы сайта в порядке вложенности, даны ссылки и указана приоритетность их индексации. Файл нужен для того, чтобы сделать структуру проекта понятнее для роботов поисковых систем. Содержимое sitemap или «карты сайта» позволяет ботам Яндекса, Google и других поисковиков узнавать, какие URL индексировать нельзя, а какие, наоборот, необходимо быстрее внести в базу. Этот инструмент рекомендуется создавать для веб-сайтов с большим количеством страниц, но он пригодится и простым ресурсам. Главное, чтобы все было составлено корректно. В статье рассказываем, как проверить sitemap на ошибки в пяти online-сервисах.

Сервисы для проверки файла sitemap.xml онлайн

  1. Анализатор файлов Sitemap от Яндекс.Вебмастер.
  2. Проверка файла XML Sitemap от Websiteplanet.
  3. Сервис Mysitemapgenerator.
  4. Проверка от Pixelplus.
  5. Сервис Sitemap-checkers.

Перечисленные SEO-инструменты работают онлайн и помогают проверить карту сайта совершенно бесплатно. Прежде чем приступать к проверке, убедитесь, что файл sitemap.xml доступен и возвращает ответ с кодом 200 ОК.

№1. Анализатор файлов Sitemap от Яндекс.Вебмастер

В панели Вебмастер от Яндекса есть встроенный инструмент для проверки содержимого sitemap. Чтобы воспользоваться им, необходимо войти в свой Яндекс ID или зарегистрироваться. В сервисе можно сделать анализ тремя способами: вставить содержимое файла текстом, загрузить саму карту в формате XML или ввести адрес ее расположения.

Анализатор файлов Sitemap от Яндекс.Вебмастер.

№2. Проверка файла XML Sitemap от Websiteplanet

В этом валидаторе XML-карты проверить файл можно только через указание ссылки. Проходить регистрацию здесь не требуется. Просто вводите адрес и нажимаете «Проверить!». Онлайн-сервис ищет ошибки сжатия, проблемы с ответами сервера, некорректно работающие урлы и др.

Проверка файла XML Sitemap от Websiteplanet.

№3. Сервис Mysitemapgenerator

Здесь можно проанализировать XML-файл бесплатно и без регистрации: введите веб-адрес карты или добавьте ее, нажав кнопку «Загрузить файл». После этого кликните «Старт» и дождитесь окончания проверки. Сервис изучит соответствие протоколу и проведет диагностику ошибок в структуре XML.

Сервис Mysitemapgenerator.

№4. Проверка от Pixelplus

Инструмент Пиксель Тулс является условно бесплатным: чтобы сделать проверку sitemap, нужно зарегистрироваться и оплатить 1 рубль. Таким образом вы получите доступ ко всем внутренним сервисам на 30 дней, включая XML-валидатор. Анализ можно провести по ссылке или с помощью загрузки файла. Результаты можно будет скачать в формате CSV.

Проверка от Pixelplus.

№5. Сервис Sitemap-checkers

Специализированный сервис для анализа содержимого sitemap.xml. Регистрация не нужна — вводите URL карты и нажимаете «Check». Инструмент взвесит файл, проверит код ответа сервера, отыщет невалидные данные.

Сервис Sitemap-checkers.

Заключение

Чаще всего веб-мастера поручают создание sitemap специальным сервисам, которые формируют файл автоматически. Но ошибки могут быть в самих страницах, поэтому проверять валидность XML-карты рекомендуется после каждого обновления.

Сервисы для проверки файла sitemap.xml онлайн
№1. Анализатор файлов Sitemap от Яндекс.Вебмастер
№2. Проверка файла XML Sitemap от Websiteplanet
№3. Сервис Mysitemapgenerator
№4. Проверка от Pixelplus
№5. Сервис Sitemap-checkers
Заключение

Sitemap validator

Количество найденных файлов карты сайта

Количество элементов в файлах карты сайта

Количество страниц во всех файлах карты сайта

Ошибки, обнаруженные на карте сайта

Предупреждения, найденные на карте сайта

Недопустимый URL-адрес в индексном файле карты сайта

Недопустимый URL-адрес

Пустая карта сайта

URL-адреса недоступны

Ошибка сжатия

Слишком много перенаправлений (>4)

Нет объявления формата

Ошибка в размере файла карты сайта

Слишком много URL-адресов на карте сайта

Слишком много карт сайта в индексном файле карты сайта

Неверная дата

Недопустимый XML: слишком много тегов

URL-адрес другого домена

Недопустимое значение атрибута

Неподдерживаемый формат

Несоответствие пути — Отсутствует www

Несоответствие пути: включает www

Неправильное пространство имен

Недопустимое значение тега
Недопустимый URL в индексном файле карты сайта: неполный URL
Отсутствует обязательный атрибут XML
Отсутствует необходимый XML-тег
Отсутствующий URL-адрес миниатюры
Отсутствующий заголовок видео
Неправильный формат индекса карты сайта: вложенные индексы карты сайта
Ошибка синтаксического анализа
Миниатюра слишком большая
Миниатюра слишком мала
Местоположение видео и страницы воспроизведения совпадают
URL-адрес местоположения видео, по-видимому, является URL-адресом страницы воспроизведения
Тег <changefreq> = никогда
Карта сайта заблокирована в robots.txt
Относительная ссылка
Слишком длинный URL-адрес
Все страницы внутри одной и той же карты сайта имеют одинаковое время изменения документа
Карта сайта не содержит тега с датой последнего изменения документа
На всей карте сайта нет даты обновления страницы или приоритета обновления страницы
Для страницы не указана частота обновления или приоритет индексации
Ведущий пробел
URL-адрес карты сайта перенаправляет на другой URL-адрес
Недопустимый формат приоритета URL-адреса
URL-адрес не разрешен
Все страницы внутри одной и той же карты сайта имеют одинаковый приоритет

Количество найденных файлов карты сайта

Это показывает, сколько файлов карты сайта было найдено на сайте. Файлы карты сайта содержат список страниц и других ресурсов сайта, подлежащих индексации. Эта информация помогает поисковым системам более эффективно индексировать сайт.

Стандарт, принятый для карты сайта, позволяет использовать множество файлов карты сайта. Пожалуйста, обратите внимание, что файлы sitemap могут быть не найдены, если их пути не соответствуют стандарту протокола sitemap или содержат орфографические ошибки.

Количество элементов в файлах карты сайта

Этот отчет показывает количество HTML-страниц и других ресурсов, найденных во всех файлах карты сайта на момент анализа сайта.

Количество страниц во всех файлах карты сайта

Этот отчет показывает, сколько страниц в формате HTML было найдено во всех файлах карты сайта на момент анализа сайта. Сюда не входят ресурсы в других форматах, таких как изображения и т.д.

Это полезный отчет для сравнения количества страниц, найденных в файлах карты сайта, с фактическим количеством страниц на сайте, проиндексированных в поисковых системах. Это может помочь быстро обнаружить различные проблемы.

Например, некоторые сайты, возможно, не удалили страницы из карты сайта, которые были удалены или отключены в административной панели сайта. Таким образом, это может привести к потере краулинового бюджета на поиск и, возможно, к снижению позиций сайта. Если в индексе поисковой системы значительно меньше страниц, чем на карте сайта, это также может указывать на то, что у сайта проблемы с индексацией. Или что карта сайта отформатирована неправильно и содержит дополнительные страницы.

Ошибки, обнаруженные на карте сайта

Ошибки в карте сайта могут привести к неправильной интерпретации данных и невозможности использования всего файла или отдельных строк внутри него. Мы проверяем карту сайта на соответствие стандартам sitemap, XML, w3c, а также рекомендациям Google, Yahoo, Bing и Яндекса.

Предупреждения, найденные на карте сайта

Предупреждения указывают на наличие проблем, которые значительно снизят эффективность карты сайта.

Например, если сайт содержит десятки тысяч страниц, то при правильном выполнении индексация изменений на страницах может занять от нескольких часов до нескольких дней. Однако, если все сделано неправильно, например, если на карте сайта нет временных меток, то индексация изменений может занять несколько недель. Таким образом, это замедляет любое продвижение или оптимизацию вашего сайта.

Сообщения об ошибках

Недопустимый URL-адрес в индексном файле карты сайта

Это означает, что URL-адрес файла карты сайта неправильно отформатирован или содержит недопустимые символы. Существует несколько распространенных причин, по которым может возникнуть эта ошибка:

  1. URL-адрес карты сайта не должен находиться в другом домене или поддомене.
  2. Google может не обрабатывать относительные URL-адреса на карте сайта. Если возможно, добавляйте абсолютные или полные URL-адреса, а не относительные.
    Например, при переходе по ссылке на другую страницу сайта используйте ссылку:
    https://www.example.com/page.hml
    вместо
    page.hml
  3. Если URL-адрес содержит пробелы и символы, замените все пробелы и недопустимые символы соответствующими объектами кодировки URL-адреса.
      Например, для пробелов вы должны использовать:
    http://www.example.com/space%20here.html
    Для символов типа & используйте:
    http://www.example.com/and%26here.html

URL-адреса в карте сайта должны соответствовать стандарту RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)

Стандарт XML (https://www.w3.org/TR/REC-xml/)

И стандарт RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Недопустимый URL-адрес

URL-адрес в вашей карте сайта указан неправильно. Эта ошибка может быть вызвана тем, что она содержит пробелы, неподдерживаемые или недопустимые символы.

Например, htp:// или http:/ вместо http://

Убедитесь, что URL-адреса, указанные на карте сайта, соответствующим образом защищены.

Например, символ "&" в URL-адресе следует заменить на "%26", а все пробелы — на "%20".

URL-адреса в карте сайта должны соответствовать стандарту RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)

Стандарт XML (https://www.w3.org/TR/REC-xml/)

И стандарт RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Для получения более подробной информации:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2

Пустая карта сайта

Файл карты сайта не содержит никаких URL-адресов

URL-адреса недоступны

Эта ошибка появляется, когда мы не можем получить URL-адреса из карты сайта.

Проверьте URL-адрес карты сайта с помощью инструмента проверки URL-адреса: (https://support.google.com/webmasters/answer/9012289), чтобы узнать, доступен ли этот адрес Google.

Ошибка сжатия

Мы получили сообщение об ошибке при попытке распаковать файл. Используйте формат gzip для сжатия файла.

Слишком много перенаправлений (>4)

URL-адрес содержит слишком много перенаправлений для поисковых роботов. Замените адреса перенаправления в ваших файлах карты сайта URL-адресами, которые необходимо отсканировать. Избегайте использования перенаправлений типа JavaScript или meta-update.

Нет объявления формата

Эта ошибка возникает, если карта сайта имеет неправильный заголовок или заголовок не соответствует формату.

Например, если ваша карта сайта создана в формате XML, то у нее должен быть заголовок:

<?версия xml="1.0"encoding="UTF-8"?>

Кроме того, согласно правилам Google и принятым стандартам, все атрибуты XML должны быть заключены в одинарные (‘) или двойные («) кавычки. Кавычки должны быть прямыми, а не фигурными.

Пожалуйста, обратите внимание, что программы обработки текстов, такие как Microsoft Word, могут заменять прямые кавычки фигурными, и тогда это нарушило бы требования.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Ошибка в размере файла карты сайта

Размер карты вашего сайта в несжатом виде превышает 50 МБ. Если размер вашей карты сайта превышает допустимый, ее следует разделить на несколько файлов меньшего размера.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Слишком много URL-адресов на карте сайта

Карта вашего сайта содержит не более 50 000 URL-адресов. Разделите карту сайта на несколько файлов и убедитесь, что каждый содержит не более 50 000 URL-адресов. Вы также можете использовать индексный файл карты сайта для размещения URL-адресов в ваших картах сайта.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Слишком много карт сайта в индексном файле карты сайта

Индексный файл sitemap содержит более 50 000 карт сайта.

Разделите индексный файл карты сайта на несколько файлов и убедитесь, что в каждом из них указано не более 50 000 карт сайта.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#index

Неверная дата

Ваша карта сайта содержит недопустимый формат даты.

Даты должны использовать кодировку W3C Datetime (https://www.w3.org/TR/NOTE-datetime).

Пример приемлемых форматов:

2021-12-19

2021-12-19T16:00:17+04 00

Время не является обязательным (время по умолчанию — 00:00:00Z).

Однако, если вы указываете время, вы должны указать часовой пояс.

Для получения более подробной информации посетите:

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://www.w3.org/TR/NOTE-datetime

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Карта сайта содержит повторяющиеся теги.

Пример ошибки:

<url>

<loc>http://www.example.com/</loc>

<lastmod>2021-12-17</lastmod>

<lastmod>2021-12-19T16:00:17+04 00</lastmod>

<priority>0.8</priority>

</url>

В примере тег <lastmod> указан дважды для одного элемента — это ошибка.

Номер строки будет указан в сообщении об ошибке. Чтобы устранить проблему, просто удалите повторяющийся тег.

Документация:

https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

URL-адрес другого домена

Карта сайта не может содержать URL-адрес другого уровня домена или другого поддомена.

Например, на карте сайта https://example.com/sitemap.xml вы не можете ссылаться на https://en.example.com/index.htm поскольку это другой домен.

Для получения более подробной информации посетите

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Недопустимое значение атрибута

Атрибут содержит недопустимое значение для XML-тега. Проверьте свои карты сайта и убедитесь, что они содержат только разрешенные атрибуты и что они написаны в соответствии со спецификациями карты сайта. Кроме того, проверьте атрибуты и значения на наличие опечаток.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Неподдерживаемый формат

Google поддерживает следующие форматы файлов:

  • XML (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#xml)
  • RSS-канал (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • mRSS (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • Atom 1.0 (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • Текст (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#text)

Эта ошибка также возникает, если карта сайта имеет неправильный заголовок или заголовок отсутствует для используемого формата.

Например, если ваша карта сайта представлена в формате XML, то у нее должен быть заголовок:

<?version xml="1.0" encoding="UTF-8"?>

Как упоминалось ранее, согласно правилам Google, все атрибуты XML должны быть заключены в одинарные (‘) или двойные («) кавычки. Кавычки должны быть прямыми, а не фигурными.

Пожалуйста, обратите внимание, что программы обработки текстов, такие как Microsoft Word, могут заменять прямые кавычки фигурными. Это противоречит стандартным требованиям.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Несоответствие пути — Отсутствует www

Путь к карте сайта не содержит префикса www (например, https://example.com/sitemap.xml)

Но указанные в нем URL-адреса содержат www (например, https://www.example.com/index.hml).

Все страницы сайта должны быть перенаправлены на желаемую версию — с www или без www. Убедитесь, что карта сайта содержит тот же вариант префикса.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

Несоответствие пути: включает www

Путь к карте сайта содержит префикс www (например, https://www.example.com/sitemap.xml), но указанные в нем URL-адреса не содержат www (например, https://example.com/index.hml).

Все страницы сайта должны быть перенаправлены на желаемую версию — с www или без www. Убедитесь, что карта сайта содержит тот же вариант префикса.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

Неправильное пространство имен

Карта сайта не содержит правильного пространства имен или объявлена неправильно. Пространство имен может содержать опечатку или неверный URL-адрес.

Убедитесь, что вы используете правильное пространство имен для вашего типа файла. Например:

Файл карты сайта: urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

Файл карты сайта для видео: xmlns: видео = "http://www.google.com/schemas/sitemap-video/1 .1"

Индексный файл карты сайта: xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9 ">

Файл, в котором хранятся HTML-код и изображения, будет содержать

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1 ">

Ошибка может возникнуть, если формат записан неправильно, например: /.9 вместо /0.9.

Или если путь указан неправильно, например:

<urlset xmlns="/schemas/sitemap/0.9">

вместо

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">

или <urlset xmlns="http://www.sitemaps.org/schmas/sitemap/0.9 "> — буква в ссылке здесь отсутствует.

Источники:

https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

https://www.w3.org/XML/Schema#dev

Недопустимое значение тега

Ваша карта сайта содержит тег с недопустимым значением. Проверьте спецификации для вашего типа карты сайта.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/image-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/news-sitemap

Недопустимый URL в индексном файле карты сайта: неполный URL

Google описывает эту ошибку следующим образом: «Индексный файл карты сайта содержит неполный URL».

Когда поисковые системы видят индекс карты сайта, они выполняют поиск файлов, на которые он ссылается, в том же каталоге.

Расположение файла карты сайта определяет набор URL-адресов, которые могут быть включены в этот конкретный файл карты сайта.

Например, файл карты сайта, расположенный по адресу http://example.com/catalog/sitemap.xml может включать любые URL-адреса, начинающиеся с http://example.com/catalog / Но не может включать URL-адреса, начинающиеся с http://example.com/images/.

Если наш инструмент не сможет найти там URL-адрес, вы увидите эту ошибку. Обновите индексный файл карты сайта, чтобы включить полный путь к каждому файлу карты сайта в списке, а затем отправьте повторно.

Было много судебных дел против поисковых систем за ошибочную индексацию разделов сайтов, которые были закрыты

Несмотря на то, что информации об этой ошибке немного, в стандартах Google sitemap ей посвящен целый раздел, несмотря на то, что многие другие ошибки не включены. Поэтому, по нашему мнению, это правило существует для того, чтобы избежать ошибочной индексации данных, которые предназначены для блокировки индексации.

Пожалуйста, обратите внимание, что не все разработчики принимают во внимание эти стандарты карты сайта при разработке своих плагинов CMS, и поэтому может возникнуть эта ошибка.

Источники: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Отсутствует обязательный атрибут XML

В теге карты сайта нет атрибута. Это обязательно.

Пример ошибки:

<?version xml="1.0" кодировка="UTF-8"?>

<urlset>

<url>

<loc>http://www.example.com /</loc>

<lastmod>2023-11-09</lastmod>

</url>

</urlset>

Здесь, в теге

<urlset>

Этот атрибут опущен:

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

Тег должен содержать:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">

Источник:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

Отсутствует необходимый XML-тег

Требуемый тег отсутствует. Номер строки будет указан в сообщении об ошибке.

Пример ошибки:

<url>

<lastmod>2021-12-19T16:00:17+04 00</lastmod>

 <priority>0.8</priority>

</url>

Тег <loc> в примере отсутствует, поэтому неясно, к какому URL-адресу принадлежит элемент.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

https://www.sitemaps.org/protocol.html

Отсутствующий URL-адрес миниатюры

URL-адрес уменьшенного изображения отсутствует.

Убедитесь, что расположение URL-адресов всех миниатюр указано с помощью тега <video: thumbnail_loc>.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Отсутствующий заголовок видео

Название видео отсутствует.

Убедитесь, что у каждого видео есть заголовок, указанный в теге <video: title> на вашей карте сайта.

Источник:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Неправильный формат индекса карты сайта: вложенные индексы карты сайта

Одна или несколько записей в вашем индексном файле карты сайта указывают на его собственный URL-адрес или URL-адрес другого индексного файла карты сайта.

Никакие другие индексные файлы карты сайта не могут быть указаны в индексном файле карты сайта, только файлы карты сайта.

Удалите все записи, указывающие на индексные файлы карты сайта.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Ошибка синтаксического анализа

Нам не удалось проанализировать XML-файл карты сайта. Скорее всего, файл содержит нарушения в своем формате XML. Вам нужно загрузить файл и проверить его с помощью одного из XML-валидаторов.

Часто эта проблема возникает из-за нарушения вложенности неэкранированного символа в теге URL. Как и во всех XML-файлах, любые значения данных (включая URL-адреса) должны использовать escape-коды сущностей для определенных символов, таких как символы & '"<>.

Убедитесь, что ваши URL-адреса правильно экранированы. Например, символ "&" следует заменить в URL-адресе на "%26", а все пробелы — на "%20".

URL-адреса на карте сайта должны соответствовать:

  • Стандарт RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)
  • Стандарт XML (https://www.w3.org/TR/REC-xml/)
  • RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Миниатюра слишком большая

Уменьшенное изображение видео, указанное на карте сайта, слишком велико. Уменьшите размер миниатюры видео до 160 x 120 пикселей.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps?visit_id=637740801105480409-2568149602&rd=1

Миниатюра слишком мала

Уменьшенное изображение видео, указанное на карте сайта, слишком маленькое. Увеличьте размер миниатюры видео до 160 x 120 пикселей.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Местоположение видео и страницы воспроизведения совпадают

На карте сайта видео URL видеоконтента и URL проигрывателя не могут совпадать. Если вы указываете как <video: player_loc>, так и <video: content_loc>, URL-адреса должны быть разными.

Для получения более подробной информации посетите: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

URL-адрес местоположения видео, по-видимому, является URL-адресом страницы воспроизведения

URL-адрес видеоконтента <video: content_loc> указывает на ту же страницу, где находится проигрыватель.

Для получения более подробной информации посетите: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Тег <changefreq> = никогда

Тег <changefreq> на карте сайта сообщает поисковой системе, как часто следует повторно сканировать эту страницу. Сканеры могут периодически сканировать страницы, помеченные как «никогда», чтобы отслеживать неожиданные изменения на этих страницах. Однако это значение «никогда» не рекомендуется, потому что, если вы внезапно измените содержимое страницы и введете новую дату в теге <lastmod>, неясно, как поведет себя поисковая система, будут ли изменения проиндексированы и сколько времени это может занять.

Карта сайта заблокирована в robots.txt

Поисковые системы не смогут получить доступ к вашей карте сайта, поскольку robots.txt файл блокирует это.

Измените robots.txt файл, позволяющий роботам сканировать карту сайта.

Относительная ссылка

В стандартах на sitemaps.org записываются следующие требования:

URL-адрес страницы. Этот URL-адрес должен начинаться с протокола (например, HTTP) и заканчиваться косой чертой, если этого требует ваш веб-сервер. Это значение должно быть меньше 2048 символов.

Источник: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

Слишком длинный URL-адрес

Длина URL-адреса не может превышать 2048 символов.

Источник: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

Типы предупреждений:

Все страницы внутри одной и той же карты сайта имеют одинаковое время изменения документа

Чтобы поисковые системы работали эффективно, карта сайта должна содержать фактическую дату изменения страницы. Без этого он резко теряет свою эффективность.

Чтобы понять эту проблему, вам нужно знать, как работают поисковые системы. Поисковая система тратит ресурсы на чтение и анализ каждой страницы, увеличивая нагрузку на сервер, на котором размещен сайт. Таким образом, поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. В упрощенном виде это означает, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались.

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода.

У поисковой системы есть только два способа узнать, была ли изменена страница: прочитать информацию о странице в карте сайта (не тратя бюджет на поиск) или проиндексировать страницу (и потратить на нее бюджет на поиск). Поэтому, если у вас нет тега с правильной датой обновления страницы, он просто переиндексирует все страницы.

При одинаковом времени изменения документа для всех страниц карты сайта поисковые системы не знают, каким страницам отдать приоритет. Они могут фокусироваться на других элементах, таких как тег приоритета. Однако это гораздо менее точный инструмент для ускорения индексации. Например, у вас может быть 1000 страниц с приоритетом 0,8 и 9000 страниц с приоритетом 0,3. В этом случае изменения на страницах из первой группы могут быть проиндексированы более чем за пять дней, а из второй группы — более чем за месяц. Если вы правильно используете этот тег приоритета рядом с датой изменения документа, изменения в индексации могут произойти в течение дня.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime).

Стандарт допускает несколько форматов, например: <lastmod>2021-12-23T18:00:15+00:00</ lastmod>

или

<lastmod>2021-11-23</lastmod>.

Карта сайта не содержит тега с датой последнего изменения документа

Чтобы поисковые системы работали эффективно, карта сайта должна содержать фактическую дату изменения страницы. Без этого он резко теряет свою эффективность и становится бесполезным.

Чтобы понять эту проблему, вам нужно знать, как работают поисковые системы. Поисковая система тратит ресурсы на чтение и анализ каждой страницы, увеличивая нагрузку на сервер, на котором размещен сайт. Таким образом, поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. В упрощенном виде это означает, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода.

У поисковой системы есть только два способа узнать, была ли изменена страница: прочитать информацию о странице в карте сайта (не тратя бюджет на поиск) или проиндексировать страницу (и потратить на нее бюджет на поиск). Поэтому, если у вас нет тега с правильной датой обновления страницы, он просто переиндексирует все страницы.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime)

Стандарт допускает несколько форматов, например:

<lastmode>2021-12-23T18:00:15+00:00</ lastmode>

или

lt;lastmode>2021-11-23</последний мод>.

Обратите внимание, что не все форматы файлов sitemap допускают использование даты последнего изменения или тега приоритета. Если ваш сайт не поддерживает этот формат карты сайта, то это может снизить скорость индексации вашего сайта. Возможно, стоит подумать о смене платформы, если это так.

На всей карте сайта нет даты обновления страницы или приоритета обновления страницы.

Дата обновления страницы и приоритет индексации страницы являются двумя наиболее важными атрибутами карты сайта. Тег, содержащий время последнего изменения, позволяет поисковым системам определить, какие страницы были изменены сегодня и должны быть проиндексированы как можно быстрее при наличии достаточного бюджета на поиск. Это лучший атрибут для ускорения индексации.

Атрибут priority позволяет вам сначала проиндексировать наиболее важные страницы, даже среди этих обновленных страниц. Однако, если на карте сайта не указан ни приоритет, ни время последнего изменения документа, сайт столкнется с большими проблемами, когда дело дойдет до индексации.

Поисковые системы тратят ресурсы на чтение и анализ каждой страницы, тем самым увеличивая нагрузку на сервер, на котором размещен сайт. По этой причине поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. По сути, это то, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода. Однако, если вы правильно используете теги <lastmod> и <priority>, вы можете увидеть страницы, проиндексированные в течение дня.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime). Стандарт допускает несколько форматов, например:

<lastmod>2021-12-23T18:00:15+00:00</ lastmod>

или

<lastmod>2021-11-23</lastmod>.

Обратите внимание, что не все форматы файлов sitemap допускают использование даты последнего изменения или тега приоритета. Если ваш сайт не поддерживает этот формат карты сайта, то это может снизить скорость индексации вашего сайта. Возможно, стоит подумать о смене платформы, если это так.

Для страницы не указана частота обновления или приоритет индексации.

Чтобы быть проиндексированным как можно быстрее, лучше всего:

  • Есть информация о последнем обновлении в теге <lastmod>
  • Помечайте страницы с высоким приоритетом тегом <priority>
  • Укажите частоту обновления в теге <changefreq>

Без этих данных поисковая система на крупном сайте может не индексировать изменения на странице более месяца. Страницы без информации о приоритете, но с частыми обновлениями будут проиндексированы в соответствии с базовыми стандартами индексации, что значительно увеличит время индексации потенциально важных страниц.

Ведущий пробел

Ваша карта сайта начинается с пробела, а не с объявления пространства имен. XML-файлы должны начинаться с XML-объявления, в котором указывается версия этого формата, которая будет использоваться.

Это не помешает поисковым системам обработать вашу карту сайта, но Google рекомендует удалять пробелы, чтобы файл соответствовал стандарту XML.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

URL-адрес карты сайта перенаправляет на другой URL-адрес

Например, в нем указывается http://example.com/sitemap.xml, но он перенаправляет на https://example.com/sitemap1.xml.

Это не помешает поисковым системам обрабатывать вашу карту сайта, но может привести к проблемам, если перенаправление будет работать некорректно.

Замените URL-адреса перенаправления в ваших файлах карты сайта на те, которые необходимо отсканировать.

Недопустимый формат приоритета URL-адреса

Приоритет индексации может иметь значение от 0.0 до 1.0.

Цифры в значении разделены точкой, а значения меньше единицы должны начинаться с символа «0». Например, вы должны написать: «0.3», а не «.3».

URL-адрес не разрешен

Ваша карта сайта содержит URL-адреса на другом поддомене или домене, отличном от домена карты сайта.

Например, если карта вашего сайта расположена по адресу http://www.example.com/sitemap.xml, тогда следующие URL-адреса будут недействительны для этой карты сайта:

  • http://example.com / — "www" отсутствует.
  • www.example.com / — отсутствует "http"
  • https://www.example.com / — используя "https", а не "http".

В стандарте карты сайта есть специальный раздел, посвященный этой ошибке:

https://www.sitemaps.org/protocol.html#location

«URL-адреса, которые не считаются действительными, исключаются из дальнейшего рассмотрения».

Поэтому даже в описании стандарта настоятельно рекомендуется поместить файл sitemap в корневой каталог сайта.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Все страницы внутри одной и той же карты сайта имеют одинаковый приоритет

Страницы, которые меняются чаще и представляют больший интерес для пользователей, должны быть приоритетными.

Чтобы указать приоритет страницы, вы можете использовать следующий тег (в диапазоне от 0 до 1):

<priority>0.8</priority>.

Пожалуйста, обратите внимание, что не все форматы файлов sitemap поддерживают этот тег.

В первую очередь поисковая система будет ориентироваться на тег времени обновления документа, поскольку это более точное значение. Когда вы указываете точную дату изменения страницы в своей карте сайта, атрибут priority имеет меньший вес. Следовательно, если тег <lastmod> содержит актуальную информацию, наличие того же приоритета страницы не является большой проблемой.

Однако присвоение высокого приоритета всем URL-адресам на сайте также не имеет смысла, поскольку это просто снова делает все страницы равноценными по приоритету.

Например, если поисковая система решит выделить бюджет на обход в размере 30 страниц в день сайту с 1000 страницами, то увеличение приоритета для всех страниц не увеличит скорость, с которой они индексируются. По-прежнему будет индексироваться 30 страниц в день.

Наилучшей практикой является определение приоритетности тех страниц, которые меняются чаще всего и являются более важными для получения трафика от поисковой системы. Затем остальным страницам следует присвоить более низкий приоритет. Это позволит сбалансировать индексацию, гарантируя, что страницы с более высоким приоритетом будут индексироваться быстрее.

Тег <приоритет> особенно важен, когда был обновлен весь сайт, поскольку в этом случае дата последнего изменения одинакова на всех страницах. Затем тег <priority> становится запасным вариантом. Обеспечение правильной настройки с помощью этого тега гарантирует, что наиболее важные страницы будут переиндексированы в первую очередь.

Понравилась статья? Поделить с друзьями:
  • Как проверить файл css на ошибки
  • Как проверить торрент на ошибки
  • Как проверить телефон на наличие ошибок
  • Как проверить ссд на наличие ошибок
  • Как проверить ссд диск на ошибки и повреждения