Проверить страницы на 404 ошибку

Битая ссылка — неработающая, ведет на несуществующую страницу на сайте. При переходе по такой посетитель увидит сообщение об ошибке. (Говоря техническим языком, сервер отправит код ответа 404 «Not found».)

Битые ссылки могут появиться из-за банальной ошибки при написании, а также страниц, которые раньше существовали, а потом были удалены или перенесены.

11 способов проверки битых ссылок на сайтеВот что Click.ru сообщает при попытке перехода на несуществующую страницу

11 способов проверки битых ссылок на сайтеА вот что отвечает Amazon

11 способов проверки битых ссылок на сайтеБывает и такой креативный подход (Convert Monster)

Главная проблема в том, что битые ссылки ухудшают поведенческие факторы сайта, влияющие на успех SEO-продвижения. Потому что не все посетители настойчивые и терпеливые: многие могут просто уйти, если возникают сложности с навигацией. К тому же избыток broken links — риск попасть под один из фильтров Google.

Рассказываем о 11 способах найти нерабочие ссылки на сайтах. Дальше дело будет за малым: останется вручную поправить их через панель управления или настроить 301 редирект.

Вебмастеры Яндекса и Google

В отчетах обоих этих официальных инструментов можно увидеть, сколько на сайте сломанных ссылок и где они находятся.

В Google Search Console: «Индекс» → «Покрытие» → «Ошибка 404». В Яндекс.Вебмастере: «Индексирование» → «Статистика обхода», а также «Ссылки» → «Внутренние ссылки».

11 способов проверки битых ссылок на сайтеПример отчета Яндекс.Вебмастера по удаленным ссылкам

Естественно, этот способ проверки работает, только если есть права доступа к сайту. Чужой ресурс не получится проанализировать таким образом.

Читайте также: 26 полезных функций «Яндекс.Вебмастера»

Системы веб-аналитики

Самые популярные счетчики веб-аналитики тоже могут помочь обнаружить проблемы с работоспособностью ссылок.

Само по себе количество ошибочных переходов (на страницу 404) можно увидеть в отчетах:

  • Яндекс.Метрики: «Содержание» → «Заголовки страниц».
  • Google Analytics: «Поведение» → «Контент сайта» → «Все страницы» (выбрать параметр «Название страницы»).

Важно: при условии, что 404-страница имеет отличный от других title. Еще она, скорее, будет выделяться и в отчетах «Страницы выхода». Там как раз можно увидеть, насколько битые ссылки ухудшают юзабилити сайта.

11 способов проверки битых ссылок на сайтеВ конструкторе Nethouse, например, заголовок 404 страницы по умолчанию выглядит так. По нему можно увидеть нерабочие URL

Кстати, с помощью Click.ru вы можете спарсить метатеги и заголовки с любого сайта. Первые 500 запросов — бесплатно. Дальше от 0,04 р. за запрос.

Отследить, где именно находится битая ссылка, немного сложнее. В Яндекс.Метрике для этого нужно:

1. Создать цель JavaScript-событие с идентификатором типа «error404», название сделать таким же.

2. Добавить в код страницы (XXXXXX — номер счетчика):

<script>
window.onload = function (){
ym(XXXXXX, 'reachGoal', 'error404');
}
</script>

3. Отслеживать в отчетах достижения этой цели по параметру «Страница входа».

11 способов проверки битых ссылок на сайтеМожно будет выбрать группировку по «Страница входа» и добавить метрику — «Целевые визиты» по указанному ID. Отчет покажет страницы, на которых срабатывала ошибка 404.

В Google Analytics можно сделать похожим образом, с помощью событий, или настроить специальный отчет (для этого проще взять шаблон Якова Осипенкова).

11 способов проверки битых ссылок на сайтеПример отчета по битым внутренним ссылкам. «Страница» как раз показывает URL, который вызвал ошибку. (Для проверки внешних ссылок есть другой шаблон).

Эти фильтры Google Analytics тоже работают только в том случае, если 404-страница имеет уникальный заголовок (title).

Читайте также: 20+ ресурсов для обучения веб-аналитике: блоги, курсы, каналы, сообщества, рассылки

Сервисы комплексного SEO-анализа

Другой способ проверить сайт на битые ссылки — воспользоваться одним из сервисов для SEO-аудита.

Netpeak Spider предлагает найти не только broken links, но и дубли метатегов; проверить код сервера сервера, структуру сайта, редиректы, индексацию и др. Мощная фича: встроенный парсер для извлечения данных с различных ресурсов. Подписка стоит от 15 $ в месяц, есть бесплатный тариф.

11 способов проверки битых ссылок на сайтеПример аудита от Netpeak Spider

Serpstat анализирует и битые ссылки, и битые картинки. И много чего еще делает: мониторит ссылочную массу, показывает ошибки в заголовках и метатегах, показывает позиции сайта в поисковиках и т. д. Подписка стоит от 55 $ в месяц, есть демо-доступ.

11 способов проверки битых ссылок на сайтеТак выглядит отчет Serpstat по URL с ошибками 404

Screaming Frog SEO Spider сканирует сайт и находит нерабочие ссылки, дубли, ошибки в метаданных, показывает структуру, анализирует редиректы, директивы и др. Лицензия на программу стоит 149 евро в год, однако поиск битых ссылок есть и в бесплатной версии.

Обзор 10 версии Screaming Frog

SEO Analysis & Website Review by WooRank отображает тайтл, дескрипшн и сниппет в Google, проверяет валидность Sitemap, мобильность, юзабилити, структурированные данные — и, конечно, битые ссылки тоже. Это расширение для Chrome, и оно бесплатное. (Правда, в отличие от других, подойдет только для небольших сайтов, так как надо анализировать постранично, вручную).

11 способов проверки битых ссылок на сайтеОценка ссылок на странице от SEO Analysis & Website Review

Кстати, анализ битых ссылок может входить в функционал сервисов автоматизации рекламы и сквозной аналитики. Например, такая возможность есть у Alytics, Marilyn.

Специализированные инструменты

Вебмастерские, системы веб-аналитики, сервисы комплексного SEO-аудита не подходят — есть более узкие инструменты, заточенные чисто под поиск битых ссылок.

Xenu’s Link Sleuth — старая-добрая программа, проверяет сайты на наличие «сломанных» ссылок. Впрочем проверяет не только ссылки, но и изображения, фреймы, плагины, скрипты. Инструмент полностью бесплатный.

11 способов проверки битых ссылок на сайтеТак выглядит отчет Xenu’s Link Sleuth

Badlinks — онлайн-сервис, который предлагает как разовую, так и регулярную проверку «плохих» ссылок на сайте. Разовая стоит от 50 рублей, регулярная — от 250 рублей в год. Стоимость сильно варьируется, так как зависит от частоты анализа и размера сайта. Бесплатный поиск ограничен 10 страницами.

11 способов проверки битых ссылок на сайтеТак выглядит бесплатный отчет от badlinks.ru (хорошо видно, как всеми силами уговаривают пройти полную платную проверку)

Check My Links — расширение Chrome для поиска нерабочих ссылок на странице. Есть возможность скопировать весь список в буфер обмена, не учитывать ссылки на определенные домены, включить отслеживание nofollow. Инструмент абсолютно бесплатный.

11 способов проверки битых ссылок на сайтеТак выглядят результаты поиска в Check My Links (кстати, еще плагин подсвечивает их на самой странице)

Если работаете с Google Ads, обратите внимание на скрипт, который сканирует все посадочные страницы и сообщает о битых ссылках на почту. О других скриптах и том, как с ними работать, — в блоге Click.ru.

Читайте также: 35+ ресурсов для обучения SEO и развития в профессии

Мертвые или неработающие ссылки могут ухудшить рейтинг вашего сайта и его поисковую способность. Это связано с тем, что внутренние и внешние ссылки, которые приводят к ошибкам 404, влияют на статистику индексируемости вашего сайта.

Для небольших веб-сайтов менее 20 страниц устранение неработающих ссылок возможно, хотя и утомительно. Для больших сайтов выявление и исправление неработающих ссылок становится невозможным, особенно потому, что может быть сложно отслеживать состояния ссылок, когда веб-документы Chrome могут ссылаться на страницы с нескольких других сайтов.

Средство проверки неработающих ссылок – это специализированный инструмент, помогающий выявлять такие неработающие ссылки. Вы проверяете URL-адреса, чтобы получить отчет, в котором указаны все мертвые ссылки. Это позволяет вам решать и исправлять их.

Чем крупнее и развитее веб-сайт, тем сложнее становится обслуживание гиперссылок. Поскольку лишь немногие владельцы веб-сайтов могут позволить себе нанять людей для обслуживания, наш бесплатный онлайн-инструмент для проверки мертвых ссылок поможет вам:

  • Проверка веб-сайта или блога на наличие неработающих гиперссылок. Вы можете бесплатно проверить до 150 ссылок; вы можете проверить неограниченное количество ссылок с любым из наших платных планов.
  • Выявление ошибок и внесение предложений по оптимизации вашего веб-сайта.
  • Сообщение о кодах ошибок для любых неработающих URL, включая ошибки 404 и 502 и переадресацию 301.
  • Устранение проблем с удобством использования для конечных пользователей для устранения проблемных переадресаций.
  • Предоставление ценных ссылок на ваш веб-сайт с помощью функций работы с неработающими ссылками.
  • Предлагает полную функциональность без создания учетной записи или загрузки какого-либо программного обеспечения.
  • Сканирование как внутренних, так и внешних гиперссылок.

Как использовать средство проверки неработающих ссылок

Использование нашего сканера неработающих ссылок для проверки работоспособности и SEO вашего веб-сайта так же просто, как копирование и вставка URL-адреса вашего веб-сайта. Вы можете просмотреть отчет нашего инструмента, выполнив 2 простых шага. Посетите нашу страницу определения URL для подробного объяснения этого основополагающего элемента вашего сайта.

Шаг 1. Вставьте URL-адрес

Отсканируйте URL-адрес главной страницы вашего веб-сайта, чтобы за считанные секунды проверить сайт на наличие неработающих входящих и исходящих ссылок. Если у вас есть высокорейтинговый контент блога, вы захотите проверить его следующим. Затем убедитесь, что все внутренние ссылки на другой контент работают должным образом. Затем запустите URL-адреса любых страниц, которые ссылаются на внешний контент, с помощью инструмента.

Обязательно скопируйте и сохраните результат каждой проверки для удобства использования. Вы можете запустить более одной проверки неработающих ссылок, прежде чем перейти к следующему шагу.

Наконец, проверьте любые другие URL-адреса, которые, по вашему мнению, важны для вашего сайта.

Введите свой URL-адрес в наш инструмент проверки мертвых ссылок

Часто сканируйте свой сайт. Частые проверки уменьшают мертвые ссылки, как внутренние, так и внешние. Почаще проверяйте, нет ли новых неработающих ссылок. Решите их, прежде чем они негативно повлияют на ваше SEO.

Шаг 2. Анализ результатов проверки неработающих ссылок

Вот фрагмент анализа результатов внешних ссылок из популярного блога WordPress с сотнями страниц:

Результаты анализа ссылок на ваш URL-адрес и с него в Интернете

Это только фрагмент. Массовый анализ результатов проверяет еще 13 внешних ссылок, 11 поддоменов и более 150 внутренних ссылок.

Чтобы понять анализ результатов, вы хотите видеть для каждой ссылки «200 OK». Перенаправление 302 допустимо, если после него следует «200 OK». Ищите любые ссылки, которые показывают ошибки «404» или «502».

Коды ошибок HTTP 404 Not Found означают, что веб-серверу не удалось найти запрошенный ресурс. Этим ресурсом может быть файл, изображение или другая веб-страница. Коды ошибок HTTP 502 Bad Gateway означают, что веб-сервер получил ошибочный или недопустимый ответ. Веб-сервер работает как прокси, когда получает недопустимый ответ от вышестоящих серверов.

Провести полный аудит для глубокого анализа

При анализе вашего URL-адреса вы также можете увидеть результаты, помеченные как коды состояния «4xx» или «3xx» или аналогичные. Сообщение с кодом состояния 4xx указывает на ошибки клиента. Они представляют собой группу кодов состояния HTTP для неправильного синтаксиса в запросе клиента на ресурсы. Причиной отказа в подаче запроса предположительно является ошибка клиента при отправке запроса.

Код состояния 3xx обозначает перенаправления, означающие, что клиент должен выполнить дальнейшие шаги, чтобы выполнить операцию запроса. Этот набор кодов состояния указывает, что пользовательский агент должен предпринять дальнейшие действия для завершения запроса.

Даже большие сайты получают эти ошибки. Вот как выглядит полный аудит для Facebook.

[URL-адрес изображения = “https://sitechecker.pro/wp-content/uploads/2022/04/broken_links_3.png” alt=”Полный аудит Facebook с многочисленными ошибками”]

Проведите полный аудит для глубокого анализа!

Просканируйте свой сайт и найдите все URL-адреса с проблемами, которые могут повредить вашим пользователям или SEO вашего сайта.

Sitechecker rating on crozdesk
Sitechecker rating on crowd
Sitechecker rating on capterra

Что такое неработающая ссылка (ошибка 404)?

Неработающая ссылка — это URL-адрес, который возвращает ответ, в котором говорится: «Страница не существует или не может быть найдена». Это означает, что любая страница, документ или изображение, запрашиваемая ссылкой, может не существовать. Таким образом, ссылка «мертвая». Это может быть как просто поврежденное изображение, которое больше не размещается на таких сайтах, как Filehippo, так и что-то более серьезное, например, домен с истекшим сроком действия.

Мертвые ссылки трудно исправить, потому что они невидимы для веб-администраторов, если они не проверяются. На большинстве бизнес-сайтов отсутствуют специалисты по веб-аналитике и программное обеспечение для отслеживания мертвых ссылок. Со временем, по мере того как веб-сайты и онлайн-топография меняются и развиваются, ссылки, которые, возможно, когда-то работали, незаметно перестают работать.

Пользователям будет все равно, работала ли ссылка раньше, только то, что она больше не работает. Поскольку у многих веб-администраторов есть другие обязанности, обслуживанием веб-сайта часто пренебрегают. Это приводит к неработающим ссылкам и грязной архитектуре веб-сайта.

Почему битые ссылки вредны для SEO?

Неработающие ссылки создают негативное впечатление у пользователей и означают, что веб-сайт не является надежным источником информации. Для пользователей обнаружение битых ссылок на сайте негативно влияет на их восприятие его качества и репутации.

Сканеры веб-поисковых систем и поисковые роботы проверяют и индексируют страницы. Затем они делают их доступными для пользователей. Зная это, легко понять, почему исправление мертвых и неработающих ссылок так важно для размещения на первых нескольких страницах любой поисковой системы.

Задача веб-мастеров и владельцев сайтов — убедиться, что никакие ссылки не ведут на несуществующие страницы и файлы по всему сайту. Пользователи ожидают, что любые внешние или внутренние ссылки, по которым они переходят, приведут их на соответствующую страницу.

Еще одна причина для устранения неработающих ссылок — оптимизация индексации поисковыми системами. Поисковая система использует для обновления и индексации веб-контента. Когда сканер веб-сайта поисковой системы (также называемый пауком) сканирует ваш сайт и находит слишком много неработающих и мертвых ссылок, это влияет на рейтинг вашего сайта.

Что вызывает неработающие ссылки?

Каждый день количество новых страниц, проиндексированных поисковыми системами, растет на тысячи, если не на десятки тысяч. Количество удаленных страниц и измененных URL-адресов одинаково, поскольку действующие веб-сайты меняют ЧПУ и контент, добавляют новые страницы и файлы и удаляют старые.

Ниже приведен список распространенных сценариев, которые могут привести к мертвым и неработающим ссылкам:

  • Удаление старых страниц, файлов HTML, листов и документов, которые стали ненужными или лишними. Вы можете пренебречь обновлением ссылок на эти страницы во время разработки веб-сайта.
  • Ссылка на внешнюю страницу с другого сайтас измененным URL-адресом если не выполняется перенаправление to прежний URL-адрес. Это может быть смена доменного имени, изменение структуры сайта или даже полное удаление страницы. Сайты могут перемещаться на доменные имена с «www» без настройки переадресации 301. Это прерывает любые ссылки на прежний URL-адрес на любом другом сайте в Интернете.
  • Автоматическое обновление контента во внешних источниках может привести к ошибкам гиперссылок и неработающим ссылкам. Например, интернет-магазины и службы доставки, которые регулярно обновляют свои каталоги, могут привести к неработающим ссылкам. Проверьте свои страницы, если вы ссылались на продукты, которые с тех пор перешли на новые URL.
  • Технический и структурный перевод веб-сайта может привести к неработающим ссылкам. Контент иногда реорганизуется в соответствии с новым стилем без учета существующих гиперссылок. Это особенно распространенная проблема для внешних ссылок. Реструктуризация может включать большое количество данных. И технические алгоритмы могут не учитывать все нюансы движущегося содержимого страницы. Это может повлиять на ваши внутренние обратные ссылки, если вы не будете осторожны при реструктуризации версии своего сайта.

Есть много других причин, по которым ссылки могут не работать, но мы определили наиболее распространенные причины выше.

Мы описали различные причины неработающих ссылок. Битые ссылки — естественный и неизбежный процесс создания веб-сайтов. Вы можете позаботиться о том, чтобы внутренние ссылки вашего сайта всегда работали. Но у вас нет возможности контролировать, что происходит с обратными ссылками на других страницах и веб-сайтах, на которые вы ссылаетесь извне.

Чем больше ваш веб-сайт, тем чаще вы ссылаетесь на другие внутренние и внешние источники. Внешние страницы, изображения, файлы, видео повышают вероятность того, что некоторые из ваших ссылок не работают. Лучшее, что вы можете сделать, это практиковать надлежащее обслуживание ссылочного.

Поисковые системы рассматривают ссылки, ведущие в никуда, как плохой знак. Это показывает, что ваш сайт плохо поддерживается и устарел. Они считают веб-сайты с большим объемом действующих ссылок актуальными и актуальными. Таким образом, надлежащая проверка и исправление ссылок необходимы для достижения и поддержания высокого рейтинга в поисковых системах.

Как исправить?

Наш инструмент проверки неработающих ссылок поможет вам определить, какие ссылки нуждаются в ремонте и обслуживании. Но вам нужно будет восстановить все неработающие ссылки, обнаруженные вручную. Например, вам может понадобиться связать устаревшую или консолидированную страницу Википедии с другим URL-адресом. Вам нужно будет вручную изменить URL-адрес неработающей ссылки, чтобы он указывал на новую страницу.

В этом видео вы узнаете, как начать работу:

Вам нужно будет восстановить или перенаправить неработающие ссылки на соответствующие замены. Вы можете улучшить навигацию и индексируемость, удалив мертвые ссылки. Это поможет вам восстановить «ссылочный капитал» и, возможно, повысить рейтинг.

Если одна из ваших ссылок не работает из-за несуществующего веб-сайта, у вас есть два варианта. Проверьте, существует ли веб-сайт, на который вы ссылаетесь. Если это так, попробуйте найти, куда внешняя страница могла переместить контент, на который вы ссылались ранее. Если нет, вы можете либо добавить ссылку на копию той же страницы, хранящуюся в веб-архиве, либо найти адекватную замену.

Если внешний сайт, на который вы ссылались, стал недоступен, проблема может быть временной. Веб-сайты часто отключаются из-за технического обслуживания, проблем с хостингом и даже случайных DDoS-атак. Особенно это касается сайтов крупных компаний и финансовых учреждений. Проверьте, был ли сайт недоступен в течение длительного периода времени. Проверьте прогноз, когда услуга вернется. Если его нет, подумайте о том, чтобы найти альтернативный веб-сайт для ссылки. Какой выбор вы сделаете, должен учитывать причину, по которой ваша ссылка не работает.

Веб-сайты, такие как блоги, могут начинаться с прямых путей к разным статьям из домена. По мере роста количества статей веб-администраторы сайта могут решить сгруппировать похожие статьи в категории. Это может изменить URL-адрес их статей. Вам нужно будет обновить пути для ваших ссылок, чтобы они приводили ваших пользователей на нужные страницы.

Если страница исчезла и вы не можете найти ей замену — вы мало что можете сделать; вам придется удалить неработающую ссылку. Чтобы избежать проблем с индексацией сайта из-за неработающих ссылок, обязательно закройте все неработающие ссылки в файле robots.txt вашего сайта.

Ищите потенциально перенаправленные домены, ссылки на которые вы не помните. Удалите или замените неработающие перенаправления, чтобы улучшить взаимодействие с пользователем. Это предотвратит плохие ссылки на вредоносные сайты, которые могут повредить вашему SEO. Другие веб-сайты, на которые вы ссылаетесь, могут не уведомлять вас о каких-либо изменениях на своих сайтах.

Вам нужно будет исправить настройки неработающей ссылки вручную. Но возможность с первого взгляда понять, с чего нужно начать, значительно экономит время. После исправления вы сможете предоставить посетителям вашего сайта гораздо более приятный и богатый контентом опыт — независимо от того, как они попали на ваш сайт. Кроме того, исправление неработающих ссылок повысит ваш рейтинг в поисковых системах. Это повышает вероятность того, что новые пользователи найдут ваш сайт. Больше посетителей увеличит ваш веб-трафик, продажи и доход. Возможно, вам придется подождать день или два после внесения исправлений, чтобы отразить новые результаты.

У нас есть более подробные статьи, за которыми вы можете следить. Они выявляют и устраняют проблемы с более сложными неработающими ссылками, связанными с неработающими файлами CSS или даже неработающим файлом JavaScript. Доступен полный набор инструментов поддержки SEO-анализа и автоматической оптимизации. Кроме того, существует множество руководств по каждому аспекту обслуживания веб-сайта.

Часто задаваемые вопросы

Какой лучший инструмент для проверки неработающих ссылок?

Средство поиска неработающих ссылок Sitechecker.pro является одним из лучших доступных в Интернете для Microsoft Windows, Linux и Mac. В отличие от своих конкурентов, оно работает на любой ОС.

Как узнать, исправлены ли мои неработающие ссылки?

Повторно запустите URL-адрес с помощью инструмента проверки неработающих ссылок Sitechecker.pro. Это покажет, устранили ли внесенные вами исправления проблемы с неработающими ссылками.

Как убрать неработающие ссылки с моего сайта?

Вы можете исправить неработающие ссылки, заменить их или удалить.

Как восстановить неработающую ссылку на внешний ресурс?

Если вы не можете найти страницу или сайт больше не существует, рассмотрите возможность создания ссылки на альтернативный внешний ресурс.

Как найти битые ссылки (404)?

Самый простой способ найти неработающие ссылки и 404 ошибок заключается в том, чтобы пропустить ваш URL-адрес через детектор неработающих ссылок Sitechecker.pro.

Сегодня я подготовил для вас материал, в котором я решил собрать свой опыт при работе с ошибками 404. Как проверить и найти ошибки 404 на своем сайте и почему это важно сделать?

Ошибка 404 на сайте означает то, что пользователь обратился к вашему сайту по такому url-адресу, страницы для которого в данный момент не существует.

Обратите внимание, что это не означает, что данной страницы вообще никогда не существовало. Она могла быть создана вами ранее, но позже вы могли переместить ее в другой раздел сайта, поменять ее название или что-то еще и автоматически изменился ее url-адрес. Кроме того, вы могли просто ее удалить.

Все бы ничего, но если на эту страницу были ссылки с вашего сайта, либо с других сайтов или она попадала в ранжирование поисковых систем, все переходы с таких мест на эту страницу, будут выдавать ошибку 404 — страница не найдена.

Как думаете есть ли на вашем сайте такие ошибки?

Признаться честно, я думал, что на моем сайте если такие ошибки и есть, то их не слишком много. Каково было мое удивление и ужас, когда я все настроил, проверил свой сайт и увидел реальную картину с ошибками 404 на своем сайте.

Вот скриншот из системы Яндекс Метрика:

Только за первые несколько дней, мне удалось найти 22 такие страницы.

Как думаете, сколько таких страниц у вас?

Большое количество 404 ошибок на вашем сайте может очень серьезно сказаться на показателях и посещаемости вашего сайта.

 Почему так происходит?

Большое количество 404 ошибок означает для поисковой системы:

+ Автор не следит за своим сайтом.

+ Автор пытается обмануть своих посетителей.

+ На сайте какие-то неполадки.

Зачем поисковой системе давать высокие позиции в поисковой выдаче таким сайтам? Соответственно, доверие поисковых систем к ним довольно серьезно снижается.

Чтобы этого не допускать, нужно постоянно проверять свой сайт на ошибки 404, находить их и устранять.

Как это можно сделать и где посмотреть есть ли они на вашем сайте или нет?

Здесь есть несколько вариантов, как это можно сделать. Давайте рассмотрим самые основные.

Вариант 1. Система Яндекс Метрика.

https://metrika.yandex.ru

Это система веб-аналитики сайта, которая может показать наиболее точную и информативную картину из всех вариантов, которые будут рассмотрены ниже.

Но, основная проблема здесь — это сложность настройки и передачи данных в эту систему.

По умолчанию, Яндекс Метрика не умеет учитывать такие переходы с ошибками 404. Для того, чтобы это стало возможным, необходимо настроить так называемые параметры визитов.

Но, человеку, который плохо разбирается в веб-разработке, сделать это может быть не совсем просто. Если у вас возникли трудности, можете обратиться ко мне, у меня есть специальная услуга по настройке ошибок 404 в системе Яндекс Метрика для вашего сайта.

Услуги веб-аналитики сайта.

Этот способ хорош также тем, что вы можете данные об ошибках 404 как метрики и использовать их при построении отчетов веб-аналитики. Это дает возможность отвечать на такие вопросы как:

1) С каких именно страниц приходили на ваш сайт и натыкались на ошибку 404.

2) Какая доля таких посещений от общего числа визитов

3) Когда именно была зафиксированна ошибка 404.

Вариант 2. Как посмотреть 404 ошибки в Яндекс.Вебмастер?

http://webmaster.yandex.ru

Страницы 404 находятся в разделе «Индексирование – Статистика обхода — Исключенные страницы»

Это хорошо, но таким способом вы можете увидеть не совсем полную информацию о вашем сайте, а только о тех страницах, которые так или иначе попадали в индекс поисковой системы Яндекс.

Вариант 3. Как посмотреть 404 ошибки в Google инструменты вебмастера.

http://www.google.com/webmasters/tools/

Этот способ аналогичен проверки ошибок 404 с помощью Яндекс Вебмастера. Картина здесь будет не совсем полная, но тем не менее, общую информацию вы можете получить.

Ошибки 404 в Google вебмастер можно найти здесь:

«Сканирование – ошибки сканирования».

После того, как вы отследите ошибки 404, на вашем сайте, нужно сделать 301 редирект на то место, где эти страницы на самом деле находятся.

Например, на wordpress это можно сделать с помощью следующего плагина.

Хороших позиций вашему сайту!

В этой статье показано, как проверить URL на 404 в PHP.

В PHP Библиотека URL-адресов клиентов широко используется для выполнения HTTP-запросов. Если вы используете cURL, вы можете получить код состояния HTTP с помощью curl_getinfo() функция. Вы можете инициализировать сеанс cURL с помощью curl_init() и передайте дескриптор cURL для использования с curl_setopt(), curl_exec(), curl_getinfo(), а также curl_close() функции. Чтобы получить код состояния HTTP для HTTP-запроса, вы можете передать CURLINFO_RESPONSE_CODE вариант для curl_getinfo() функция.

<?php

$url = «https://www.google.com/test»;

$handle = curl_init($url);

curl_setopt($handle,  CURLOPT_RETURNTRANSFER, TRUE);

$http_response = curl_exec($handle);

$http_status_code = curl_getinfo($handle, CURLINFO_RESPONSE_CODE);

curl_close($handle);

if ($http_status_code === 404) {

    echo «404 Not found»;

}

?>

Скачать код

 
Обратите внимание, что возвращаемое значение для CURLINFO_RESPONSE_CODE вариант является целым числом. Вы также можете использовать CURLINFO_HTTP_CODE вариант, который является устаревшим псевдонимом для CURLINFO_RESPONSE_CODE. Вы даже можете написать служебный метод, который возвращает код состояния HTTP, как показано ниже:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

<?php

function get_http_status_code($url)

{

    $handle = curl_init($url);

    curl_setopt($handle,  CURLOPT_RETURNTRANSFER, TRUE);

    curl_exec($handle);

    $http_status_code = curl_getinfo($handle, CURLINFO_HTTP_CODE);

    curl_close($handle);

    return $http_status_code;

}

$url = «https://www.google.com/test»;

$http_status_code = get_http_status_code($url);

if ($http_status_code === 404) {

    echo «404 Not found»;

}

?>

Скачать код

 
Вы можете использовать curl_setopt() с CURLOPT_NOBODY возможность пропустить загрузку страницы. Он исключает тело из вывода, а метод запроса устанавливается равным HEAD.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

<?php

function get_http_status_code($url)

{

    $handle = curl_init($url);

    curl_setopt($handle,  CURLOPT_NOBODY, TRUE);

    curl_exec($handle);

    $http_status_code = curl_getinfo($handle, CURLINFO_RESPONSE_CODE);

    curl_close($handle);

    return $http_status_code;

}

$url = «https://www.google.com/test»;

$http_status_code = get_http_status_code($url);

if ($http_status_code === 404) {

    echo «404 Not found»;

}

?>

Скачать код

The get_headers() Функция извлекает все заголовки, отправленные сервером в ответ на HTTP-запрос. Код состояния HTTP является первым элементом возвращаемого массива, и для 404 не найдено значение будет «HTTP/1.1 404 не найдено».

<?php

$url = «https://www.google.com/test»;

$headers = get_headers($url);

if ($headers[0] === «HTTP/1.1 404 Not Found») {

    echo «404 Not found»;

}

?>

Скачать код

 
По умолчанию get_headers() Функция извлекает заголовки с помощью HTTP-запроса GET. Чтобы вместо этого отправить запрос HTTP HEAD, вы можете установить контекст потока по умолчанию с помощью stream_context_set_default() функция.

<?php

stream_context_set_default([‘http’ => [‘method’ => ‘HEAD’]]);

$url = «https://www.google.com/test»;

$headers = get_headers($url);

if ($headers[0] === «HTTP/1.1 404 Not Found») {

    echo «404 Not found»;

}

?>

Скачать код

 
Обратите внимание, что возвращаемый статус HTTP для ошибки 404 не найден: «HTTP/1.1 404 не найден». Чтобы получить встроенный код состояния HTTP, вы можете сделать что-то вроде следующего:

<?php

function get_http_status_code($url)

{

    $headers = get_headers($url);

    return intval(explode(‘ ‘, $headers[0])[1]);

}

$url = «https://www.google.com/test»;

$http_status_code = get_http_status_code($url);

if ($http_status_code === 404) {

    echo «404 Not found»;

}

?>

Скачать код

Вот и все, что касается тестирования URL-адреса на 404 в PHP.

200

OK

«Успешно». Запрос успешно обработан.

201

Created

«Создано». Запрос успешно выполнен и в результате был создан ресурс. Этот код обычно присылается в ответ на запрос PUT «ПОМЕСТИТЬ».

202

Accepted

«Принято». Запрос принят, но ещё не обработан. Не поддерживаемо, т.е., нет способа с помощью HTTP отправить асинхронный ответ позже, который будет показывать итог обработки запроса. Это предназначено для случаев, когда запрос обрабатывается другим процессом или сервером, либо для пакетной обработки.

203

Non-Authoritative Information

«Информация не авторитетна». Этот код ответа означает, что информация, которая возвращена, была предоставлена не от исходного сервера, а из какого-нибудь другого источника. Во всех остальных ситуациях более предпочтителен код ответа 200 OK.

204

No Content

«Нет содержимого». Нет содержимого для ответа на запрос, но заголовки ответа, которые могут быть полезны, присылаются. Клиент может использовать их для обновления кешированных заголовков полученных ранее для этого ресурса.

205

Reset Content

«Сбросить содержимое». Этот код присылается, когда запрос обработан, чтобы сообщить клиенту, что необходимо сбросить отображение документа, который прислал этот запрос.

206

Partial Content

«Частичное содержимое». Этот код ответа используется, когда клиент присылает заголовок диапазона, чтобы выполнить загрузку отдельно, в несколько потоков.

300

Multiple Choice

«Множественный выбор». Этот код ответа присылается, когда запрос имеет более чем один из возможных ответов. И User-agent или пользователь должен выбрать один из ответов. Не существует стандартизированного способа выбора одного из полученных ответов.

301

Moved Permanently

«Перемещён на постоянной основе». Этот код ответа значит, что URI запрашиваемого ресурса был изменен. Возможно, новый URI будет предоставлен в ответе.

302

Found

«Найдено». Этот код ответа значит, что запрошенный ресурс временно изменен. Новые изменения в URI могут быть доступны в будущем. Таким образом, этот URI, должен быть использован клиентом в будущих запросах.

303

See Other

«Просмотр других ресурсов». Этот код ответа присылается, чтобы направлять клиента для получения запрашиваемого ресурса в другой URI с запросом GET.

304

Not Modified

«Не модифицировано». Используется для кэширования. Это код ответа значит, что запрошенный ресурс не был изменен. Таким образом, клиент может продолжать использовать кэшированную версию ответа.

305

Use Proxy

«Использовать прокси». Это означает, что запрошенный ресурс должен быть доступен через прокси. Этот код ответа в основном не поддерживается из соображений безопасности.

306

Permanent Redirect

«Перенаправление на постоянной основе». Это означает, что ресурс теперь постоянно находится в другом URI, указанном в заголовке Location: HTTP Response. Данный код ответа имеет ту же семантику, что и код ответа 301 Moved Permanently, за исключением того, что агент пользователя не должен изменять используемый метод HTTP: если POST использовался в первом запросе, POST должен использоваться и во втором запросе.

400

Bad Request

«Плохой запрос». Этот ответ означает, что сервер не понимает запрос из-за неверного синтаксиса.

401

Unauthorized

«Неавторизовано». Для получения запрашиваемого ответа нужна аутентификация. Статус похож на статус 403, но,в этом случае, аутентификация возможна.

402

Payment Required

«Необходима оплата». Этот код ответа зарезервирован для будущего использования. Первоначальная цель для создания этого когда была в использовании его для цифровых платежных систем(на данный момент не используется).

403

Forbidden

«Запрещено». У клиента нет прав доступа к содержимому, поэтому сервер отказывается дать надлежащий ответ.

404

Not Found

«Не найден». Сервер не может найти запрашиваемый ресурс. Код этого ответа, наверно, самый известный из-за частоты его появления в вебе.

405

Method Not Allowed

«Метод не разрешен». Сервер знает о запрашиваемом методе, но он был деактивирован и не может быть использован. Два обязательных метода, GET и HEAD, никогда не должны быть деактивированы и не должны возвращать этот код ошибки.

406

Not Acceptable

Этот ответ отсылается, когда веб сервер после выполнения server-driven content negotiation, не нашел контента, отвечающего критериям, полученным из user agent.

407

Proxy Authentication Required

Этот код ответа аналогичен коду 401, только аутентификация требуется для прокси сервера.

408

Request Timeout

Ответ с таким кодом может прийти, даже без предшествующего запроса. Он означает, что сервер хотел бы отключить это неиспользуемое соеднинение. Этот метод используется все чаще с тех пор, как некоторые браузеры, вроде Chrome и IE9, стали использовать HTTP механизмы предварительного соединения для ускорения серфинга (смотрите баг 634278, будущей реализации этого механизма в Firefox). Также учитывайте, что некоторые серверы прерывают соединения не отправляя подобных сообщений.

409

Conflict

Этот ответ отсылается, когда запрос конфликтует с текущим состоянием сервера.

410

Gone

Этот ответ отсылается, когда запрашиваемый контент удален с сервера.

411

Length Required

Запрос отклонен, потому что сервер требует указание заголовка Content-Length, но он не указан.

412

Клиент указал в своих заголовках условия, которые сервер не может выполнить

413

Precondition Failed

Размер запроса превышает лимит, объявленный сервером. Сервер может закрыть соединение, вернув заголовок Retry-After

414

Request Entity Too Large

URI запрашиваемый клиентом слишком длинный для того, чтобы сервер смог его обработать

415

Unsupported Media Type

Медиа формат запрашиваемых данных не поддерживается сервером, поэтому запрос отклонен

416

Requested Range Not Satisfiable

Диапозон указанный заголовком запроса Range не может быть выполнен; возможно, он выходит за пределы переданного URI

417

Expectation Failed

Этот код ответа означает, что ожидание, полученное из заголовка запроса Expect, не может быть выполнено сервером.

500

Internal Server Error

«Внутренняя ошибка сервера». Сервер столкнулся с ситуацией, которую он не знает как обработать.

501

Not Implemented

«Не выполнено». Метод запроса не поддерживается сервером и не может быть обработан. Единственные методы, которые сервера должны поддерживать (и, соответственно, не должны возвращать этот код) — GET и HEAD.

502

Bad Gateway

«Плохой шлюз». Эта ошибка означает что сервер, во время работы в качестве шлюза для получения ответа, нужного для обработки запроса, получил недействительный (недопустимый) ответ.

503

Service Unavailable

«Сервис недоступен». Сервер не готов обрабатывать запрос. Зачастую причинами являются отключение сервера или то, что он перегружен. Обратите внимание, что вместе с этим ответом удобная для пользователей(user-friendly) страница должна отправлять объяснение проблемы. Этот ответ должен использоваться для временных условий и Retry-After: HTTP-заголовок должен, если возможно, содержать предполагаемое время до восстановления сервиса. Веб-мастер также должен позаботиться о заголовках, связанных с кэшем, которые отправляются вместе с этим ответом, так как эти ответы, связанные с временными условиями, обычно не должны кэшироваться.

504

Gateway Timeout

Этот ответ об ошибке предоставляется, когда сервер действует как шлюз и не может получить ответ вовремя.

505

HTTP Version Not Supported

«HTTP-версия не поддерживается». HTTP-версия, используемая в запроcе, не поддерживается сервером.

Понравилась статья? Поделить с друзьями:
  • Проверить текст на английском на ошибки и грамматику
  • Проверить танки на ошибки
  • Проверить съемный диск на ошибки и исправить
  • Проверить ошибку плагина
  • Проверить ошибку двигателя как проверить