Представьте библиотеку, где одна и та же книга стоит на разных полках под разными номерами. Библиотекарь не понимает, какую запись считать основной. Читатели берут разные экземпляры и путаются. Так поисковики воспринимают дубли страниц: несколько одинаковых документов и ни одного явного главного.
Дубли страниц – это разные URL, которые ведут на одинаковый или почти одинаковый контент. В результате поисковик может выбрать не ту страницу для выдачи. Ссылочный вес делится между копиями, а новые страницы индексируются медленнее.
Почему появляются дубли страниц
Чаще всего причина в технических особенностях CMS. Один и тот же материал открывается по разным адресам. Например, карточка товара доступна с категорией и без нее, с параметрами сортировки или фильтрации.
Вторая причина – версии страницы. Один и тот же URL может открываться по http и https, с www и без www, со слешем в конце и без него. Без перенаправлений это разные страницы для поисковика.
Третья причина – служебные страницы. Версии для печати, страницы с UTM-метками, технические дубли. Если их не закрыть, они попадают в индекс и засоряют его.
Четвертая причина – ошибки настройки. Например, если любой несуществующий URL открывает главную страницу, сайт создает бесконечное количество дублей. О том, как это исправить, мы писали в статье про ошибку 404.
Чем вредны дубли страниц
Если у страницы есть дубли, поисковик может выбрать для выдачи не ту версию. В итоге вы продвигаете один URL, а ранжируется другой или не ранжируется ни один.
Падает точность выдачи. Поисковик хуже понимает, какая страница отвечает на запрос. Теряется ссылочный вес. Если ссылки ведут на разные версии, ни одна не получает достаточной силы. Замедляется индексация. Робот тратит время на копии вместо новых страниц.
На практике это выглядит так: карточка товара есть, но в поиске показывается версия с фильтрами. Или в индексе 30 000 страниц, хотя реально полезных только 5 000.
Особенно это критично для интернет-магазинов. Один товар может дублироваться через категории, фильтры и параметры. В итоге сайт разрастается тысячами лишних страниц и теряет позиции. О том, как исправлять дублирующиеся элементы, мы разбирали в статье про дублирующиеся теги title и description.
Как найти дубли страниц на сайте
Первый способ – инструменты вебмастеров. В Яндекс Вебмастере можно найти страницы с одинаковыми заголовками и описаниями. В Google Search Console обратите внимание на раздел «Исключенные» – там часто находятся дубли.
Второй способ – краулеры. Например, Screaming Frog или SEOBernard. Они обходят сайт и показывают страницы с одинаковыми title, description и контентом. Это прямые кандидаты на дубли.
Третий способ – поиск через Google. Введите команду site:ваш-сайт.ру и посмотрите выдачу. Если видите одинаковые страницы с разными URL, это дубли.
Чаще всего дубли появляются здесь:
- Страницы с параметрами (utm, sort, filter, page) – создают множество комбинаций URL.
- Версии сайта (http/https, www/без www) – одна страница доступна по разным адресам.
- Страницы со слешем и без – технически это разные URL.
- Карточки товаров в разных категориях – один товар, несколько адресов.
- Служебные страницы – печать, мобильные версии, технические копии.
- Пагинация – частично дублирует контент предыдущих страниц.
Как исправить дубли страниц
Первое – настроить 301 редирект. Выберите одну версию страницы и перенаправьте на нее все остальные. Например, с http на https или с версии без www на www.
Второе – использовать rel="canonical". Укажите в коде страницы основной URL. Это помогает, когда редирект невозможен, например, для фильтров.
Третье – закрыть дубли от индексации. Используйте robots.txt или метатег noindex. Но важно не закрыть полезные страницы.
Для интернет-магазинов отдельно настраивают фильтры. Основные категории оставляют в индексе, а комбинации фильтров закрывают, чтобы не создавать тысячи страниц.
После исправлений проверьте индекс. Количество страниц должно приблизиться к числу реальных полезных документов. Дубли страниц – это не мелкая ошибка. Пока они есть, сайт теряет позиции, трафик и деньги.
Часто задаваемые вопросы про дубли страниц (FAQ)
Что такое дубли страниц на сайте?
Это разные URL с одинаковым или почти одинаковым контентом. Поисковик воспринимает их как отдельные страницы и выбирает одну из них для выдачи.
Как проверить дубли страниц на сайте онлайн?
Используйте Яндекс Вебмастер, Google Search Console или различные краулеры. Они показывают страницы с одинаковым содержимым.
Почему дубли страниц вредят SEO?
Они делят ссылочный вес, мешают индексации и приводят к тому, что в выдаче оказывается не та страница.
Как убрать дубли страниц на сайте?
Настройте 301 редирект на основную версию. Если это невозможно, используйте rel="canonical" или закройте страницы от индексации.
Сколько страниц в индексе считается нормой?
Столько, сколько у вас реально полезных страниц. Если индекс больше в несколько раз, значит, есть дубли или проблемы с фильтрами.