Как проиндексировать сайт в поисковых системах

Индексация сайта позволяет отобразить его страницы в поисковой системе. За такую работу отвечают специальные алгоритмы – роботы. Они сканируют всю информацию на сайте: картинки, фотографии, видео и так далее. Если все прошло успешно, то веб-страницы добавляются в базу и начинают появляться в поисковике при релевантных запросах пользователей.

Как сказать роботу, чтобы он просканировал сайт и отправил его в поисковую систему? Об этом и многом другом поговорим в сегодняшней статье.

Как работает индексирование

Поисковый робот сканирует страницу, и она попадает в Google, Яндекс или другую систему. Но между этими процессами протекают еще и внутренние. После обхода страницы вся полученная информация отправляется в базу данных – индекс, которая хранится в поисковике. Следующим этапом данные распределяются по двум путям: для выстраивания ранжирования (сортировки сайта в поисковой выдаче) и для служебных целей.

При сканировании работы исследуют не только видимую для пользователей текстовую информацию, но и другие параметры: атрибуты документа, информацию из тегов alt, title и description, скрипты. 

И даже если робот обошел весь сайт, не факт, что он окажется в топе. На это влияет уникальность страницы и полезность контента. Если робот посчитает, что информация не соответствует действительности либо недостаточно уникальна, он может не добавить ее в индекс.

Процесс индексации в Google и Яндекс происходит немного по-разному. 

Как оно работает в Google

Первым делом стоит сказать, что точные алгоритмы индексирования страниц засекречены. Как работают Google и Яндекс, знают только сотрудники компаний, но поговорить о базовых принципах можно.

В Google используется технология Mobile-first, которая в первую очередь сканирует мобильную версию сайта. Таким образом, если десктопная версия отлично проработана и заслуживает внимания, а про мобильную версию забыли, то вероятность индексирования будет крайне мала.

Другая особенность Гугла – проверка краулингового бюджета – регулярности и объема посещения сайта роботом. Чем выше этот показатель, тем быстрее будут проходить индексацию новые страницы. Как именно он рассчитывается, неизвестно, но многие специалисты предполагают, что это связано с возрастом сайта и частотой его обновлений.

Как оно работает в Яндекс

В отличие от Гугла, Яндекс не берется в первую очередь за мобильную версию – он изучает, как устроена десктопная версия сайта. С краулинговым бюджетом все наоборот – по крайне мере, официально. Индексирование происходит вне зависимости от траста и других показателей ресурса.

На попадание в поисковик может влиять количество страниц в сети, которые выкладываете вы и другие пользователи. А чтобы добиться высоких результатов в выдаче, сайт должен быть популярным. Чем больше пользователей его посещают, тем лучше.

И еще одна особенность – поисковик не сканирует на сайте файлы размером больше 10 Мб. Это следует учитывать, если вы собираетесь покорять Яндекс.

Комьюнити теперь в Телеграм

Подпишитесь и будьте в курсе последних IT-новостей

Подписаться

Как настроить индексацию сайта

Чаще всего индексация сайта происходит автоматически. Для настройки индексации сайта нам потребуется файл robots.txt. Обычно он генерируется CMS и выглядит примерно так:

Зачем нужен файл robots.txt

Может показаться, что в файле написано что-то сложное и непонятное, но не переживайте – сейчас во всем разберемся. Вот на что стоит обратить внимание:

  • user-agent – показывает, для какого поисковика настраивается индексирование;
  • disallow – показывает, какие страницы не должны попасть в индекс.

Теперь поговорим о другом файле под названием sitemap.xml. Уже из названия понятно, что это карта сайта. Она показывает некую иерархию – как устроена структура ресурса. Это необходимо для упрощения считывания данных поисковыми роботами. В файл вносятся все страницы, которые должны быть проиндексированы.

Такой файл, как правило, создается всего в несколько кликов с помощью плагинов CMS. Например, на WordPress можно воспользоваться AIOSEO. В настройках плагина достаточно перевести ползунок в режим «Включено».

Как создать карту сайта в WordPress с помощью плагина AIOSEO

Чтобы сайт максимально быстро индексировался, следует обеспечить внутреннюю перелинковку. Тогда поисковый робот без проблем будет переходить по страницам и быстро найдет новый документ.

После этого вам останется пройти базовую настройку в Google Search Console и Яндекс.Вебмастере. Там нет ничего сложного – интерфейс сам подскажет, что нужно делать.

Можно ли ускорить индексирование

Как таковой заветной кнопки для ускорения индексирования не существует, но можно «поторопить» робота. Это будет полезно, если индексация страницы идет слишком долго, например, из-за какого-то сбоя.

Сделать это можно через личный кабинет Яндекс.Вебмастера. Первым делом необходимо перейти в раздел «Переобход страниц».

Как ускорить индексацию страниц в Вебмастере

После этого вводим адрес той страницы, которую нужно проиндексировать, и нажимаем «Отправить».

Переобход страниц в Вебмастере

Так можно поступать не только с новыми страницами, но и при редактировании старых. Важное замечание – количество отправок в сутки ограничено, причем все зависит от возраста и траста сайта.

У Google ускорение индексации состоит из двух этапов – сначала переходим в Search Console и в верхней части вводим необходимый адрес. Затем нажимаем на клавишу «Enter».

Как ускорить индексацию страниц в Google

На отразившейся странице будет доступна информация по данной странице. Чтобы ее проиндексировать, достаточно нажать на кнопку:

Индексирование страниц в Google Search Console

Как удалить страницу из результатов поисковой системы

Существует три способа удаления страницы: использование тега robots, добавление запрещающей директивы в системный файл robots.txt и использование специальных инструментов Google или Яндекс.

Первый способ подразумевает добавление тега в страницы:

Чтобы добавить запрещенную директиву, необходимо прописать «пожелания» для робота. Они могут быть не выполнены, но чаще всего срабатывают. Для этого в файле robots.txt прописываем:

User-agent: Google или Yandex

Disallow: /указывается ссылка на желаемую страницу, которую нужно удалить из выдачи

И последний, пожалуй, самый простой способ – воспользоваться Google Search Console или Яндекс.Вебмастером. В настройках сервисов есть отдельная вкладка, позволяющая удалить любую страницу сайта. Вот так это выглядит в Вебмастере:

Как удалить страницу из выдачи в Вебмастере

Чтобы попасть на эту страницу, необходимо в личном кабинете перейти в «Инструменты» и выбрать «Удаление страниц из поиска».

Как понять, что страница есть в поисковике

Один из самых простых способов понять, проиндексировалась ли страница – это ввести запрос в поисковую систему. Выглядит он как ссылка на страницу, например: https://timeweb.com/ru/community/articles/luchshie-rossiyskie-servisy-email.

Если мы введем такой запрос в гугле, то увидим эту страницу в выдаче:

Как понять, что сайт проиндексирован

Соответственно, если бы страница не проиндексировалась, то по данному запросу мы ее не увидели.

Также мы можем посмотреть все страницы, которые были добавлены в поисковик. Для этого необязательно сотню раз вводить адреса страниц. Достаточно воспользоваться простой формулой:

site:адрес сайта

При таком запросе будет отображен список всех страниц, которые есть в данном поисковике. Вот, например, как это выглядит в Гугле:

Как понять что страницы сайта есть в поисковике

Также вы можете посмотреть индексацию страниц через Яндекс.Вебмастер в разделе «Индексирование» -> «Страницы в поиске».

Почему проиндексированная страница пропала из выдачи?

Этому может способствовать множество различных причин. Вот одни из самых распространенных:

  • запрашиваемая страница выдает 301 код ошибки;
  • запрашиваемая страница выдает 400 и 500 коды ошибок;
  • в файле robots.txt стоит запрет на индексирование;
  • на странице есть дублирующий контент;
  • наложены санкции за покупные ссылки, некачественный или устаревший контент.

При любых сложностях с индексированием в первую очередь следует смотреть рассмотренные выше файлы – robots.txt и sitemap.xml. Если там все в порядке, то необходимо проверить, нет ли каких-либо ограничивающих фильтров. Если и с ними все хорошо, то лучше всего обратиться к администратору хостинга.

Выводы

Индексация страниц в поисковиках – это один из важнейших этапов успешного SEO-продвижения. Если вы хотите, чтобы ваши страницы посещали другие пользователи, то необходимо регулярно контролировать синхронизацию с популярными поисковыми системами.

Главное правило – это качественный контент, который ценится людьми и ботами. Старайтесь, чтобы сайт был хорошим для пользователей не только в плане контента, но и удобства использования. Все это может повлиять на индексацию как с позитивной, так и с негативной стороны.

источник

Related Posts