Что такое индексация сайта, как ее проверить и как ускорить
- Что такое индексация сайта
- Индексация сайта в Яндекс и Google
- Настройка и ускорение индексации сайта
- Проверка присутствия сайта в индексе
- Запрет на индексацию сайта
- Возможные ошибки в индексации сайта
Что такое индексация сайта
Процесс «прописки» сайта в любых поисковых системах (ПС) необходим для того, чтобы последние его могли опознать и представить ищущим в Сети. Если веб-ресурс создан, но не подвергнут этой процедуре, то его будет возможно найти только по точному адресу.
Индексированием называется способ, которым робот любой ПС распознаёт страницы сайта и позже фиксирует данные об этом в базе указанной системы поиска.
После и в результате процедуры веб-ресурс представляется потребителю и может продвигаться. Материал о контенте, ссылках и еще некоторые характеристики сайта позволяют зафиксировать его тематику и ключевики, соответствующие запросам пользователей Сети. Благодаря этому ПС выдает по запросу клиента наиболее точно отвечающие ему страницы веб-ресурса.
Но специалисты предупреждают, что полагаться только на продвижение не стоит. Основная роль принадлежит поведенческим характеристикам, а не технологии обхода страниц ресурса. Индексация сайта влияет на эффективность актуализации представленных на нем материалов. Она минимизирует время, за которое страницы появляются в выдаче ПС, и регулярно обновляются.
Индексация сайта в Яндексе и Google
- Индексация ресурса в Google.
При получении введенных пользователем символов такая система, как Google, производит поиск по индексу этой ПС, включающему в себя миллиарды обработанных страниц. Дополнительно на результат влияют характеристики: местоположение и тип использованного для этого устройства; язык, на котором он задан, иные данные.
С 2019 г. Google трансформировал базовый принцип этой деятельности, ориентируясь на работу с Mobile-first. По этой технологии приоритетными для поиска со смартфонов, проводимого Googlebot, стали мобильные варианты веб-площадок. Постепенно на данный способ индексирования ПС переводит все ресурсы. Их хозяева информируются об этом по Google Search Console.
Другие особенности Google-индексации страниц сайта:
- Регулярность обновления индекса.
- На эту процедуру у веб-ресурса уходит от нескольких минут до недели.
- Не соответствующие установленным ПС требованиям страницы не удаляются из индекса, но их рейтинг понижается.
Таким образом, все отработанные страницы появляются в этой базе, но показываются сделавшему запрос только лучшие. Бот-поисковик определяет соответствие сайта Google-критериям индексации, которых более 200 единиц.
- Поисковая Яндекс-индексация.
Схема деятельности Яндекс в принципе схожа с описанной выше работой Гугл. Робот этой ПС выявляет ресурс, исследует его материалы и выставляет каждую страницу в индекс, из которого она будет представлена в результатах выдачи.
Особенности поисковой индексации сайта в Яндекс:
- Обновление индекса этой ПС синхронизировано с апдейтом ее поисковой базы, происходящим примерно раз в 3 суток.
- На процедуру у веб-страницы уходит 7–30 дней.
- Из индекса данной ПС некачественные страницы удаляются.
- Яндекс показывает клиенту только те ресурсы, которые максимально соответствуют запросу, предоставляют полезный контент и не доставляют проблем при использовании.
Таким образом, индексация сайта в этих поисковиках имеет общие и особенные черты.
Настройка и ускорение индексации сайта
Стандартно индексация не требует вмешательства. Но если нужна ее настройка, то это делается в создаваемом CMS файле robots.txt. Сложного в этом нет ничего. Нужно знать, что файл позволяет видеть/изменить основные характеристики в разделах:
- User-agent – здесь указан поисковик, для которого идет настройка индексирования.
- Disallow – тут прописаны страницы, которые должны быть закрыты для индекса.
Этот файл обычно достаточно быстро создается плагинами CMS – для веб-ресурса, созданного на WordPress, можно применить AIOSEO, в котором совершить единственное действие – сдвинуть ползунок на значение «Включено».
Скорость индексации сайта зависит от качества внутренней перелинковки. Если она соответствует требованиям, то робот легко будет передвигаться по разделам веб-ресурса и быстро выявит появившиеся на нем новые материалы.
В конце нужно провести ключевую, но совершенно не сложную настройку в соответствии с указаниями интерфейса в Яндекс.Вебмастер или Google Search Console. Рассмотрим подробнее.
Одним нажатием на кнопочку сделать процесс индексирования более активным нельзя. Но иногда робота ПС можно ускорить, например, при слишком медленной его работе после какого-нибудь сбоя.
Яндекс.Вебмастер: В личном кабинете открываем раздел «Переобход страниц». Там необходимо ввести адрес подлежащей оптимизации скорости индексации страницы в соответствующее поле и кликнуть «Отправить».
Эта схема работает и для новых, и для оптимизации уже индексированных страниц веб-ресурса. Но нужно знать, что суточное количество кликов «Отправить» ограничено и определяется трастом сайта и его возрастом.
Google Search Console: Здесь технология двухэтапная, но по сути она еще проще, чем в Яндекс. Вверху окошка консоли нужно ввести адрес оптимизируемой страницы и кликнуть на «Enter».
После этого откроется окно с данными по этому разделу сайта. Проиндексировать страничку можно просто нажав там же на соответствующую клавишу.
Проверка присутствия сайта в индексе
Проверить индексацию сайта, его разделов и страниц, например, наличие интернет-магазина в индексе, можно несколькими способами:- Используя поисковые операторы в запросах.
- На панели/консоли вебмастера. Основными средствами проверки индексации сайтов онлайн для хозяев ресурсов считаются Google Search Console и Яндекс.Вебмастер. Эти инструменты представляют в деталях данные на каждую страницу ресурса, чтобы без сложностей понять, какие разделы и зоны не индексированы и почему – т. е. определить, что нужно исправить для лучшей его индексации.
- С помощью плагинов, скриптов. Способ предназначен для автоматизированного исследования. Плагины, скрипты – специализированные браузерные расширения, работающие по аналогии с описанными выше вариантами. Результаты проверки можно получить быстро, без дополнительных настроек, просто открыв сайт и активировав нужное дополнение.
- Seo Magic – информирует о количестве адресов, ТИЦ, АГС, которые индексированы.
- RDS Bar – инспектирует суммарный индекс сайта, индексацию и положение данной страницы в разных ПС, проверяет ссылки (входящие/обратные).
- Open SEO Stats – выдает суммарные данные по адресам, имеющимся в индексе, а также описание страниц, представление внешних ссылок, показатели скорости загрузки.
- Онлайн-сервисами проверки индексации сайта. Это альтернативные скриптам/плагинам инструменты в виде сервисных сайтов. Они не только позволяют проверить индексацию ресурса, но и выдают множество данных, которые нужны для выявления разных подобных проблем. Представителями этих инструментов являются «Топвизор», Rush Analytics, а также SEO-reports.
- Добавления в уже рассмотренный нами выше файл robots.txt в список команды Disallow адреса исключаемой страницы. Она закрывает доступ поисковым роботам к этой части сайта. Все возможности работы с данным файлом и его влияние на обходы роботами ресурсов описаны в Яндекс-руководстве.
- Вставки в структурирующий содержание веб-страницы код HTML тега «noindex». Этот вариант запрета для робота индексации страницы (или их однотипной группы) считают элементарным. Нужно просто вставить в часть с HTML-кодом раздела сайта данную директиву.
- Формы авторизации – но только для определенных страниц типа дорабатываемых вариантов или личного кабинета. Этот вариант является самым надежным. Ни запрет в списке Disallow, ни использование тега «noindex» не исключают индексацию на 100 %: их можно обойти, например, внутренними ссылками на страницу.
Этот ручной контроль использует при поисковом запросе оператор «site:» Он быстро дает возможность посмотреть общие данные о проиндексированных страницах веб-ресурса.
Для этого формируется запрос по шаблону: «site: [url сайта/раздела/страницы]». Если надо узнать дату крайней работы поискового бота, то пишем «cache: [адрес веб-страницы]» – результат будет представлен не только по основному домену, но и по поддоменам.
Также можно узнать информацию о прошедшем за определенный последний период сканировании – от часа до года. Но ссылка на сайт не будет отражена, если ресурс под санкциями или фильтрами. Тогда надо использовать дополнительные операторы «url:» и «inurl:». Если страницы нет в базе, то выдача будет пустая.
Самые популярные:
Запрет на индексацию сайта
Далеко не все сайты и страницы можно предоставлять для индексации ПС. А служебные и те, что еще дорабатываются, нельзя не только допускать в выдачу, но даже показывать роботам-поисковикам. Для исключения этого обычно закрывают от индексации либо такие страницы, либо полностью веб-ресурс.Проводится эта работа с помощью:
Возможные ошибки в индексации сайта
Обычно такие ситуации возникают из-за закрытия сайта от индексации по ошибке. Например, если у веб-ресурса несколько администраторов и один из них, обновляя плагины, случайно изменил файл robots.txt. Результат: сайт не показывается в поисковой выдаче. В первую очередь всегда рекомендуется смотреть изменения в данном файле. И лучшим для этого считается сервис «Анализ robots.txt» в Яндекс.Вебмастер (аналог – Google Webmaster Tools).Проблема включения в результаты поиска технических разделов сайта. Это может случиться, например, когда картинка сайта, созданного на WordPress, размещена в нем как медиафайл – тогда она будет определяться роботами как отдельный раздел веб-ресурса. Изменить ситуацию можно редиректом с данной страницы на документ с выводом изображения.
Вопросы индексирования, которые связаны с нарушениями в работе хостинга/сервера, необходимо задавать их администраторам, в данной статье это не рассматривается.
Долгая индексация возможна из-за того, что ПС наложили на веб-ресурс фильтры. Выявить эти причины можно по предупреждениям, направляемым веб-мастерам. При устранении указанных в них проблем фильтры удалят.
Индексация страниц сайта в наше время – достаточно краткая процедура. Если на веб-ресурсе верны все настройки, то новый материал может появиться в результатах выдачи ПС уже через 30 минут после размещения.