Контроль индексации поисковыми системами необходим владельцам веб-сайтов, которые хотят эффективно управлять своим присутствием в Интернете. Если вы хотите запретить Google индексировать определенные веб-страницы или целые веб-сайты, вы можете использовать несколько методов. В этой статье мы рассмотрим различные подходы, сопровождаемые примерами кода, позволяющие отключить индексацию Google и улучшить SEO вашего сайта.
Метод 1: файл Robots.txt
Файл robots.txt — это текстовый файл, расположенный в корневом каталоге вашего веб-сайта. Он служит набором инструкций для сканеров поисковых систем, сообщая им, какие страницы или каталоги следует исключить из индексации. Чтобы запретить индексирование Google, добавьте в файл robots.txt следующий код:
User-agent: Googlebot
Disallow: /
Этот код дает указание сканеру Google (Googlebot) не сканировать и не индексировать какие-либо страницы вашего веб-сайта. Однако учтите, что другие поисковые системы могут не следовать этой директиве.
Метод 2: метатеги – noindex и nofollow
Метатеги содержат инструкции для поисковых систем о том, как обрабатывать определенные веб-страницы. Чтобы запретить Google индексировать определенную страницу, добавьте следующий метатег в раздел <head>
HTML-кода:
<meta name="robots" content="noindex, nofollow">
Директива noindex сообщает поисковым системам не индексировать страницу, а директива nofollow предписывает им не переходить по ссылкам на этой странице.
Метод 3: HTTP-заголовки — X-Robots-Tag
HTTP-заголовки позволяют вам контролировать взаимодействие веб-браузеров и сканеров поисковых систем с вашим веб-сайтом. Заголовок X-Robots-Tag эффективно предотвращает индексацию Google. Добавьте следующий код в конфигурацию сервера вашего сайта или в файл.htaccess:
Header set X-Robots-Tag "noindex, nofollow"
Этот заголовок отправляется с каждым ответом HTTP, давая указание поисковым системам не индексировать страницы и не переходить по ссылкам на страницах.
Метод 4: HTML-код – мета-тег роботов
Как и в методе 2, вы также можете использовать HTML-код непосредственно на веб-странице, чтобы предотвратить индексацию Google. Поместите следующий код в раздел <head>
HTML-кода:
<meta name="robots" content="noindex, nofollow">
Этот метод полезен, если вы хотите запретить индексирование только определенных страниц.