Чтобы запретить поисковым системам индексировать определенные части вашего веб-сайта, вы можете использовать файл robots.txt или добавить метатег noindex на свои веб-страницы. Вот несколько методов с примерами кода:
- Метод Robots.txt:
Файл robots.txt представляет собой текстовый файл, расположенный в корневом каталоге вашего веб-сайта. Он определяет правила для веб-роботов (также известных как сканеры или пауки), определяющие, какие страницы или каталоги сканировать, а какие нет. Чтобы запретить поисковым системам индексировать весь ваш веб-сайт, вы можете использовать следующий код в файле robots.txt:
User-agent: *
Disallow: /
Этот код предписывает всем сканерам поисковых систем не индексировать ни одну страницу вашего веб-сайта.
- Метод метатега.
В качестве альтернативы вы можете использовать метатег «noindex» в HTML-коде определенных веб-страниц, индексирование которых вы хотите запретить поисковым системам. Добавьте следующий код в разделHTML-файла:
<meta name="robots" content="noindex">
Этот метатег сообщает поисковым роботам не индексировать страницу.
- HTTP-заголовок X-Robots-Tag:
Вы также можете использовать HTTP-заголовок X-Robots-Tag, чтобы запретить индексирование определенных страниц. Добавьте следующий код в конфигурацию сервера или файл.htaccess:
Header set X-Robots-Tag "noindex"
Этот заголовок будет отправлен вместе с ответом для указанных страниц, не позволяя поисковым системам индексировать их.
Имейте в виду, что эти методы лишь инструктируют поисковые системы не индексировать страницы; они не запрещают другим источникам напрямую получать доступ к контенту, если у них есть URL-адрес.