Метод 1. Использование API консоли поиска Google
Google предоставляет API, называемый API консоли поиска Google, который обеспечивает программный доступ к данным консоли поиска. Используя этот API, мы можем получить ценную информацию о статусе индексации страницы. Вот пример фрагмента кода, который поможет вам начать:
import googleapiclient.discovery
import json
# Set up the API client
service = googleapiclient.discovery.build('webmasters', 'v3', developerKey='YOUR_API_KEY')
# Define the URL of the page you want to check
url = 'https://example.com/page'
# Make a request to the API
request = service.urlTestingTools().mobileFriendlyTest().run(url=url)
response = request.execute()
# Extract the index status
index_status = response['mobileFriendliness']
# Check if the page is indexed
if index_status == 'NOT_MOBILE_FRIENDLY':
print('The page is not indexed.')
elif index_status == 'MOBILE_FRIENDLY':
print('The page is indexed.')
else:
print('The index status is unknown.')
Метод 2: парсинг страницы результатов поиска Google
Другой способ проверить, проиндексирована ли страница, — это парсинг страницы результатов поиска Google. Мы можем использовать библиотеки веб-скрапинга Python, такие как BeautifulSoup и запросы, для извлечения соответствующей информации. Вот пример фрагмента кода:
import requests
from bs4 import BeautifulSoup
# Define the URL of the page you want to check
url = 'https://example.com/page'
# Perform a Google search for the URL
google_url = f'https://www.google.com/search?q=site%3A{url}'
response = requests.get(google_url)
soup = BeautifulSoup(response.text, 'html.parser')
# Find the indexed status on the search results page
result_stats = soup.find(id='result-stats')
if result_stats:
print('The page is indexed.')
else:
print('The page is not indexed.')
Метод 3. Использование API индексирования Google (для подходящих сайтов).
Если ваш сайт соответствует API индексирования Google, вы можете использовать его для прямого уведомления Google о новом или обновленном контенте. Проверив ответ API, вы можете определить, была ли страница успешно проиндексирована. Вот пример фрагмента кода:
import requests
import json
# Define the URL of the page you want to check
url = 'https://example.com/page'
# Set up the API request
api_url = 'https://indexing.googleapis.com/v3/urlNotifications:publish'
api_key = 'YOUR_API_KEY'
# Make the API request
payload = {
'url': url,
'type': 'URL_UPDATED'
}
headers = {
'Content-Type': 'application/json',
'Authorization': f'Bearer {api_key}'
}
response = requests.post(api_url, data=json.dumps(payload), headers=headers)
# Check the API response for indexing status
if response.status_code == 200:
print('The page is indexed.')
else:
print('The page is not indexed.')
В этой статье мы рассмотрели три метода проверки статуса страницы в индексе Google с помощью Python. Мы обсудили использование API консоли поиска Google, очистку страницы результатов поиска Google и использование API индексирования Google для подходящих сайтов. Включив эти методы в свой рабочий процесс SEO, вы сможете эффективно отслеживать статус индексирования ваших веб-страниц и предпринимать соответствующие действия для улучшения видимости вашего сайта в результатах поиска.