Методы извлечения URL-адресов с использованием Selenium в Python

Чтобы получить URL-адрес с помощью Selenium в Python, вы можете использовать следующие методы:

  1. driver.current_url: этот метод возвращает URL-адрес текущей страницы, загруженной в браузер.

  2. driver.execute_script("return window.location.href"): этот метод выполняет код JavaScript для получения текущего URL-адреса.

  3. driver.current_window_handle: этот метод возвращает URL-адрес текущего дескриптора окна.

  4. driver.page_source: этот метод возвращает исходный код HTML текущей страницы, который может содержать URL-адрес.

Вот пример, демонстрирующий использование этих методов:

from selenium import webdriver
# Set up the Selenium driver
driver = webdriver.Chrome()
# Open a website
driver.get("https://www.example.com")
# Method 1: Using driver.current_url
url1 = driver.current_url
print("Method 1:", url1)
# Method 2: Using driver.execute_script
url2 = driver.execute_script("return window.location.href")
print("Method 2:", url2)
# Method 3: Using driver.current_window_handle
url3 = driver.current_window_handle
print("Method 3:", url3)
# Method 4: Using driver.page_source
page_source = driver.page_source
url4 = page_source.split('<link rel="canonical" href="')[1].split('"')[0]
print("Method 4:", url4)
# Close the browser
driver.quit()