Метод 1: манипуляция строками
Один простой способ удаления https://, www. и подкаталогов из URL-адреса — использование функций манипуляции строками. Вот пример на Python:
url = 'https://www.example.com/subdirectory/page.html'
# Remove 'https://'
url = url.replace('https://', '')
# Remove 'www.'
url = url.replace('www.', '')
# Remove subdirectories
url = url.split('/')[0]
print(url) # Output: example.com
Метод 2: регулярные выражения (Python)
Регулярные выражения предоставляют мощный и гибкий способ сопоставления строк и управления ими. Вот пример использования модуля Python re
:
import re
url = 'https://www.example.com/subdirectory/page.html'
# Remove 'https://', 'www.', and subdirectories
pattern = r'(https?://)?(www\.)?([^/]+)'
domain = re.match(pattern, url).group(3)
print(domain) # Output: example.com
Метод 3: регулярные выражения (JavaScript)
В JavaScript регулярные выражения можно использовать для достижения того же результата. Вот пример:
const url = 'https://www.example.com/subdirectory/page.html';
// Remove 'https://', 'www.', and subdirectories
const pattern = /(https?:\/\/)?(www\.)?([^/]+)/;
const domain = url.match(pattern)[3];
console.log(domain); // Output: example.com
Не забудьте адаптировать примеры кода в соответствии с вашим конкретным языком программирования и требованиями. Удачных манипуляций с URL!