Извлечение шаблонов HTML Href с помощью регулярных выражений

Чтобы извлечь шаблоны HTML-ссылок с помощью регулярных выражений, вы можете использовать следующие методы в различных языках программирования:

  1. Python:

    import re
    html = '<a href="https://example.com">Link</a>'
    pattern = r'<a\s+href=["\'](.*?)["\']'
    hrefs = re.findall(pattern, html)
  2. JavaScript:

    const html = '<a href="https://example.com">Link</a>';
    const pattern = /<a\s+href=["'](.*?)["']/g;
    const hrefs = html.match(pattern);
  3. PHP:

    $html = '<a href="https://example.com">Link</a>';
    $pattern = '/<a\s+href=["\'](.*?)["\']/';
    preg_match_all($pattern, $html, $matches);
    $hrefs = $matches[1];
  4. Java:

    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    String html = "<a href=\"https://example.com\">Link</a>";
    String pattern = "<a\\s+href=[\"'](.*?)[\"']";
    Pattern regex = Pattern.compile(pattern);
    Matcher matcher = regex.matcher(html);
    while (matcher.find()) {
       String href = matcher.group(1);
       // Do something with href
    }

Обратите внимание, что использование регулярных выражений для анализа HTML не рекомендуется для сложных структур HTML. Обычно лучше использовать специальную библиотеку анализа HTML.