Получить заголовки страниц в PHP - Fcodenotes - блог о программировании

теги. Вот пример:

function getPageTitleUsingRegex($htmlContent) {
    preg_match("/<title>(.*?)<\/title>/i", $htmlContent, $matches);
    return isset($matches[1]) ? $matches[1] : null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingRegex($htmlContent);
echo $pageTitle;

function getPageTitleUsingDOM($htmlContent) {
    $dom = new DOMDocument();
    $dom->loadHTML($htmlContent);
    $titleElements = $dom->getElementsByTagName('title');
    if ($titleElements->length > 0) {
        return $titleElements->item(0)->nodeValue;
    }
    return null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingDOM($htmlContent);
echo $pageTitle;

Метод 3: использование внешних библиотек
PHP предоставляет несколько сторонних библиотек, которые упрощают задачи очистки веб-страниц. Одной из таких библиотек является SimpleHTMLDom, которая предлагает интуитивно понятный интерфейс для извлечения данных из HTML-документов. Вот пример использования этой библиотеки:

require_once 'simple_html_dom.php';
function getPageTitleUsingSimpleHTMLDom($htmlContent) {
    $dom = str_get_html($htmlContent);
    $titleElement = $dom->find('title', 0);
    return $titleElement ? $titleElement->plaintext : null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingSimpleHTMLDom($htmlContent);
echo $pageTitle;