теги. Вот пример:
function getPageTitleUsingRegex($htmlContent) {
preg_match("/<title>(.*?)<\/title>/i", $htmlContent, $matches);
return isset($matches[1]) ? $matches[1] : null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingRegex($htmlContent);
echo $pageTitle;
function getPageTitleUsingDOM($htmlContent) {
$dom = new DOMDocument();
$dom->loadHTML($htmlContent);
$titleElements = $dom->getElementsByTagName('title');
if ($titleElements->length > 0) {
return $titleElements->item(0)->nodeValue;
}
return null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingDOM($htmlContent);
echo $pageTitle;
Метод 3: использование внешних библиотек
PHP предоставляет несколько сторонних библиотек, которые упрощают задачи очистки веб-страниц. Одной из таких библиотек является SimpleHTMLDom, которая предлагает интуитивно понятный интерфейс для извлечения данных из HTML-документов. Вот пример использования этой библиотеки:
require_once 'simple_html_dom.php';
function getPageTitleUsingSimpleHTMLDom($htmlContent) {
$dom = str_get_html($htmlContent);
$titleElement = $dom->find('title', 0);
return $titleElement ? $titleElement->plaintext : null;
}
// Usage example
$htmlContent = file_get_contents('http://example.com');
$pageTitle = getPageTitleUsingSimpleHTMLDom($htmlContent);
echo $pageTitle;