Метод 1: использование find_all()
Метод find_all() в BeautifulSoup позволяет нам находить все вхождения определенного тега в документе. Мы можем передать несколько имен тегов в виде списка для одновременного поиска различных тегов. Вот пример:
Выход:
<h1>My Web Page</h1>
<p class="content">Paragraph 1</p>
<p>Paragraph 2</p>
Выход:
<li class="fruit">Apple</li>
<li class="fruit">Banana</li>
<li class="vegetable">Carrot</li>
Выход:
<h2>Title</h2>
<p>Paragraph 1</p>
<p>Paragraph 2</p>
Освоив эти методы, вы сможете эффективно извлекать нужные данные с веб-страниц и использовать их для различных целей, таких как анализ данных, машинное обучение или создание приложений.
Не забывайте всегда соблюдать условия обслуживания веб-сайта и помнить о законности и этике парсинга веб-страниц. Удачной чистки!