В этой статье блога мы рассмотрим различные методы и приведем примеры кода для извлечения вызовов Google Analytics с использованием регулярных выражений. Google Analytics — это широко используемый сервис веб-аналитики, который помогает отслеживать и анализировать трафик веб-сайта. Извлечение вызовов Google Analytics может быть полезно для отладки, аудита или извлечения данных для дальнейшего анализа. Мы рассмотрим несколько подходов для разных сценариев.
Метод 1: базовое сопоставление регулярных выражений
Регулярные выражения (регулярные выражения) — это мощные инструменты для сопоставления с образцом. Чтобы найти вызовы Google Analytics, вы можете начать с базового шаблона регулярного выражения, соответствующего коду отслеживания Google Analytics. Вот пример на Python:
import re
text = "ga('create', 'UA-XXXXXXXX-X', 'auto');"
pattern = r"ga\('create', 'UA-\w{8}-\d', 'auto'\);"
matches = re.findall(pattern, text)
print(matches)
Этот шаблон соответствует формату ga('create', 'UA-XXXXXXXX-X', 'auto');, где UA-XXXXXXXX-Xпредставляет собой идентификатор отслеживания Google Analytics. При необходимости настройте шаблон в зависимости от вашей конкретной реализации.
Метод 2: гибкое сопоставление с дополнительными параметрами
Вызовы Google Analytics могут иметь дополнительные параметры, такие как специальные параметры, события или дополнительные конфигурации. Чтобы уловить эти варианты, вы можете изменить шаблон регулярного выражения, включив в него необязательные части. Вот пример:
pattern = r"ga\('create', 'UA-\w{8}-\d'(?:, \{.*?\})?, 'auto'\);"
# Example with optional configuration object
text1 = "ga('create', 'UA-XXXXXXXX-X', { 'cookieDomain': 'example.com' }, 'auto');"
# Example without optional configuration object
text2 = "ga('create', 'UA-XXXXXXXX-X', 'auto');"
matches1 = re.findall(pattern, text1)
matches2 = re.findall(pattern, text2)
print(matches1)
print(matches2)
Этот шаблон позволяет сопоставить оба случая, когда объект конфигурации присутствует или отсутствует.
Метод 3. Извлечение идентификаторов отслеживания
Если вы специально хотите извлечь идентификаторы отслеживания Google Analytics из вызовов, вы можете соответствующим образом изменить шаблон. Вот пример:
pattern = r"ga\('create', '(UA-\w{8}-\d)', 'auto'\);"
text = "ga('create', 'UA-XXXXXXXX-X', 'auto');"
matches = re.findall(pattern, text)
print(matches)
Этот шаблон фиксирует идентификатор отслеживания (UA-XXXXXXXX-X) внутри группы, что позволяет извлечь его отдельно.
Регулярные выражения предоставляют гибкий и мощный подход для поиска вызовов Google Analytics на веб-страницах. Используя регулярное выражение, вы можете извлекать коды отслеживания, сопоставлять варианты формата вызова и захватывать дополнительные параметры. Не забудьте настроить шаблоны в зависимости от вашей конкретной реализации и структуры вызовов Google Analytics.