Фильтрация столбцов в DataFrame Pandas на основе их имен — обычная операция при анализе и манипулировании данными. В этой статье мы рассмотрим различные методы эффективного решения этой задачи. Мы предоставим примеры кода для каждого метода, чтобы продемонстрировать их использование и обсудить их плюсы и минусы. Давайте погрузимся!
Методы фильтрации столбцов по имени:
Метод 1: использование функции filter()
filtered_df = df.filter(like='column_name')
Этот метод фильтрует столбцы по совпадению подстрок. Он выбирает столбцы, имена которых содержат указанную подстроку.
Метод 2: использование метода доступа loc
filtered_df = df.loc[:, df.columns.str.contains('column_name')]
Этот метод использует логическое индексирование с помощью locи функции str.contains()для фильтрации столбцов на основе шаблона регулярного выражения.
Метод 3. Использование метода доступа locи списка имен столбцов
columns_to_keep = ['column_name1', 'column_name2', ...]
filtered_df = df.loc[:, columns_to_keep]
Этот метод фильтрует столбцы, явно указывая список имен столбцов, которые необходимо сохранить.
Метод 4. Использование функции drop()
columns_to_drop = ['column_name1', 'column_name2', ...]
filtered_df = df.drop(columns=columns_to_drop)
Этот метод фильтрует столбцы, явно указывая список имен столбцов, которые нужно удалить.
Метод 5. Использование индексации столбцов
filtered_df = df[['column_name1', 'column_name2', ...]]
Этот метод напрямую выбирает столбцы путем индексации со списком имен столбцов.
Метод 6: использование функции reindex()
columns_to_keep = ['column_name1', 'column_name2', ...]
filtered_df = df.reindex(columns=columns_to_keep)
Этот метод фильтрует столбцы, переиндексируя DataFrame со списком имен столбцов.
Метод 7. Использование метода доступа locи лямбда-функции
filtered_df = df.loc[:, lambda df: df.columns.str.contains('column_name')]
Этот метод использует лямбда-функцию внутри метода доступа locдля фильтрации столбцов на основе условия.
В этой статье мы рассмотрели несколько эффективных методов фильтрации столбцов в DataFrame Pandas по имени. Каждый метод имеет свои преимущества и может быть более подходящим в зависимости от конкретного случая использования. Применяя эти методы, вы можете легко извлечь нужные столбцы из вашего DataFrame. Поэкспериментируйте с этими методами и выберите тот, который лучше всего соответствует вашим потребностям!