Эффективные способы фильтрации столбцов в кадре данных Pandas по имени

Фильтрация столбцов в DataFrame Pandas на основе их имен — обычная операция при анализе и манипулировании данными. В этой статье мы рассмотрим различные методы эффективного решения этой задачи. Мы предоставим примеры кода для каждого метода, чтобы продемонстрировать их использование и обсудить их плюсы и минусы. Давайте погрузимся!

Методы фильтрации столбцов по имени:

Метод 1: использование функции filter()

filtered_df = df.filter(like='column_name')

Этот метод фильтрует столбцы по совпадению подстрок. Он выбирает столбцы, имена которых содержат указанную подстроку.

Метод 2: использование метода доступа loc

filtered_df = df.loc[:, df.columns.str.contains('column_name')]

Этот метод использует логическое индексирование с помощью locи функции str.contains()для фильтрации столбцов на основе шаблона регулярного выражения.

Метод 3. Использование метода доступа locи списка имен столбцов

columns_to_keep = ['column_name1', 'column_name2', ...]
filtered_df = df.loc[:, columns_to_keep]

Этот метод фильтрует столбцы, явно указывая список имен столбцов, которые необходимо сохранить.

Метод 4. Использование функции drop()

columns_to_drop = ['column_name1', 'column_name2', ...]
filtered_df = df.drop(columns=columns_to_drop)

Этот метод фильтрует столбцы, явно указывая список имен столбцов, которые нужно удалить.

Метод 5. Использование индексации столбцов

filtered_df = df[['column_name1', 'column_name2', ...]]

Этот метод напрямую выбирает столбцы путем индексации со списком имен столбцов.

Метод 6: использование функции reindex()

columns_to_keep = ['column_name1', 'column_name2', ...]
filtered_df = df.reindex(columns=columns_to_keep)

Этот метод фильтрует столбцы, переиндексируя DataFrame со списком имен столбцов.

Метод 7. Использование метода доступа locи лямбда-функции

filtered_df = df.loc[:, lambda df: df.columns.str.contains('column_name')]

Этот метод использует лямбда-функцию внутри метода доступа locдля фильтрации столбцов на основе условия.

В этой статье мы рассмотрели несколько эффективных методов фильтрации столбцов в DataFrame Pandas по имени. Каждый метод имеет свои преимущества и может быть более подходящим в зависимости от конкретного случая использования. Применяя эти методы, вы можете легко извлечь нужные столбцы из вашего DataFrame. Поэкспериментируйте с этими методами и выберите тот, который лучше всего соответствует вашим потребностям!