При работе с большими наборами данных в Pandas часто требуется выбрать определенные столбцы или диапазоны столбцов из DataFrame. В этой статье мы рассмотрим несколько методов эффективного выбора нескольких диапазонов столбцов в DataFrame Pandas. Мы предоставим примеры кода для каждого метода, что позволит вам выбрать тот, который лучше всего соответствует вашим потребностям.
Метод 1: использование индексации столбцов
Пример кода:
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9],
                   'D': [10, 11, 12]})
# Select multiple ranges of columns using column indexing
selected_columns = df[df.columns[1:3]]
print(selected_columns)Метод 2: использование метода iloc
Пример кода:
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9],
                   'D': [10, 11, 12]})
# Select multiple ranges of columns using iloc
selected_columns = df.iloc[:, [1, 3]]
print(selected_columns)Метод 3: использование метода loc
Пример кода:
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9],
                   'D': [10, 11, 12]})
# Select multiple ranges of columns using loc
selected_columns = df.loc[:, 'B':'D']
print(selected_columns)Метод 4: использование метода filter
Пример кода:
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9],
                   'D': [10, 11, 12]})
# Select multiple ranges of columns using filter
selected_columns = df.filter(regex='[BCD]')
print(selected_columns)Метод 5: использование понимания списка
Пример кода:
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9],
                   'D': [10, 11, 12]})
# Select multiple ranges of columns using list comprehension
selected_columns = [col for col in df.columns if 'B' <= col <= 'D']
print(df[selected_columns])В этой статье мы рассмотрели пять различных методов эффективного выбора нескольких диапазонов столбцов в DataFrame Pandas. Эти методы обеспечивают гибкость и простоту использования, позволяя извлекать столбцы, необходимые для анализа. Включив эти методы в рабочий процесс анализа данных, вы сможете эффективно манипулировать наборами данных и анализировать их с помощью Pandas.