Работа с большими наборами данных часто предполагает извлечение определенных значений столбцов для анализа или дальнейшей обработки. Pandas, мощная библиотека манипулирования данными на Python, предоставляет множество методов для эффективного извлечения значений столбцов из DataFrame. В этой статье мы рассмотрим несколько методов с примерами кода, которые помогут вам овладеть искусством извлечения столбцов в Pandas.
Метод 1: использование скобочных обозначений
Один из самых простых способов извлечения значений столбцов в Pandas — использование скобочных обозначений. Предположим, у вас есть DataFrame с именем df
и вы хотите извлечь значения из столбца с именем «column_name». Фрагмент кода ниже демонстрирует этот метод:
column_values = df["column_name"]
Метод 2: использование точечной нотации
Pandas также позволяет получать доступ к значениям столбцов с помощью точечной нотации. Этот метод полезен, когда имена столбцов являются допустимыми именами переменных Python. Вот пример:
column_values = df.column_name
Метод 3: использование аксессора loc
Аксессор loc
в Pandas предоставляет мощный способ извлечения значений столбца на основе меток. Вы можете использовать его для извлечения одного или нескольких столбцов одновременно. Чтобы извлечь значения из одного столбца, используйте фрагмент кода ниже:
column_values = df.loc[:, "column_name"]
Метод 4. Использование метода доступа iloc
.
Подобно loc
, метод доступа iloc
позволяет извлекать значения столбца на основе целого числа. -Индексация местоположений вместо меток. Вот пример:
column_values = df.iloc[:, column_index]
Метод 5: использование средств доступа at
и iat
.
Если вы заинтересованы в извлечении одного скалярного значения из DataFrame, вы можете использовать Аксессоры 14и iat
. Аксессор at
работает с индексацией на основе меток, а iat
использует индексацию по целочисленному местоположению. Вот пример использования at
:
value = df.at[row_index, "column_name"]
Метод 6: использование метода get
Метод get
в Pandas позволяет извлекать значения столбцов, корректно обрабатывая отсутствующие или несуществующие столбцы. Он возвращает None
или указанное значение по умолчанию, если столбец не найден. Вот пример:
column_values = df.get("column_name")
Извлечение значений столбцов — фундаментальная задача анализа данных, и Pandas предоставляет богатый набор методов для эффективного выполнения этой задачи. В этой статье мы рассмотрели шесть различных методов, включая обозначение скобок, обозначение через точку, loc
, iloc
, at
, iat
и метод get
. В зависимости от вашего конкретного варианта использования вы можете выбрать наиболее подходящий метод для извлечения значений столбцов из DataFrame Pandas. Освоив эти методы, вы сможете легко справляться с различными задачами по анализу данных.