Изучение Pandas: методы просмотра всех столбцов в DataFrame

При работе с задачами анализа данных или манипулирования ими с использованием языка программирования Python библиотека Pandas является важным инструментом. Одним из общих требований является просмотр всех столбцов DataFrame. В этой статье мы рассмотрим различные способы достижения этой цели на примерах кода.

Метод 1: использование DataFrame.columns
Самый простой способ просмотреть все столбцы в DataFrame Pandas — получить доступ к атрибуту columns. Этот атрибут возвращает объект Index, содержащий все имена столбцов.

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Access the column names
columns = df.columns
print(columns)

Выход:

Index(['A', 'B', 'C'], dtype='object')

Метод 2: использование DataFrame.head
Другой подход — использовать метод head, который возвращает первые n строк DataFrame. Установив n равным 0, мы сможем получить только имена столбцов.

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Access the column names
column_names = df.head(0)
print(column_names)

Выход:

Empty DataFrame
Columns: [A, B, C]
Index: []

Метод 3: использование DataFrame.info
Метод infoпредоставляет краткую сводку DataFrame, включая имена столбцов, типы данных и использование памяти.

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Display DataFrame information
df.info()

Выход:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
A    3 non-null int64
B    3 non-null int64
C    3 non-null int64
dtypes: int64(3)
memory usage: 200.0 bytes

Метод 4: использование DataFrame.describe
Метод describeгенерирует описательную статистику DataFrame, включая имена столбцов, количество, среднее значение, стандартное отклонение и т. д.

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Display descriptive statistics
statistics = df.describe()
print(statistics)

Выход:

              A         B         C
count  3.000000  3.000000  3.000000
mean   2.000000  5.000000  8.000000
std    1.000000  1.000000  1.000000
min    1.000000  4.000000  7.000000
25%    1.500000  4.500000  7.500000
50%    2.000000  5.000000  8.000000
75%    2.500000  5.500000  8.500000
max    3.000000  6.000000  9.000000

В этой статье мы рассмотрели различные методы просмотра всех столбцов в кадре данных Pandas. Используя атрибут columns, метод headс n=0, метод infoи метод describe, мы можем легко получить доступ к именам столбцов и получить представление о структуре и статистике DataFrame. Эти методы полезны для задач анализа и манипулирования данными.

Включив эти методы в рабочие процессы анализа данных Python, вы получите прочную основу для эффективного изучения и понимания ваших данных.