При работе с задачами анализа данных или манипулирования ими с использованием языка программирования Python библиотека Pandas является важным инструментом. Одним из общих требований является просмотр всех столбцов DataFrame. В этой статье мы рассмотрим различные способы достижения этой цели на примерах кода.
Метод 1: использование DataFrame.columns
Самый простой способ просмотреть все столбцы в DataFrame Pandas — получить доступ к атрибуту columns
. Этот атрибут возвращает объект Index, содержащий все имена столбцов.
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Access the column names
columns = df.columns
print(columns)
Выход:
Index(['A', 'B', 'C'], dtype='object')
Метод 2: использование DataFrame.head
Другой подход — использовать метод head
, который возвращает первые n строк DataFrame. Установив n равным 0, мы сможем получить только имена столбцов.
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Access the column names
column_names = df.head(0)
print(column_names)
Выход:
Empty DataFrame
Columns: [A, B, C]
Index: []
Метод 3: использование DataFrame.info
Метод info
предоставляет краткую сводку DataFrame, включая имена столбцов, типы данных и использование памяти.
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Display DataFrame information
df.info()
Выход:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
A 3 non-null int64
B 3 non-null int64
C 3 non-null int64
dtypes: int64(3)
memory usage: 200.0 bytes
Метод 4: использование DataFrame.describe
Метод describe
генерирует описательную статистику DataFrame, включая имена столбцов, количество, среднее значение, стандартное отклонение и т. д.
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
# Display descriptive statistics
statistics = df.describe()
print(statistics)
Выход:
A B C
count 3.000000 3.000000 3.000000
mean 2.000000 5.000000 8.000000
std 1.000000 1.000000 1.000000
min 1.000000 4.000000 7.000000
25% 1.500000 4.500000 7.500000
50% 2.000000 5.000000 8.000000
75% 2.500000 5.500000 8.500000
max 3.000000 6.000000 9.000000
В этой статье мы рассмотрели различные методы просмотра всех столбцов в кадре данных Pandas. Используя атрибут columns
, метод head
с n=0, метод info
и метод describe
, мы можем легко получить доступ к именам столбцов и получить представление о структуре и статистике DataFrame. Эти методы полезны для задач анализа и манипулирования данными.
Включив эти методы в рабочие процессы анализа данных Python, вы получите прочную основу для эффективного изучения и понимания ваших данных.