Pandas — это мощная библиотека манипулирования данными на Python, предоставляющая обширные функциональные возможности для работы со структурированными данными. Среди множества полезных методов выделяется метод «формы». В этой статье блога мы рассмотрим метод «формы» в pandas, обсудим его назначение, использование и продемонстрируем различные примеры, демонстрирующие его универсальность. Итак, давайте углубимся и раскроем скрытый потенциал метода «формы»!
Понимание цели метода «Форма»:
Метод «форма» в pandas в основном используется для определения размеров DataFrame или Series. Он возвращает кортеж, содержащий количество строк и столбцов, присутствующих в наборе данных. Информация о форме невероятно ценна при выполнении задач по анализу и манипулированию данными, поскольку позволяет получить представление о структуре ваших данных.
Синтаксис и базовое использование:
Метод shape можно вызвать непосредственно для объекта DataFrame или Series. Вот синтаксис:
df.shape
Это вернет кортеж из двух целых чисел, представляющих количество строк и столбцов в DataFrame.
Пример 1. Анализ размеров фрейма данных
Давайте рассмотрим простой пример, где у нас есть DataFrame под названием «данные», содержащий информацию об учащихся:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 28],
'Gender': ['Female', 'Male', 'Male']
}
df = pd.DataFrame(data)
print(df.shape)
Выход:
(3, 3)
В этом примере DataFrame имеет 3 строки и 3 столбца, как указано в выводе.
Пример 2: объединение «Shape» с Numpy
Поскольку pandas построен на основе Numpy, мы можем легко интегрировать метод shape с операциями Numpy. Давайте посмотрим пример:
import pandas as pd
import numpy as np
data = np.random.randint(0, 10, size=(5, 3))
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
print(df.shape)
Выход:
(5, 3)
Здесь мы создаем DataFrame со случайными целочисленными значениями, используя функцию random.randintNumpy. Применяя метод «форма», мы можем подтвердить, что DataFrame имеет 5 строк и 3 столбца.
Изучение продвинутых приложений:
Метод «shape» можно комбинировать с другими операциями pandas для выполнения расширенного анализа данных. Вот несколько примеров:
- Фильтрация строк по форме. Вы можете использовать метод «форма», чтобы отфильтровать строки, соответствующие определенным условиям. Например, чтобы извлечь строки, в которых количество столбцов превышает определенное значение:
df_filtered = df[df.shape[1] > 2]
<ол старт="2">
df_transposed = df.T
print(df_transposed.shape)