Освоение панд: раскрытие возможностей метода «формы»

Pandas — это мощная библиотека манипулирования данными на Python, предоставляющая обширные функциональные возможности для работы со структурированными данными. Среди множества полезных методов выделяется метод «формы». В этой статье блога мы рассмотрим метод «формы» в pandas, обсудим его назначение, использование и продемонстрируем различные примеры, демонстрирующие его универсальность. Итак, давайте углубимся и раскроем скрытый потенциал метода «формы»!

Понимание цели метода «Форма»:

Метод «форма» в pandas в основном используется для определения размеров DataFrame или Series. Он возвращает кортеж, содержащий количество строк и столбцов, присутствующих в наборе данных. Информация о форме невероятно ценна при выполнении задач по анализу и манипулированию данными, поскольку позволяет получить представление о структуре ваших данных.

Синтаксис и базовое использование:

Метод shape можно вызвать непосредственно для объекта DataFrame или Series. Вот синтаксис:

df.shape

Это вернет кортеж из двух целых чисел, представляющих количество строк и столбцов в DataFrame.

Пример 1. Анализ размеров фрейма данных

Давайте рассмотрим простой пример, где у нас есть DataFrame под названием «данные», содержащий информацию об учащихся:

import pandas as pd
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 28],
    'Gender': ['Female', 'Male', 'Male']
}
df = pd.DataFrame(data)
print(df.shape)

Выход:

(3, 3)

В этом примере DataFrame имеет 3 строки и 3 столбца, как указано в выводе.

Пример 2: объединение «Shape» с Numpy

Поскольку pandas построен на основе Numpy, мы можем легко интегрировать метод shape с операциями Numpy. Давайте посмотрим пример:

import pandas as pd
import numpy as np
data = np.random.randint(0, 10, size=(5, 3))
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
print(df.shape)

Выход:

(5, 3)

Здесь мы создаем DataFrame со случайными целочисленными значениями, используя функцию random.randintNumpy. Применяя метод «форма», мы можем подтвердить, что DataFrame имеет 5 строк и 3 столбца.

Изучение продвинутых приложений:

Метод «shape» можно комбинировать с другими операциями pandas для выполнения расширенного анализа данных. Вот несколько примеров:

  1. Фильтрация строк по форме. Вы можете использовать метод «форма», чтобы отфильтровать строки, соответствующие определенным условиям. Например, чтобы извлечь строки, в которых количество столбцов превышает определенное значение:
df_filtered = df[df.shape[1] > 2]

<ол старт="2">

  • Изменение формы данных. Метод «shape» можно использовать для изменения формы или реструктуризации ваших данных. Вы можете транспонировать DataFrame, используя атрибут «T», а затем применить метод «shape», чтобы получить новые размеры:
  • df_transposed = df.T
    print(df_transposed.shape)