Вы любитель данных и любите работать с Pandas? Если да, то вы, вероятно, знакомы с мощным объектом DataFrame, который Pandas предоставляет для манипулирования и анализа данных. Одним из ключевых аспектов работы с DataFrames является выбор определенных строк и столбцов для дальнейшего анализа. В этой статье мы собираемся погрузиться в мир выбора DataFrame с помощью функции iloc
в Pandas. Так что хватайте шляпу программиста и начнем!
Функция iloc
в Pandas означает «целочисленное местоположение» и позволяет нам выбирать данные на основе их числового положения в DataFrame. Он обеспечивает универсальный и эффективный способ извлечения определенных строк и столбцов, что делает его важным инструментом в наборе инструментов любого специалиста по данным. Давайте рассмотрим некоторые часто используемые методы на примерах кода:
-
Выбор строк:
- Одна строка: чтобы выбрать одну строку, вы можете использовать синтаксис
df.iloc[row_index]
. Например,df.iloc[0]
вернет первую строку DataFrame. - Несколько строк. Чтобы выбрать несколько строк, вы можете передать список индексов строк в
df.iloc
. Например,df.iloc[[0, 2, 4]]
получит первую, третью и пятую строки.
- Одна строка: чтобы выбрать одну строку, вы можете использовать синтаксис
-
Выбор столбцов:
- Один столбец: чтобы выбрать один столбец, вы можете использовать синтаксис
df.iloc[:, column_index]
. Например,df.iloc[:, 0]
вернет первый столбец DataFrame. - Несколько столбцов. Чтобы выбрать несколько столбцов, вы можете передать список индексов столбцов в
df.iloc[:, ]
. Например,df.iloc[:, [0, 2, 4]]
получит первый, третий и пятый столбцы.
- Один столбец: чтобы выбрать один столбец, вы можете использовать синтаксис
-
Выбор подмножеств:
- Строки и столбцы. Вы можете комбинировать индексацию строк и столбцов для выбора определенных подмножеств данных. Например,
df.iloc[0:3, 2:5]
будет извлекать строки от 0 до 2 (эксклюзивно) и столбцы со 2 по 4 (эксклюзивно). - Условный выбор. Вы можете использовать условные выражения внутри
df.iloc
для выбора данных на основе определенных критериев. Например,df.iloc[df['column_name'] > 5]
вернет строки, в которых значение столбца «имя_столбца» больше 5.
- Строки и столбцы. Вы можете комбинировать индексацию строк и столбцов для выбора определенных подмножеств данных. Например,
-
Другие полезные методы:
- Отрицательное индексирование. Вы можете использовать отрицательные индексы с
df.iloc
для отсчета от конца DataFrame. Например,df.iloc[-1]
вернет последнюю строку. - Размер шага: вы можете указать размер шага для выбора каждой n-й строки или столбца. Например,
df.iloc[1:10:2]
вернет строки 1, 3, 5, 7 и 9.
- Отрицательное индексирование. Вы можете использовать отрицательные индексы с
Используя различные методы, предоставляемые iloc
, вы можете точно извлечь данные, необходимые для анализа, будь то одна строка, несколько строк, один столбец или подмножества данных в зависимости от условий.. Не забудьте настроить индексы и диапазоны в соответствии со структурой вашего DataFrame!
В заключение отметим, что функция iloc
в Pandas — мощный инструмент для выбора DataFrame. Его способность получать доступ к данным по целочисленному расположению делает его универсальным выбором для задач манипулирования данными. Итак, в следующий раз, когда вам придется работать с Pandas, не забудьте воспользоваться преимуществами iloc
!
Теперь, когда вы узнали о выборе DataFrame с помощью iloc
, вы хорошо подготовлены к эффективному извлечению данных в Pandas. Приятного кодирования!