В мире анализа и обработки данных работа с большими наборами данных часто требует от нас удаления ненужных или избыточных столбцов из наших фреймов данных. Хотим ли мы устранить шумные или ненужные функции или просто уменьшить размерность наших данных, процесс удаления столбцов является важнейшим навыком, который необходимо освоить. В этой статье блога мы рассмотрим различные методы удаления столбцов в кадре данных с использованием популярной библиотеки Python pandas. Так что пристегните ремни и приготовьтесь стать профессионалом в объезде колонн!
Метод 1: использование функции drop()
Функция drop() в pandas обеспечивает гибкий способ удаления столбцов из кадра данных. Вы можете указать имена столбцов или индексы, которые хотите удалить, а pandas позаботится обо всем остальном. Давайте рассмотрим пример:
import pandas as pd
# Create a sample dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# Drop a single column by name
df = df.drop('City', axis=1)
# Drop multiple columns by name
df = df.drop(['Age', 'City'], axis=1)
# Drop columns by index
df = df.drop(df.columns[[0, 2]], axis=1)
print(df)
Метод 2: использование ключевого слова del
Другой способ удалить столбец — использовать ключевое слово del в Python. Этот метод позволяет напрямую удалить столбец из фрейма данных без необходимости использования каких-либо дополнительных функций. Однако обратите внимание, что этот метод изменяет фрейм данных на месте и не возвращает новый фрейм данных. Вот пример:
import pandas as pd
# Create a sample dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# Drop a single column using del
del df['City']
print(df)
Метод 3: использование функции pop()
Функция pop() в pandas не только удаляет столбец из кадра данных, но также возвращает удаленный столбец в виде серии. Это может быть полезно, если вы хотите сохранить удаленный столбец для дальнейшего анализа или использовать его в отдельном фрейме данных. Давайте посмотрим, как это работает:
import pandas as pd
# Create a sample dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# Drop a single column using pop
dropped_column = df.pop('City')
print(df)
print(dropped_column)
Метод 4: использование индексации столбцов
Pandas позволяет удалять столбцы путем прямой индексации кадра данных и исключения столбцов, которые вы хотите сохранить. Этот метод особенно полезен, когда вам нужно удалить большое количество столбцов. Вот пример:
import pandas as pd
# Create a sample dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# Drop columns using column indexing
df = df[df.columns[~df.columns.isin(['Age', 'City'])]]
print(df)
В этой статье мы рассмотрели несколько способов удаления столбцов из фрейма данных с помощью pandas. Независимо от того, предпочитаете ли вы гибкость функции drop(), простоту ключевого слова del, функциональность функции pop() или элегантность индексации столбцов, теперь у вас есть набор методов для обработки любого сценария манипулирования данными. Так что вперед, погрузитесь в свои данные и удалите ненужные столбцы, как профессионал!