Pandas – это популярная библиотека манипулирования данными на Python, широко используемая в рабочих процессах анализа данных и анализа данных. Одной из распространенных задач является разделение столбца списков на несколько столбцов, каждый из которых содержит элементы исходного списка. В этой статье мы рассмотрим различные методы достижения этой цели с помощью панд, а также примеры кода.
Метод 1: использование функции apply()
import pandas as pd
# Create a sample DataFrame
data = {'col1': [[1, 2, 3], [4, 5, 6], [7, 8, 9]]}
df = pd.DataFrame(data)
# Split the column of lists into multiple columns
df[['col2', 'col3', 'col4']] = df['col1'].apply(pd.Series)
print(df)
Метод 2: использование метода str.split()
import pandas as pd
# Create a sample DataFrame
data = {'col1': [['apple', 'banana'], ['orange', 'grape'], ['kiwi', 'watermelon']]}
df = pd.DataFrame(data)
# Split the column of lists into multiple columns
df[['col2', 'col3']] = df['col1'].str.join(',').str.split(',', expand=True)
print(df)
Метод 3. Использование функции zip()
import pandas as pd
# Create a sample DataFrame
data = {'col1': [[1, 2], [3, 4], [5, 6]]}
df = pd.DataFrame(data)
# Split the column of lists into multiple columns
df['col2'], df['col3'] = zip(*df['col1'])
print(df)
Метод 4. Использование конструктора DataFrame
import pandas as pd
# Create a sample DataFrame
data = {'col1': [[1, 2], [3, 4], [5, 6]]}
df = pd.DataFrame(data)
# Split the column of lists into multiple columns
df[['col2', 'col3']] = pd.DataFrame(df['col1'].tolist(), index=df.index)
print(df)
В этой статье мы рассмотрели несколько методов разделения столбца списков на несколько столбцов в pandas. Мы рассмотрели методы использования функции apply(), метода str.split(), функции zip() и конструктора DataFrame. В зависимости от конкретных требований вашего проекта вы можете выбрать наиболее подходящий метод. Имея в своем распоряжении эти методы, вы сможете эффективно решать задачи манипулирования данными в пандах.
Не забудьте оптимизировать свою статью в блоге для SEO, включив в нее соответствующие ключевые слова, такие как Python, манипулирование данными, Pandas, наука о данных и анализ данных. Это поможет улучшить видимость и охват вашей статьи для более широкой аудитории, интересующейся этими темами.