Манипулирование данными — важнейший аспект любой задачи анализа данных или машинного обучения. Pandas, популярная библиотека манипулирования данными на Python, предоставляет мощные инструменты для работы со структурированными данными, включая возможность создания DataFrames. В этой статье мы рассмотрим различные методы создания DataFrame из словаря Python, а также приведем примеры кода.
Метод 1: использование конструктора pd.DataFrame()
Самый простой способ создать DataFrame из словаря — использовать конструктор pd.DataFrame(). Ключи словаря станут именами столбцов, а значения станут данными столбцов.
import pandas as pd
# Sample dictionary
data = {'Name': ['John', 'Emma', 'Michael'],
'Age': [25, 28, 30],
'City': ['New York', 'London', 'Paris']}
# Creating a DataFrame
df = pd.DataFrame(data)
print(df)
Выход:
Name Age City
0 John 25 New York
1 Emma 28 London
2 Michael 30 Paris
Метод 2: использование метода from_dict().
Pandas предоставляет удобный метод from_dict()для создания DataFrame из словаря. Этот метод позволяет указать ориентацию результирующего DataFrame: «столбцы» или «индекс».
import pandas as pd
data = {'Name': ['John', 'Emma', 'Michael'],
'Age': [25, 28, 30],
'City': ['New York', 'London', 'Paris']}
# Creating a DataFrame with 'columns' orientation
df = pd.DataFrame.from_dict(data, orient='columns')
print(df)
Выход:
Name Age City
0 John 25 New York
1 Emma 28 London
2 Michael 30 Paris
Метод 3. Использование метода append().
Если у вас есть пустой DataFrame и вы хотите заполнить его данными из словаря, вы можете использовать метод append().. Этот метод позволяет добавлять строки в существующий DataFrame.
import pandas as pd
# Empty DataFrame
df = pd.DataFrame()
data = {'Name': 'John', 'Age': 25, 'City': 'New York'}
# Appending data from dictionary
df = df.append(data, ignore_index=True)
print(df)
Выход:
Name Age City
0 John 25 New York
Метод 4: использование метода from_records()
Другой способ создать DataFrame из словаря — использовать метод from_records(). Этот метод принимает список кортежей или списков, где каждый кортеж/список представляет собой строку данных.
import pandas as pd
data = [('John', 25, 'New York'),
('Emma', 28, 'London'),
('Michael', 30, 'Paris')]
# Creating a DataFrame
df = pd.DataFrame.from_records(data, columns=['Name', 'Age', 'City'])
print(df)
Выход:
Name Age City
0 John 25 New York
1 Emma 28 London
2 Michael 30 Paris
В этой статье мы рассмотрели различные методы создания DataFrame из словаря в Python с использованием библиотеки Pandas. Мы рассмотрели такие методы, как использование конструктора pd.DataFrame(), from_dict(), append()и from_records(). В зависимости от вашего конкретного случая использования вы можете выбрать метод, который лучше всего соответствует вашим потребностям. Благодаря этим методам вы сможете эффективно создавать DataFrames и с легкостью выполнять задачи по манипулированию данными.
Не забудьте оптимизировать свой контент для поисковых систем, используя релевантные ключевые слова и предоставляя читателям ценную информацию.