В Python существует несколько методов работы с DataFrames pandas. Вот некоторые часто используемые методы:
-
Создание DataFrame:
- Использование словаря. Вы можете создать DataFrame, передав словарь списков или массивов в функцию
pd.DataFrame(). - Чтение из файла: Pandas предоставляет такие функции, как
pd.read_csv(),pd.read_excel()и т. д. для чтения данных из файлов различных форматов и создания DataFrame.
- Использование словаря. Вы можете создать DataFrame, передав словарь списков или массивов в функцию
-
Просмотр данных:
head(): возвращает первые несколько строк DataFrame.tail(): возвращает несколько последних строк DataFrame.sample(): возвращает случайную выборку строк из DataFrame.
-
Манипулирование данными:
loc[]иiloc[]: используются для индексации и выбора строк и столбцов.drop(): удаляет указанные строки или столбцы из DataFrame.fillna(): заполняет пропущенные значения в DataFrame указанным значением.sort_values(): сортирует DataFrame на основе одного или нескольких столбцов.groupby(): группирует данные на основе одного или нескольких столбцов.
-
Очистка и преобразование данных:
isnull(): проверяет наличие пропущенных значений в DataFrame.drop_duulates(): удаляет повторяющиеся строки из DataFrame.apply(): применяет функцию к каждому элементу или строке/столбцу DataFrame.merge(): объединяет два DataFrame на основе общего столбца.
-
Статистический анализ:
describe(): генерирует описательную статистику DataFrame.mean(),median(),std()и т. д.: вычисление различных статистических показателей.corr(): вычисляет корреляцию между столбцами.
-
Вывод данных:
to_csv(): записывает DataFrame в файл CSV.to_excel(): записывает DataFrame в файл Excel.to_sql(): записывает DataFrame в базу данных SQL.