Вот список нескольких часто используемых методов библиотеки Python pandas, а также примеры кода:
-
DataFrame.head(): возвращает первые n строк DataFrame.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) print(df.head(2)) -
DataFrame.tail(): возвращает последние n строк DataFrame.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) print(df.tail(2)) -
DataFrame.info(): предоставляет сводную информацию о DataFrame, включая типы данных и использование памяти.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) print(df.info()) -
DataFrame.describe(): генерирует описательную статистику DataFrame.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) print(df.describe()) -
DataFrame.shape: возвращает размеры DataFrame (строки, столбцы).
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) print(df.shape) -
DataFrame.groupby(): группирует DataFrame по одному или нескольким столбцам.
import pandas as pd df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'], 'B': ['one', 'one', 'two', 'two'], 'C': [1, 2, 3, 4]}) grouped = df.groupby('A') print(grouped.get_group('foo')) -
DataFrame.merge(): объединяет два DataFrame на основе общего столбца.
import pandas as pd df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]}) df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]}) merged = pd.merge(df1, df2, on='key') print(merged) -
DataFrame.dropna(): удаляет пропущенные значения (NaN) из DataFrame.
import pandas as pd df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 6]}) df.dropna(inplace=True) print(df) -
DataFrame.sort_values(): сортирует DataFrame по одному или нескольким столбцам.
import pandas as pd df = pd.DataFrame({'A': [3, 2, 1], 'B': [6, 5, 4]}) df.sort_values(by='A', inplace=True) print(df) -
DataFrame.to_csv(): сохраняет DataFrame в виде файла CSV.
import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df.to_csv('data.csv', index=False)