Учебное пособие по Python Pandas: изучите основные методы на примерах кода

Вот список нескольких часто используемых методов библиотеки Python pandas, а также примеры кода:

  1. DataFrame.head(): возвращает первые n строк DataFrame.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.head(2))
  2. DataFrame.tail(): возвращает последние n строк DataFrame.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.tail(2))
  3. DataFrame.info(): предоставляет сводную информацию о DataFrame, включая типы данных и использование памяти.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.info())
  4. DataFrame.describe(): генерирует описательную статистику DataFrame.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.describe())
  5. DataFrame.shape: возвращает размеры DataFrame (строки, столбцы).

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    print(df.shape)
  6. DataFrame.groupby(): группирует DataFrame по одному или нескольким столбцам.

    import pandas as pd
    df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'],
                   'B': ['one', 'one', 'two', 'two'],
                   'C': [1, 2, 3, 4]})
    grouped = df.groupby('A')
    print(grouped.get_group('foo'))
  7. DataFrame.merge(): объединяет два DataFrame на основе общего столбца.

    import pandas as pd
    df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
                    'value': [1, 2, 3, 4]})
    df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
                    'value': [5, 6, 7, 8]})
    merged = pd.merge(df1, df2, on='key')
    print(merged)
  8. DataFrame.dropna(): удаляет пропущенные значения (NaN) из DataFrame.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 6]})
    df.dropna(inplace=True)
    print(df)
  9. DataFrame.sort_values(): сортирует DataFrame по одному или нескольким столбцам.

    import pandas as pd
    df = pd.DataFrame({'A': [3, 2, 1], 'B': [6, 5, 4]})
    df.sort_values(by='A', inplace=True)
    print(df)
  10. DataFrame.to_csv(): сохраняет DataFrame в виде файла CSV.

    import pandas as pd
    df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
    df.to_csv('data.csv', index=False)