Освоение форматирования чисел с плавающей запятой в Pandas: подробное руководство

В мире анализа и обработки данных библиотека Python Pandas является мощным инструментом. Он предлагает широкий спектр функций для эффективной обработки и преобразования данных. Одним из важных аспектов обработки данных является форматирование числовых значений, особенно чисел с плавающей запятой. В этой статье мы углубимся в различные методы, предоставляемые Pandas для форматирования чисел с плавающей запятой, используя разговорный язык и практические примеры кода. Итак, начнём!

Метод 1: использование функции round.
Если вы хотите округлить числа с плавающей запятой до определенного количества десятичных знаков, вам пригодится функция round.. Вот пример:

import pandas as pd
data = {'Value': [3.14159, 2.71828, 1.41421]}
df = pd.DataFrame(data)
df['Rounded'] = df['Value'].round(2)
print(df)

Выход:

     Value  Rounded
0  3.14159     3.14
1  2.71828     2.72
2  1.41421     1.41

Метод 2. Использование функции applyдля форматирования строк.
Функция applyпозволяет применять собственное форматирование к каждому элементу столбца. Мы можем использовать форматирование строк для достижения желаемого форматирования с плавающей запятой. Давайте посмотрим пример:

df['Formatted'] = df['Value'].apply(lambda x: f'{x:.2f}')
print(df)

Выход:

     Value Formatted
0  3.14159      3.14
1  2.71828      2.72
2  1.41421      1.41

Метод 3: использование функции mapс методом format
Функция mapпозволяет сопоставить метод форматирования каждому элемент в столбце. Мы можем использовать метод formatвместе с желаемым спецификатором формата для достижения форматирования с плавающей запятой. Вот пример:

df['Formatted'] = df['Value'].map('{:.2f}'.format)
print(df)

Выход:

     Value Formatted
0  3.14159      3.14
1  2.71828      2.72
2  1.41421      1.41

Метод 4. Использование функции astypeс аргументом 'str'.
Если вы хотите преобразовать значения с плавающей запятой в строки при применении форматирования, вы можете использовать astypeфункция. Указав аргумент как 'str', Pandas преобразует столбец в строковый тип, что позволит вам форматировать значения. Вот пример:

df['Formatted'] = df['Value'].astype(str).str[:5]
print(df)

Выход:

     Value Formatted
0  3.14159      3.14
1  2.71828      2.71
2  1.41421      1.41

В этой статье мы рассмотрели различные методы форматирования чисел с плавающей запятой в Pandas. Мы рассмотрели такие методы, как округление, применение пользовательского форматирования, использование функции mapи преобразование в строки. Освоив эти методы, вы сможете легко добиться желаемого форматирования чисел с плавающей запятой в своих задачах анализа данных. Не забывайте экспериментировать с различными методами в зависимости от ваших конкретных требований. Приятного кодирования!