Как заменить значения NaN средним значением в Pandas DataFrame: методы и примеры - Fcodenotes

Чтобы заменить пропущенные значения (NaN) средним значением в DataFrame pandas, вы можете использовать несколько методов. Вот несколько вариантов:

Метод 1. Использование метода fillna() со значением mean()

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
                   'B': [np.nan, 2, 3, np.nan, 6]})
# Replace NaN values with the mean for each column
df_filled = df.fillna(df.mean())
print(df_filled)

Метод 2. Использование метода fillna() для определенных значений столбца

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
                   'B': [np.nan, 2, 3, np.nan, 6]})
# Calculate column means
column_means = df.mean()
# Replace NaN values with column means
df_filled = df.fillna(column_means)
print(df_filled)

Метод 3. Использование метода fillna() с сопоставлением словаря

import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
                   'B': [np.nan, 2, 3, np.nan, 6]})
# Replace NaN values with column means using dictionary mapping
df_filled = df.fillna({'A': df['A'].mean(), 'B': df['B'].mean()})
print(df_filled)

Эти методы заменят значения NaN в DataFrame средним значением каждого соответствующего столбца.