Чтобы заменить пропущенные значения (NaN) средним значением в DataFrame pandas, вы можете использовать несколько методов. Вот несколько вариантов:
Метод 1. Использование метода fillna() со значением mean()
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
'B': [np.nan, 2, 3, np.nan, 6]})
# Replace NaN values with the mean for each column
df_filled = df.fillna(df.mean())
print(df_filled)
Метод 2. Использование метода fillna() для определенных значений столбца
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
'B': [np.nan, 2, 3, np.nan, 6]})
# Calculate column means
column_means = df.mean()
# Replace NaN values with column means
df_filled = df.fillna(column_means)
print(df_filled)
Метод 3. Использование метода fillna() с сопоставлением словаря
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5],
'B': [np.nan, 2, 3, np.nan, 6]})
# Replace NaN values with column means using dictionary mapping
df_filled = df.fillna({'A': df['A'].mean(), 'B': df['B'].mean()})
print(df_filled)
Эти методы заменят значения NaN в DataFrame средним значением каждого соответствующего столбца.