Как заполнить значения NaN во всех столбцах средними значениями: методы в Python, R, SQL и Excel

Чтобы заполнить пропущенные значения (NaN) во всех столбцах их средними значениями, вы можете использовать различные методы на разных языках программирования. Вот несколько примеров:

Python (Панды):

import pandas as pd
# Assuming your data is stored in a DataFrame called 'df'
df = df.fillna(df.mean())

Р:

# Assuming your data is stored in a data frame called 'df'
df <- sapply(df, function(x) ifelse(is.na(x), mean(x, na.rm = TRUE), x))

SQL (MySQL):

-- Assuming your table is called 'your_table' and each column has a corresponding mean column
UPDATE your_table
SET column1 = COALESCE(column1, (SELECT AVG(column1) FROM your_table)),
    column2 = COALESCE(column2, (SELECT AVG(column2) FROM your_table)),
    ...

Excel (с использованием формул):

  1. Вставьте новый столбец рядом с каждым столбцом с пропущенными значениями.
  2. Используйте формулу =IF(ISBLANK(A1), AVERAGE(A:A), A1)в новом столбце, предполагая, что столбец A содержит данные.
  3. Перетащите формулу вниз, чтобы заполнить все ячейки.
  4. Скопируйте значения из нового столбца и вставьте их в исходный столбец.