Руководство по повторной выборке данных временных рядов с помощью Pandas: методы и использование - Fcodenotes

Pandas — мощная библиотека манипулирования данными на Python. Функция «resample» в pandas используется для повторной выборки данных временных рядов. Он позволяет вам изменять частоту данных временных рядов, например преобразовывать ежедневные данные в ежемесячные или понижать дискретизацию данных с более высокой частоты на более низкую.

Функция повторной выборки pandas предоставляет различные методы, которые можно применять в процессе повторной выборки. Некоторые из часто используемых методов:

“asfreq”: этот метод выбирает определенную частоту для передискретизированных данных и заполняет все недостающие значения NaN.
“bfill” или “backfill”: этот метод заполняет пропущенные значения, используя следующее допустимое наблюдение.
“ffill” или “pad”: этот метод заполняет пропущенные значения, используя предыдущее действительное наблюдение.
“mean”: этот метод вычисляет среднее значение повторно взятых данных.
“sum”: этот метод вычисляет сумму повторно дискретизированных данных.
“max”: этот метод вычисляет максимальное значение передискретизированных данных.
“min”: этот метод вычисляет минимальное значение передискретизированных данных.
“медиана”: этот метод вычисляет медиану повторно взятых данных.
“ohlc”: этот метод вычисляет значения открытия, максимума, минимума и закрытия повторно взятых данных, обычно используемые в анализе финансовых данных.

Это всего лишь несколько примеров методов, доступных в pandas resample. Выбор метода зависит от ваших конкретных требований к анализу данных.