Выполнение кумулятивной суммы для серии Pandas в Python: методы и примеры

“pd series cumsum” относится к операции совокупной суммы над объектом серии pandas в Python. Накопленная сумма вычисляет промежуточную сумму значений в серии.

Вот несколько методов выполнения операции накопительной суммы в серии pandas:

  1. Использование метода cumsum(): метод cumsum()вычисляет совокупную сумму элементов в ряду. Он возвращает новую серию той же длины, что и исходная, где каждый элемент представляет собой совокупную сумму до этой позиции.
import pandas as pd
# Create a sample series
series = pd.Series([1, 2, 3, 4, 5])
# Compute the cumulative sum
cumulative_sum = series.cumsum()
print(cumulative_sum)

Выход:

0    1
1    3
2    6
3   10
4   15
dtype: int64
  1. Использование функции numpy.cumsum(): поскольку объекты серии pandas создаются на основе массивов NumPy, вы также можете использовать функцию numpy.cumsum()для вычислить накопительную сумму. Сначала преобразуйте серию в массив NumPy, используя атрибут .values, а затем примените функцию numpy.cumsum().
import pandas as pd
import numpy as np
# Create a sample series
series = pd.Series([1, 2, 3, 4, 5])
# Compute the cumulative sum using numpy
cumulative_sum = np.cumsum(series.values)
print(cumulative_sum)

Выход:

[ 1  3  6 10 15]
  1. Использование метода cumulative_sum()из библиотек расширений pandas. Существует также несколько библиотек расширений pandas, таких как cudf и dask, которые предоставляют свои собственные реализации операции накопленной суммы. Эти библиотеки обеспечивают повышенную производительность и масштабируемость для больших наборов данных. Использование может варьироваться в зависимости от выбранной вами библиотеки.