“pd series cumsum” относится к операции совокупной суммы над объектом серии pandas в Python. Накопленная сумма вычисляет промежуточную сумму значений в серии.
Вот несколько методов выполнения операции накопительной суммы в серии pandas:
- Использование метода
cumsum(): методcumsum()вычисляет совокупную сумму элементов в ряду. Он возвращает новую серию той же длины, что и исходная, где каждый элемент представляет собой совокупную сумму до этой позиции.
import pandas as pd
# Create a sample series
series = pd.Series([1, 2, 3, 4, 5])
# Compute the cumulative sum
cumulative_sum = series.cumsum()
print(cumulative_sum)
Выход:
0 1
1 3
2 6
3 10
4 15
dtype: int64
- Использование функции
numpy.cumsum(): поскольку объекты серии pandas создаются на основе массивов NumPy, вы также можете использовать функциюnumpy.cumsum()для вычислить накопительную сумму. Сначала преобразуйте серию в массив NumPy, используя атрибут.values, а затем примените функциюnumpy.cumsum().
import pandas as pd
import numpy as np
# Create a sample series
series = pd.Series([1, 2, 3, 4, 5])
# Compute the cumulative sum using numpy
cumulative_sum = np.cumsum(series.values)
print(cumulative_sum)
Выход:
[ 1 3 6 10 15]
- Использование метода
cumulative_sum()из библиотек расширений pandas. Существует также несколько библиотек расширений pandas, таких как cudf и dask, которые предоставляют свои собственные реализации операции накопленной суммы. Эти библиотеки обеспечивают повышенную производительность и масштабируемость для больших наборов данных. Использование может варьироваться в зависимости от выбранной вами библиотеки.