Подсчет значений по столбцу в Pandas: методы и примеры

Чтобы подсчитать значения по столбцу в Pandas, вы можете использовать несколько методов. Вот несколько подходов:

  1. value_counts(): этот метод возвращает серию, содержащую количество уникальных значений в одном столбце. Его можно применить непосредственно к серии Pandas или столбцу DataFrame.
import pandas as pd
# Count values in a single column
df['column_name'].value_counts()
  1. groupby(): этот метод позволяет сгруппировать DataFrame по одному или нескольким столбцам, а затем применить функцию агрегирования, например count(), для подсчета вхождения.
import pandas as pd
# Group by a column and count values
df.groupby('column_name').size()
  1. crosstab(): эта функция вычисляет перекрестную таблицу двух или более факторов, обеспечивая подсчет частоты комбинаций факторов.
import pandas as pd
# Count values using cross-tabulation
pd.crosstab(index=df['column_name1'], columns=df['column_name2'])
  1. pivot_table(): этот метод создает сводную таблицу в виде электронной таблицы, позволяющую суммировать и агрегировать данные по столбцам и строкам.
import pandas as pd
# Create a pivot table to count values
df.pivot_table(index='column_name1', columns='column_name2', aggfunc='size')