Группировка и подсчет строк в R: подробное руководство

В R существует несколько методов группировки данных и подсчета количества строк в каждой группе. Вот некоторые часто используемые подходы:

  1. База R с aggregate():

    result <- aggregate(. ~ group_var, data = your_data, FUN = length)
  2. База R с table():

    result <- table(your_data$group_var)
  3. База R с tapply():

    result <- tapply(your_data$group_var, your_data$group_var, FUN = length)
  4. База R с by():

    result <- by(your_data$group_var, your_data$group_var, FUN = length)
  5. Пакет dplyr:

    library(dplyr)
    result <- your_data %>% group_by(group_var) %>% summarise(count = n())
  6. Пакет data.table:

    library(data.table)
    your_data <- data.table(your_data)
    result <- your_data[, .(count = .N), by = group_var]
  7. Пакет plyr:

    library(plyr)
    result <- ddply(your_data, .(group_var), summarise, count = length(group_var))