“Построение таблиц частот в R: анализ распределения данных”
При анализе данных таблицы частот являются полезным инструментом для понимания распределения категориальных переменных. Они дают представление о количестве наблюдений, попадающих в каждую категорию, и помогают выявить закономерности и тенденции в данных. В этой статье блога мы рассмотрим несколько методов построения таблиц частот в R, а также приведем примеры кода.
Метод 1: использование функции table()
Самый простой и понятный способ создать таблицу частот в R — использовать функцию table(). Эта функция принимает вектор или коэффициент в качестве входных данных и возвращает объект таблицы, содержащий количество каждого уникального значения.
# Example data
data <- c("A", "B", "C", "A", "A", "B", "C", "C", "C")
# Create frequency table
freq_table <- table(data)
# Print the frequency table
print(freq_table)
Выход:
data
A B C
3 2 4
Метод 2: использование пакета dplyr
Пакет dplyr предоставляет набор мощных функций для манипулирования данными, включая построение таблиц частот. Функцию count() из dplyr можно использовать для подсчета вхождений каждого значения в столбец.
library(dplyr)
# Example data frame
df <- data.frame(variable = c("A", "B", "C", "A", "A", "B", "C", "C", "C"))
# Create frequency table
freq_table <- df %>% count(variable)
# Print the frequency table
print(freq_table)
Выход:
variable n
1 A 3
2 B 2
3 C 4
Метод 3: применение функции summary()
Функция summary() в R предоставляет краткую сводку объектов данных, включая таблицы частот для факторов. Преобразовав переменную в коэффициент, мы можем использовать функцию summary() для получения таблицы частот.
# Example data
data <- c("A", "B", "C", "A", "A", "B", "C", "C", "C")
# Convert to factor
data <- factor(data)
# Create frequency table using summary()
freq_table <- summary(data)
# Print the frequency table
print(freq_table)
Выход:
A B C
3 2 4
Метод 4: использование пакета janitor
Пакет janitor предоставляет функции, упрощающие очистку данных и табулирование. Функция tabyl() в janitor позволяет нам создавать таблицы частот с дополнительными опциями, такими как расчет пропорций и процентов.
library(janitor)
# Example data frame
df <- data.frame(variable = c("A", "B", "C", "A", "A", "B", "C", "C", "C"))
# Create frequency table with proportions
freq_table <- df %>% tabyl(variable, show_missing = FALSE, percent = TRUE)
# Print the frequency table
print(freq_table)
Выход:
variable percent
A 33.33
B 22.22
C 44.44
Таблицы частот необходимы для анализа распределения категориальных переменных. В этой статье мы рассмотрели четыре различных метода построения таблиц частот в R. Используя функцию table(), пакет dplyr, функцию summary() или пакет janitor, вы можете легко создавать таблицы частот и получать представление о своих данные.