В статистическом анализе доверительные интервалы имеют решающее значение для оценки диапазона значений, в который может попасть параметр совокупности. Одним из эффективных способов визуализации доверительных интервалов является использование популярного пакета R ggplot2. В этой статье мы рассмотрим различные методы создания среднецентрированных доверительных интервалов с помощью ggplot2, а также приведем примеры кода для каждого метода.
Метод 1: панели ошибок с помощью geom_errorbar
Функция geom_errorbar в ggplot2 позволяет нам добавлять панели ошибок к нашему графику для представления доверительных интервалов. Вот пример фрагмента кода:
library(ggplot2)
# Create a basic scatter plot
data <- data.frame(x = 1:5, y = c(2, 4, 6, 8, 10))
# Calculate mean and standard deviation
mean_y <- mean(data$y)
sd_y <- sd(data$y)
# Create the plot with error bars
ggplot(data, aes(x = x, y = y)) +
geom_point() +
geom_errorbar(ymin = mean_y - 1.96 * sd_y, ymax = mean_y + 1.96 * sd_y, width = 0.2)
Метод 2: доверительные интервалы с помощью geom_smooth
Другой подход заключается в использовании функции geom_smooth, которая подбирает плавную кривую по данным и отображает вокруг нее доверительный интервал. Вот пример фрагмента кода:
# Create a basic scatter plot
data <- data.frame(x = 1:5, y = c(2, 4, 6, 8, 10))
# Create the plot with confidence intervals
ggplot(data, aes(x = x, y = y)) +
geom_point() +
geom_smooth(method = "lm", se = TRUE)
Метод 3: коробчатые диаграммы с geom_boxplot
Если у вас есть категориальные данные, вы можете использовать коробчатые диаграммы для визуализации распределения значений вместе с доверительными интервалами. Вот пример фрагмента кода:
# Create a basic boxplot
data <- data.frame(category = rep(c("A", "B", "C"), each = 20),
value = rnorm(60, mean = 0, sd = 1))
# Create the plot with boxplots and confidence intervals
ggplot(data, aes(x = category, y = value)) +
geom_boxplot() +
geom_errorbar(stat = "summary", fun.data = mean_cl_normal, width = 0.2)
В этой статье мы рассмотрели три различных метода визуализации доверительных интервалов в ggplot2: использование столбцов ошибок, сглаживание кривых с помощью доверительных интервалов и включение доверительных интервалов в коробчатые диаграммы. Эти методы дают ценную информацию о неопределенности, связанной с оценочными значениями. Используя возможности ggplot2, вы можете создавать визуально привлекательные и информативные графики, которые эффективно отражают неопределенность ваших данных.