В этой статье блога мы рассмотрим, как улучшить визуализацию данных с помощью ggplot2, и уделим особое внимание добавлению еще одного «цветового» условия для джиттера с помощью ggboxplot. Если вы программист на R и хотите повысить уровень своей игры по визуализации данных, это руководство для вас!
Что такое ggplot2 и ggboxplot?
Прежде чем углубляться в детали, давайте быстро познакомимся с ggplot2 и ggboxplot. ggplot2 — это мощный пакет R для создания потрясающих и настраиваемых визуализаций данных. Он следует грамматике графического подхода, позволяя строить сложные графики слой за слоем. ggboxplot — это расширение ggplot2, которое специализируется на создании коробчатых диаграмм с дополнительными функциями и возможностями настройки.
Начало работы.
Для начала убедитесь, что в вашей среде R установлены пакеты ggplot2 и ggpubr. Вы можете установить их, используя следующий код:
install.packages("ggplot2")
install.packages("ggpubr")
После установки пакетов загрузите их в сеанс R:
library(ggplot2)
library(ggpubr)
Создание базового графика ggboxplot:
Давайте начнем с создания базового графика ggboxplot с одним условием «цвет». Для этого примера мы будем использовать встроенный набор данных «ToothGrowth», который содержит данные о влиянии витамина С на рост зубов у морских свинок.
data(ToothGrowth)
ggboxplot(ToothGrowth, x = "dose", y = "len", color = "dose",
palette = c("#F8766D", "#00BFC4", "#00BA38"),
add = "jitter")
В приведенном выше коде мы указываем набор данных ToothGrowthи сопоставляем переменную «доза» с осью X и «len» с осью Y. Для параметра «color» установлено значение «dose», что означает, что коробчатые диаграммы будут окрашены в зависимости от различных значений переменной «dose». Аргумент paletteопределяет цветовую схему коробчатых диаграмм. Для параметра addустановлено значение «дрожание», которое добавляет к коробчатым диаграммам точки с дрожанием для лучшей визуализации.
Добавление еще одного условия «цвета»:
Чтобы добавить еще одно условие «цвета» к дрожащим точкам, мы можем использовать параметр «group» в ggboxplot. Предположим, у нас есть еще одна переменная под названием «supp» в наборе данных ToothGrowth, представляющая два разных типа добавок: «VC» и «OJ». Мы раскрасим дрожащие точки на основе переменных «доза» и «супп».
ggboxplot(ToothGrowth, x = "dose", y = "len", color = c("dose", "supp"),
palette = "Set2", add = "jitter")
В обновленном коде мы установили параметр «color» в вектор, содержащий «dose» и «supp». Мы используем палитру Set2, чтобы обеспечить визуально привлекательный выбор цветов.
В этой статье мы рассмотрели, как улучшить визуализацию ggboxplot, добавив еще одно «цветное» условие. Включив параметр «группа» и указав несколько переменных, мы смогли создать более информативные и визуально привлекательные графики. Используя эти методы в своем наборе инструментов, вы сможете повысить уровень визуализации данных в R.
Не забывайте экспериментировать с различными цветовыми палитрами и параметрами настройки, чтобы создавать потрясающие графики, которые эффективно передают ваши данные.
Удачного заговора!