Левые соединения — мощный инструмент анализа и манипулирования данными, позволяющий объединять наборы данных на основе общего ключевого столбца. Однако иногда нам нужно выбрать только определенные столбцы из правого набора данных в нашей операции левого соединения. В этой статье блога мы рассмотрим несколько методов пакета dplyr, которые позволяют нам выполнять левые соединения, сохраняя при этом только нужные столбцы. Мы будем использовать разговорный язык и приводить примеры кода, чтобы сделать концепции более понятными.
Метод 1: использование select() после левого соединения
Один простой подход — применить функцию select() из dplyr после выполнения левого соединения. Это позволяет нам выбирать столбцы, которые мы хотим сохранить из правильного набора данных. Вот пример:
library(dplyr)
result <- left_join(dataset1, dataset2) %>%
select(desired_col1, desired_col2)
Метод 2: использование аргумента select в функции left_join()
Функция left_join() dplyr также предоставляет аргумент select, который позволяет нам указать столбцы, которые необходимо сохранить из правого набора данных, непосредственно в операции соединения. Вот пример:
result <- left_join(dataset1, dataset2, select = c(desired_col1, desired_col2))
Метод 3: использование функции left_join() с сокращенной записью
dplyr предоставляет сокращенную запись для выполнения левых соединений с помощью оператора канала %>%. Это позволяет нам указать столбцы, которые следует сохранить из нужного набора данных, с помощью функции select() в операции соединения. Вот пример:
result <- dataset1 %>%
left_join(dataset2 %>% select(desired_col1, desired_col2))
Метод 4: использование функции rename_with()
Если вы хотите сохранить все столбцы из нужного набора данных, но переименовать их, вы можете использовать функцию rename_with() из dplyr. Этот метод позволяет выборочно переименовывать столбцы из правого набора данных при выполнении левого соединения. Вот пример:
result <- left_join(dataset1, dataset2) %>%
rename_with(~paste0("new_", .), starts_with("desired"))
В этой статье мы рассмотрели несколько методов выполнения левых соединений в dplyr при выборе определенных столбцов. Мы научились использовать функцию select() после левого соединения, указывать нужные столбцы непосредственно в функции left_join(), использовать сокращенную запись с помощью select() и переименовывать столбцы из правого набора данных с помощью функции rename_with(). Имея в своем распоряжении эти методы, вы можете эффективно манипулировать и анализировать данные, сохраняя при этом только те столбцы, которые вам нужны. Приятного кодирования!