Если вы начинающий программист R или опытный аналитик данных, вы, вероятно, сталкивались с загадочным оператором «%in%». Поначалу это может показаться загадочным, но не бойтесь! В этой статье мы погрузимся в мир «%in%» и рассмотрим его многочисленные применения. Мы рассмотрим все: от проверки членства в векторе до подмножества фреймов данных. Так что пристегнитесь и приготовьтесь раскрыть всю мощь «%in%» в R!
Метод 1: базовое тестирование членства
Давайте начнем с самого фундаментального варианта использования «%in%»: проверки наличия элемента в векторе. Предположим, у нас есть вектор под названием «фрукты», содержащий различные названия фруктов:
fruits <- c("apple", "banana", "orange", "grape", "kiwi")
Чтобы проверить, присутствует ли «киви» в векторе, мы можем использовать оператор «%in%» следующим образом:
"kiwi" %in% fruits
Это вернет логическое значение TRUE, если присутствует «киви», и FALSEв противном случае.
Метод 2: подмножество кадров данных
Оператор «%in%» также можно использовать для подмножества кадров данных на основе определенных условий. Допустим, у нас есть фрейм данных под названием «студенты» со столбцами «имя» и «возраст». Мы хотим извлечь строки, в которых имена учеников — «Джон» или «Эмили». Вот как мы можем это сделать:
subset <- students[students$name %in% c("John", "Emily"), ]
При этом будет создан новый фрейм данных под названием «подмножество», содержащий только строки, имена которых соответствуют «Джон» или «Эмили».
Метод 3: фильтрация данных
Еще одно удобное применение «%in%» — фильтрация данных на основе определенного условия. Представьте, что у нас есть фрейм данных «продажи» со столбцом «продукт», содержащим разные названия продуктов. Мы хотим отфильтровать фрейм данных, чтобы включить только те строки, в которых продукт имеет значение «Apple» или «Orange». Вот как это можно сделать:
filtered_sales <- sales[sales$product %in% c("Apple", "Orange"), ]
При этом будет создан новый фрейм данных под названием «filtered_sales», который будет включать только строки, соответствующие указанным названиям продуктов.
Метод 4: удаление элементов
Иногда нам необходимо удалить определенные элементы из вектора. Здесь также может пригодиться оператор «%in%». Допустим, у нас есть вектор под названием «числа», содержащий целые числа от 1 до 10, и мы хотим удалить числа 3 и 7. Мы можем добиться этого, используя следующий код:
numbers <- 1:10
filtered_numbers <- numbers[!(numbers %in% c(3, 7))]
Полученный вектор filtered_numbers исключит элементы 3 и 7.
Оператор «%in%» в R — это мощный инструмент для проверки членства, разделения фреймов данных, фильтрации данных и удаления элементов. Используя этот оператор, вы можете повысить эффективность и читаемость своего кода. Так что давайте, попробуйте и раскройте магию «%in%» в своем путешествии по программированию на R!