Линейная регрессия – это фундаментальный статистический метод, используемый для понимания и анализа взаимосвязей между переменными. В этой статье блога мы исследуем мир линейной регрессии на языке программирования R. Мы познакомим вас с концепциями, предоставим примеры кода и поделимся несколькими методами выполнения линейного регрессионного анализа. Итак, пейте свой любимый напиток и давайте окунемся в увлекательный мир линейной регрессии в R!
- Простая линейная регрессия.
Давайте начнем с самой простой формы линейной регрессии, известной как простая линейная регрессия. Он предполагает установление линейной связи между двумя переменными: одной независимой переменной (предиктором) и одной зависимой переменной (реакцией). Цель состоит в том, чтобы найти наиболее подходящую линию, отражающую взаимосвязь между этими переменными. В R мы можем использовать функциюlm()
для выполнения простой линейной регрессии. Вот пример:
# Load necessary libraries
library(ggplot2)
# Create a data frame
data <- data.frame(x = c(1, 2, 3, 4, 5), y = c(2, 4, 6, 8, 10))
# Perform simple linear regression
model <- lm(y ~ x, data = data)
# Plot the regression line
ggplot(data, aes(x, y)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
- Множественная линейная регрессия:
Когда на зависимую переменную влияет более одной независимой переменной, мы используем множественную линейную регрессию. Это позволяет нам анализировать коллективное влияние нескольких предикторов на переменную ответа. Функциюlm()
также можно использовать для множественной линейной регрессии. Вот пример:
# Create a data frame
data <- data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(2, 4, 6, 8, 10),
y = c(3, 5, 7, 9, 11))
# Perform multiple linear regression
model <- lm(y ~ x1 + x2, data = data)
# Print the model summary
summary(model)
- Полиномиальная регрессия:
В некоторых случаях взаимосвязь между переменными лучше отражается полиномиальной функцией, а не прямой линией. Полиномиальная регрессия позволяет нам подогнать к данным изогнутые линии. В R мы можем использовать функциюpoly()
для генерации полиномиальных членов. Вот пример:
# Create a data frame
data <- data.frame(x = c(1, 2, 3, 4, 5), y = c(1, 4, 9, 16, 25))
# Perform polynomial regression
model <- lm(y ~ poly(x, degree = 2), data = data)
# Plot the regression curve
ggplot(data, aes(x, y)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
- Взвешенная линейная регрессия.
Иногда одни наблюдения имеют больший вес или важность, чем другие. Взвешенная линейная регрессия позволяет нам присваивать разные веса каждой точке данных в зависимости от ее значимости. В R мы можем использовать функциюlm()
с аргументомweights
. Вот пример:
# Create a data frame
data <- data.frame(x = c(1, 2, 3, 4, 5), y = c(2, 4, 6, 8, 10))
weights <- c(0.1, 0.2, 0.3, 0.4, 0.5)
# Perform weighted linear regression
model <- lm(y ~ x, data = data, weights = weights)
# Print the model summary
summary(model)
Линейная регрессия — мощный инструмент для понимания и прогнозирования взаимосвязей между переменными. В этой статье мы рассмотрели простую линейную регрессию, множественную линейную регрессию, полиномиальную регрессию и взвешенную линейную регрессию в R. Используя эти методы, вы можете получить ценную информацию из своих данных и принять обоснованные решения. Так что вперед, раскройте возможности линейной регрессии с помощью R и откройте мир возможностей в своем путешествии по анализу данных!