Итак, вы решили окунуться в увлекательный мир машинного обучения, но не знаете, с чего начать. Не волнуйтесь, мы вас прикроем! В этом руководстве для начинающих мы познакомим вас с несколькими методами написания вашей первой программы машинного обучения с использованием Python. Мы будем поддерживать разговор, объясняя концепции простыми словами и попутно предоставляя примеры кода. Давайте начнем!
Метод 1: линейная регрессия
Линейная регрессия — отличная отправная точка для понимания основ машинного обучения. Это простой, но мощный алгоритм, который прогнозирует непрерывный результат на основе входных функций. Вот как это можно реализовать:
# Import the necessary libraries
import numpy as np
from sklearn.linear_model import LinearRegression
# Create your dataset
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([2, 4, 6, 8, 10])
# Create and train the model
model = LinearRegression()
model.fit(X, y)
# Predict a new value
new_X = np.array([[6]])
predicted_y = model.predict(new_X)
print(predicted_y) # Output: [12.]
Метод 2: K-ближайшие соседи (KNN)
KNN — это простой и интуитивно понятный алгоритм, который классифицирует новые точки данных на основе большинства голосов их k ближайших соседей. Вот пример:
# Import the necessary libraries
from sklearn.neighbors import KNeighborsClassifier
# Create your dataset
X = [[2.7810836, 2.550537003], [1.465489372, 2.362125076], [3.396561688, 4.400293529], [1.38807019, 1.850220317],
[3.06407232, 3.005305973], [7.627531214, 2.759262235], [5.332441248, 2.088626775], [6.922596716, 1.77106367],
[8.675418651, -0.242068655], [7.673756466, 3.508563011]]
y = [0, 0, 0, 0, 0, 1, 1, 1, 1, 1]
# Create and train the model
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X, y)
# Predict a new value
new_X = [[3.0, 2.5]]
predicted_y = model.predict(new_X)
print(predicted_y) # Output: [0]
Метод 3: Деревья решений
Деревья решений — это универсальные алгоритмы, которые можно использовать как для задач классификации, так и для регрессии. Они создают модель, которая прогнозирует значение целевой переменной на основе значений признаков. Вот пример:
# Import the necessary libraries
from sklearn.tree import DecisionTreeClassifier
# Create your dataset
X = [[5.1, 3.5, 1.4, 0.2], [4.9, 3.0, 1.4, 0.2], [6.2, 3.4, 5.4, 2.3], [5.9, 3.0, 5.1, 1.8]]
y = [0, 0, 1, 1]
# Create and train the model
model = DecisionTreeClassifier()
model.fit(X, y)
# Predict a new value
new_X = [[5.5, 2.3, 4.0, 1.3]]
predicted_y = model.predict(new_X)
print(predicted_y) # Output: [1]
Поздравляем! Вы узнали три разных метода написания своей первой программы в области машинного обучения. Линейная регрессия, K-ближайшие соседи и деревья решений — отличная отправная точка для понимания основ. Не забывайте практиковаться, изучать больше алгоритмов и экспериментировать с различными наборами данных, чтобы углубить свои знания. Приятного кодирования!