Ковариация с тепловой картой: методы и примеры кода для визуализации связей в наборе данных

«Ковариация с тепловой картой» относится к процессу визуализации ковариационной матрицы набора данных с помощью тепловой карты. Ковариационная матрица дает ценную информацию о взаимосвязях между различными переменными в наборе данных. Вот несколько методов расчета ковариационной матрицы и создания тепловой карты, а также примеры кода:

Метод 1: использование NumPy и Matplotlib в Python

import numpy as np
import matplotlib.pyplot as plt
# Create a random dataset
data = np.random.rand(100, 5)  # 100 samples with 5 variables
# Calculate the covariance matrix
cov_matrix = np.cov(data, rowvar=False)
# Create a heatmap using Matplotlib
plt.imshow(cov_matrix, cmap='hot', interpolation='nearest')
plt.colorbar()
plt.show()

Метод 2: использование Pandas и Seaborn в Python

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Create a pandas DataFrame
data = pd.DataFrame(np.random.rand(100, 5), columns=['Var1', 'Var2', 'Var3', 'Var4', 'Var5'])
# Calculate the covariance matrix
cov_matrix = data.cov()
# Create a heatmap using Seaborn
plt.figure(figsize=(8, 6))
sns.heatmap(cov_matrix, annot=True, cmap='coolwarm')
plt.show()

Метод 3: использование R

# Create a random dataset
data <- matrix(runif(100 * 5), ncol = 5)
# Calculate the covariance matrix
cov_matrix <- cov(data)
# Create a heatmap using the "heatmap" function in R
heatmap(cov_matrix, col = heat.colors(256))

Эти методы демонстрируют, как рассчитать ковариационную матрицу и визуализировать ее в виде тепловой карты с использованием разных языков программирования. Полученные тепловые карты помогают выявить закономерности и взаимосвязи между переменными в наборе данных.