Визуализация данных в Python: изучение Seaborn и Matplotlib

Визуализация данных – важный аспект анализа данных и рассказывания историй. Python предоставляет мощные библиотеки, такие как Seaborn и Matplotlib, которые позволяют пользователям создавать визуально привлекательные и информативные диаграммы, графики и графики. В этой статье мы рассмотрим различные методы и примеры кода с использованием Seaborn и Matplotlib, которые помогут улучшить ваши навыки визуализации данных.

  1. Линейный график.
    Линейный график идеально подходит для отображения тенденций с течением времени или непрерывных точек данных.
import matplotlib.pyplot as plt
import seaborn as sns
# Sample data
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
# Matplotlib line plot
plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Line Plot')
plt.show()
# Seaborn line plot
sns.lineplot(x=x, y=y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Line Plot')
plt.show()
  1. Гистограмма.
    Гистограммы полезны для сравнения категориальных данных или отображения частот.
import matplotlib.pyplot as plt
import seaborn as sns
# Sample data
x = ['A', 'B', 'C', 'D']
y = [10, 25, 15, 20]
# Matplotlib bar plot
plt.bar(x, y)
plt.xlabel('Categories')
plt.ylabel('Frequency')
plt.title('Bar Plot')
plt.show()
# Seaborn bar plot
sns.barplot(x=x, y=y)
plt.xlabel('Categories')
plt.ylabel('Frequency')
plt.title('Bar Plot')
plt.show()
  1. Точечная диаграмма.
    Точечная диаграмма помогает визуализировать взаимосвязь между двумя непрерывными переменными.
import matplotlib.pyplot as plt
import seaborn as sns
# Sample data
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
# Matplotlib scatter plot
plt.scatter(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Scatter Plot')
plt.show()
# Seaborn scatter plot
sns.scatterplot(x=x, y=y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Scatter Plot')
plt.show()
  1. Гистограмма.
    Гистограммы отображают распределение одной переменной.
import matplotlib.pyplot as plt
import seaborn as sns
# Sample data
data = [1, 2, 2, 3, 3, 3, 4, 4, 5]
# Matplotlib histogram
plt.hist(data)
plt.xlabel('Values')
plt.ylabel('Frequency')
plt.title('Histogram')
plt.show()
# Seaborn histogram
sns.histplot(data)
plt.xlabel('Values')
plt.ylabel('Frequency')
plt.title('Histogram')
plt.show()
  1. Тепловая карта.
    Тепловые карты полезны для визуализации матриц или корреляционных матриц.
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# Sample data
data = np.random.rand(5, 5)
# Matplotlib heatmap
plt.imshow(data, cmap='hot')
plt.colorbar()
plt.title('Heatmap')
plt.show()
# Seaborn heatmap
sns.heatmap(data, cmap='hot', annot=True)
plt.title('Heatmap')
plt.show()

Python предлагает мощные библиотеки, такие как Seaborn и Matplotlib, для визуализации данных. В этой статье мы рассмотрели различные методы и предоставили примеры кода для создания линейных графиков, гистограмм, диаграмм рассеяния, гистограмм и тепловых карт с использованием Seaborn и Matplotlib. Овладев этими методами визуализации, вы сможете эффективно передавать ценную информацию из своих данных.