Визуализация данных – это мощный инструмент для анализа и представления данных в визуально привлекательной форме. Одним из популярных типов визуализации является двойная гистограмма, которая позволяет нам сравнивать два набора данных рядом. В этой статье мы рассмотрим различные методы создания двойных гистограмм с использованием Matplotlib, широко используемой библиотеки Python для визуализации данных. Так что хватайте свое программирующее снаряжение и приступайте!
Метод 1: базовая двойная гистограмма
Для начала мы создадим базовую двойную гистограмму с помощью Matplotlib. Мы предполагаем, что вы уже установили Matplotlib и импортировали его в свою среду Python. Вот простой фрагмент кода, который поможет вам начать:
import matplotlib.pyplot as plt
# Data
categories = ['Category A', 'Category B', 'Category C', 'Category D']
values1 = [20, 35, 30, 25]
values2 = [15, 30, 40, 20]
# Plotting
plt.bar(categories, values1, label='Dataset 1')
plt.bar(categories, values2, label='Dataset 2')
# Labels and Legends
plt.xlabel('Categories')
plt.ylabel('Values')
plt.title('Double Bar Chart Example')
plt.legend()
# Display the chart
plt.show()
Метод 2: сгруппированная двойная гистограмма
В некоторых случаях вам может потребоваться сгруппировать столбцы каждого набора данных вместе для лучшего сравнения. Matplotlib предоставляет параметр widthдля управления шириной каждой полосы. Вот пример сгруппированной двойной гистограммы:
import numpy as np
# Data
categories = ['Category A', 'Category B', 'Category C', 'Category D']
values1 = [20, 35, 30, 25]
values2 = [15, 30, 40, 20]
# Plotting
bar_width = 0.35
index = np.arange(len(categories))
plt.bar(index, values1, bar_width, label='Dataset 1')
plt.bar(index + bar_width, values2, bar_width, label='Dataset 2')
# Labels and Legends
plt.xlabel('Categories')
plt.ylabel('Values')
plt.title('Grouped Double Bar Chart Example')
plt.xticks(index + bar_width/2, categories)
plt.legend()
# Display the chart
plt.show()
Метод 3: двойная гистограмма с накоплением
В других сценариях вам может потребоваться сложить столбцы каждого набора данных, чтобы отобразить общее значение. Этого можно добиться, используя параметр bottomв функции bar. Вот пример двойной гистограммы с накоплением:
# Data
categories = ['Category A', 'Category B', 'Category C', 'Category D']
values1 = [20, 35, 30, 25]
values2 = [15, 30, 40, 20]
# Plotting
plt.bar(categories, values1, label='Dataset 1')
plt.bar(categories, values2, bottom=values1, label='Dataset 2')
# Labels and Legends
plt.xlabel('Categories')
plt.ylabel('Values')
plt.title('Stacked Double Bar Chart Example')
plt.legend()
# Display the chart
plt.show()
В этой статье мы рассмотрели различные методы создания двойных гистограмм с использованием Matplotlib. Мы начали с базовой двойной гистограммы, а затем научились создавать сгруппированные и сложенные версии. Эти методы могут помочь вам эффективно визуализировать и сравнить два набора данных. Экспериментируйте с различными наборами данных и настраивайте диаграммы в соответствии со своими потребностями. Приятной визуализации!