Изучение визуализации данных с помощью гистограммы Matplotlib: подробное руководство

Визуализация данных — важный компонент анализа данных, позволяющий нам получать ценную информацию и принимать обоснованные решения. Matplotlib, популярная библиотека Python, предоставляет широкий набор инструментов для создания визуально привлекательных и информативных графиков. В этой статье мы сосредоточимся на одном из фундаментальных типов графиков Matplotlib — гистограмме. Мы рассмотрим различные методы создания и настройки гистограмм с помощью Matplotlib, сопровождаемые примерами кода.

  1. Базовая гистограмма.
    Давайте начнем с создания базовой гистограммы с помощью функции pyplot.hist()Matplotlib. Эта функция принимает набор данных в качестве входных данных и автоматически вычисляет границы интервала и частоты.
import matplotlib.pyplot as plt
data = [1, 2, 3, 3, 4, 4, 4, 5, 5, 6, 7, 8, 8, 9]
plt.hist(data)
plt.show()
  1. Настройка размера и цвета ячеек.
    Вы можете контролировать количество ячеек и их размер на гистограмме, чтобы настроить уровень детализации. Кроме того, вы можете указать цвет полос с помощью параметров bins, rangeи color.
plt.hist(data, bins=5, range=(0, 10), color='skyblue')
plt.show()
  1. Добавление заголовков и меток.
    Чтобы улучшить читаемость гистограммы, важно предоставить соответствующие заголовки и метки. Matplotlib позволяет добавлять заголовок, метку оси X и метку оси Y, используя функции plt.title(), plt.xlabel()и plt.ylabel()соответственно..
plt.hist(data)
plt.title("Histogram of Data")
plt.xlabel("Values")
plt.ylabel("Frequency")
plt.show()
  1. Сложенные гистограммы.
    В случаях, когда вы хотите сравнить несколько наборов данных, вы можете создать составные гистограммы. Этого можно добиться, предоставив список наборов данных функции plt.hist().
dataset1 = [1, 2, 3, 3, 4, 4, 4]
dataset2 = [5, 5, 6, 7, 8, 8, 9]
plt.hist([dataset1, dataset2], bins=5, label=['Dataset 1', 'Dataset 2'])
plt.legend()
plt.show()
  1. Гистограмма с графиком плотности.
    Вы можете наложить график плотности поверх гистограммы, чтобы визуализировать распределение данных более плавно. Это можно сделать с помощью параметра density=True.
plt.hist(data, bins=5, density=True, alpha=0.7)
plt.show()

Используя возможности гистограмм Matplotlib, вы можете улучшить анализ данных и получить ценную информацию. Поэкспериментируйте с предоставленными примерами кода, чтобы создать визуально привлекательные и информативные гистограммы, соответствующие вашим конкретным потребностям.