Изучение Numpy: руководство для начинающих по гистограммам процентных данных

Гистограммы – это мощные инструменты визуализации, используемые для понимания распределения данных. В этой статье блога мы углубимся в numpy, популярную библиотеку Python для научных вычислений, и рассмотрим различные методы создания гистограмм, специально предназначенных для процентных данных в диапазоне от 0 до 100 процентов. Мы предоставим примеры кода и объясним каждый метод в разговорной форме. Итак, начнём!

Метод 1: np.histogram()
Функция np.histogram() — это универсальный метод, который позволяет нам создавать гистограммы на основе необработанных данных. Чтобы использовать его с процентными данными, нам необходимо убедиться, что данные находятся в диапазоне от 0 до 100. Вот пример:

import numpy as np
import matplotlib.pyplot as plt
# Generating random percentage data
data = np.random.uniform(0, 100, size=100)
# Creating a histogram
hist, bins = np.histogram(data, bins=10, range=(0, 100))
# Plotting the histogram
plt.hist(data, bins=10, range=(0, 100))
plt.xlabel('Percentage')
plt.ylabel('Frequency')
plt.title('Histogram of Percentage Data')
plt.show()

Метод 2: np.histogram_bin_edges()
Если вы предпочитаете управлять краями интервала вручную, вы можете использовать функцию np.histogram_bin_edges(). Этот метод позволяет вам определять пользовательские края ячейки в соответствии с вашими конкретными потребностями. Вот пример:

import numpy as np
import matplotlib.pyplot as plt
# Generating random percentage data
data = np.random.uniform(0, 100, size=100)
# Manually defining bin edges
bin_edges = np.arange(0, 101, 10)
# Creating a histogram
hist, bins = np.histogram(data, bins=bin_edges)
# Plotting the histogram
plt.hist(data, bins=bin_edges)
plt.xlabel('Percentage')
plt.ylabel('Frequency')
plt.title('Histogram of Percentage Data')
plt.show()

Метод 3: np.histogramdd()
Если вы работаете с многомерными процентными данными, np.histogramdd() может оказаться полезным. Этот метод позволяет создавать гистограммы в нескольких измерениях. Вот простой пример:

import numpy as np
import matplotlib.pyplot as plt
# Generating random two-dimensional percentage data
data = np.random.uniform(0, 100, size=(100, 2))
# Creating a two-dimensional histogram
hist, bins = np.histogramdd(data, bins=10, range=[(0, 100), (0, 100)])
# Plotting the histogram
plt.imshow(hist.T, origin='lower', extent=[0, 100, 0, 100], aspect='auto', cmap='viridis')
plt.xlabel('Percentage 1')
plt.ylabel('Percentage 2')
plt.title('Two-Dimensional Histogram of Percentage Data')
plt.colorbar(label='Frequency')
plt.show()

В этой статье мы рассмотрели три различных метода создания гистограмм процентных данных с помощью numpy. Мы использовали функцию np.histogram() для создания гистограммы из необработанных данных, np.histogram_bin_edges() для ручного определения границ пользовательского интервала и np.histogramdd() для создания многомерных гистограмм. С помощью этих методов вы можете эффективно визуализировать и анализировать процентные данные в диапазоне от 0 до 100 процентов. Удачного гистограммирования!