Методы возврата индексов ячеек: NumPy, Pandas, Python Bisect и пользовательская реализация

Чтобы вернуть индексы бинов, вы можете рассмотреть следующие методы:

  1. Функция digitize()NumPy: эта функция присваивает каждый элемент входного массива соответствующему интервалу на основе заданных краев интервала. Он возвращает массив индексов, указывающий размещение каждого элемента в ячейке.

  2. Функция cut()Pandas: эту функцию можно использовать для сегментации и сортировки данных по ячейкам. Указывая края интервала, он присваивает метки каждому интервалу и возвращает категориальный объект с индексами интервалов.

  3. Встроенный модуль Python bisect: этот модуль предоставляет функции bisect()и bisect_left(), которые можно используется для поиска точек вставки элементов в отсортированном списке. Применяя эти функции к краям интервалов, вы можете получить индексы интервалов.

  4. Пользовательская реализация: вы можете вручную перебирать края интервала и сравнивать их с каждым элементом, чтобы определить индекс интервала. Используя цикл или понимание списка, вы можете собирать индексы ячеек.