Чтобы создать подборки в pandas без указания диапазона, вы можете использовать несколько методов. Вот несколько вариантов:
-
Биннинг одинаковой ширины:
- Используйте функцию
cutс нужным количеством ячеек. Pandas автоматически разделит данные на интервалы одинаковой ширины.
Пример:pd.cut(data, bins=5)
- Используйте функцию
-
Биннинг по равной частоте:
- Используйте функцию
qcutвместоcut. Он делит данные на ячейки примерно одинакового размера, обеспечивая одинаковое количество точек данных в каждой ячейке.
Пример:pd.qcut(data, q=5)
уль>
- Используйте функцию
-
Пользовательское группирование:
- Если вы имеете в виду конкретные границы интервалов, вы можете создавать собственные интервалы с помощью функции
cutи передачи списка краев интервалов.
Пример:pd.cut (data, bins=[0, 10, 20, 30, 40])
- Если вы имеете в виду конкретные границы интервалов, вы можете создавать собственные интервалы с помощью функции
-
Квантильное группирование:
- Вы можете создавать интервалы на основе квантилей, которые делят данные на равные части. Используйте функцию
cutи укажите нужные квантили в качестве количества интервалов.
Пример:pd.cut(data, bins=4, labels=False)
- Вы можете создавать интервалы на основе квантилей, которые делят данные на равные части. Используйте функцию
-
Бинсы на основе описательной статистики:
- Используйте описательную статистику данных для динамического создания подборок. Например, вы можете рассчитать среднее и стандартное отклонение и создать интервалы на основе кратного стандартного отклонения от среднего значения.