Комплексное руководство по случайному выбору и удалению индекса в Pandas

Pandas – это популярная библиотека анализа данных на Python, предоставляющая мощные инструменты для манипулирования и анализа структурированных данных. Одной из распространенных задач является случайный выбор и удаление индексов из DataFrame или Series. В этой статье мы рассмотрим различные методы достижения этой цели, а также приведем примеры кода.

Метод 1: использование функции sample()
Функция sample()в pandas позволяет нам случайным образом выбирать строки или столбцы из DataFrame или Series. Чтобы случайным образом выбрать и удалить индекс, мы можем объединить sample()с функцией drop(). Вот пример:

import pandas as pd
# Create a sample DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# Randomly pick and remove an index
index_to_remove = df.sample().index
df.drop(index_to_remove, inplace=True)
print(df)

Выход:

   A   B
0  1   6
2  3   8
3  4   9
4  5  10

Метод 2: использование функции random.choice()NumPy.
Другой подход — использовать функцию random.choice()из библиотеки NumPy. Этот метод позволяет нам случайным образом выбирать индексы и удалять их с помощью логической индексации. Вот пример:

import pandas as pd
import numpy as np
# Create a sample DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# Randomly pick and remove an index
indices = np.random.choice(df.index, size=2, replace=False)
df = df[~df.index.isin(indices)]
print(df)

Выход:

   A   B
0  1   6
3  4   9
4  5  10

Метод 3: использование функции random.sample()
Функция random.sample()из стандартной библиотеки Python также может использоваться для случайного выбора индексов и их удаления. Вот пример:

import pandas as pd
import random
# Create a sample DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# Randomly pick and remove an index
indices = random.sample(df.index.tolist(), k=2)
df = df.drop(indices)
print(df)

Выход:

   A   B
0  1   6
2  3   8
4  5  10

В этой статье мы рассмотрели три различных метода случайного выбора и удаления индексов в pandas. Используя функцию sample(), функцию random.choice()NumPy или функцию random.sample(), вы можете легко решить эту задачу в своих проектах анализа данных. Не забудьте настроить код в соответствии с вашими конкретными требованиями и набором данных. Приятного кодирования!