Освоение манипулирования данными: преобразование серии Pandas в массив NumPy

Pandas и NumPy — две популярные библиотеки в экосистеме Python, которые широко используются для манипулирования и анализа данных. В то время как Pandas предоставляет структуры данных высокого уровня, такие как Series и DataFrame, NumPy предлагает мощные возможности числовых вычислений. В определенных сценариях вам может потребоваться преобразовать серию Pandas в массив NumPy. В этой статье мы рассмотрим несколько методов решения этой задачи, а также приведем примеры кода.

Метод 1: использование атрибута values
Один простой способ преобразовать серию Pandas в массив NumPy — использовать атрибут valuesобъекта Series. Атрибут valuesвозвращает базовые данные в виде массива NumPy. Вот пример:

import pandas as pd
import numpy as np
# Creating a Pandas Series
series = pd.Series([1, 2, 3, 4, 5])
# Converting the Series to a NumPy array
numpy_array = series.values
print(numpy_array)

Выход:

[1 2 3 4 5]

Метод 2: использование метода to_numpy()
Начиная с версии Pandas 0.24 доступен специальный метод to_numpy()для преобразования серии в массив NumPy. Этот метод обеспечивает более явный способ достижения преобразования. Вот пример:

import pandas as pd
import numpy as np
series = pd.Series([1, 2, 3, 4, 5])
numpy_array = series.to_numpy()
print(numpy_array)

Выход:

[1 2 3 4 5]

Метод 3: приведение типов серии
Другой подход к преобразованию серии Pandas в массив NumPy – преобразование серии в массив NumPy с помощью функции np.array(). Этот метод позволяет указать желаемый тип данных для результирующего массива. Вот пример:

import pandas as pd
import numpy as np
series = pd.Series([1, 2, 3, 4, 5])
numpy_array = np.array(series)
print(numpy_array)

Выход:

[1 2 3 4 5]

Метод 4: использование метода astype()
Метод astype()в Pandas можно использовать для преобразования типа данных серии. Если указать np.ndarrayв качестве желаемого типа данных, серия фактически преобразуется в массив NumPy. Вот пример:

import pandas as pd
import numpy as np
series = pd.Series([1, 2, 3, 4, 5])
numpy_array = series.astype(np.ndarray)
print(numpy_array)

Выход:

[1 2 3 4 5]

В этой статье мы рассмотрели несколько методов преобразования серии Pandas в массив NumPy. Мы рассмотрели использование атрибута values, метода to_numpy(), приведения типов и метода astype(). В зависимости от вашего конкретного случая использования вы можете выбрать метод, который лучше всего соответствует вашим потребностям. Используя эти методы, вы можете легко переключаться между Pandas и NumPy, раскрывая весь потенциал обеих библиотек в рабочих процессах манипулирования данными.

Не забудьте выбрать метод, который лучше всего соответствует требованиям вашего проекта и совместимости версий. Теперь у вас есть четкое представление о том, как преобразовать серию Pandas в массив NumPy, что позволит вам эффективно решать широкий спектр задач по манипулированию данными.