Изучение прогнозирования временных рядов: подробное руководство по запуску AutoARIMA на биржевых данных

Прогнозирование временных рядов – это мощный метод, используемый для прогнозирования будущих значений на основе исторических закономерностей. Одним из популярных методов в этой области является AutoARIMA, который автоматически определяет оптимальные параметры модели ARIMA. В этой статье мы рассмотрим шаги по запуску AutoARIMA в столбце «закрыть» набора данных «stock_data_clean». Мы рассмотрим несколько методов с примерами кода, которые помогут вам приступить к прогнозированию временных рядов с помощью AutoARIMA.

Методы:

  1. Подготовка данных:

    • Импортируйте необходимые библиотеки: pandas, numpy, matplotlib.
    • Загрузите набор данных «stock_data_clean».
    • Предварительная обработка данных путем преобразования их в подходящий формат временных рядов.
    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    
    # Load the dataset
    stock_data = pd.read_csv('stock_data_clean.csv')
    
    # Convert the 'close' column to datetime
    stock_data['close'] = pd.to_datetime(stock_data['close'])
    
    # Set the 'close' column as the index
    stock_data.set_index('close', inplace=True)
  2. Визуализируйте временной ряд:

    • Постройте график данных временных рядов, чтобы получить представление о закономерностях и тенденциях.
    plt.figure(figsize=(12, 6))
    plt.plot(stock_data.index, stock_data['close'])
    plt.title('Stock Close Prices Over Time')
    plt.xlabel('Time')
    plt.ylabel('Close Price')
    plt.show()
  3. Установите и импортируйте необходимые библиотеки:

    • Установите библиотеку pmdarima, которая обеспечивает реализацию AutoARIMA.
    • Импортируйте необходимые модули из pmdarima.
    !pip install pmdarima
    from pmdarima.arima import auto_arima
  4. Запустить AutoARIMA:

    • Примените AutoARIMA для автоматического определения оптимальных параметров модели ARIMA.
    # Define the exogenous variables if any
    exog = None
    
    # Run AutoARIMA
    model = auto_arima(stock_data, exogenous=exog)
  5. Сводка модели и диагностика:

    • Распечатайте сводку подобранной модели и диагностируйте ее остатки.
    print(model.summary())
    model.plot_diagnostics(figsize=(12, 8))
    plt.show()
  6. Прогнозирование:

    • Создание прогнозов на будущее с использованием подобранной модели AutoARIMA.
    # Set the number of steps to forecast
    n_steps = 30
    
    # Generate forecasts
    forecasts, conf_int = model.predict(n_steps, return_conf_int=True)

В этой статье мы рассмотрели, как запустить AutoARIMA для столбца «закрыть» набора данных «stock_data_clean». Мы рассмотрели различные этапы, включая подготовку данных, визуализацию, установку необходимых библиотек, запуск AutoARIMA, сводку модели и прогнозирование. Следуя этим методам, вы можете использовать возможности AutoARIMA для прогнозирования временных рядов на основе собственных наборов данных. Не забудьте точно настроить параметры и оценить производительность модели с учетом ваших конкретных требований.