Комплексное руководство по классификации автоматизированного машинного обучения (AutoML) с использованием scikit-learn

В этом руководстве мы рассмотрим различные методы и приемы выполнения классификации автоматизированного машинного обучения (AutoML) с использованием популярной библиотеки scikit-learn на Python. Мы рассмотрим различные подходы и предоставим примеры кода, которые помогут вам эффективно приступить к реализации моделей классификации AutoML. Давайте погрузимся!

Содержание:

  1. Введение в классификацию AutoML

  2. Предварительная обработка данных и разработка функций

  3. Автоматический выбор функций

  4. Выбор алгоритма и оптимизация гиперпараметров

  5. Ансамблевые методы для классификации AutoML

  6. Оценка модели и показатели эффективности

  7. Пример: классификация AutoML с помощью scikit-learn

  8. Вывод

  9. Введение в классификацию AutoML:

    • Что такое AutoML?
    • Преимущества и проблемы классификации AutoML
    • Знакомство с библиотекой scikit-learn
  10. Предварительная обработка данных и разработка функций:

    • Обработка пропущенных значений
    • Кодирование категориальных признаков
    • Масштабирование и нормализация функций
    • Обработка несбалансированных наборов данных
  11. Автоматический выбор функций:

    • Выбор одномерных признаков
    • Рекурсивное устранение функций (RFE)
    • Важность функций с использованием древовидных моделей
  12. Выбор алгоритма и оптимизация гиперпараметров:

    • Поиск по сетке
    • Случайный поиск
    • Байесовская оптимизация с использованием гауссовских процессов
    • Генетические алгоритмы
  13. Ансамблевые методы для классификации AutoML:

    • Бэггинг (бутстрап-агрегирование)
    • Бустинг (AdaBoost, градиентное повышение)
    • Стекирование
  14. Оценка модели и показатели эффективности:

    • Матрица путаницы
    • Точность, точность, полнота и показатель F1.
    • Кривая ROC и показатель AUC-ROC
  15. Пример: классификация AutoML с помощью scikit-learn:

    • Пошаговый пример с использованием реального набора данных.
    • Подготовка данных, обучение модели и оценка
  • Обзор затронутых тем
  • Важность AutoML в задачах классификации
  • Дополнительные ресурсы и следующие шаги