Свертка и максимальное объединение: изучение методов компьютерного зрения и глубокого обучения - Fcodenotes

Свертка и максимальное объединение — это английский термин, обычно используемый в области компьютерного зрения и глубокого обучения. Вот несколько методов, связанных со сверткой и максимальным объединением:

Сверточные нейронные сети (CNN): CNN — это класс глубоких нейронных сетей, обычно используемых для классификации изображений и распознавания объектов. Они используют сверточные слои, которые применяют фильтры (ядра) к входным изображениям, извлекая важные функции.
Пошаговая свертка. При пошаговой свертке фильтр (ядро) перемещается по входному изображению с шагом больше 1, что приводит к уменьшению дискретизации на выходе. Это уменьшает пространственные размеры карт объектов.
Расширенная свертка. Расширенная свертка, также известная как атральная свертка, включает в себя введение промежутков или отверстий между элементами ядра. Это позволяет расширить рецептивное поле без увеличения количества параметров.
Транспонированная свертка (деконволюция). Транспонированная свертка используется для повышения дискретизации или создания карт объектов с более высоким разрешением. Он выполняет операцию, обратную стандартной свертке, сопоставляя несколько входных значений с одной выходной позицией.
Уровни объединения: Максимальное объединение — это распространенный тип операции объединения, используемый в CNN. Это уменьшает пространственные размеры карт объектов, выбирая максимальное значение в каждой области объединения. Объединение средних значений – это еще один вариант, в котором вместо максимального значения принимается среднее значение.
Объединение глобальных средних значений. Вместо использования полностью связанных слоев в конце CNN глобальное объединение средних значений вычисляет среднее значение каждой карты объектов, что приводит к векторному представлению фиксированной длины.
Дробное максимальное объединение: дробное максимальное объединение разделяет входные данные на перекрывающиеся области и выбирает максимальное значение из каждой области, обеспечивая более гибкие коэффициенты понижающей дискретизации.
Объединение пространственных пирамид: объединение пространственных пирамид разделяет входную карту объектов на несколько субрегионов и выполняет операции объединения независимо для каждого субрегиона. Он собирает многомасштабную информацию для входных данных переменного размера.
Адаптивное объединение: адаптивное объединение динамически адаптирует области объединения к входному размеру. Это позволяет CNN обрабатывать входные данные произвольных размеров и выдавать выходные данные фиксированного размера.
Групповая свертка. Групповая свертка делит входные данные и фильтрует их на группы и выполняет свертку независимо внутри каждой группы. Это может снизить сложность вычислений и способствовать разнообразию функций.