Нечеткое сопоставление строк в Python с использованием модуля FuzzyWuzzy

Чтобы импортировать модуль fuzzywuzzyв Jupyter Notebook, вы можете выполнить следующие действия:

  1. Установите модуль fuzzywuzzy, если вы еще этого не сделали. Это можно сделать, выполнив следующую команду в ячейке кода Jupyter Notebook:
!pip install fuzzywuzzy
  1. Импортируйте необходимые функции или классы из модуля fuzzywuzzy. В этом случае мы импортируем функцию process, которая обычно используется для нечеткого сопоставления строк:
from fuzzywuzzy import process

После того как вы импортировали функцию process, вы можете использовать ее для выполнения нечеткого сопоставления строк. Вот пример, демонстрирующий, как использовать функцию process:

# List of choices
choices = ["apple", "banana", "orange", "pineapple"]
# Input string to match
input_string = "appel"
# Using fuzzywuzzy's process function
best_match = process.extractOne(input_string, choices)
print("Best match:", best_match[0])  # Output: Best match: apple
print("Match score:", best_match[1])  # Output: Match score: 80

В приведенном выше примере у нас есть список вариантов выбора [“яблоко”, “банан”, “апельсин”, “ананас”] и входная строка “appel”. Функция process.extractOne()сравнивает входную строку с каждым вариантом и возвращает наилучшее совпадение вместе с оценкой совпадения. В этом случае лучшим совпадением является «яблоко» с рейтингом соответствия 80.