Вычислить индекс Жаккара с помощью примеров кода на Python

Индекс Жаккара, также известный как коэффициент сходства Жаккара, является мерой сходства между двумя наборами данных. Он определяется как размер пересечения множеств, деленный на размер их объединения. Индекс Жаккара часто используется в интеллектуальном анализе данных, поиске информации и системах рекомендаций.

Вот несколько методов расчета индекса Жаккара с примерами кода на Python:

Метод 1: использование наборов

def jaccard_index(set1, set2):
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    return intersection / union
set1 = {1, 2, 3, 4, 5}
set2 = {4, 5, 6, 7, 8}
index = jaccard_index(set1, set2)
print(index)  # Output: 0.2

Метод 2: использование списков

def jaccard_index(list1, list2):
    intersection = len(set(list1).intersection(list2))
    union = len(set(list1).union(list2))
    return intersection / union
list1 = [1, 2, 3, 4, 5]
list2 = [4, 5, 6, 7, 8]
index = jaccard_index(list1, list2)
print(index)  # Output: 0.2

Метод 3: использование строк

def jaccard_index(str1, str2):
    set1 = set(str1)
    set2 = set(str2)
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    return intersection / union
str1 = "apple"
str2 = "banana"
index = jaccard_index(str1, str2)
print(index)  # Output: 0.0

Это всего лишь несколько примеров того, как можно рассчитать индекс Жаккара с использованием различных типов данных. Вы можете адаптировать эти методы в зависимости от вашего конкретного случая использования.