Как подсчитать количество предложений в Python: объяснение нескольких методов

Чтобы подсчитать количество предложений в заданном тексте с помощью Python, вы можете использовать различные методы. Вот несколько подходов:

Метод 1: использование регулярных выражений
Вы можете использовать регулярные выражения, чтобы разбить текст на предложения и подсчитать количество полученных сегментов. Модуль reв Python обеспечивает функциональность регулярных выражений. Вот пример:

import re
def count_sentences(text):
    sentences = re.split(r'(?<=[.!?])\s+', text)
    return len(sentences)

Метод 2: использование NLTK
NLTK (Natural Language Toolkit) — популярная библиотека для обработки естественного языка в Python. Он предоставляет встроенный токенизатор, который можно использовать для разделения текста на предложения:

import nltk
def count_sentences(text):
    sentences = nltk.sent_tokenize(text)
    return len(sentences)

Метод 3: использование SpaCy
SpaCy — еще одна мощная библиотека Python для обработки естественного языка. Он включает в себя токенизатор предложений, который можно использовать для подсчета предложений:

import spacy
def count_sentences(text):
    nlp = spacy.load('en_core_web_sm')
    doc = nlp(text)
    sentences = list(doc.sents)
    return len(sentences)

Обратите внимание, что в примерах кода предполагается, что текст написан на английском языке. Если вы работаете с текстом на другом языке, возможно, вам придется соответствующим образом скорректировать код или использовать библиотеки для конкретного языка.