Разбор строк в слова в C#

В C# существует несколько методов, которые можно использовать для преобразования строк в слова. Вот некоторые распространенные подходы:

  1. Метод разделения.
    Вы можете использовать метод Splitиз класса String, чтобы разделить строку на слова на основе указанного разделителя.. Например:

    string input = "parse strings into words";
    string[] words = input.Split(' ');

    При этом строка будет разделена по каждому пробелу, в результате чего получится массив слов.

  2. Регулярные выражения.
    Регулярные выражения предоставляют мощный способ анализа строк. Вы можете использовать класс Regexиз пространства имен System.Text.RegularExpressionsдля сопоставления и извлечения слов. Например:

    using System.Text.RegularExpressions;
    string input = "parse strings into words";
    string pattern = @"\b\w+\b";
    MatchCollection matches = Regex.Matches(input, pattern);
    foreach (Match match in matches)
    {
       string word = match.Value;
       // Do something with the word
    }

    Отдельные слова будут извлечены с использованием шаблона регулярного выражения \b\w+\b, который соответствует одному или нескольким символам слова.

  3. StringTokenizer:
    Класс StringTokenizer, доступный в пространстве имен System, может использоваться для токенизации строки в слова. Он позволяет указывать разделители и предоставляет методы для перебора слов. Вот пример:

    using System;
    string input = "parse strings into words";
    char[] delimiters = { ' ' };
    StringTokenizer tokenizer = new StringTokenizer(input, delimiters);
    while (tokenizer.MoveNext())
    {
       string word = tokenizer.Current;
       // Do something with the word
    }

    Этот подход дает вам больше контроля над разделителями, используемыми для токенизации строки.