Подсчет частоты слов в Bash и Python

Фраза «подсчет частоты bash» относится к подсчету частоты слов или элементов в текстовом файле с использованием языка программирования Bash. Вот несколько методов, которые можно использовать для достижения этой цели:

  1. Использование AWK:
    Вы можете использовать язык программирования AWK для выполнения подсчета частот в Bash. Вот пример команды:

    awk '{ for (i=1; i<=NF; i++) count[$i]++ } END { for (word in count) print word, count[word] }' <filename>
  2. Использование grep и сортировки.
    Вы можете комбинировать команды grep и sort для подсчета частоты слов в текстовом файле. Вот пример команды:

    grep -o -E '\w+' <filename> | sort | uniq -c
  3. Использование tr, sort и uniq:
    Другой подход — использовать команды tr, sort и uniq вместе. Вот пример команды:

    tr -s ' ' '\n' < <filename> | sort | uniq -c
  4. Использование Python.
    Хотя вы запросили методы Bash, использование языка сценариев, такого как Python, также может быть эффективным. Вот пример скрипта Python для подсчета частот слов:

    from collections import Counter
    with open('<filename>', 'r') as file:
       words = file.read().split()
       word_counts = Counter(words)
       for word, count in word_counts.items():
           print(word, count)