Как просмотреть кодировку текстового файла в Linux: методы и примеры

Чтобы просмотреть кодировку текстового файла в Linux, вы можете использовать несколько методов. Вот несколько примеров:

  1. Использование команды файл:

    file -i filename.txt

    Эта команда отобразит тип файла и информацию о кодировке. Кодировка будет указана после части вывода charset=.

  2. Использование команды enca:

    enca -L none filename.txt

    Команда encaпытается определить кодировку файла. Параметр -L noneотключает определение языка, фокусируясь только на кодировке. В выводе будет отображена обнаруженная кодировка.

  3. Использование библиотеки Python chardet:

    pip install chardet

    Затем в вашем скрипте Python:

    import chardet
    with open('filename.txt', 'rb') as f:
    result = chardet.detect(f.read())
    print(result['encoding'])

    Этот подход использует библиотеку chardetдля определения кодировки файла.