Преобразование текста в речь стало проще с помощью GTTS на Python

В сегодняшней записи блога мы исследуем мир синтеза текста в речь (TTS) с использованием популярной библиотеки Python под названием GTTS (Google Text-to-Speech). Хотите ли вы добавить голосовые функции в свои проекты, создать аудиокниги или даже создать виртуального помощника, GTTS предоставляет простой способ преобразования текста в речь. В этой статье мы рассмотрим несколько методов и примеры кода, которые помогут вам начать работу с TTS.

Метод 1: базовое преобразование текста в речь
Первый метод преобразования текста в речь с помощью GTTS довольно прост. Сначала вам необходимо установить библиотеку, выполнив в терминале следующую команду:

pip install gtts

После установки вы можете использовать следующий фрагмент кода для генерации речи из заданного текста:

from gtts import gTTS
text = "Hello, world!"
tts = gTTS(text=text, lang='en')
tts.save("output.mp3")

Метод 2: выбор языка и контроль скорости речи
GTTS позволяет вам указать язык текста, который вы хотите преобразовать, и контролировать скорость речи. Вот пример:

from gtts import gTTS
text = "Hola, mundo!"
tts = gTTS(text=text, lang='es', slow=True)
tts.save("output.mp3")

Метод 3: сохранение речи в различных аудиоформатах
По умолчанию GTTS сохраняет сгенерированную речь в виде файла MP3. Однако вы можете сохранить его и в других аудиоформатах. Вот пример сохранения речи в формате WAV:

from gtts import gTTS
text = "Hello, world!"
tts = gTTS(text=text, lang='en')
tts.save("output.wav")

Метод 4: потоковая передача речи непосредственно в браузер
Если вы хотите транслировать речь непосредственно в веб-браузер, не сохраняя ее в виде файла, вы можете использовать класс Audioиз IPython.displayмодуль. Вот пример:

from gtts import gTTS
from IPython.display import Audio
text = "Hello, world!"
tts = gTTS(text=text, lang='en')
tts.save("output.mp3")
audio = Audio("output.mp3")
audio

В этой статье мы рассмотрели возможности GTTS в Python для синтеза речи. Мы рассмотрели различные методы, включая базовое преобразование, выбор языка, управление скоростью речи, сохранение в различных аудиоформатах и ​​потоковую передачу речи непосредственно в браузер. Благодаря GTTS добавление голосовых функций в ваши проекты Python стало еще проще. Теперь ваша очередь экспериментировать и создавать потрясающие приложения с синтезом речи!