В последнее время многие инструменты моделей TTS стали доступны всем, предоставляя дополнительную возможность некоторым новичкам или тем, кто в ней нуждается.
Но программистам/разработчикам или людям, которым необходимо интегрировать службы TTS, это кажется немного хлопотным.
Сегодня я поделюсь с вами очень интересным проектом.—edge-tts
。
Этот проект на самом деле является Python Сторонние модули, позволяющие использовать Microsoft Edge Онлайн-сервис преобразования текста в речь, доступный через Python. вводить коди Используйте предоставленныйedge-tts
иedge-playback
Заказ。
Вы можете спросить, зачем использовать этот модуль?
Проще говоря, эффект от этого модуля сравним с ChatTTS,и поддерживает несколько диалектов,Такие как кантонский, шэньси, тайваньский и т. д.,Очень практично.
Главное, используйте edge-tts
Установка не требуется Microsoft Edge Браузер или В системах Windows нет необходимости API ключ. Это означает, что независимо от того, какую операционную систему вы используете, если у вас есть Python среды, вы можете легко начать работу.
Адрес проекта указан ниже. Заинтересованные друзья могут перейти непосредственно на GitHub, чтобы просмотреть подробности проекта.
https://github.com/rany2/edge-tts
Мы живем в эпоху информационного взрыва, когда в наше поле зрения ежедневно попадает огромное количество информации. Как эффективно получить и обработать эту информацию, стало проблемой, с которой должен столкнуться каждый.
здесь,Текст в текстголос Технологии пригодятся。От ИИ к человечеству,Просто представьте,Когда вы водите машину, бегаете или делаете работу по дому,Способность получать информацию через уши.,Сильно ли повысилась эффективность? Это не просто технологический прогресс,Это еще и изменение образа жизни.
и edge-tts
Это поднимает это удобство на новый уровень. Нам больше не нужны сложные конфигурации и не нужно беспокоиться о совместимости платформ. Нам нужно всего лишь несколько простых строк кода, чтобы преобразовать текст в живую речь.
и И,Функции, поддерживающие несколько диалектов,Это делает его еще более мощным в практическом применении. представлять себе,Прочтите текст на диалекте Шэньси своим родственникам и друзьям.,Спикер воспроизводит новость на кантонском диалекте.,Этот опыт очень уникален и близок к жизни.
Вначале вы можете попробовать использовать его для преобразования простого текста. Например, преобразовать некоторые статьи в речь и слушать их во время бега. Этот опыт является совершенно новым, и создается впечатление, что у нас к услугам личного диктора в любое время и в любом месте.
По мере углубления использования,Я начал пробовать более сложные сценарии применения. например,Интегрируйте его в некоторые из моих сценариев автоматизации.,Помогите мне после выполнения определенных задач,Автоматически сообщать результаты. конечно, я верю,edge-tts
Потенциал гораздо больше этого.
1. Установите модуль Edge-TTS:
pip install edge-tts
2. Импортируйте модуль Edge-tts в код:
import edge_tts
3. Создайте объект «Общение»:
communicate = edge_tts.Communicate()
4. Используйте методsay() для преобразования текста в речь:
communication.say("Привет, это edge-tts пример. ")
5. Если вам нужно сохранить голос в виде аудиофайла, вы можете использовать метод save():
communicate.save("output.mp3","Привет,Это файл, сохраненный как Аудиопример. ")
6. Если вам нужно немедленно воспроизвести голос, вы можете использовать метод play():
общаться.play("Привет,Это пример мгновенной игры. ")
конечно,Официальная рекомендация заключается в том, что мы используем его напрямую.edge-tts
иedge-playback
Два вида Заказинструменты для строк。
edge-playback:
Преобразуйте текст в речь и мгновенно воспроизводите ее.
edge-tts:
Преобразуйте текст в речь и сохраните как аудиофайл.
Например, используйте команду Edge-tts для сохранения аудио в формате MP3.
$ edge-tts --text «Пойдем, поедим горячее!» --write-media demo.mp3 --write-subtitles demo.vtt
Например, используйте команду Edge-Playback, чтобы напрямую генерировать результаты и воспроизводить звук.
$ edge-playback --text «Пойдем, поедим горячее!»
Описание отдельных параметров:
--write-media: используется для указания места сохранения сгенерированного голосового аудиофайла.
--write-subtitles: используется для создания файлов субтитров, синхронизированных с речью. Файлы субтитров по умолчанию имеют формат .vtt, который можно использовать для отображения субтитров в видеоплеерах.
--language: укажите произношение. Для китайского языка просто напишите после него «zh-CN».
--gender: Вы можете установить мужские и женские тембры, «женский»/«мужской».
--pitch: шаг в диапазоне от -1,0 до 1,0.
Такие параметры, как громкость, скорость и т. д., также можно настроить.
Динамическая речь с использованием VoicesManager (полный пример кода):
Базовый пример использования:
Используя Edge-tts, вы можете делать что-то во многих сценариях, будь то повышение эффективности или создание расширенных продуктов, все в порядке.
Начать легко, независимо от того, являетесь ли вы техническим новичком или опытным разработчиком, вы найдете в этом удовольствие и практическую ценность.
Спасибо, что сопровождали меня всю дорогу,Постройте мир с помощью кода,Давайте вместе отправимся в волшебное путешествие, полное неизвестных и чудес. Если вас интересуют навыки программирования на Python, интересные и практичные проекты с открытым исходным кодом, новые отраслевые знания, различная техническая информация и т. д.,Тогда не пропустите захватывающий контент, который я представлю вам в будущем.!Нажмитесосредоточиться на,Сделайте свой путь исследования и обучения более красочным,мы растем вместе,Давайте двигаться вперед вместе! 🚀💻📚
Запросите три последовательных соединения одним щелчком мыши:Нравиться、Вперед、заглянуть