Руководство по развертыванию TTS API: создание персонализированной службы синтеза речи
Руководство по развертыванию TTS API: создание персонализированной службы синтеза речи

Используйте легкий сервер приложений для создания API преобразования текста в речь TTS.

Предисловие

  • Поскольку в предыдущей статье я посчитал, что сторонний API использовался слишком часто, и я беспокоился, что однажды он внезапно станет непригодным для использования, поэтому я подумал о создании его самостоятельно (PS: В основном потому, что я не видел компанию объявить об этом интерфейсе внешнему миру)
  • Я искал везде и наконец нашел TTS, который можно собрать самому. Его можно модифицировать и превратить в API (не боюсь шуток, это тоже сторонний интерфейс-edge-tts).

1. введение в Edge-TTS

  • Edge-TTS — это библиотека Python, использующая преобразование текста в речь Microsoft.
  • Текст можно преобразовать в речь, поддерживается несколько языков и голосов.

2. Подготовка

  • сервер,Здесь я рекомендуюЛегкий сервер приложений Tencent Cloud,Используется для развертывания служб TTS.
  • Пакет файлов, который необходимо развернуть, необходим во время развертывания.
  • Доменное имя, которое может понадобиться, если его использует третья сторона.

3. Специальные инструкции

  • На этот раз для развертывания мы используем метод докера, поэтому серверная среда должна отдавать приоритет среде Linux. Конечно, если вы большой начальник, среда Windows также приемлема. Ниже я буду использовать серверную среду Centos7 в качестве примера для выполнения руководства по развертыванию.
  • Поскольку используемая в этот раз библиотека является службой Microsoft, она может существовать всегда или может быть отключена через некоторое время. Это неясно, но если появится новая, я снова опубликую новую статью. Объясните, как это сделать. используйте это.

4. Фактический эффект работы

  • Использовать хранилище объектовcos в качестве хранилища для создания снимка экрана (обратный адрес хранилища)

  • Запуск снимка экрана с использованием локального хранилища (возвращает локальный адрес)

5. Начать развертывание

5.1 Для удобства и скорости,Здесь я использую панель Pagoda для операций быстрого развертывания.!ВходитьЛегкий сервер приложений Tencent CloudКупитьлегкий сервер приложений, выберите панель «Пагода». Конечно, вы можете выбрать centos7.6 и установить его самостоятельно.

5.2 После покупки сервера адрес входа в панель и пароль учетной записи отобразятся в сообщении Tencent Cloud через несколько минут. Затем просто запустите его прямо в браузере.

5.3 При входе в панель управления Pagoda вам будет предложено привязать и зарегистрировать учетную запись Pagoda. Вы можете просто зарегистрироваться. После успешной привязки выберите файл в левом столбце и войдите в этот каталог.

5.4 Давайте создадим каталог. Поскольку нам нужно загрузить код, я сначала загружу код на основе объекта хранилища cos (эта версия загрузит преобразованный голос в cos и вернет адрес).

версия-2024-2-29.zip

5.5 После загрузки распакуйте (лучше всего создать в директории www директорию для запуска, чтобы потом не забыть)

5.6 После распаковки дважды щелкните файл Edge-tts.py. Нам нужно настроить некоторые функции. Функция каждого места указана в файле. Всего нужно настроить 6 мест, 4 перед кодом и 2. сзади! Все очень просто! В правой части параметров, которые необходимо настроить, указано, где их настроить.

Облачное объектное хранилище TencentОткрыть адресhttps://curl.qcloud.com/f3qqvIGU

5.6 После завершения вышеуказанного процесса (внимательно проверьте, есть ли пробелы в параметрах и нет ли ошибок в параметрах), откройте докер в левом столбце. Если он не установлен, нажмите его установить.

5.7 После установки докера нажимаем на терминал в левом столбце! Введите каталог, в котором хранится загруженный пакет файлов выше, а затем введите команду. Введите команду ниже и выполните ее самостоятельно.

Язык кода:php
копировать
cd /www/tts
chmod +x dockerRun.sh
./dockerRun.sh

5.8 Затем дождитесь выполнения кода. Если появится скриншот ниже, это означает, что операция прошла успешно.

5.9 После успешного запуска напрямую введите IP-адрес вашего сервера: 2020, чтобы проверить, доступен ли к нему доступ. Если он не открывается, возможно, брандмауэр вашего сервера не открыт. Вам также необходимо перейти в консоль Tencent Cloud, чтобы активировать брандмауэр сервера. и пагода Фаервол панели должен быть включен.

5.10 Затем вводим полный путь в браузере. ip:2020+текст, который нужно преобразовать+актер озвучки

Язык кода:php
копировать
    "xiaoxiao": "zh-CN-XiaoxiaoNeural",
    "xiaoyi": "zh-CN-XiaoyiNeural",
    "yunjian": "zh-CN-YunjianNeural",
    "yunxi": "zh-CN-YunxiNeural",
    "yunxia": "zh-CN-YunxiaNeural",
    "yunyang": "zh-CN-YunyangNeural",
    "xiaobei": "zh-CN-liaoning-XiaobeiNeural",
    "xiaoni": "zh-CN-shaanxi-XiaoniNeural",
    "hiugaai": "zh-HK-HiuGaaiNeural",
    "hiumaan": "zh-HK-HiuMaanNeural",
    "wanlung": "zh-HK-WanLungNeural",
    "hsiaochen": "zh-TW-HsiaoChenNeural",
    "hsioayu": "zh-TW-HsiaoYuNeural",
    "yunjhe": "zh-TW-YunJheNeural",
Язык кода:php
копировать
серверip:2020/dealAudio?text=Добро пожаловатьtts&voice=xiaoxiao
  • text — это текст, который вам нужно преобразовать
  • Голос - актер озвучки, вы можете выбрать его сами

5.10 Выше представлен метод развертывания Tencent Cloud COS, затем приведен метод развертывания локального хранилища. Процесс развертывания тот же, но пакеты файлов разные, поэтому вы можете просто посмотреть процесс развертывания выше. необходимо настроить что-либо для локального развертывания. Его можно использовать сразу после установки.

bendi.zip

5.11 Привязываем доменное имя для внешнего доступа! Лучше всего использовать SSL-сертификат.

6. Меры предосторожности

  • Их нельзя развернуть на одном сервере одновременно, поскольку они оба имеют один и тот же порт. Прежде чем их можно будет развернуть вместе, необходимо изменить порт.
  • Для развертывания локального хранилища, если доменное имя привязано, вам необходимо рассмотреть вопрос о междоменном использовании! Я уже написал это в коде, и весь доступ доступен. Вы можете изменить его для собственного использования или ограничить определенные доменные имена. .
  • Опять же помните, что интерфейс непостоянен и может внезапно исчезнуть.

7. Заключение

  • через эту статью,Мы узнали, как создать API TTS (преобразование текста в речь) с использованием легкого сервера приложений. Преимущество этого в том, что мы можем сами управлять этой услугой.,Не нужно слишком полагаться на третьи стороны。Мы подробно представили Легкий сервер приложений Tencent Процесс развертывания с использованием библиотеки Edge-TTS в облаке также предусматривает использование хранилища. объектов COS и локальное хранилище — два варианта развертывания.

  • Как новичок,Мы должны идти в ногу с технологическими изменениями. в этой статье,Мы используем Docker для управления нашими приложениями.,Это не только удобно,Это также повышает мобильность и воспроизводимость приложений. Мы также упомянули некоторые вопросы, требующие внимания.,Например, при развертывании нескольких сервисов на одном сервере необходимо обращать внимание на конфликты портов.,При развертывании локального хранилища необходимо учитывать ограничения междоменного доступа.

  • В целом, благодаря этой статье мы узнали, как создать API преобразования текста в речь TTS, и получили глубокое понимание некоторых технических деталей и мер предосторожности в процессе развертывания. Как технические специалисты, мы должны продолжать изучать и исследовать новые технологии, чтобы лучше реагировать на меняющиеся потребности и проблемы.
boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose