С развитием программ с открытым исходным кодом все больше и больше программистов начинают обращать внимание на большие модели с открытым исходным кодом и пополнять их ряды. У каждого свои опасения по поводу отраслей и проектов с открытым исходным кодом. Присоединяйтесь к нашим рекомендациям по популярным проектам с открытым исходным кодом и делитесь популярными проектами, которые вас интересуют!
Сам автор чатттс также заявил на х, что ChatTTS пробил потолок открытого исходного кода. Однако то, что в настоящее время является открытым исходным кодом, является только базовой моделью, которая не контролировалась и не настраивалась SFT.
Самый человекоподобный ИИ уже здесь! ChatTTS, голосовой потолок с открытым исходным кодом, быстро стал популярным и получил 9 тысяч звезд за 3 дня.
Адрес проекта: https://github.com/2noise/ChatTTS/tree/main
ChatTTs — это технология синтеза речи, которая использует передовые алгоритмы и модели искусственного интеллекта для создания естественного и плавного речевого вывода. С помощью ChatTT компьютеры могут преобразовывать текст в реалистичные человеческие голоса, выраженные в различных стилях речи и интонациях. Эта технология имеет широкий потенциал применения в голосовых помощниках, виртуальных якорях, аудиокнигах и других областях.
Проект с открытым исходным кодом «ChatTTS» представляет собой инструмент преобразования текста в речь, который имеет следующие характеристики:
1. Многоязычная поддержка: ChatTTS может говорить не только на китайском, но и на английском языке и легко конвертировать несколько языков.
2. Детальный контроль. Этот инструмент поддерживает детальный контроль, например добавление смеха, пауз и модальных частиц, чтобы сделать сгенерированную речь более яркой и интересной.
3. Воспроизведение потерянных голосов: ChatTTS может воспроизводить голоса ушедших людей, например, пресс-конференцию Стива Джобса, поэтому вы можете прослушать их снова в любое время.
4. Очень реалистичная имитация: будь то изменение интонации или тона, ChatTTS может точно имитировать ее, и практически невозможно сказать, что это генерируется ИИ.
5. Смешанный китайский и английский язык. ChatTTS может гибко справляться со смешанным китайским и английским языками, демонстрируя свободный акцент на наполовину китайском и наполовину английском языках, демонстрируя высокий уровень языковых способностей.
Благодаря этим функциям ChatTTS вышел на новый уровень в области преобразования текста в речь. Я надеюсь, что этот проект принесет пользователям лучший опыт и больше возможностей.
Загрузите код с GitHub.
git clone https://github.com/2noise/ChatTTS
Прежде чем начать, убедитесь, что у вас установлены необходимые пакеты. Вам понадобится фонарик и ChatTTS. Если он еще не установлен, вы можете установить его с помощью pip:
pip install torch ChatTTS
Импортируйте необходимые библиотеки для вашего скрипта. Вам понадобится фонарик, ChatTTS и аудио из IPython.display.
import torch
import ChatTTS
from IPython.display import Audio
Создайте экземпляр класса ChatTTS и загрузите предварительно обученную модель.
chat = ChatTTS.Chat()
chat.load_models()
Определите текст, который будет преобразован в голос。Воля<YOUR TEXT HERE>Замените желаемым текстом。
texts = ["Привет, добро пожаловать в ChatTTS!"]
Используйте метод вывода для генерации речи из текста. Установите use_decoder=True, чтобы включить декодер.
wavs = chat.infer(texts, use_decoder=True)
Воспроизведите сгенерированный звук, используя класс Audio из IPython.display. Установите частоту дискретизации 24 000 Гц и включите автозапуск.
Audio(wavs[0], rate=24_000, autoplay=True)
Вот полный сценарий для справки:
import torch
import ChatTTS
from IPython.display import Audio
# Инициализировать ChatTTS
chat = ChatTTS.Chat()
chat.load_models()
# Определите текст, который будет преобразован в голос
texts = ["Привет, добро пожаловать в ChatTTS!"]
# генерироватьголос
wavs = chat.infer(texts, use_decoder=True)
# Воспроизвести сгенерированное аудио
Audio(wavs[0], rate=24_000, autoplay=True)
Если у вас возникли проблемы с развертыванием, вы можете выбрать онлайн-сайт для бесплатного использования ~
ChatTTS: Text-to-Speech For Chat
Обратная связь по эффекту:
Как только проект был выпущен, пользователи сети из всех слоев общества опробовали его один за другим и обнаружили, что звук действительно трудно отличить настоящий от фальшивого.
Некоторые используют GPT для генерации текста и позволяют ChatTTS его «читать». Разница в тоне и тоне очень мала:
Надеюсь, это поможет! ну давай же!
Если вы нашли содержание этой статьи полезным, пожалуйста, не стесняйтесь поставить ей палец вверх и подписаться, чтобы продолжать получать ценную информацию. Искренне благодарю вас за внимание и поддержку!