Мы часто сталкиваемся с ситуациями, когда звук преобразуется в текст, например, протоколы встреч, записанные во время собрания, или лекции учителя, записанные во время урока. Хотя существуют некоторые онлайн-инструменты, которые могут конвертировать аудио в текст, с учетом вопросов безопасности данных и стоимости они не очень удобны в использовании.
Сегодня я хотел бы представить вам инструмент с открытым исходным кодом — Buzz, который позволяет распознавать аудио локально и оффлайн и преобразовывать его в текст.
Buzz Открытый исходный кодизречь в текстинструмент,Он способен преобразовывать голос в текст в режиме реального времени.,Поддержка нескольких операционных систем,включать Windows、macOS и Linux。Он не только поддерживаетРаспознавание речи в реальном времени,Он также может конвертировать видео и аудио файлы в текст или субтитры.,Это значительно облегчает создателям контента, переводчикам и пользователям.
Поскольку это кроссплатформенный инструмент, Windows Пользователи могут release Загрузите установочный пакет со страницы Mac Пользователи могут использовать brew install --cask buzz
команда для установки приложения.
Откройте приложение и вы увидите, что интерфейс очень простой:
Нажмите «➕» в верхней строке меню, чтобы выбрать аудиофайлы. Затем во всплывающем диалоговом окне выберите модель, задачу и язык для использования. Здесь мы используем базовую модель Whisper по умолчанию и выбираем «Транскрибировать» для задачи преобразования речи в текст.
После нажатия кнопки «Выполнить» программа автоматически загрузит файл модели и преобразует его. Преобразованные задачи отобразятся в списке главной страницы, как показано на рисунке:
Дважды щелкните задачу, чтобы просмотреть успешно преобразованный текст, как показано на рисунке:
Вы можете просмотреть время звука каждого предложения на этой странице и воспроизвести звук. Вы также можете нажать кнопку загрузки в правом нижнем углу, чтобы экспортировать файл в формат txt или формат субтитров srt.
Конечно, Базз Также поддерживает речь в реальном времени в тексти Функция перевода。Нажмите в левом верхнем углу главной страницы.измаленькая кнопка микрофона,Вы можете войти в интерфейс записи в реальном времени. Он по-прежнему настроен на использование типа задачи из Модели.,Нажмите кнопку «Записать»,Вы можете конвертировать текст в режиме реального времени.
С ростом числа крупномасштабных моделей с открытым исходным кодом и появлением множества инструментов, которые интегрируют эти крупномасштабные модели на GitHub, мы можем запускать эти модели на персональных компьютерах с более низким порогом, что помогает нам выполнять больше работы. Buzz – это простой в использовании инструмент преобразования речи в текст. Если у вас схожие потребности, попробуйте его быстро.
Адрес проекта: https://github.com/chidiwilliams/buzz