В этой статье будет представлена платформа распознавания речи с очень высокой точностью, то есть FunASR. Данные обучения модели этой платформы превышают десятки тысяч часов. После тестирования точность очень высока. В этой статье рассказывается, как запустить службу WebSocket и вызвать ее на Android для распознавания в режиме реального времени и получения результатов во время разговора.
# Установите версию Pytorch для процессора.
conda install pytorch torchvision torchaudio cpuonly -c pytorch
# Установите версию Pytorch для графического процессора.
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
conda install ffmpeg
conda install -c conda-forge pynini
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
server.py
программа,Начните загружать аудиофайлы для идентификации Служить.python server.py
Python не поддерживает несколько одновременно,Если вы хотите использовать больше одновременно Служить,Должен быть в системе Linux,осуществлятьwebsocket
каталогDockerприложение。
Использование Android StudioОткрыть Исходный кодвAndroidClient
Оглавление,Это Android-приложение Исходный код,Открыть Тогда вам придется сначала изменить егоWebSocketадресASR_HOST
,Измените его на IP-адрес сервера Служить, который вы использовали выше.,Нажмите «Выполнить», чтобы установить его на свой телефон Android.
Рендеринг приложения: