Настройка офлайн-распознавания аудио
Для загрузки моделей распознавания аудио в текущей версии Атомкод сервис VoiceAI требует подключения к сайту https://huggingface.co/. Если Docker-контейнер сервиса VoiceAI не имеет доступа к этому ресурсу, функция распознавания аудио недоступна.
Эта инструкция не применима к развертыванию Атомкод в Kubernetes.
Перед выполнением описанной ниже инструкции убедитесь в следующем:
- Вы имеете доступ с правами администратора к серверу с ролью Сервер Приложений или выделенному GPU-серверу.
- Утилиты docker и tar установлены.
- Вы имеете доступ к внутреннему репозиторию
nexus.atomkod.ru.
Чтобы настроить офлайн-распознавание аудио:
-
Скачайте архив с моделью whisper по ссылке: https://nexus.atomkod.ru/repository/platform-raw/distribution/whisper2.tar.gz.
-
Скопируйте архив на сервер (Сервер Приложений или выделенный GPU-сервер), на котором запущен сервис VoiceAI.
-
Поместите архив в Docker-контейнер VoiceAI в директорию
/modelsс помощью командыdocker cp whisper2.tar.gz voiceai:/models/ -
Подключитесь к Docker-контейнеру VoiceAI и распакуйте архив с помощью команды
tar -xzvf /models/whisper2.tar.gzВ результате в директории
/modelsв Docker-контейнере должны присутствовать директорииlocksиmodels--openai--whisper-large-v3-turbo. -
Настройте локальное разрешение имен для перенаправления запросов к
huggingface.co.В файл
/etc/hostsDocker-контейнера добавьте следующую строку:127.0.0.1 huggingface.co
Теперь вы можете запустить распознавание аудио. При первом запуске после настройки может возникнуть задержка 5–10 минут, связанная с инициализацией модели. Последующие запуски должны выполняться в штатном режиме.
При перезагрузке Docker-контейнера VoiceAI повторите действия, описанные в п.5 этой инструкции. При пересоздании Docker-контейнера VoiceAI выполните действия, описанные в п.п.3-5 этой инструкции.