Перейти к основному содержимому

Настройка офлайн-распознавания аудио

Для загрузки моделей распознавания аудио в текущей версии Атомкод сервис VoiceAI требует подключения к сайту https://huggingface.co/. Если Docker-контейнер сервиса VoiceAI не имеет доступа к этому ресурсу, функция распознавания аудио недоступна.

к сведению

Эта инструкция не применима к развертыванию Атомкод в Kubernetes.

Перед выполнением описанной ниже инструкции убедитесь в следующем:

  • Вы имеете доступ с правами администратора к серверу с ролью Сервер Приложений или выделенному GPU-серверу.
  • Утилиты docker и tar установлены.
  • Вы имеете доступ к внутреннему репозиторию nexus.atomkod.ru.

Чтобы настроить офлайн-распознавание аудио:

  1. Скачайте архив с моделью whisper по ссылке: https://nexus.atomkod.ru/repository/platform-raw/distribution/whisper2.tar.gz.

  2. Скопируйте архив на сервер (Сервер Приложений или выделенный GPU-сервер), на котором запущен сервис VoiceAI.

  3. Поместите архив в Docker-контейнер VoiceAI в директорию /models с помощью команды

    docker cp whisper2.tar.gz voiceai:/models/
  4. Подключитесь к Docker-контейнеру VoiceAI и распакуйте архив с помощью команды

    tar -xzvf /models/whisper2.tar.gz

    В результате в директории /models в Docker-контейнере должны присутствовать директории locks и models--openai--whisper-large-v3-turbo.

  5. Настройте локальное разрешение имен для перенаправления запросов к huggingface.co.

    В файл /etc/hosts Docker-контейнера добавьте следующую строку:

    127.0.0.1 huggingface.co

Теперь вы можете запустить распознавание аудио. При первом запуске после настройки может возникнуть задержка 5–10 минут, связанная с инициализацией модели. Последующие запуски должны выполняться в штатном режиме.

При перезагрузке Docker-контейнера VoiceAI повторите действия, описанные в п.5 этой инструкции. При пересоздании Docker-контейнера VoiceAI выполните действия, описанные в п.п.3-5 этой инструкции.