Настройка офлайн-распознавания аудио

Для загрузки моделей распознавания аудио в текущей версии Атомкод сервис VoiceAI требует подключения к сайту https://huggingface.co/. Если Docker-контейнер сервиса VoiceAI не имеет доступа к этому ресурсу, функция распознавания аудио недоступна.

к сведению

Эта инструкция не применима к развертыванию Атомкод в Kubernetes.

Перед выполнением описанной ниже инструкции убедитесь в следующем:

Вы имеете доступ с правами администратора к серверу с ролью Сервер Приложений или выделенному GPU-серверу.
Утилиты docker и tar установлены.
Вы имеете доступ к внутреннему репозиторию nexus.atomkod.ru.

Чтобы настроить офлайн-распознавание аудио:

Скачайте архив с моделью whisper по ссылке: https://nexus.atomkod.ru/repository/platform-raw/distribution/whisper2.tar.gz.
Скопируйте архив на сервер (Сервер Приложений или выделенный GPU-сервер), на котором запущен сервис VoiceAI.
Поместите архив в Docker-контейнер VoiceAI в директорию /models с помощью команды
```
docker cp whisper2.tar.gz voiceai:/models/
```
Подключитесь к Docker-контейнеру VoiceAI и распакуйте архив с помощью команды
```
tar -xzvf /models/whisper2.tar.gz
```
В результате в директории /models в Docker-контейнере должны присутствовать директории locks и models--openai--whisper-large-v3-turbo.
Настройте локальное разрешение имен для перенаправления запросов к huggingface.co.

В файл /etc/hosts Docker-контейнера добавьте следующую строку:
```
127.0.0.1 huggingface.co
```

Теперь вы можете запустить распознавание аудио. При первом запуске после настройки может возникнуть задержка 5–10 минут, связанная с инициализацией модели. Последующие запуски должны выполняться в штатном режиме.

При перезагрузке Docker-контейнера VoiceAI повторите действия, описанные в п.5 этой инструкции. При пересоздании Docker-контейнера VoiceAI выполните действия, описанные в п.п.3-5 этой инструкции.