Развертывание сервера vLLM
Атомкод Атомкод поддерживает работу с большими языковыми моделями. Для обеспечения системного окружения, необходимого для работы различных больших языковых моделей и предоставления API для взаимодействия с клиентскими запросами, для обеспечения работы функций Атомкод, использующих искусственный интеллект, требуется провести развертывание сервера vLLM и больших языковых моделей.
Развертывание сервера vLLM является необязательным.
Развертывание сервера vLLM его следует выполнить в первую очередь перед развертыванием Атомкод.
Системные требования
Для развертывания vLLM необходимо:
- ОС: Ubuntu 22.04.
- Наличие доступа в интернет на сервере с ролью vLLM.
Минимальные требования для развертывания vLLM перечислены в следующей таблице.
| Минимум | Оптимум | Максимум | |
|---|---|---|---|
| Модель | 14B с минимальным контекстом (~32к) токенов | 14B со средним контекстом ~40к токенов + простая размышляющая модель на 16B. | 14B с расширенным контекстом ~90к токенов + размышляющая модель на 32B | 
| Видеокарты | NVIDIA Quadro RTX A6000 48G или NVIDIA А100 40G или аналоги с видеопамятью от 40G | NVIDIA H100 | 2 * NVIDIA H100 | 
| Количество ядер процессоров, шт. | 16 для GPU NVIDIA Quadro RTX A6000 48G иначе 8 | 8 | 16 | 
| Оперативная память, Гб | 128 | 152 | 304 | 
| Объём SSD, Гб | 500 | 500 | 500 | 
Развертывание vLLM
Перейдите в консоль ssh на сервер с ролью Сервер vLLM и повысьте права командой
sudo -i
Подготовьте учётную запись ansible для удалённого управления этим сервером. Используйте команды:
useradd -mUG sudo -s /bin/bash ansible
mkdir -p /home/ansible/.ssh
echo "ansible ALL=(ALL:ALL) NOPASSWD:ALL" > /etc/sudoers.d/ansible
touch /home/ansible/.ssh/authorized_keys
chmod 700 /home/ansible/.ssh
chmod 600 /home/ansible/.ssh/authorized_keys
chown -R ansible. /home/ansible/.ssh
Скопируйте публичный ключ, который используется на Сервере с ролью Ansible мастер, из файла  /root/.ssh/id_rsa.pub в файл /home/ansible/.ssh/authorized_keys на сервере с ролью Сервер vLLM.
Перейдите на сервер с ролью Ansible мастер. Повысьте права командой
sudo -i
Перейдите в директорию /opt/platform/installer/vLLMInstall командой
cd /opt/platform/installer/vLLMInstall
В этой директории располагаются ansible-роли и плейбук для установки vLLM.
Вы можете установить vLLM с настройками по умолчанию или же выбрать расширенную настройку.