Как настроить NVLink на выделенном сервере
Настройка NVLink на выделенном сервере AlexHost
Зачем использовать NVLink на AlexHost? NVLink обеспечивает сверхбыструю связь GPU-GPU и GPU-CPU, что идеально подходит для задач искусственного интеллекта, глубокого обучения и высокопроизводительных вычислений. Выделенные серверы AlexHost с NVMe-хранилищем, корневым доступом и защитой от DDoS обеспечивают идеальную среду для установки нескольких GPU с поддержкой NVLink. В этом руководстве рассматривается настройка NVLink для оптимальной производительности на AlexHost.
Что такое NVLink?
NVLink – это фирменная технология межсоединений NVIDIA, которая обеспечивает передачу данных между GPU или между GPU и CPU с высокой пропускной способностью. Она обеспечивает более быстрый обмен данными, чем стандартные соединения PCI Express (PCIe), за счет использования нескольких полос данных. Такая прямая связь сводит к минимуму необходимость прохождения данных через центральный процессор, что позволяет уменьшить узкие места и повысить общую производительность системы. Ключевые преимущества NVLink
- Более быстрая связь: NVLink обеспечивает двунаправленную пропускную способность до 25 ГБ/с на линию, что значительно быстрее, чем PCIe 3.0.
- Масштабируемость: NVLink позволяет масштабировать несколько GPU для сложных вычислений, таких как обучение моделей искусственного интеллекта или научное моделирование.
- Унифицированный доступ к памяти: NVLink обеспечивает общий доступ к памяти между графическими процессорами, позволяя им использовать память друг друга и совместно работать с большими массивами данных.
Необходимые условия для настройки NVLink
Перед настройкой NVLink убедитесь, что у вас есть все необходимое
- Поддерживаемые графические процессоры: NVLink доступен только на определенных графических процессорах NVIDIA, таких как NVIDIA Tesla, Quadro и GeForce RTX (2080, 2080 Ti, 3080, 3090 и т.д.). Убедитесь, что ваши GPU поддерживают NVLink, посмотрев документацию NVIDIA для конкретной модели, которую вы используете.
- Мост NVLink: Мост NVLink необходим для физического соединения графических процессоров. Количество необходимых мостов зависит от количества GPU и желаемой конфигурации. Некоторые графические процессоры могут использовать несколько NVLink для увеличения пропускной способности.
- Система с поддержкой NVLink: Убедитесь, что материнская плата и BIOS вашей системы поддерживают NVLink. В системе должно быть достаточно слотов PCIe и соответствующее расстояние для физического размещения GPU и моста NVLink.
- Драйверы NVIDIA и CUDA: Для полноценного использования NVLink необходимо установить новейшие драйверы NVIDIA и набор инструментов CUDA. Они необходимы для обеспечения связи между графическими процессорами.
Пошаговое руководство по настройке NVLink
Шаг 1: Установите графические процессоры
Перед настройкой NVLink установите поддерживаемые графические процессоры NVIDIA в слоты PCIe вашей системы. Убедитесь, что GPU надежно установлены в соответствующие слоты. Если ваша материнская плата поддерживает несколько GPU, обратите внимание на расстояние между слотами, так как оно должно соответствовать мосту NVLink
- Выключите питание и выньте вилку из розетки.
- Откройте корпус системы.
- Вставьте графические процессоры в слоты PCIe и закрепите их на месте.
- Подключите все необходимые кабели питания от блока питания (БП) к GPU.
- Закройте корпус системы и включите питание.
Шаг 2: Установка моста NVLink
После установки графических процессоров их можно подключить с помощью моста NVLink. Выполните следующие действия
- Найдите разъемы NVLink на верхней части графических процессоров. Эти разъемы предназначены специально для моста NVLink.
- Совместите мост NVLink с разъемами и осторожно вставьте его на место. Убедитесь, что мост надежно закреплен на обоих графических процессорах.
- Если в вашей конфигурации используется несколько мостов NVLink (для некоторых GPU с двумя разъемами), повторите этот процесс для каждого моста.
Шаг 3: Установите драйверы NVIDIA
Чтобы включить NVLink, необходимо установить в систему последние версии драйверов NVIDIA. Выполните следующие шаги для установки драйверов
- Загрузите последние версии драйверов NVIDIA: Зайдите на страницу загрузки драйверов NVIDIA, выберите модель GPU и загрузите подходящие драйверы для вашей операционной системы.
- Установите драйверы: Для Linux
Для Windows запустите скачанную программу установки драйверов и следуйте инструкциям на экране.
- Перезагрузите систему: После установки драйверов перезагрузите систему, чтобы изменения вступили в силу.
Шаг 4: Установите набор инструментов CUDA Toolkit
NVLink часто используется в сочетании с CUDA, особенно в задачах глубокого обучения и высокопроизводительных вычислениях. Чтобы в полной мере использовать NVLink, необходимо установить в системе набор инструментов CUDA Toolkit
- Загрузите CUDA Toolkit: Посетите страницу загрузки CUDA Toolkit и загрузите подходящую версию для вашей операционной системы.
- Установите CUDA: Для Linux
Для Windows запустите программу установки CUDA и следуйте подсказкам.
- Проверка установки CUDA: После установки убедитесь, что CUDA установлена правильно, выполнив следующую команду
Это должно вернуть версию CUDA, установленную в вашей системе.
Шаг 5: Включите NVLink
Теперь, когда графические процессоры установлены, драйверы и CUDA настроены, можно включить NVLink
- Проверьте конфигурацию GPU: Убедитесь, что графические процессоры установлены и распознаются системой, используя следующую команду (Linux)
Это должно отобразить список всех установленных в системе GPU и показать их соответствующий статус PCIe и NVLink.
- Включите NVLink с помощью nvidia-smi: Инструмент nvidia-smi используется для включения и мониторинга NVLink. Чтобы проверить, включен ли NVLink, выполните команду
Если NVLink настроен правильно, в выводе будут показаны связи между графическими процессорами, указывающие на то, какие GPU подключены через NVLink. Ищите метку “NVLink” между парами графических процессоров.
- Бенчмарк NVLink: Для измерения производительности NVLink можно запустить тесты или бенчмарки. Такие инструменты, как cuBLAS или NCCL (NVIDIA Collective Communications Library), можно использовать для оценки скорости передачи данных между GPU по NVLink.
Шаг 6: Настройте приложения для использования NVLink
Чтобы ваши приложения могли использовать преимущества NVLink, вам нужно настроить их на использование высокоскоростного межсоединения между GPU. Многие фреймворки глубокого обучения, такие как TensorFlow, PyTorch и MXNet, автоматически обнаруживают NVLink и используют его для операций с несколькими GPU. Например, в TensorFlow можно проверить доступные GPU и их NVLink-соединение, используя
Такие фреймворки, как NCCL (NVIDIA Collective Communications Library), оптимизированы для NVLink и используются для передачи данных в средах с несколькими GPU
Шаг 7: Мониторинг состояния NVLink
После того как NVLink настроен, необходимо отслеживать его состояние, чтобы убедиться, что он работает правильно. Инструмент nvidia-smi обеспечивает всесторонний мониторинг трафика NVLink, использования полосы пропускания и производительности GPU. Вы можете использовать
Эта команда показывает подробную статистику о соединении NVLink, включая пропускную способность и любые ошибки, возникающие при передаче данных
Выводы: Повышение производительности GPU с помощью NVLink на AlexHost
NVLink повышает производительность нескольких GPU для AI и HPC, а выделенные серверы AlexHost обеспечивают мощность и безопасность для максимального использования. Установите GPU, подключите мосты NVLink, настройте драйверы/CUDA и осуществляйте мониторинг с помощью nvidia-smi. Благодаря скорости и поддержке NVMe от AlexHost ваши рабочие нагрузки, связанные с глубоким обучением или моделированием, будут работать с максимальной производительностью – начните работу уже сегодня!