Как да конфигурирате NVLink на специализиран сървър
Конфигуриране на NVLink на Вашия AlexHost специализиран сървър
Защо да използвате NVLink в AlexHost? NVLink дава възможност за свръхбърза комуникация между GPU и GPU и GPU, идеална за AI, дълбоко обучение и HPC задачи. Специализираните сървъри на AlexHost с NVMe съхранение, root достъп и DDoS защита осигуряват перфектната среда за мулти-GPU настройки с NVLink. Това ръководство обхваща конфигурирането на NVLink за оптимална производителност в AlexHost.
Какво е NVLink?
NVLink е патентована технология за свързване на NVIDIA, която позволява прехвърляне на данни между графични процесори или между графични процесори и централни процесори с висока честотна лента. Тя позволява по-бърза комуникация в сравнение със стандартните PCI Express (PCIe) връзки чрез използване на няколко ленти за данни. Тази директна комуникация свежда до минимум необходимостта данните да преминават през централния процесор, което може да намали тесните места и да подобри цялостната производителност на системата. Основни предимства на NVLink
- По-бърза комуникация: NVLink осигурява до 25 GB/s двупосочна широчина на лентата за всяка връзка, което е значително по-бързо от PCIe 3.0.
- Мащабируемост: NVLink дава възможност за мащабиране на множество графични процесори за сложни изчисления, като например обучение на модели за изкуствен интелект или научни симулации.
- Унифициран достъп до паметта: NVLink улеснява споделения достъп до паметта между графичните процесори, като им позволява да използват взаимно паметта си и да работят заедно върху големи масиви от данни.
Предварителни условия за конфигуриране на NVLink
Преди да настроите NVLink, уверете се, че разполагате със следното
- Поддържани графични процесори: NVLink е налична само за някои графични процесори на NVIDIA, като NVIDIA Tesla, Quadro и GeForce RTX (2080, 2080 Ti, 3080, 3090 и др.). Проверете дали вашите графични процесори поддържат NVLink, като проверите документацията на NVIDIA за конкретния модел, който използвате.
- Мост NVLink: За физическото свързване на графичните процесори е необходим NVLink мост. Броят на мостовете, от които се нуждаете, зависи от броя на графичните процесори и желаната конфигурация. Някои графични процесори могат да използват няколко NVLink за по-голяма пропускателна способност.
- Система, поддържаща NVLink: Уверете се, че дънната платка и BIOS на вашата система поддържат NVLink. Системата трябва да има достатъчно PCIe слотове и подходящо разстояние, за да побере физически графичните процесори и NVLink моста.
- Драйвери на NVIDIA и CUDA: За да използвате напълно NVLink, трябва да инсталирате най-новите драйвери на NVIDIA и инструментариума CUDA. Те са от съществено значение за осигуряване на комуникация между графичните процесори.
Ръководство стъпка по стъпка за конфигуриране на NVLink
Стъпка 1: Инсталирайте графичните процесори
Преди да конфигурирате NVLink, инсталирайте поддържаните графични процесори NVIDIA в PCIe слотовете на вашата система. Уверете се, че графичните процесори са добре поставени в съответните слотове. Ако дънната ви платка поддържа няколко графични процесора, обърнете внимание на разстоянието между слотовете, тъй като то трябва да е съобразено с NVLink моста
- Изключете машината и я извадете от електрическата мрежа.
- Отворете кутията на системата.
- Поставете графичните процесори в слотовете PCIe и ги закрепете на място.
- Свържете всички необходими захранващи кабели от захранващия блок (PSU) към графичните процесори.
- Затворете корпуса на системата и включете отново захранването.
Стъпка 2: Инсталиране на NVLink моста
След като графичните процесори са инсталирани, можете да ги свържете с помощта на NVLink моста. Следвайте следните стъпки
- Идентифицирайте NVLink конекторите в горната част на графичните процесори. Тези съединители са предназначени специално за NVLink моста.
- Подравнете NVLink моста с конекторите и внимателно го натиснете на мястото му. Уверете се, че мостът е здраво поставен върху двата графични процесора.
- Ако конфигурацията ви използва няколко NVLink моста (за някои графични процесори с два конектора), повторете този процес за всеки мост.
Стъпка 3: Инсталиране на драйвери NVIDIA
За да активирате NVLink, трябва да инсталирате най-новите драйвери на NVIDIA на вашата система. Следвайте тези стъпки, за да инсталирате драйверите
- Изтеглете най-новите драйвери на NVIDIA: Посетете страницата за изтегляне на драйвери на NVIDIA, изберете модела на графичния си процесор и изтеглете подходящите драйвери за вашата операционна система.
- Инсталирайте драйверите: За Linux
За Windows, стартирайте изтегления инсталатор на драйвери и следвайте инструкциите на екрана.
- Рестартирайте системата: След като инсталирате драйверите, рестартирайте системата си, за да се уверите, че промените са в сила.
Стъпка 4: Инсталиране на CUDA Toolkit
NVLink често се използва в комбинация с CUDA, особено при задачи за дълбоко обучение и високопроизводителни изчисления. За да използвате напълно NVLink, трябва да инсталирате CUDA Toolkit на вашата система
- Изтеглете CUDA Toolkit: Посетете страницата за изтегляне на CUDA Toolkit и изтеглете подходящата версия за вашата операционна система.
- Инсталирайте CUDA: За Linux
За Windows: Стартирайте инсталатора на CUDA и следвайте указанията.
- Проверете инсталацията на CUDA: След инсталацията проверете дали CUDA е инсталирана правилно, като изпълните следната команда
Тя трябва да върне версията на CUDA, инсталирана на вашата система.
Стъпка 5: Активирайте NVLink
След като графичните процесори са инсталирани, а драйверите и CUDA са настроени, можете да активирате NVLink
- Проверете конфигурацията на графичния процесор: Проверете дали графичните процесори са инсталирани и разпознати от системата, като използвате следната команда (Linux)
Това трябва да изведе всички графични процесори, инсталирани в системата, и да покаже тяхното състояние по PCIe и NVLink.
- Активиране на NVLink с nvidia-smi: Инструментът nvidia-smi се използва за активиране и наблюдение на NVLink. За да проверите дали NVLink е активирана, изпълнете
Ако NVLink е правилно конфигуриран, на изхода ще се покажат връзките между графичните процесори, показващи кои графични процесори са свързани чрез NVLink. Потърсете етикета “NVLink” между двойките графични процесори.
- Бенчмарк NVLink: Можете да стартирате тестове или бенчмаркове, за да измерите производителността на NVLink. Инструменти като cuBLAS или NCCL (NVIDIA Collective Communications Library) могат да се използват за сравнителен анализ на скоростта на трансфер на данни между графичните процесори чрез NVLink.
Стъпка 6: Конфигуриране на приложенията за използване на NVLink
За да могат вашите приложения да се възползват от NVLink, трябва да ги конфигурирате да използват високоскоростната връзка между графичните процесори. Много фреймуърки за дълбоко обучение като TensorFlow, PyTorch и MXNet автоматично откриват NVLink и я използват за операции с няколко графични процесора. Например в TensorFlow можете да проверите наличните графични процесори и тяхната свързаност с NVLink, като използвате
Рамки като NCCL (NVIDIA Collective Communications Library) са оптимизирани за NVLink и се използват за прехвърляне на данни в мулти-GPU среди
Стъпка 7: Наблюдение на състоянието на NVLink
След като NVLink е конфигуриран, е важно да се следи състоянието му, за да се гарантира, че функционира правилно. Инструментът nvidia-smi осигурява цялостно наблюдение на трафика на NVLink, използването на честотната лента и производителността на графичните процесори. Можете да използвате
Тази команда показва подробни статистически данни за NVLink връзката, включително пропускателната способност и всички грешки, възникнали по време на прехвърлянето на данни
Заключение: Повишаване на производителността на графичния процесор с NVLink в AlexHost
NVLink повишава производителността на многопроцесорните конфигурации за изкуствен интелект и високопроизводителни изчисления, а специализираните сървъри на AlexHost предоставят мощността и сигурността, за да я увеличат максимално. Инсталирайте графични процесори, свържете NVLink мостове, настройте драйвери/CUDA и наблюдавайте с nvidia-smi. Със скоростта и поддръжката на NVMe на AlexHost вашите работни натоварвания за дълбоко обучение или симулация работят с максимална производителност – започнете още днес!