Новички с нулевым фундаментом используют облачный сервер графического процессора (на примере системы Windows) для создания собственной среды глубокого обучения.
Новички с нулевым фундаментом используют облачный сервер графического процессора (на примере системы Windows) для создания собственной среды глубокого обучения.

фон

Недавно мой преподаватель организовал работу по воспроизведению дипломной модели. Однако аппаратных условий было недостаточно, поэтому мне пришлось повсюду искать бесплатные ресурсы графических процессоров. В это время я проводил дни, покупая ресурсы графических процессоров у сотен компаний. случайно наткнулся на событие опыта облачного сервера Tencent GPU, можно сказать, что длительная засуха встречается с легким дождем. Как новичок с нулевым фундаментом, я теперь запишу для вас процесс создания собственной среды глубокого обучения с использованием облачного сервера графического процессора (на примере системы Windows).

1. Экологический отбор

1.1 Среда инициализации системы

  • Модель: GN8.LARGE56
  • ОС: Windows Server 2019 Data Center Edition, 64-разрядная китайская версия.
  • CPU:Intel(R) Xeon(R) CPU E5-2680 v4 @2.40GHz 2.40GHz * 6vCPUs
  • RAM:56GB
  • GPU:Tesla P40 * 1

Что касается выбора системы, я выбрал Windows, с которой мне удобно работать. Выбирая систему Windows, я могу использовать сервер в качестве второго компьютера, которым легко управлять. Если вы знакомы с Linux, вы можете выбрать Ubuntu или Centos. В отличие от систем Windows, которые требуют настройки различных сред, необходимых для глубокого обучения, системы Linux могут напрямую выбирать различные настроенные бесплатные образы из рыночных образов и использовать их напрямую без каких-либо проблем. Заботы об установке исчезли.

1.2 Переустановите систему

Если вы хотите изменить систему, сервер также предоставляет возможность переустановки системы. Нажмите «Дополнительно» на панели операций в интерфейсе личного экземпляра, и появится опция переустановки системы, как показано на рисунке ниже.

Нажмите «Переустановить систему». Обратите внимание, что данные будут удалены после переустановки системы. Сохраните их. В интерфейсе конфигурации переустановки вы можете нажать на общедоступный образ или образ рынка, чтобы выбрать нужную конфигурацию. Некоторые образы рынка требуют оплаты, поэтому обратите внимание на разницу при выборе.

2. Соответствие версий между CUDA, cuDNN, Pytorch, TensorFlow и Python.

Перед установкой различных драйверов нам необходимо иметь общее представление о соответствии версий CUDA, cuDNN, Pytorch, TensorFlow и Python и выбрать подходящую версию адаптации в соответствии с нашей собственной конфигурацией, чтобы избежать проблем с несоответствием версий при последующем использовании.

2.1 Выбор версии драйвера CUDA

CUDA (Compute Unified Device Architecture) — вычислительная платформа, выпущенная производителем видеокарт NVIDIA. CUDA™ — это архитектура параллельных вычислений общего назначения, представленная NVIDIA, которая позволяет графическим процессорам решать сложные вычислительные задачи. Он включает в себя архитектуру набора команд CUDA (ISA) и механизм параллельных вычислений внутри графического процессора.

При выборе версии драйвера CUDA,Сначала нам нужно понять вычислительную мощность видеокарты.,Адрес запроса:https://developer.nvidia.com/zh-cn/cuda-gpus,По официальной информации,Tesla Вычислительная мощность видеокарты P40 составляет 6,1. Для более подробного ознакомления ознакомьтесь с документацией CUDA:

https://docs.nvidia.com/cuda/ampere-compatibility-guide/index.html#building-ampere-compatible-apps-using-cuda-10-0

В соответствии с соответствующей взаимосвязью между версией CUDA и вычислительной мощностью видеокарты, мы должны выбрать версию CUDA 8.0 или выше.

2.2 Выбор версии драйвера видеокарты

Определите версию CUDA, а затем выберите версию драйвера видеокарты. На следующем рисунке показана соответствующая связь между CUDA и драйвером. Дополнительные обновления и более подробную информацию можно найти в официальном описании: https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

2.3 Выбор версии cuDNN

NVIDIA cuDNN — это библиотека с графическим ускорением для глубоких нейронных сетей. Он подчеркивает производительность, простоту использования и низкую нагрузку на память. NVIDIA cuDNN можно интегрировать в платформы машинного обучения более высокого уровня, такие как Google Tensorflow и популярное программное обеспечение для кафе Калифорнийского университета в Беркли. Простая конструкция плагина позволяет разработчикам сосредоточиться на разработке и реализации моделей нейронных сетей, а не просто настраивать производительность, а также обеспечивает возможность высокопроизводительных современных параллельных вычислений на графических процессорах.

cuDNN — это библиотека ускорения глубокого обучения на графическом процессоре, основанная на CUDA. С ее помощью вычисления глубокого обучения могут выполняться на графическом процессоре. Если вы хотите запустить глубокую нейронную сеть на CUDA, вам необходимо установить cuDNN, чтобы графический процессор мог работать с глубокой нейронной сетью, а скорость работы была намного выше, чем у процессора.

На рисунке ниже показаны соответствующие отношения между некоторыми cuDNNВерсиями и CUDAВерсиями. Для получения более подробной информации обратитесь к официальной версии. сайт:https://developer.nvidia.com/rdp/cudnn-download

2.4 Отношения соответствия версий Pytorch и CUDA

Содержимое этой части обновляется в режиме реального времени. Чтобы получить последнюю соответствующую версию, запросите напрямую официальный запрос. сайт:https://pytorch.org/get-started/previous-versions Официальный представитель предоставил четкую информацию об установке. Здесь также следует отметить, что чем новее версии Pytorch и CUDA, тем лучше, поскольку в новых версиях часто возникают проблемы с совпадением, поэтому рекомендуется сначала просмотреть соответствующие отношения. в настоящее время удовлетворены, и выберите После выбора версии, которую хотите использовать, установите различные драйверы.

2.5 Сопоставление версий TensorFlow, Python, CUDA, cuDNN

Tensorflow немного сложнее, чем Pytorch, поскольку для него также требуется поддержка версий Python и компилятора. Соответствующая связь между версиями CPU и GPU и версиями Python, CUDA и cuDNN следующая.

Версия TensorFlow на основе версии процессора:TensorFlow-CPU

Версия

Python Версия

компилятор

Инструменты сборки

tensorflow-2.6.0

3.6-3.9

MSVC 2019

Bazel 3.7.2

tensorflow-2.5.0

3.6-3.9

MSVC 2019

Bazel 3.7.2

tensorflow-2.4.0

3.6-3.8

MSVC 2019

Bazel 3.1.0

tensorflow-2.3.0

3.5-3.8

MSVC 2019

Bazel 3.1.0

tensorflow-2.2.0

3.5-3.8

MSVC 2019

Bazel 2.0.0

tensorflow-2.1.0

3.5-3.7

MSVC 2019

Bazel 0.27.1-0.29.1

tensorflow-2.0.0

3.5-3.7

MSVC 2017

Bazel 0.26.1

tensorflow-1.15.0

3.5-3.7

MSVC 2017

Bazel 0.26.1

tensorflow-1.14.0

3.5-3.7

MSVC 2017

Bazel 0.24.1-0.25.2

tensorflow-1.13.0

3.5-3.7

MSVC 2015 update 3

Bazel 0.19.0-0.21.0

tensorflow-1.12.0

3.5-3.6

MSVC 2015 update 3

Bazel 0.15.0

tensorflow-1.11.0

3.5-3.6

MSVC 2015 update 3

Bazel 0.15.0

tensorflow-1.10.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.9.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.8.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.7.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.6.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.5.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.4.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.3.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.2.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.1.0

3.5

MSVC 2015 update 3

Cmake v3.6.3

tensorflow-1.0.0

3.5

MSVC 2015 update 3

Cmake v3.6.3

TensorFlow на базе GPUВерсияTensorFlow-GPU

Язык кода:javascript
копировать
Для поддержки Графический процессор, пожалуйста, измените CUDA и cuDNN bin Каталог добавлен в $PATH:
export PATH="/c/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v11.0/bin:$PATH"
export PATH="/c/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v11.0/extras/CUPTI/libx64:$PATH"
export PATH="/c/tools/cuda/bin:$PATH"

Версия

Python Версия

компилятор

Инструменты сборки

cuDNN

CUDA

tensorflow_gpu-2.6.0

3.6-3.9

MSVC 2019

Bazel 3.7.2

8.1

11.2

tensorflow_gpu-2.5.0

3.6-3.9

MSVC 2019

Bazel 3.7.2

8.1

11.2

tensorflow_gpu-2.4.0

3.6-3.8

MSVC 2019

Bazel 3.1.0

8.0

11.0

tensorflow_gpu-2.3.0

3.5-3.8

MSVC 2019

Bazel 3.1.0

7.6

10.1

tensorflow_gpu-2.2.0

3.5-3.8

MSVC 2019

Bazel 2.0.0

7.6

10.1

tensorflow_gpu-2.1.0

3.5-3.7

MSVC 2019

Bazel 0.27.1-0.29.1

7.6

10.1

tensorflow_gpu-2.0.0

3.5-3.7

MSVC 2017

Bazel 0.26.1

7.4

10

tensorflow_gpu-1.15.0

3.5-3.7

MSVC 2017

Bazel 0.26.1

7.4

10

tensorflow_gpu-1.14.0

3.5-3.7

MSVC 2017

Bazel 0.24.1-0.25.2

7.4

10

tensorflow_gpu-1.13.0

3.5-3.7

MSVC 2015 update 3

Bazel 0.19.0-0.21.0

7.4

10

tensorflow_gpu-1.12.0

3.5-3.6

MSVC 2015 update 3

Bazel 0.15.0

7.2

9.0

tensorflow_gpu-1.11.0

3.5-3.6

MSVC 2015 update 3

Bazel 0.15.0

7

9

tensorflow_gpu-1.10.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.9.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.8.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.7.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.6.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.5.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

7

9

tensorflow_gpu-1.4.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

6

8

tensorflow_gpu-1.3.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

6

8

tensorflow_gpu-1.2.0

3.5-3.6

MSVC 2015 update 3

Cmake v3.6.3

5.1

8

tensorflow_gpu-1.1.0

3.5

MSVC 2015 update 3

Cmake v3.6.3

5.1

8

tensorflow_gpu-1.0.0

3.5

MSVC 2015 update 3

Cmake v3.6.3

5.1

8

Объединив приведенное выше содержимое и исходя из моих текущих привычек использования, я наконец решил установить CUDA10.2 + Python3.7 + Pytorch 1.8.1 + Tensorflow_gpu_2.2.0. Далее я расскажу о процессе установки.

3. Знакомство с процессом установки

3.1 Установка драйвера видеокарты

Перейти на официальный сайт NVIDIA:Official Drivers | NVIDIA Выберите версию драйвера видеокарты в CUDA. В раскрывающемся меню Toolkit,Мы видим все драйверы, поддерживаемые видеокартой. Версия,Здесь выбираем версию 10.2.

Нажмите «ПОИСК», чтобы войти в интерфейс загрузки драйвера, нажмите «Загрузить», а затем установите. Здесь мы загружаем и устанавливаем непосредственно через браузер облачного сервера. Вы также можете загрузить его локально, затем загрузить на облачный сервер через FTP-инструмент и затем установить его в соответствии с вашими личными потребностями.

3.2 Установка CUDA

3.2.1 Загрузка CUDA

Сначала зайдите на официальный сайтhttps://developer.nvidia.com/cuda-toolkit-archive ,Просто выберите версию, которую хотите скачать.,Здесь мы скачиваем версию 10.2.

Затем выберите соответствующую конфигурацию системы и нажмите «Загрузить», чтобы загрузить.

3.2.2 Установка CUDA

После завершения загрузки запустите ее, и появится следующее приглашение. Это приглашение временно сохранить адрес. Нет необходимости изменять его. Просто сохраните значение по умолчанию и нажмите «ОК».

Согласитесь и продолжайте.

Выберите здесь «Пользовательский».

Вы можете выбирать по своим личным потребностям. Я здесь не особо использую Nsight, поэтому не устанавливал.

Затем нажимайте «Далее», пока установка не завершится. Будьте осторожны, не изменяйте путь установки, просто используйте его по умолчанию.

3.2.3 Настройка переменных среды

Щелкните правой кнопкой мыши мой компьютер>>>свойство>>>Расширенные настройки системы>>>переменные среды,Выберите переменную Path в системных переменных.,Нажмите, чтобы изменить,Добавьте к нему следующие пути,Нажмите «ОК» после добавления.

Язык кода:javascript
копировать
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2 
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
C:\Program Files\NVIDIA Corporation\NVSMI

3.2.4 Проверьте, успешно ли установлены драйвер видеокарты и CUDA

существоватьcmdВойдите в окноnvidia-smi,Отображение следующего изображения показывает, что установка драйвера видеокарты прошла успешно (на рисунке ниже показан работающий графический процессор).,При работе на графическом процессоре,Введите эту команду в окне cmd, чтобы просмотреть использование графического процессора).

существоватьcmdВойдите в окноnvcc -V(VДолжно быть с большой буквы),Отобразите следующее описание содержания изображения Установка Успех CUDA

3.3 Установка cuDNN

3.3.1 Загрузка cuDNN

Войти на официальный сайт:https://developer.nvidia.com/rdp/cudnn-download,Загрузите cuDNN, соответствующий версии.,Этот сайт требует регистрации/логина для загрузки,Просто следуйте подсказкам для регистрации.

НажмитеArchived cuDNN Releases,Посмотреть больше Версия,Выберите то, что вам нужно. Затем скачайте.

3.3.2 Установка cuDNN

Установка cuDNN относительно проста. Сначала разархивируйте загруженный сжатый пакет, и вы получите следующие три файла:

Измените файлы в трех вышеуказанных папках, скопировать на Установка соответственно. CUDAкорневой каталогC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2Загрузите соответствующую папку и все будет готово.cuDNNУстановить。

На этом этапе мы завершили установку драйвера видеокарты, CUDA и cuDNN. Далее мы устанавливаем Tensorflow_gpu и Pytorch, две часто используемые библиотеки глубокого обучения.

4. Установка Pytorch и Tensorflow

В соответствующем введении к версии выше,Мы выбрали три Python3.7 + Pytorch 1.8.1 + Tensorflow_gpu_2.2.0.,Каждый может в соответствии со своими потребностями,См. взаимосвязь сравнения версий.,Выберите тот, который подходит вам.

PytorchиTensorflowиз Установить Рекомендую пройтиAnacondaсоздаватьизвиртуальная среда。Anaconda(официальный сайт)То есть вы можете легко получить пакет и управлять им.,В то же время окружающей средой можно управлять единообразно. Anaconda включает более 180 научных пакетов и их зависимостей, включая Conda и Python.,Процесс установки прост,Может использоваться с высокой производительностьюPythonиRязык,Существует бесплатная поддержка сообщества.

4.1 Установка Анаконды

Введите первыйAnacondaОфициальный сайт:https://www.anaconda.com/distribution/,Прокрутите страницу вниз до конца,Выберите подходящую версию, нажмите, чтобы скачать,Если отображаемая на странице версия Python — это не то, что вам нужно,Может Нажмите На картинке нижеизarchive,Выберите прошлую версию.

Нажмитеarchive,Здесь мы выбираем скачать Anaconda3-2019.03-Windows-x86_64,он несетиздаPython 3.7, соответствует требованиям.

После завершения загрузки,Дважды щелкните, чтобы запустить,по очереди НажмитеNext>>I Agree>>Next。

Здесь рекомендуется изменить путь установки, поскольку папка ProgramData на диске C является скрытой. Для облегчения управления рекомендуется установить ее в другую папку.

Первый вариант — добавить путь установки Anaconda в переменную среды, а второй — использовать Python3.7 в качестве интерпретатора по умолчанию. Здесь я проверил оба, затем нажмите «Установить», чтобы начать установку, и дождитесь завершения установки. установка пройдет успешно.

4.2 Среда конфигурации

После завершения установки нажмите Windows, и появится папка Anaconda3. Откройте приглашение Anaconda и войдите в окно командной строки. В этом интерфейсе вы можете создать свою собственную виртуальную среду и установить различные пакеты зависимостей.

входитьconda create -n xxx_env python=3.7然后回车就开始создавать自己извиртуальная среда,Обратите внимание, что xxx_env — это имя среды.,Может быть установлен в соответствии с вашими предпочтениями,python=3.7 — это версия Python, которую можно модифицировать в соответствии с вашими потребностями.

Создание прошло успешно, как показано на рисунке ниже.

Язык кода:javascript
копировать
#Активировать команду
conda activate xxx_env 
#Выход из команды
conda deactivate

Войдите в созданную вами виртуальную среду и установите нужные пакеты по мере необходимости.

4.3 Установите Pytorch 1.8.1 + Tensorflow_gpu_2.2.0

ОткрытьpytorchОфициальный сайт:https://pytorch.org/get-started/previous-versions/,Используйте код установки, рекомендованный официальным сайтом.,УстановитьизCUDAВерсиядля10.2,Итак, я выбрал torch==1.8.1+cu102.,Вы можете выбрать conda или pipУстановить,Здесь я выбрал метод pip Установить.

Язык кода:javascript
копировать
# CUDA 10.2
pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

Рекомендуется использовать метод установки Tsinghuayuan, который может ускорить скорость загрузки. Как использовать:

Язык кода:javascript
копировать
pip install some-package -i https://pypi.tuna.tsinghua.edu.cn/simple

Таким образом, приведенная выше команда изменена на:

Язык кода:javascript
копировать
# CUDA 10.2
pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna.tsinghua.edu.cn/simple

Способ установки Tensorflow_gpu_2.2.0 аналогичен:

Язык кода:javascript
копировать
pip install tensorflow-gpu==2.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

Способ установки keras аналогичен:

Язык кода:javascript
копировать
pip install keras -i https://pypi.tuna.tsinghua.edu.cn/simple

Таким образом, мы установили несколько базовых библиотек глубокого обучения. Вы можете использовать описанный выше метод для установки необходимых вам пакетов. Вы можете использовать собственный блокнот Anaconda Jupyter, инструменты Spyder или установить PyCharm и другие инструменты, чтобы начать изучать код!

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose