Начало работы с nvidia-smi
Начало работы с nvidia-smi

Начало работы с nvidia-smi

представлять

nvidia-smi — инструмент для управления и мониторинга NVIDIA. Утилита командной строки для графического процессора. Он предоставляет простой и мощный способ просмотра использования графического процессора, температуры, использования памяти и другой информации, а также выполнения некоторых основных операций управления. Эта статья будетпредставлять Как использоватьnvidia-smiА также общие варианты использования и параметров.。

Установить

nvidia-smi обычно используется вместе с драйвером видеокарты NVIDIA. Если у вас уже есть соответствующий драйвер, вы можете запустить nvidia-smi прямо из командной строки.

Язык кода:javascript
копировать
plaintextCopy codenvidia-smi

Если nvidia-smi недоступен,вам нужно убедиться, что у вас есть правильный УстановитьNVIDIAДрайвер видеокарты。Вы можете посетить​Официальный сайт NVIDIA​Загрузите и Установитьпоследний Драйвер видеокартыпрограмма。

Основное использование

Когда вы запустите команду nvidia-smi, будет отображена информация обо всех доступных графических процессорах NVIDIA в текущей системе. Будут указаны индекс, температура, использование и другая информация для каждого графического процессора. Запустите следующую команду, чтобы просмотреть информацию о графическом процессоре в вашей системе:

Язык кода:javascript
копировать
bashCopy codenvidia-smi

Вы увидите вывод, аналогичный следующему:

Язык кода:javascript
копировать
plaintextCopy code+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.39       Driver Version: 460.39       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:00:1E.0 Off |                    0 |
| N/A   41C    P8     8W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

Кроме того, nvidia-smi поддерживает множество других параметров командной строки для получения более подробной информации о графическом процессоре и выполнения некоторых операций управления.

Общие варианты

Ниже приведены распространенные параметры команды nvidia-smi:

  • ​--list-gpus​​:Только списокGPUИндекс、имя и общий объем памяти.
  • ​--query-gpu=QUERY​​:Используйте операторы запроса, чтобы получить более подробную информациюGPUинформация。Например,использовать​​--query-gpu=temperature.gpu,fan.speed,memory.total,memory.used​​доступныйGPUтемпература、скорость вентилятора и состояние памяти.
  • ​--format=FORMAT​​:Укажите выходной формат,Включая csv, json, xml и т. д.
  • ​--display=DISPLAY​​:Указатьинформацияотображается, в которомGPUначальство。
  • ​--gpu-reset​​:Сбросить указанноеGPU。
  • ​--help​​:показать помощьинформация。

Пример

Вот некоторые варианты использования Примера:

  1. Перечислите индексы и названия всех графических процессоров:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --list-gpus
  1. Получите температуру графического процессора и использование памяти:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --query-gpu=temperature.gpu,memory.used --format=csv
  1. Отображение информации о графическом процессоре для указанного индекса:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --display=1
  1. Сброс графического процессора для указанного индекса:
Язык кода:javascript
копировать
bashCopy codenvidia-smi --gpu-reset=2

Мы можем выбрать подходящие опции и параметры в соответствии с реальными потребностями.

в заключение

nvidia-smi — бесплатная утилита командной строки для управления и мониторинга графических процессоров NVIDIA. Он предоставляет множество функций и опций, позволяющих пользователям легко просматривать состояние, производительность и использование памяти графического процессора. С nvidia-smi пользователи могут лучше понимать и управлять ресурсами своего графического процессора. Надеюсь, эта статья поможет вам понять и использовать nvidia-smi. Если у вас есть дополнительные вопросы о nvidia-smi, обратитесь к официальной документации или другим ресурсам для получения дополнительной информации.

Пример кода: используйте nvidia-smi для мониторинга температуры графического процессора и отправки предупреждений.

В некоторых сценариях приложений с интенсивным использованием графического процессора,Очень важно своевременно следить за температурой графического процессора. Ниже приведен пример кода,Получите температуру графического процессора с помощью nvidia-smi,и отправляет предупреждение, когда температура превышает пороговое значение.

Язык кода:javascript
копировать
pythonCopy codeimport subprocess
import smtplib
from email.mime.text import MIMEText
def get_gpu_temperature():
    result = subprocess.run(['nvidia-smi', '--query-gpu=temperature.gpu', '--format=csv,noheader'], capture_output=True, text=True)
    temperatures = result.stdout.strip().split('\n')
    return [int(temp) for temp in temperatures]
def send_email_alert(message):
    sender_email = 'your_email@example.com'
    receiver_email = 'recipient_email@example.com'
    password = 'your_email_password'
    
    msg = MIMEText(message)
    msg['Subject'] = 'GPU Temperature Alert'
    msg['From'] = sender_email
    msg['To'] = receiver_email
    
    with smtplib.SMTP_SSL('smtp.example.com', 465) as smtp:
        smtp.login(sender_email, password)
        smtp.send_message(msg)
# Установить порог температуры
temperature_threshold = 80
# Получить температуру графического процессора
gpu_temperatures = get_gpu_temperature()
# Проверьте, не превышает ли температура какого-либо графического процессора пороговое значение, и если да, отправьте оповещение по электронной почте.
for i, temp in enumerate(gpu_temperatures):
    if temp > temperature_threshold:
        message = f'GPU {i} temperature is {temp}°C, exceeding the threshold of {temperature_threshold}°C!'
        send_email_alert(message)

пожалуйста, обрати внимание,Перед запуском приведенного выше кода примера,Убедитесь, что ваша система правильно установлена ​​и настроена с помощью инструмента командной строки nvidia-smi.,и вы правильно настроилиSMTPсерверинформация。 начальствоописывать Пример Код вызывает​​nvidia-smi​​Заказ Получить температуру графического процессораинформация,ииспользовать​​subprocess​​захват модуля Заказ Выход выполнения。Затем,Он сравнивает полученную температуру с заданным порогом.,Если температура любого графического процессора превышает порог,будет отправлено оповещение по электронной почте。 Вы можете изменять и расширять его в соответствии с фактическими потребностями, например, добавляя такие функции, как запланированные проверки и запись исторических данных о температуре.

Примечание. Код примера предоставляет только базовую структуру.,При реальном применении необходимо вносить соответствующие изменения и корректировки в соответствии с конкретными обстоятельствами. в то же время,Если вы хотите перехватывать исключения и отправлять оповещения по электронной почте при аномальной температуре графического процессора.,Также необходимо настроить соответствующие механизмы обработки ошибок и циклов.,Обеспечить надежность и стабильность кода. кроме того,при отправке электронной почты,Пожалуйста, используйте SMTP-сервер легально,и соблюдать соответствующие политики безопасности и конфиденциальности.

Недостатки nvidia-smi

  1. Зависит от драйвера NVIDIA: nvidia-smi — это инструмент командной строки, предоставляемый NVIDIA.,Для установки и правильной работы он использует графический драйвер NVIDIA. Если драйвер неправильный или неисправен,nvidia-smi может работать неправильно.
  2. Применимо только к видеокартам NVIDIA: nvidia-smi можно использовать только для мониторинга и управления видеокартами NVIDIA, а не видеокартами других марок. Это ограничивает его применение в некоторых средах с гибридными графическими процессорами.
  3. Интерфейс командной строки: nvidia-smi взаимодействует через интерфейс командной строки, который может быть недостаточно интуитивным и дружелюбным для пользователей, не знакомых с операциями командной строки.
  4. Мониторинг в реальном времени не поддерживается: nvidia-smi — это статическая команда, которая обеспечивает однократный запрос информации о графическом процессоре. Если вам необходимо отслеживать такие параметры, как температура графического процессора, в режиме реального времени, вам необходимо использовать другие инструменты или писать собственные скрипты.

Похожие инструменты

  1. GPU-Z: GPU-Z — это инструмент для мониторинга и отображения информации о видеокарте. Он поддерживает видеокарты нескольких марок, включая NVIDIA, AMD и т. д. По сравнению с nvidia-smi, GPU-Z обеспечивает более дружественный графический интерфейс, который может динамически отображать такие параметры, как температура графического процессора, мощность, нагрузка и т. д., а также имеет некоторые дополнительные функции, такие как идентификация модели видеокарты, просмотр информации BIOS, и т. д.
  2. MSI Afterburner: MSI Afterburner — это инструмент для разгона видеокарт, который может отслеживать и настраивать параметры производительности видеокарт NVIDIA и AMD. Он обеспечивает мониторинг параметров графического процессора в режиме реального времени, таких как температура, частота, нагрузка и т. д., а также может отображать изменения производительности видеокарты с помощью диаграмм и журналов. Помимо функций мониторинга, он также поддерживает частотную модуляцию видеокарты, управление вентиляторами, перехват видео и другие функции.
  3. Open Hardware Monitor: Open Hardware Monitor — это инструмент мониторинга оборудования с открытым исходным кодом. Помимо поддержки мониторинга информации об оборудовании, такой как процессор и память, он также может отслеживать такие параметры, как температура графического процессора, нагрузка и частота. Он предоставляет графический интерфейс и интерфейс API, позволяющие пользователям просматривать состояние оборудования в режиме реального времени, а также может создавать отчеты и записи журналов. Все перечисленные выше инструменты можно использовать в качестве альтернативы nvidia-smi. Выберите подходящий инструмент для мониторинга и управления графическим процессором в соответствии с реальными потребностями. Эти инструменты предоставляют более богатые функции и более дружественные интерфейсы для удовлетворения потребностей различных пользователей.
boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose