vGPU、MIG и временной интервалтехнологияоптимизация AI и ML из GPU использовать. Узнайте, как эти методы могут уменьшить GPU стоимость и улучшить масштабируемость проекта.
Переведено с Guide to GPU Sharing Techniques: vGPU, MIG and Time Slicing,Автор: Самир Кулкарни.
оптимизация GPU Использование имеет решающее значение в современных вычислениях, особенно когда AI и ML Что касается обработки, графический процессор Существуют эти поля играют ключевую роль, поскольку они обладают беспрецедентными возможностями параллельных вычислений, позволяющими быстро обрабатывать большие наборы данных. современный GPU Бесценен в этих областях. у них есть тысячи ядер,Может быть достигнут очень высокий параллелизм. Это обеспечивает комплексное обучение модели и анализ данных в реальном времени.,И этисуществовать Традиция CPU На да нереально из.
воспользовавшись GPU ресурсы, организации могут ускорить Рабочий процесс МЛОпс,Получайте информацию быстрее,и повысить эффективность своей вычислительной инфраструктуры. Этого можно добиться за счет снижения потребности в дополнительном аппаратном обеспечении. Обеспечение операционных расходов необходимо для достижения значительной экономии средств, а также улучшения масштабируемости и гибкости для удовлетворения потребностей современных вычислительных задач. оптимизация GPU использовать скорость из Ключевого метода, который распределяется между различными нагрузками из Работы в зависимости от существования Графический процессор здесь. графический процессор (vGPU)、Многоэкземплярный графический процессор (MIG) и Временной интервал графического процессор вступает в игру на своем месте!
(vGPU vs MIG vs временной интервал)
vGPU、MIG и Временной интервал графического Цель процессора существует, позволяя нескольким задачам или пользователям совместно использовать одну физику. GPU Приходитьоптимизация GPU Ресурс изиспользовать ставку. Однако они существуют Работа таким образом, Требования к оборудованиюивариант Есть некоторые различия с точки зрения использования. В этом посте блога мы Воля проясняем эти различия и помогаем вам сделать лучший выбор для лучшего GPU оптимизация。
vGPU или виртуальный GPU это технология, которая позволяет физически GPU в нескольких виртуальных машинах (VM) разделен между. каждый VM получить все GPU Выделенный раздел ресурсов, обеспечивающий одновременный доступ нескольким пользователям и приложениям. GPU ускориться. Эта технология виртуализации требует высокой производительности графики или вычислительной мощности для достижения последовательной и предсказуемой производительности. VM Окружающая среда имеет решающее значение.
vGPU Предоставляется на виртуальной машине при необходимости GPU Очень полезно в из ситуаций. Некоторые конкретные примеры включают инфраструктуру виртуальных рабочих столов. (VDI), облачные игры и сценарии удаленной рабочей станции.
Для обработки AI/ML виртуальные графические процессоры важны для выполнения рабочих нагрузок в контейнерных средах.
vGPU Можно назначить одному, создав VM из GPU Аппаратные виртуальные экземпляры для работы. Обычно этот процесс включает в себя следующие части.
Виртуализация графического процессорадаабстрактныйфизика GPU аппаратное обеспечение для создания нескольких Виртуальных графический процессор (vGPU) из процесса, эти vGPU Может быть назначен на разные извиртуальные машины. (VM) или контейнер. графический процессор Аннотация да реализуется путем объединения компонентов программного обеспечения и управления, в том числе программ управления и специализированных GPU водитель.
Программы управления, такие как VMware vSphere、Citrix XenServer или KVM (машина на базе ядра извиртуальная), управление vGPU из Распределение и Планирование. Программы управления включают в себя один GPU Менеджмент, это ифизика GPU взаимодействовать и контролировать GPU Ресурсы поступают VM израспределение.
(архитектура виртуального графического процессора for NVIDIA vGPU)
NVIDIA vGPU из архитектура виртуального графического процессора
На хосте включено следующее vGPU Основные задействованные компоненты.
Уведомление: существуют В некоторых случаях вам может не понадобиться хост-драйвери GPU Менеджер существует одновременно. Одного из этого может быть достаточно. Пожалуйста, обратитесь к документации производителя для получения конкретных указаний.
каждый VM Назначается на основе предопределенных профилей GPU Ресурсы из части. Эти файлы конфигурации определяют каждый VM Сколько получить GPU Память вычислительной мощности,убеждатьсясправедливое распределениеиоптимальныйиспользовать。
Чтобы включить ииспользовать vGPU, вам нужна виртуализация, совместимая с конкретными Графические процессоры, хотя и самые современные GPU Все совместимо. NVIDIA Предусмотрено несколько опор vGPU из GPU, в основном из его Tesla、Quadro и A100 ряд。AMD Firepro S-Series такжеподдерживатьиспользовать SR-IOV извиртуализация。
Multi-Instance GPU (MIG) да NVIDIA существовать 2020 Год 5 Запустил технологию в марте. Это позволяет Воля одиночного физика GPU существоватьаппаратное уровни обеспечения разделены на множественную изоляцию из GPU Пример.каждые экземпляры работают независимо, имеют собственные выделенные вычислительные ресурсы и память пропускной способности. Это позволяет нескольким пользователям или приложениям совместно использовать один и тот же ресурс. GPU,сохраняя при этомпроизводительностьизоляция и безопасность。
потому что MIG позволятьсуществоватьаппаратное пара уровней обеспечения GPU руководить Раздел,Таким образом, он может достичь лучшей производительности.,Меньше накладных расходов и выше безопасность.
несколько экземпляров GPU Обычно используется для GPU Интенсивные приложения, такие как HPC Рабочая нагрузка, настройка гиперпараметров и т. д. он также используется для AI Модельное обучениеисервер вывода,Эти серверы требуют высокойпроизводительностьи Выше между процессамиизбезопасность。
NVIDIA MIG существоватьаппаратное реализация уровня программного обеспечения GPU поделился. графический процессор Ресурсы чипа (такие как CUDA Ядро и Память)существоватьаппаратное Уровни обеспечения делятся на более мелкие изолированные Пример.
MIG технология, встроенная в GPU из нескольких комбинаций архитектурных функций для достижения. Ниже приведены некоторые важные функции:
MIG использовать NVIDIA A100 GPU из Архитектура, Архитектура спроектирована таким образом, чтобы быть разделенной на семь отдельных частей. GPU Пример.каждый Экземпляр называется“МИГ-срез” , могут быть настроены на различные количества GPU Ресурсы, такие как Память вычислительных ядер.
каждый МИГ-срез работает независимо от других участков и имеет аппаратное обеспечение обязательного карантина. Выполнение нагрузки из Работы на этом экземпляре «убедитьсуществовать» не будет мешать загрузке из Работы на другом экземпляре, тем самым обеспечивая безопасную и предсказуемую среду изпроизводительности. Изоляция также предотвращает любые потенциальные нарушения безопасности и утечки данных между экземплярами.
Ресурсы графического процессора разделены на компоненты с помощью комбинации встроенного ПО и программного обеспечения. Администраторы могут создавать и управлять этими компонентами, например, в соответствии с конкретными потребностями рабочей нагрузки.,Для больших учебных работ может потребоваться более крупный изкусочек.,С большей вычислительной мощностью Памяти,А для меньших задач по рассуждению можно использовать искусочек меньшего размера.
несколько экземпляров GPU да Новая технология, которая популярна лишь у немногих GPU рядмодельподдерживать。этои NVIDIA A100 серия запущена вместе, по состоянию на 2024 Год 6 месяц, в настоящее время поддерживается только NVIDIA Ampere、Blackwell и Hopper поколение GPU поддерживать (источник)。Эти поколенияизнесколько примеровмодельсоответственнода A100、B100/200 и H100/200 GPU。
Временной интервал графического процессорада Технология виртуализации, позволяющая выполнять несколько рабочих загрузок или виртуальныймашина (VM) Поделитесь синглом Графический процессор. Каждый фрагмент по порядку. GPU часть вычислительных ресурсов распределяется между различными задачами или пользователями. Это дает возможность существовать в одиночку GPU Выполняйте несколько задач одновременно, чтобы максимизировать использование ресурсов и обеспечить справедливость воля. GPU время назначено каждому Работанагрузка。
Временной интервал графического процессора подходит для тех, кому необходимо ограниченное аппаратное существование обеспечение выполнения большого количества работ из всех Работа нагрузки. Он подходит для сценариев, которые не требуют сложного управления ресурсами и допускают изменчивость. GPU Доступ к квесту «Ипроизводительность».
Как уже говорилось выше, Временной интервал графического процессора по определению из профиля Воля GPU Распределение ресурсов Даватькаждыйвременной интервализразличные процессы。нижедаиспользоватьвременной Интервал Планирование и выполнение GPU Задача из основных шагов.
(Временной интервал графического процессора)
GPU Управление планировщиком GPU Ресурсы существуютиз распределяются между различными задачами. Это Воля GPU извременной интервал на интервалы, и эти периоды времени распределяются между различными нагрузками Работы в соответствии с предопределенными политиками Воля. VM。каждыйвременной Интервал означает одну фиксированную продолжительность, в течение этого периода существует эксклюзивный доступ к определенной Рабочей нагрузке. GPU ресурс. Эти ломтики обычно короткие, что позволяет GPU Быстро переключайтесь между задачами.
входящий из GPU Задача ставится существованияодин Зависит от Управление планировщикочередь. Планировщик организует эти задачи в соответствии с приоритетом, требованиями к ресурсам и другими политиками. Планировщик может иметь разные стратегии, например. Круговое планирование。
Когда интервал времени, назначенный задаче, заканчивается, графический процессор Переключение контекста выполняется для сохранения текущей задачи по состоянию и загрузки следующей задачи по состоянию. Это предполагает сохранение и восстановление регистров, указателей Память и других сопутствующих данных. графический процессор Все задачи, назначенные для убеждения, доступны в пределах необходимых вычислений и Памятьресурса. Это включает в себя управление назначениями Память и правильную передачу данных для убеждения. GPU и От кого GPU передача инфекции.
существовать в пределах отведенного ему интервала времени, задача существует GPU Работайте дальше, используйте вычислительное ядро, Памяйте другие ресурсы. Планировщик отслеживает производительность каждой задачи, корректируя временной интервал и Распределение по мере необходимости. ресурсов,Возьмите общую скорость использования графического процессора и убедитесь в справедливом доступе.
Временной интервал графического процессорно специфичный из Требования к оборудованию。большинствосовременный GPU Всеподдерживатьэто。
Следующие три типа GPU Раздел Сравнение технологий с высоты птичьего полета. Эта диаграмма представляет собой краткую справку для их понимания.существовать Тип раздела、SM/Память Качество обслуживания、изоляция ошибки и другие аспекты различных функций из различий.
Функция | vGPU | временной интервал | MIG |
---|---|---|---|
Тип раздела | логика | логика | физика |
самый большой раздел | большинство 20 (с использованием VCS и A100 80GB GPU) | неограниченный | 7 |
SM QoS | ❌ | ❌ | ✅ |
Качество обслуживания памяти | ❌ | ❌ | ✅ |
изоляция ошибок | ✅ | ❌ | ✅ |
Переконфигурировать | динамичный | динамичный | Необходимо перезагрузить |
GPU поддерживать | Большинство графических процессоров | Большинство графических процессоров | A100、A30、Blackwell и Hopper ряд |
существовать В этом сообщении блога,Мы исследовали три Виртуализация графического процессоратехнология:vGPU、Многоэкземплярный графический процессор (MIG) и Временной интервал графического процессора。
Теперь существуешь, ты уже знаешь vGPU、Временной интервал графического процессораи MIG Разница между из и Нам бы хотелось услышать, как вы используете эти технологии. Хотите выйти на производственный уровень и нуждаетесь в одобрении, вы можете ввести AI и GPU Эксперт по облакам чтобы помочь тебе построить себя из AI облако.
Если вы нашли эту статью полезной и информативной,Пожалуйста, подпишитесь на нашу еженедельную рассылку,больше нравитсяизстатья。пожалуйстасуществовать LinkedIn Начать разговор об этой статье из. Я хотел бы услышать ваши мысли.