NVIDIA A800 и H800: суперпартнер в области вычислений или герой-одиночка?
NVIDIA A800 и H800: суперпартнер в области вычислений или герой-одиночка?

Рано утром кто-то из группы задал вопрос:

Я думаю, что это очень хороший вопрос. Вы можете расширить этот вопрос до:

Могу ли я вставить RTX3080 и RTX4090 в свою машину?

или,

Могу ли я вставить карту RTX и карту Tesla в свою машину?

Так смогут ли A800 и H800 сформировать суперкоманду по вычислительной мощности? Этот вопрос необходимо рассматривать с двух точек зрения:

Во-первых, давайте посмотрим на возможности их соединения на одной машине.

Основное внимание в карте A800 уделяется ее возможностям межсетевого взаимодействия, которые позволяют обеспечить P2P-доступ и общую видеопамять. Две карты A800 можно соединить между собой через P2P-доступ, чтобы заимствовать и получать доступ к видеопамяти друг у друга, без проблем! Однако предыдущие поколения NV-карт не могут осуществлять P2P-доступ между версиями вычислительной мощности, поэтому A800 и H800 не могут быть соединены между собой, теряя возможность взаимодействия друг с другом и агрегирования видеопамяти. Возможность межсетевого взаимодействия является важным преимуществом A800! По этой же причине карта А100 не имеет этой функции (из-за слишком высокой скорости Интернета), поэтому ее замедлили и превратили в карту А800. Поэтому, если смешать A800 и H800, они не смогут соединить между собой и потеряют соответствующие характеристики, что бессмысленно. Так что с этой точки зрения смешивать эти две карты не рекомендуется.

Однако, если они используются вместе на одной машине, выход все же есть. Предположим, по соображениям бюджета вы сначала устанавливаете карту A800, а затем добавляете карту H800 после того, как у вас появится бюджет. Это нормально. Однако при написании программ необходимо обращать внимание на функциональные различия разных вычислительных возможностей. Например, вычислительная мощность A800 составляет всего 8,0, и каждый SM не имеет встроенного механизма передачи данных DMA, такого как TMA, а у H800 он есть! Чтобы обеспечить полную производительность двух карт, необходимо написать и оптимизировать разные версии кода для разных карт. Конечно, если время и бюджет ограничены и вы не сможете воспользоваться новыми функциями новой карты, просто используйте ее как старую карту с более высокой производительностью. Хе-хе, хотя это и небольшая потеря, но это все равно приемлемо.

Что касается ситуаций с несколькими компьютерами, например, если несколько машин образуют стойку, вы все равно можете смешивать карты A800 и H800. В настоящее время это на самом деле небольшой кластер прикладного программного обеспечения высокого уровня. Виртуальное крупномасштабное распределенное прикладное программное обеспечение работает на нескольких машинах одновременно. В этом случае, конечно, использовать его не составит труда. Однако при планировании задач могут возникнуть некоторые проблемы. Потому что новая карта может быть быстрее, а старая в некоторых приложениях может быть относительно медленнее. Поэтому возможность планировать задачи очень важна. Мы должны поддерживать баланс нагрузки между несколькими картами или несколькими компьютерами, чтобы некоторые старые карты не стали узким местом для производительности всей системы. Эй, планирование немного затруднительно.

Обратите внимание, что эта комбинация нескольких машин обычно используется для распределенного обучения глубокому обучению. Это частный случай упомянутого выше приложения! Многие люди покупают его просто для того, чтобы сформировать большую команду из нескольких машин. В этом случае пользователям, возможно, не придется писать код самостоятельно, а просто выбрать мощную распределенную среду обучения. Хе-хе, сможет ли этот фреймворк справиться с аппаратными конфигурациями с разными характеристиками и производительностью одновременно, это зависит от самого фреймворка.

Итак, могут ли A800 и H800 образовать вычислительный кластер? Если они плотно соединены между собой на одной машине, смешивать их не рекомендуется! Но если вы сначала купите A800, а затем у вас будет бюджет на покупку H800, вы сможете его использовать. Вам просто нужно уделить внимание написанию разных версий кода. Для стойки, состоящей из нескольких машин, также возможно сочетание A800 и H800, но вам нужно быть более осторожным с точки зрения планирования задач. Короче говоря, их полезно использовать, но не позволяйте их функциям и производительности пропадать зря! Хе-хе~

Вышеизложенное отражает только наше мнение. Если у вас есть какие-либо дополнительные или иные мнения, оставьте сообщение, и мы обсудим его вместе!

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose