[Знания] Понимание схемы топологии компьютерного оборудования lstopo и знаний, связанных с PCI, на одном изображении.
[Знания] Понимание схемы топологии компьютерного оборудования lstopo и знаний, связанных с PCI, на одном изображении.

При перепечатке просьба указывать источник:Теория большого взрыва старшего Сяофэна[xfxuezhagn.cn] Если эта статья поможет вам,добро пожаловать[Ставь лайк, в избранное, подписывайся]ой~

Оглавление

аппаратная топология lstopo

Дополнительные знания

HostBridge и PCIBridge

HostBridge и Потеря PCIBridge

Пропускная способность разных версий PCIe

Версия PCIe и накладные расходы на кодирование

Соотношение между ГТ/с и ГБ/с


Если вы хотите установить: sudo apt install hwloc hwloc-gui -y

Затем: лстопо-в

аппаратная топология lstopo

Пропускная способность на рисунке представляет собой общую полосу пропускания в одном направлении, а не полосу пропускания одного канала.

Одна вещь требует особого внимания:потому чтоNVIDIAВождение встречиАвтоматически управлять параметрами графического процессора,Итак, в режиме ожидания,что ты видишьGPUСоответствующийPCIeпропускная способность составляет 4 ГБ/с. Но на самом деле, когда вы запускаете код, драйвер автоматически возможность подтянуться, как на картинке ниже, пропускная способность достигла максимума в 16ГБ/с. Так что не обманывайтесь:

Точно так же другие параметры, такие как Perf, также по умолчанию имеют значение P8 и автоматически переключаются на P2 при запуске задачи.

Дополнительные знания

Следующий контент взят из GPT и предназначен только для справки.

HostBridge и PCIBridge

в компьютерном оборудовании,HostBridge и PCIBridge Это ключевой компонент, используемый для подключения и управления различными типами аппаратных устройств. Вот их подробное объяснение:

HostBridge (главный мост)

HostBridge,также называется главным мостом,Это мост, соединяющий процессор и шину PCI. Его основная функция — соединение процессора с устройствами на шине PCI (такими как видеокарты, сетевые карты, устройства хранения данных и т. д.). HostBridge отвечает за передачу данных между процессором и устройствами PCI.,И управляет контролем памяти и запросами ввода-вывода.

PCIBridge (PCIмост)

PCIBridge, также известный как мост PCI, представляет собой мост, используемый для расширения шины PCI. Он позволяет подключать несколько устройств PCI и передавать данные между различными устройствами PCI. PCIBridge в основном используется для расширения шины PCI системы для подключения большего количества устройств PCI. Мосты PCI могут быть традиционными мостами PCI (для стандартных устройств PCI) или мостами PCIe (для устройств PCI Express).


HostBridge и Потеря PCIBridge

HostBridge и Потеря PCIBridge зависит от множества факторов,Включая аппаратную архитектуру, скорость соединения, тип передаваемых данных и т. д. Вообще говоря,Эта потеря включает в себя Задержка(латентность)ипропускная ограничения мощности (пропускной способности). Вот некоторые распространенные типы потерь и факторы, влияющие на них:

HostBridge и PCIBridgeиз Задерживать

  • Задержка HostBridge:HostBridgeобычно отвечает заCPU、ПамятьиI/Oустройства, соединенные вместе,Его производительность в основном определяется скоростью системной шины и сложностью логики управления. в современных системах,Скорость HostBridge обычно составляет от десятков до сотен наносекунд.
  • Задержка PCIBridge:PCIBridgeиспользуется для объединения несколькихPCIустройства, подключенные к одному и тому жеPCIв автобусе。этоиз Задерживать В основном состоит измост Подключите чипиздизайнискорость соединения (например, поколение PCIe) решают. PCIe Однопрыжковая задержка для версии 3.0 и выше обычно составляет от нескольких сотен наносекунд до микросекунд.

HostBridge и PCIBridgeизпропускная способность

  • Пропускная способность HostBridge:HostBridgeизпропускная способность зависит от системной шины (например, QPI, UPI) пропускная способность. Шина пропускная для современных высокопроизводительных систем способность может достигать десятков ГБ/с.
  • Пропускная способность PCIBridge:PCIBridgeизпропускная способностьв зависимости отPCIe-версияи Количество каналов。Например,PCIe 3.0 Теоретическая максимальная пропускная способность x16 способность составляет около 16 ГБ/с, а PCIe 4.0 Теоретическая максимальная пропускная способность x16 способность составляет около 32 ГБ/с.

фактические факторы влияния

  1. PCIe-версия:разные версииизPCIe(нравитьсяPCIe 3.0, 4.0, 5.0) с разной пропускной способностью возможности Заботиться о собственности. Более новые версии обычно предлагают более высокую пропускную способность. способностьинижеиз Задерживать。
  2. Количество каналов:PCIeКоличество каналы (такие как x1, x4, x8, x16) напрямую влияют на общую пропускную способность способность。Болееиз Количество каналы означают более высокую пропускную способность способность。
  3. Тип устройства:разные типыизоборудование(нравитьсяхранилище、сеть、GPU)вернопропускная Требования к способностии За содержание разные. Например, графические процессоры и высокоскоростные устройства хранения данных обычно требуют более высокой пропускной способности. способностьинижеиз Задерживать。
  4. Загрузка системы:Загрузка системы Условия одновременного доступа также повлияют на фактическую способность. Например, когда несколько устройств одновременно обращаются к одному и тому же мосту, может возникнуть пропускная способность. способностьконкурироватьи Задерживать Увеличивать。

Конкретные числовые примеры

  • Задерживать:в современных системах,HostBridge и Один переход PCIBridge обычно занимает от десятков до сотен наносекунд. PCIe 4.0из Задерживатьобычно чемPCIe 3,0 низкий.
  • пропускная способность:PCIe 3.0 Максимальная теория х16 пропускная способностьдля16GB/s,PCIe 4.0 x16 — 32 ГБ/с, PCIe 5.0 x16 — 64 ГБ/с.

Пропускная способность разных версий PCIe

Версия PCIe и накладные расходы на кодирование

Что касается пропускной способности PCIe, вы действительно можете увидеть некоторые различия в десятичных запятых, в основном из-за таких факторов, как накладные расходы на кодирование при передаче данных.

на PCIe В версиях 1.0и2.0 при передаче данных используется кодировка 8b/10b, что означает, что на каждые 10 бит передаваемых данных 2 бита используются для Накладных. расходы на кодирование. Следовательно, фактическая эффективная скорость передачи данные будут немного ниже теоретической максимальной пропускной способности способность。

Начиная с PCIe 3.0, при передаче данных используется кодировка 128b/130b, что означает, что 2 бита из каждых 130 бит передаваемых данных используются для кодирования служебных данных, эффективность кодирования повышается, а фактическая эффективная полоса пропускания приближается к теоретической полосе пропускания.

Конкретные примеры расчета:

  • PCIe 1.0и2.0
    • пропускная на канал способность:2.5 ГТ/с (2,5 в секунду GigaTransfers)
    • 8b/10bАктуально после кодированияпропускная способность:2.5 * 0.8 = 2.0 Гбит/с (2,0 в секунду GigaBits)
    • Преобразование в байты: 2,0 Гбит/с / 8 = 0,25 ГБ/с (на полосу).
    • канал х16: 0,25 * 16 = 4 ГБ/с ​​(в одну сторону)
  • PCIe 3.0
    • пропускная на канал способность:8 GT/s
    • Фактическая пропускная способность после кодирования 128b/130b: 8 * (128/130) = 7,877 Гбит/с.
    • Преобразовано в байты: 7,877 Гбит/с / 8 = 0,985 ГБ/с (на полосу)
    • канал x16: 0,985 * 16 = 15.75 ГБ/с ​​(в одну сторону)
  • PCIe 4.0
    • пропускная на канал способность:16 GT/s
    • Фактическая пропускная способность после кодирования 128b/130b: 16 * (128/130) = 15,754 Гбит/с.
    • Преобразовано в байты: 15,754 Гбит/с / 8 = 1,969 ГБ/с (на полосу).
    • канал x16: 1,969 * 16 = 31.51 ГБ/с ​​(в одну сторону)
  • PCIe 5.0
    • пропускная на канал способность:32 GT/s
    • Фактическая пропускная способность после кодирования 128b/130b: 32 * (128/130) = 31,508 Гбит/с.
    • Преобразовано в байты: 31,508 Гбит/с / 8 = 3,938 ГБ/с (на полосу).
    • канал x16: 3,938 * 16 = 63.02 ГБ/с ​​(в одну сторону)

Соотношение между ГТ/с и ГБ/с

GT/s(GigaTransfers per second)иGB/s(GigaBytes per второй) является мерой PCIe (периферийное Component Interconnect Express)интерфейспропускная Две разные единицы способности. GT/s представляет собой количество передач в секунду, а GB/s представляет собой объем данных, передаваемых в секунду. Чтобы конвертировать GT/s в GB/s, вам необходимо рассмотреть Накладные расходы на кодированиеи Разрядность данных。

Трансформационные отношения

  1. скорость передачи данных:PCIeСкорость передачиGT/sдляединица,Представляет количество передач в секунду (или скорость передачи символов).
  2. Накладные расходы на кодирование:PCIeразные версии采用不同изметод кодирования,Воздействие эффективное пропускная способность。
    • PCIe 1.0и2.0 использует кодировку 8b/10b, 2 из каждых 10 бит используются для служебных данных, эффективная пропускная способность способностьдлятеорияпропускная способностьиз80%。
    • PCIe 3.0 и более поздние версии используют кодировку 128b/130b, 2 бита из каждых 130 бит используются для служебных данных, эффективная пропускная способность способностьдлятеорияпропускная способностьиз98.46%。
  3. Разрядность данных:1 Byte = 8 бит, скорость передачи данных (Гбит/с) при преобразовании необходимо преобразовать в скорость передачи данных (ГБ/с).

Этапы преобразования

  1. Рассчитайте эффективную скорость передачи данных на канал (Гбит/с).
  2. Конвертировать Гбит/с в ГБ/с.

Конкретный расчет

Ниже приведен расчет однонаправленной пропускной способности на линию различных версий PCIe:

  1. PCIe 1.0и2.0
    • На канал: 2,5 GT/s
    • 8b/10bКодировка действительнапропускная способность:2.5 GT/s * 0.8 = 2.0 Gbps
    • Преобразование в ГБ/с: 2,0 Гбит/с / 8 = 0,25 ГБ/с.
  2. PCIe 3.0
    • На канал: 8 GT/s
    • 128b/130bКодировка действительнапропускная способность:8 GT/s * (128/130) = 7.877 Gbps
    • Преобразование в ГБ/с: 7,877 Гбит/с / 8 = 0,985 ГБ/с.
  3. PCIe 4.0
    • На канал: 16 GT/s
    • 128b/130bКодировка действительнапропускная способность:16 GT/s * (128/130) = 15.754 Gbps
    • Преобразовать в ГБ/с: 15,754 Гбит/с / 8 = 1,969 ГБ/с.
  4. PCIe 5.0
    • На канал: 32 ГТ/с
    • 128b/130bКодировка действительнапропускная способность:32 GT/s * (128/130) = 31.508 Gbps
    • Преобразование в ГБ/с: 31,508 Гбит/с / 8 = 3,938 ГБ/с.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose