Анализ самого мощного отечественного ядра RISC-V с открытым исходным кодом «Kunming Lake»: производительность сравнима с Neoverse N2
Анализ самого мощного отечественного ядра RISC-V с открытым исходным кодом «Kunming Lake»: производительность сравнима с Neoverse N2

27 августа по местному времени, во второй день конференции Hot Chips 2024, было официально представлено отечественное высокопроизводительное процессорное ядро ​​RISC-V третьего поколения «Xiangshan» с открытым исходным кодом «Kunming Lake».

Благодаря преимуществам оптимизированных инструкций, масштабируемости и открытому исходному коду набор инструкций RISC-V всегда считался третьей наиболее многообещающей архитектурой набора команд процессора после x86 и Arm.

На этом фоне Институт вычислительных технологий Китайской академии наук, Пекинский научно-исследовательский институт микросхем с открытым исходным кодом и Университет Китайской академии наук совместно запустили проект высокопроизводительного процессора RISC-V с открытым исходным кодом «Сяншань», который в основном нацелен на высокопроизводительные приложения.

В 2021 году было официально выпущено высокопроизводительное процессорное ядро ​​RISC-V первого поколения с открытым исходным кодом «Yanqi Lake» серии «Xiangshan». Это самое производительное процессорное ядро ​​с открытым исходным кодом в мире за тот же период. В мае 2023 года было официально выпущено высокопроизводительное процессорное ядро ​​RISC-V второго поколения серии «Xiangshan» «Nanhu». В то время оно также стало первым отечественным высокопроизводительным процессорным ядром RISC-V с открытым исходным кодом. тест Arm Cortex-A76 ; На этот раз выпущено высокопроизводительное процессорное ядро ​​RISC-V с открытым исходным кодом третьего поколения серии «Xiangshan», которое представляет собой тест ядра Arm Neoverse N2.

По имеющимся данным, высокопроизводительное процессорное ядро ​​RISC-V третьего поколения с открытым исходным кодом имеет техпроцесс 7 нм, основную частоту 3 ГГц и оценку SPECINT2006 15 баллов/ГГц. Его производительность сравнивается с Arm. Ядро Neoverse N2 может широко использоваться в серверах. Высокопроизводительные чипы, такие как микросхемы, чипы искусственного интеллекта, графические процессоры и DPU, могут служить в качестве технологий с открытым исходным кодом и общей базой для передовой компьютерной индустрии.

На рисунке ниже показана микроархитектура высокопроизводительного процессорного ядра RISC-V третьего поколения «Xiangshan» с открытым исходным кодом «Kunming Lake», включая векторные и гипервизорные расширения.

Вот конструкция предсказателя ветвления и кода инструкций/интерфейсного TLB для ядра «Озеро Куньмин».

Бэкэнд имеет 6-уровневое декодирование/переименование/планирование.

Модуль целочисленных вычислений представляет собой конструкцию из 4 АЛУ, которая также имеет модули с плавающей запятой и векторные модули.

Ядро «Kunming Lake» также имеет блоки памяти с конвейерами загрузки и хранения, MMU и кэши данных.

Ядро «Kunming Lake» имеет до 1 МБ выделенного кэша L2 и общий кэш L3 объемом 16 МБ. Общий L3 объемом 16 МБ может показаться небольшим по сравнению с современными конструкциями больших серверных процессоров, но по сравнению с Neoverse N2 он довольно хорош.

Это конвейерная схема 13-ступенчатой ​​сборочной линии активной зоны «Озеро Куньмин».

Сравнение параметров высокопроизводительных процессорных ядер RISC-V с открытым исходным кодом «Xiangshan» «Nanhu» и «Kunming Lake» с Arm Neoverse N2 и Arm Cortex A76. Видно, что по некоторым параметрам «Куньмин Лейк» уже лучше Neoverse N2.

Что касается производительности, оценка "Kunming Lake" по SPEC CPU 2006 достигла 44 баллов, а за счет оптимизации компилятора может даже достичь 47,63 балла.

Во время 4-го китайского саммита RISC-V (RVSC2024), проходившего с 19 по 25 августа этого года, разработчики успешно продемонстрировали в Пекинском научно-исследовательском институте микросхем с открытым исходным кодом, что они успешно запустили «Cloud·Original» на основе платы разработки «Nanhu». ". По имеющимся данным, Nanhu v3 и Kunming Lake v1 в настоящее время готовы к снятию на пленку.

В дополнение к процессорным ядрам RISC-V проект «Xiangshan» запустил настраиваемые и масштабируемые решения SoC, которые поддерживают более высокопроизводительные чипы для создания более крупных кластеров.

Что касается программного обеспечения, проект «Сяншань» также оснащен инструментами с открытым исходным кодом.

А цепочки инструментов гибкой разработки, такие как difftest, можно использовать для своевременного обнаружения ошибок RTL.

LightSSS поддерживает воспроизведение отладочной информации при моделировании. Эти инструменты помогают улучшить конструкцию чипов посредством тестирования перед запуском в производство.

По имеющимся данным, группа компаний разрабатывает чипы AI для центров обработки данных, серверные чипы RISC-V сверхвысокой вычислительной мощности на основе высокопроизводительного ядра RISC-V с открытым исходным кодом «Xiangshan», полностью независимые чипы облачных вычислений RISC-V для Ожидается, что в 2025 году отечественные графические процессоры на базе RISC-V и другие высокопроизводительные чипы станут коллективным прорывом в области высокопроизводительных вычислительных чипов RISC-V.

Наконец, есть краткое описание проекта Сяншань, дорожная карта двух ядер «Наньху» и «Озеро Куньмин». Два ядра продвигаются параллельно двумя командами. Планируется реализовать пятую версию проекта. Ядро «Наньху» и озеро Куньмин в этом году. Вторая версия проекта будет завершена, и итерации продолжатся в следующем году.

Редактор: Core Intelligence — Меч Руруни

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose