Вычисления в памяти: история развития и последние результаты
Вычисления в памяти: история развития и последние результаты

Концепция вычислений в памяти была предложена еще в прошлом веке, но в то время люди надеялись повысить производительность и энергоэффективность за счет оптимизации конструкции процессора и модернизации технологических процессов. Исследования в области вычислений в памяти остановились лишь на теоретической стадии. С наступлением эры больших данных вычисления в памяти считаются новым способом повышения энергоэффективности и производительности процессоров, а также ускорения операций нейронных сетей из-за их структурных особенностей и «недействительности» закона Мура. Далее мы начнем с зарождения вычислений в памяти и представим историю их развития и последние достижения.

1. Концепция вычислений в памяти

Концепция вычислений в памяти восходит к1969 годКто-то предложил。затем,Стэнфордский исследовательский институтизKautzждать Размещено людьмиизодна статья«Массивы клеточной логики в памяти» впервые объединяют хранилище и логику.,Предложил решение «логика в памяти»[1],В статье предложено проектирование ячеистого логикахранилище (CLIM) массива.,Основные элементы и соединения в этом массиве можно «запрограммировать» для достижения желаемой логической операции.,То есть самое раннее «хранилище-логика». Следующее изображение1 представляет собой массив «интегрированное хранилище-логика», разработанный в этой статье, и реализуемую им функцию логики.

Рис. 1. Массив с интегрированной логикой хранения данных[1]

Сразу после1970 год,отСтэнфордский университетизStoneДругие опубликованные статьи,РазработанныйАрхитектура хранения данных, поддерживающая логические операции。Но всегдаиз Давайте поговорим,В 1970-е и 1980-е годы,Такие проблемы, как узкие места производительности процессора, стенки хранилища и стенки энергопотребления, не являются заметными.,Что мешает расчёту производительности, так это недостаточно мощный процессор,И поскольку в то время закон Мура еще не «истёк»,,Люди также ожидают улучшения коэффициента энергоэффективности за счет модернизации процессов.,поэтомуЛюди уделяют больше внимания тому, как повысить производительность процессора, и не читают больше статей и углубленных исследований по архитектуре вычислений в памяти.

1997 год,Калифорнийский университет, БерклиизPattersonДругие будутПроцессор интегрирован в DRAMначальство,Реализовано сочетание хранилища и расчета,Но в этот период,Вычисления в памяти все еще находятся на стадии теоретических исследований в передовых лабораториях.,Практического применения на рынке нет.

В последние годы, с развитием больших данных, искусственного интеллекта и других приложений, а также с «аннулированием» закона Мура, всемирно известные компании-производители микросхем, такие как Nvidia, Samsung и Efficient, обратили свое внимание на вычисления в памяти и провели обширные исследования. компоновка и реализация приложений. В настоящее время вычисления в памяти стали «обязательным полем битвы для военных стратегов». Как добиться прорыва в производительности, вычислительной мощности и энергопотреблении в эпоху искусственного интеллекта? Вычисления в памяти могут быть надежным ответом.

2. Современные вычисления в памяти

после 2010 года,Приложения, управляемые большими данными, быстро развиваются,Объем данных растет в геометрической прогрессии[2]。Nvidiaизглавный научный сотрудникBill Dallyсуществовать2015Годизтемадля“Nvidia's Path to Exascale”изотметил в своем выступлении,Энергопотребление передачи данных между DRAM и ЦП в 1000 раз выше, чем при простом сложении с плавающей запятой двойной точности[3].,Потребление энергии, вызванное передачей данных, в настоящее время становится основной частью энергопотребления вычислений.,стать ограничениембольшие данные новое узкое место в энергоэффективности количественных расчетов.

в то же время,Быстрая разработка новых устройств хранения данных,Включает в себя 3D-устройства многоуровневой хранилища.,нравитьсяHMC/HBMи3D XPoint;и перекрестный забор(crossbar)структураизэнергонезависимыйхранилищеустройство,нравитьсяRRAMиPCM。такизэнергонезависимыйхранилищеустройствои ТрадицияDRAMструктура по сравнению с,Он имеет преимущества высокой плотности и низкого статического энергопотребления.,В то же время егоСпециальные физические структуры обеспечивают поддержку объединения хранилища и вычислений.[2]。

Поэтому исследователи считают, что после 2010 года исследователи считают, что предоставление памяти определенного объема вычислительной мощности для уменьшения перемещения данных и снижения энергопотребления при работе компьютерной системы снова стало цениться исследователями.

2010 год,Лаборатории HPизWilliamsДля педагогического коллективамемристорРеализация простого логического значениялогика Функция。Новый типхранилищеустройствоизбыстрое развитиедля Вычисления в памяти закладывают техническую основу。С увлечением глубоким обучениемизприбытие,Вычисления в памяти благодаря своим структурным характеристикам,Считается, что он способен ускорять операции глубокого обучения.,Университеты начали соответствующие исследования в области вычислений в памяти,За границей начали появляться компании-производители процессоров, основной торговой точкой которых являются вычисления в памяти.,нравитьсяMythic。2010 год до 2015,Его можно рассматривать как этап накопления технологий вычислений в памяти.

с 2016 по 2020 год,Академическое сообщество добилось прогресса в исследованиях в различных областях вычислений в памяти. 2016 год,Доктор Го Синьцзе(сейчас Чжицунь Технологияглавный научный сотрудник)существоватьКалифорнийский университет, Санта-Барбара (UCSB)изКоманда профессора Се Юаня,Разработан первый в мире3слой нейронной сетииз Вычисления в памяти с плавающим затвором для глубокого обучениячип(PRIMEАрхитектура),Впервые была проверена полезность вычислений в памяти на основе транзисторов с плавающим затвором в приложениях глубокого обучения. По сравнению с традиционной схемой Архитектуры фон Неймана.,PRIME может снизить энергопотребление примерно в 20 раз и увеличить скорость примерно в 50 раз.,Вызвал широкое внимание отрасли на. С искусственным интеллектом и т. д. большой данныеприложениеизрост,Интегрированная технология хранения и вычислений широко исследовалась и применялась в научных кругах и промышленности в стране и за рубежом. впоследствии,различныйнравитьсяPRIME、ISAACи т. д. на основеУмножай и накапливайиз Вычисления в памяти Архитектураи на основелогикадействовать、поискдействоватьиз Вычисления в памяти相关研究被提出[2]。

На ежегодной конференции Microprocessor Top Annual Conference 2017 (Micro 2017) компании Nvidia, Intel, Microsoft, Samsung, Калифорнийский университет в Санта-Барбаре и т. д. представили свои прототипы вычислительных систем в памяти [5]. То есть в 2017 году Го Синьцзе продолжила освоение чипа глубокого обучения с плавающими затворами в памяти 7-уровневой нейронной сети. В том же году она вернулась в Китай и стала соучредителем Zhicun Technology, которая является первой в стране. -Компания по производству вычислительных чипов памяти основана в Китае.

В 2018 году ISSCC, ведущая конференция в области интегральных схем, посвятила повестку дня обсуждению тем, связанных с вычислениями в памяти, к 2019 году;,В программе дискуссий по вычислениям в памяти на IEDM, ведущей конференции в области электронных устройств, стало три,Соответствующие документы также достигаютБолее двадцати статей;2020ГодизISSCCначальство Вычисления в памятииз Диссертация такженачальство Подниматьксемь статей[6],Это показывает, что статус вычислений в памяти в академических кругах постоянно улучшается.,Соответствующие академические достижениядля后续Вычисления в памяти产品из Выброс заложил прочную основуиз База。Цзютянь Жуйсинь, Houmo IntelligenceждатьВ этот период были созданы отечественные компании по производству чипов искусственного интеллекта.,И начал накапливать технологии.

Рис. 2. Схема архитектуры PRIME[4]

Начиная с 2021 года,Постепенно запускаются продукты, связанные с вычислениями в памяти. Международные гиганты, включая Samsung, Hynix, TSMC и такие компании, как Mythic, накопили технологии.,Началось пробное производство вычислений в памяти,Samsung продемонстрировала на основеHBM2-PIMтехнологияиз Вычисления в памятичип、хиникспоказалGDDR6-AiMизобразец,TSMC продемонстрировала результаты своих исследований по реализации вычислений в памяти на SRAM, ReRAM, PCM, STT-MRAM и других устройствах. Индустриализация вычислений в памяти показывает первые результаты,Выпускается все больше и больше продуктов для вычислений в памяти. Американская процессорная компания Mythic выпускает процессор M1076,Внедрить аналоговое решение для вычислений в памяти,хранилищеMedia для Flash,Достигнув вычислительной мощности 25TOPS и энергопотребления 3 Вт по 40-нм техпроцессу, в 2022 году отечественная компания «Чжицунь Технология» запустит первый серийный процессор вычислений в памяти SOCchiпWTM2101;,Принять аналоговую парадигму хранения и вычислений.,Использование Flash в качестве носителя,Достижение высокой вычислительной мощности в 50 Gops в чрезвычайно маленьком корпусе размером 2,6x3,2 мм² в рамках зрелого 40-нм техпроцесса.,Низкое энергопотреблениек5uA.Уже используется в коммерческих целяхкв умных носимых устройствах2023ГодХоу Мо Разведкапосадочная дистанцияЧип Хунту H30,Принять парадигму вычислений с цифровым хранилищем,Использование SRAM в качестве носителя,Достижение вычислительной мощности 256TOPS и энергопотребления 35 Вт [8].

Рис. 3. Принципиальная схема чипа Houmo Hongtu H30[8].

Что касается научных исследований в университетах,Команда профессора У Хуацяна и доцента Гао Биня из Школы интегральных схем Университета ЦинхуаНа основе парадигмы вычислений в памяти.,Разработана первая в мире полностью интегрированная система.из、Поддержка эффективных срезовначальствоизучатьизмемристор (RRAM) чип вычислений в памяти。Результаты исследования основаны на«Полностью интегрированная симуляция мозга для краевого обучения мемристорчип»длявопроссуществовать Публикация онлайнсуществовать《Science》начальство[9]。Исследовательская группа академика Хуан Жу из Школы интегральных схем и Института искусственного интеллекта Пекинского университетаНа основе технологии вычислений в памяти.,Предложить эффективныеизМеханизм ускорения вычислений в памяти SRAM без АЦП,а статья ISSCC будет опубликована в 2022 году[10].

Здесь создано первое сообщество разработчиков вычислений в памяти CSDN. Основанное на исследованиях технологий в памяти, проведенных в различных отраслях, университетах и ​​​​исследовательских институтах, оно охватывает самый богатый контент для вычислений в памяти, в основе которого лежит технология in-memory и беспрецедентный открытый исходный код. технологический контент, включая анализ коммерческих приложений в облаке, периферии и устройстве, а также понимание новых технологических тенденций в эпоху искусственного интеллекта и т. д., приглашайте экспертов отрасли проводить регулярные семинары в памяти, чтобы попрактиковаться и испытать передовую архитектуру; теория на практике, как лучшее окно, вычисления в памяти делают вас всегда под рукой.
портал:https://bbs.csdn.net/forums/computinginmemory?category=10003
Первое сообщество разработчиков вычислений в памяти. Теперь для новых участников установлен нулевой порог, и вы можете зарабатывать баллы для обмена на ценные подарки, публикуя статьи;
Пионеры/посланники вычислений в памяти, вносящие вклад в развитие сообщества, могут получать двойные баллы и прирост трафика, выбранный сообществом;
Кроме того, выбранные вами статьи могут получить бонусы сообщества в размере 800, бесплатные места в офлайн-тренировочных лагерях и возможности обмена со знаменитостями на тематических мероприятиях в магазине;
Сообщество будет отдавать приоритет избранным статьям по технологиям и приложениям вычислений в памяти.,https://github.com/CIMDeveloper/CIM-Files,Пожалуйста, проверьте~

3. Направление развития вычислений в памяти

В настоящее время технология вычислений в памяти имеет очень широкие сценарии применения и широкие направления развития.,Ниже приведен краткий список некоторыхГорячие точки исследований в области технологий вычислений в памяти

(1) Обработка видео в реальном времени

Обработка видео в реальном времени是Вычисления в памятитехнологияиз一大приложение方面,Мобильные устройства (мобильные телефоны, дроны, портативные устройства) ограничены рассеиванием тепла.,Традиционный видеочип не может поддерживать высокие стандарты обработки в реальном времени. Высокая пропускная способность, высокая вычислительная мощность и другие характеристики технологии вычислений в памяти.,Это дает ей естественное преимущество в исследовании и разработке новых зрительных систем. По результатам исследования,одомашненныйЧжицунь Технологияпосадочная дистанцияЧипы продуктов серии WTM-8,Это высокопроизводительный и маломощный чип AI Vision для мобильных устройств, предназначенный для обработки видео.,Использование второго поколения 3D-вычислений в памяти Архитектура,дляПервый в мире чип машинного зрения для вычислений в памяти,Производство фильма завершено и вот-вот начнется массовое производство.,Он имеет основные преимущества: высокая вычислительная мощность, низкое энергопотребление, высокая энергоэффективность и низкая стоимость.,Применяется для высокопроизводительных изображений и пространственных вычислений [11].

Рисунок 4. Принципиальная схема чипов серии WTM-8[11]

(2) Сенсорная память и технология вычислений.

Технология сенсорной памятидействительныйначальството естьсуществовать Вычисления в памятитехнология中加начальствоощущение,Интеграция чувств, памяти и вычислений АрхитектурадлянаборИнтегрированные измерения, хранение и вычисленияиз Архитектура,Он решает проблему энергопотребления при передаче данных фон Неймана и объединяет ее с датчиками для повышения общей эффективности. По результатам научных исследований,Исследовательская группа академика Ло И Китайской инженерной академиисуществовать Журнал Китайской инженерной академии《Engineering》2022Год Нет.7Опубликовано в номере«Перспективы интеллектуальных видеочипов, объединяющих датчики, память и вычисления»одно предложение,Обобщены два различных типа Архитектуры, используемые в интегрированных интеллектуальных системах обработки изображений, хранения и вычислений [12].

Рисунок 5. Принципиальная схема сегнетоэлектрического фотоэлектрического датчика (слева) и интегрированной схемы нейронной сети для расчета памяти датчика (справа).

(3) Вычислительная технология, основанная на мозге

компьютерные вычисления, основанные на мозге,Судя по названию, это похоже на«человеческий мозг»Думай так же,Изучите методы обработки информации биологического мозга,С нейронами и синапсами как основными единицами,Моделируйте биологическую нервную систему с точки зрения структуры и функций.,А затем построить новую вычислительную форму «искусственного супермозга». По результатам научных исследований,1 августа 2019 г.,Университет Цинхуакомпьютерные вычисления, основанные на мозге Команда профессора Исследовательского центра Ши Лупина разработала первые в мире компьютерные системы гетерогенного термоядерного синтеза. вычисления, основанные на мозгечип,существовать《Nature》Журналначальство Публикуйте соответствующие статьи«Гетерогенная архитектура чипа «Тяньцзинь» для общего искусственного интеллекта»[13]。

В дополнение к указанным выше исследовательским точкам,Технология вычислений в памяти имеет множество других исследовательских приложений.,Например, карты-ускорители искусственного интеллекта, проектирование 3D-вычислений в памяти и т. д. конечно,Существует множество возможных исследовательских применений технологии вычислений в памяти, которые необходимо срочно найти.,С нетерпением ждем того дня, когда вычисления в памяти действительно войдут в нашу жизнь

Источник

[1] W. H. Kautz, “Cellular Logic-in-Memory Arrays,” IEEE Trans. Comput., vol. C–18, no. 8, pp. 719–727, Aug. 1969.

[2] Мао Хайю, Шу Цзиву, Ли Фэй и др. Прогресс исследований в области вычислений с памятью [J]. Китайская наука: информатика, 2021, 51 (02): 173-205.

[3] Вычисления в памяти Вычисления в памяти — это просто развлечение в академических кругах или это действительно ценно? - Чжиху (zhihu.com)

[4] Chi P, Li S, Xu C, et al. Prime: A novel processing-in-memory architecture for neural network computation in reram-based main memory[J]. ACM SIGARCH Computer Architecture News, 2016, 44(3): 27-39.

[5] Чэнь Вэй: Что такое интегрированная технология хранения и вычислений? История разработки, преимущества, направления применения, основные носители - Zhihu (zhihu.com)

[6] Вычисления в памяти на грани взрыва – The Paper (thepaper.cn)

[7] После почти 30 лет молчания оно стало популярным! Как вычисления в памяти могут устранить узкое место вычислительной мощности ИИ? - Чжиху (zhihu.com)

[8] Официальный сайт Houmoai (houmoai.com)

[9] Добавьте больше «основной» кинетической энергии! Команда Цинхуа опубликовала новейшую версию Научно-Пекинского национального исследовательского центра информационных наук и технологий (tsinghua.edu.cn)

[10] Академик Хуан Ру из Исследовательского центра интеллектуальных чипов, вдохновленных мозгом, исследовательская группа доцента Яна Бонана добилась важных результатов исследований в области «чипов искусственного интеллекта для вычислений в памяти» - Научно-исследовательский институт искусственного интеллекта Пекинского университета (pku.edu) .cn)

[11] Официальный сайт Witintech (witintech.com).

[12] Pan W, Zheng J, Wang L, et al. A future perspective on in-sensor computing[J]. Engineering, 2022, 14(7): 7797.

[13] Пусть велосипед по-настоящему «самоходный» и «Tianji Core» смотрят в бесконечное будущее - официальный сайт Университета Цинхуа (tsinghua.edu.cn)

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose