Монтажер: Ли Шу
Исследователи из Университета Цинхуа использовали оригинальный метод Гамильтона (DeepH) теории функционала плотности глубокого обучения для разработки универсальной модели материала DeepH и продемонстрировали реальное решение для построения «модели большого материала». Эта революционная разработка является инновацией. Открытие материалов открывает новые возможности.
в материальном дизайне,Понимание его электронной структуры и свойств является ключом к прогнозированию свойств материала, открытию новых материалов и оптимизации свойств материала. прошлое,Теория функционала плотности (ТПФ) широко используется в промышленности для изучения электронной структуры и свойств материалов.,Его суть заключается в использовании электронной плотности в качестве носителя всей информации в основном состоянии молекул (атомов).,а не волновая функция одного электрона,Тем самым преобразуя многоэлектронную систему в одноэлектронную задачу для решения,Это упрощает процесс расчета,Это также может обеспечить точность расчета.,Это может более точно отразить распределение пор по размерам.
Однако ДПФ чрезвычайно затратен в вычислительном отношении и часто может использоваться только для изучения небольших материальных систем. Вдохновленные Инициативой «Геном материалов», ученые начали пытаться использовать ДПФ для создания огромной базы данных материалов. Хотя до сих пор был собран лишь ограниченный набор данных, это уже замечательное начало. Начиная с этого, с новыми изменениями, вызванными технологией искусственного интеллекта, исследователи начали думать: «Может ли объединение глубокого обучения и ДПФ, позволяющее нейронной сети глубоко изучить суть ДПФ, привести к революционному прорыву?»
Это в точности гамильтониан теории функционала плотности глубокого обучения. (DeepH) 方法的核心。DeepH может не только выполнять вычисления с беспрецедентной скоростью и эффективностью.,А с увеличением данных обучения,Его интеллект также постоянно улучшается.недавно,Сюй Юн с факультета физики Университета Цинхуа、Исследовательская группа Дуань Вэньхуэя успешно использовала свой оригинальный DeepH метод, разработать DeepH Универсальная модель материала и продемонстрировано реальное решение для создания «большой модели материала». Этот прорыв открывает новые возможности для открытия инновационных материалов.
Соответствующее исследование называется «Универсальная модель материалов гамильтониана теории функционала плотности глубокого обучения» и опубликовано в Science Bulletin.
Бумажный адрес: https://doi.org/10.1016/j.scib.2024.06.011 Подпишитесь на официальный аккаунт и ответьте «DeepH» в фоновом режиме, чтобы получить полную информацию. PDF
Проект с открытым исходным кодом «awesome-ai4s» объединяет более 100 статей. AI4S Интерпретируйте статью и предоставьте обширные наборы данных и инструменты: https://github.com/hyperai/awesome-ai4s
Чтобы продемонстрировать универсальность модели универсального материала DeepH, в этом исследовании была создана большая база данных материалов, содержащая 104 твердых материала, через автоматизированную интерактивную инфраструктуру и базу данных (AiiDA).
Чтобы продемонстрировать разнообразный элементный состав, в исследовании также были выбраны первые четыре строки таблицы Менделеева, исключая переходные элементы от Sc к Ni, чтобы избежать помех со стороны магнитных материалов, и исключая элементы благородного газа. Возможные структуры материалов извлекаются из базы данных Materials Project. Помимо фильтрации по типу элемента, возможные материалы дополнительно уточняются в проекте материалов, чтобы включать только те, которые помечены как «немагнитные». Для простоты исключены структуры, содержащие более 150 атомов в элементарной ячейке.
Распределение количества атомов и элементов в каждой структуре универсального набора данных
В результате применения этих критериев фильтрации окончательный набор данных о материале состоит из всего 12,062 состоит из конструкции. В процессе обучения набор данных 6:2:2 Доля делится на обучающий набор、Набор проверкиитестовый набор。Следующий,В этом исследовании используются Структура AiiDA (автоматизированная интерактивная инфраструктура и база данных) разрабатывает высокопроизводительный рабочий процесс для выполнения расчетов по теории функционала плотности и использования его для создания баз данных материалов.
Исследования полагают,DFT гамильтониан (DFT Hamiltonian) является идеальной целью машинного обучения.
Возможные способы разработки крупномасштабных моделей материалов, способных описывать взаимосвязи структура-свойства материала.
первый,DFT гамильтониан доступен непосредственно из полной энергии (total энергия), плотность заряда (charge плотность), зонная структура (band структура), физическая реакция (physical responses) Основные величины, полученные из других физических величин,DeepH Общая модель материала может принимать любую структуру материала в качестве входных данных и генерировать соответствующие данные. DFT гамильтониан,Это позволяет напрямую получать различные свойства материала.,Как показано на картинке выше.
Как DeepH отдельно изучает и прогнозирует блоки матрицы Гамильтона ДПФ на основе локальной структурной информации.
Во-вторых,В локальном атомном базисе ДПФ гамильтонианк можно выразить как разреженную матрицу, элементы матрицы которой определяются локальной химической средой.Ожидание переменнейронная сеть (Equivariant neural networks) Средний, Глубокий Использование разных угловых квантовых чисел l помеченные выходные характеристики, представляющие DFT гамильтониан, как показано выше. Следовательно, можно моделировать гамильтонианские матричные элементы между атомными парами на основе близлежащей структурной информации, не требуя знания всей структуры материала. DFT гамильтонианская матрица для моделирования. Это не только значительно упрощает учебных задач и значительно увеличил объем обучающих данных. С точки зрения рассуждений, когда-то глубоко обучение Онлайн-обучение позволяет получить достаточно обучающих данных, обученная модель может способствовать прибытию более невидимых новых материальных структур.
DeepH Основная идея заключается в использовании нейронных сетей для представления HDFT。проходить Изменение структуры входного материала,первый был создан DFT сгенерированный код HDFT данные обучения, которые затем используются для обучения нейронной сети. Эти обученные сетевые модели затем используются для рассуждений о новых материальных структурах.
В этом процессе есть два очень важных априорных знания: одно — принцип локальности,Это исследование находится в Представлены в локальной атомной выборке DFT гамильтониан и разложить гамильтониан на блоки, описывающие межатомные связи или внутриатомные связи. Следовательно, одна структура учебного материала может соответствовать большому количеству гамильтонианских фрагментов данных. Более того, каждый гамильтонианский блок может быть определен на основе информации о локальной структуре, а не всей структуре. Это упрощение обеспечивает DeepH Высокая точность и переносимость моделей.
Во-вторых, принцип симметрии.При просмотре из разных систем координат,Законы физики остаются прежними. поэтому,Соответствующие физические величины и уравнения демонстрируют эквивалентность при преобразовании координат. Поддержание эквивалентности не только повышает эффективность данных.,И повысить способность к обобщению,Это можеткзначительно улучшено DeepH производительность. первое поколение DeepH Архитектура упрощает проблему эквивалентности за счет локальной системы координат и восстанавливает эквивалентные функции за счет преобразования локальных координат. второе поколение DeepH Архитектура основана на эквивалентных нейронных сетях под названием Дип Х-Е3. В этой структуре векторы признаков всех входных, скрытых и выходных слоев являются эквивалентными векторами. Недавно один из авторов этой работы предложил архитектуру нового поколения для глубокого обучения. Дип Х-2. С точки зрения эффективности и точности DeepH-2 Работайте оптимально.
Таким образом, модель глубокого обучения в этом исследовании DeepH использовать DeepH-2 Методическое обучение, в том числе 1,728 Тысячи параметров на основе 3 Эквивалентные блоки преобразования образуют нейронную сеть, которую можно использовать для передачи сообщений. Каждый узел и ребро несут. 80 эквивалентные характеристики.Внедрение структуры материала содержит атомный номерирасстояние между атомами,Используйте стратегию сглаживания по Гауссу,Центральный диапазон базовой функции колеблется от 0.0 до 9,0Å. Выходные характеристики нейронной сети передаются через линейный слой, а затем через Wigner-Eckart построение слоев DFT гамильтониан。
Исследование проводилось на графическом процессоре NVIDIA A100 в течение 343 эпох и заняло 207 часов. На протяжении всего процесса обучения размер пакета фиксируется равным 1, что означает, что каждый пакет содержит одну структуру материала. Наконец, при начальной скорости обучения 4×10-4, скорости затухания 0,5 и терпимости затухания 20 минимальная выбранная скорость обучения составляет 1×10-5, и обучение прекращается, когда скорость обучения достигает этого значения.
Об обучающих, валидационных и тестовых наборах,Модель Прогнозирующий Теория функционала плотности гамильтониан Средняя абсолютная ошибка (MAE) матричных элементов Достичь соответственно 1,45, 2,35 и 2,20 мэ В,Это демонстрирует способность модели рассуждать о невидимых структурах.
Оценка характеристик общей модели материала
При оценке производительности универсальной модели материала, обученной методом Deep-2 с использованием большой базы данных материалов из 104 твердых материалов, примерно 80% структур материала среди всех структур в наборе данных имели среднее абсолютное значение меньше среднего ( 2,2 мэ В) ошибка. Только 34 структуры (приблизительно 1,4% тестового набора) имеют средние абсолютные ошибки, превышающие 10 мэ В, что указывает на хорошую точность прогнозирования модели для основных структур.
провести дальнейший анализ набора данных,Модель Отклонения в характеристиках структуры материала могут быть вызваныданные Вызвано отклонением заданного распределения。Исследование показало, что чем больше обучающих структур пар элементов содержится в наборе данных, тем меньше соответствующая средняя абсолютная ошибка. Это явление может указывать на существование «закона масштабирования» в моделях общего материала глубокого обучения, то есть больший набор обучающих данных может улучшить производительность модели.
DFT Рассчитать DeepH Сравните прогнозируемые результаты
чтобы оценить DeepH Точность модели универсальных материалов при прогнозировании свойств материалов, это исследование находится в При расчете примера соответственно использовать на основе теории функционала плотности (DFT) Рассчитать DeepH Прогнозирующий DFT гамильтониан,Затем сравнили результаты расчета посещаемости этими двумя методами. Результаты показывают,DeepH Прогнозирующий Результат тот же, что и DFT Результаты расчетов очень близки, что доказывает DeepH Превосходная точность прогнозирования при расчете свойств материалов.
Доработанная универсальная модель материала для изучения конкретных материалов.
В конкретном приложении исследование исследовало аллотропы углерода с использованием точно настроенной модели универсального материала. Среди них набор данных по углеродным материалам получен из Самарской базы данных аллотропов углерода (SACADA), которая содержит в общей сложности 427 аллотропов углерода с различной атомной структурой.
На основе этого исследователи доработали общую модель материала и создали улучшенную модель специально для углеродных материалов. DeepH Модель. По сравнению с моделью без предварительного обучения точная настройка может улучшить прогнозы. DFT Средняя абсолютная ошибка гамильтониана существенно снижается до 0.54 мэ В, его также можно использовать менее чем за 50% Достигните сопоставимой точности прогнозирования в структуре обучения.
также,Точная настройка также значительно улучшает сходимость обучения.,и сократить время обучения. Можно сказать,Точная настройка помогает повысить точность прогнозов и повысить эффективность обучения. Что важнее,После тонкой настройки DeepH Модель показала значительные преимущества в прогнозировании свойств материала, а точно настроенная модель обеспечивает точные прогнозы зонной структуры практически для всех протестированных структур.
к ChatGPT В качестве отправной точки времени ИИ Мы официально вступили в новую «эру великих моделей». Эта эпоха характеризуется использованием больших наборов данных и передовых алгоритмов для глубокого обучения, способного решать сложные задачи. обучение Модель。В области материаловедения эти большие модели сочетаются с мудростью исследователей, открывая беспрецедентную новую эру исследований.Это большие Модельне только способен справитьсяи Анализ огромного количества научных данныхданные,Он также может предсказывать свойства и поведение материалов.,тем самым ускоряя открытие и разработку новых материалов.,Содействие развитию этой области в более эффективном и точном направлении.
В последнее время искусственный интеллект для науки постоянно сталкивался с материаловедением, создавая новые искры.
На основе отечественного,Пекинский национальный исследовательский центр физики конденсированного состояния SF10 Группа, Институт физики Китайской академии наук и Информационный центр компьютерной сети Китайской академии наук сотрудничали, чтобы передать десятки тысяч данных о путях химического синтеза в большую модель. LLAMA2-7b, получив таким образом MatChat Модель можно использовать для прогнозирования пути синтеза неорганических материалов; Университет электронных наук и технологий Китая, Университет Фудань и Институт технологии материалов и инженерии Нинбо Китайской академии наук успешно разработали «усталостностойкие сегнетоэлектрические материалы». " и взял на себя инициативу в преодолении проблемного поля в мире. 70 Годы проблем усталости сегнетоэлектрических материалов; Шанхайский университет Цзяо Тонг; AIMS-Lab Лаборатория разрабатывает модель интеллектуального проектирования материалов нового поколения Alpha Мат... Результаты исследований появляются часто, а материальные инновации и открытия вступили в новую эру.
Глядя на мир,Google принадлежит DeepMind Разработана модель обучения с подкреплением искусственного интеллекта для материаловедения. GNoME, нашел это 38 Более 10 000 термодинамически стабильных кристаллических материалов эквивалентны «добавлению человечеству большего количества энергии». 800 «Годы интеллектуального накопления» значительно ускорили скорость исследований по открытию новых материалов; Microsoft выпустила модель поколения искусственного интеллекта в области материаловедения. MatterGen, который может прогнозировать новые структуры материала по требованию на основе требуемых свойств материала Meta; AI Сотрудничал с американскими университетами для разработки крупнейшего в отрасли набора данных о каталитических материалах. Open Catalyst Проект, набор данных по адсорбции металлоорганического каркаса OpenDAC... Технологический гигант использует собственную технологию, чтобы активизировать область материаловедения.
Хотя по сравнению с традиционными методами исследования и разработки материалов, искусственный интеллект открывает двери для изучения более широкого спектра материальных возможностей, значительно сокращая время и расходы, связанные с открытием материалов. Однако ИИ for Science В области материалов также существуют проблемы с надежностью и эффективной реализацией, обеспечением качества данных, идентификацией и смягчением последствий для обучения. AI Необходимо решить ряд проблем, таких как потенциальные отклонения в данных системы. Это также может означать, что еще предстоит пройти долгий путь, прежде чем искусственный интеллект сможет играть более важную роль в области материаловедения.