Команда Fudan NLP опубликовала 80-страничный обзор большой модели агента, в котором представлен обзор текущего состояния и будущего агентов ИИ в одной статье.
Команда Fudan NLP опубликовала 80-страничный обзор большой модели агента, в котором представлен обзор текущего состояния и будущего агентов ИИ в одной статье.

Колонна «Машинное сердце»

Редакция «Машинное сердце»

Станут ли агенты ключом к AGI? Команда Fudan NLP всесторонне исследует агентов на основе LLM.

Недавно группа обработки естественного языка Фуданьского университета (FudanNLP) запустила LLM-based Agents Обзорная статья, полный текст не превышает размера 86 Страниц, всего 600 Больше ссылок! Авторы начинают с AI Agent отход от истории,Комплексный обзор текущего состояния интеллектуальных агентов на основе крупномасштабных языковых моделей, включая: предысторию, состав, сценарии применения агентов на основе LLM и вызывающее обеспокоенность агентское общество.。в то же время,Авторы обсудили Agent Соответствующие перспективные открытые вопросы имеют большое значение для будущих тенденций развития в смежных областях.

  • Ссылка на документ: https://arxiv.org/pdf/2309.07864.pdf.
  • Список документов агентов на основе LLM: https://github.com/WooooDyy/LLM-Agent-Paper-List

Члены команды также добавят «резюме в одно предложение» к каждому соответствующему документу, добро пожаловать в репозиторий Star.

История исследования

В течение долгого времени исследователи занимались созданием общего искусственного интеллекта (искусственного интеллекта), который эквивалентен человеческому уровню или даже превосходит его. General интеллект, ОИИ). Уже как 1950 С, Алан Turing Он распространил понятие «интеллект» на искусственные объекты и предложил знаменитый тест Тьюринга. Эти объекты искусственного интеллекта часто называют —— актерское мастерство(Agent*)。「актерское Понятие «мастерство» зародилось в философии и описывает человека, имеющего желания, убеждения, намерения. также Сущность, способная действовать. В сфере искусственного интеллекта,Термин получил новое значение:Интеллектуальные сущности, характеризующиеся автономией, реактивностью, позитивностью и коммуникабельностью.

*Не существует единого мнения относительно китайского перевода термина «Агент». Некоторые ученые переводят его как «агент», «действующее лицо», «агент» или «разумный агент». Оба термина «агент» и «разумный агент», встречающиеся в этой статье, относятся к агенту.

С тех пор актерское Дизайн мастерства оказался в центре внимания сообщества искусственного интеллекта. Однако прошлая работа в основном была сосредоточена на повышении актерского мастерства. особые способности мастерства,Например, рассуждение символа или освоение конкретной задачи (шахматы, го и т. д.). Эти исследования больше сосредоточены на разработке алгоритмов и стратегиях обучения.,и пренебрегли развитием присущих Модели общих возможностей.,Такие как память знаний, долгосрочное планирование, эффективное обобщение и эффективное взаимодействие и т. д. Оказывается,Расширение присущих моделям возможностей является ключевым фактором содействия дальнейшему развитию интеллектуальных агентов.

Появление больших языковых моделей (LLM) дает надежду на дальнейшее развитие интеллектуальных агентов. Если путь развития от НЛП к ОИИ разделить на пять уровней: корпус, Интернет, восприятие, воплощение и социальные атрибуты, то нынешние крупномасштабные языковые модели достигли второго уровня, с вводом и выводом текста в масштабах Интернета. Исходя из этого, если агентам, основанным на LLM, предоставить пространство восприятия и пространство действий, они достигнут третьего и четвертого уровней. Более того, когда несколько агентов взаимодействуют и сотрудничают для решения более сложных задач или отражения социального поведения в реальном мире, у них есть потенциал достичь пятого уровня — общества агентов.

Авторы представляют себе гармоничное общество разумных агентов, в котором могут участвовать и люди. Сцена взята из Фестиваля морских фонарей в «Genshin Impact».

Рождение агента

Шикарное актерское с благословения Великой Модели. Каким будет мастерство? Вдохновленные дарвиновским законом о «выживании наиболее приспособленных», авторы предложили разумное актерское мастерство, основанное на большой модели. мастерство универсальных рамок. Если люди хотят выжить в обществе, они должны научиться адаптироваться к окружающей среде, поэтому им необходимо обладать когнитивными способностями и уметь воспринимать и реагировать на изменения во внешнем мире. Так же умное актерское мастерство Структура также состоит из трех частей.:Терминал управления (Brain), терминал восприятия (Perception) и терминал действия (Action).

  • консоль:обычно состоит из LLMs композиция, шикарно актерское Ядро мастерства. Он может не только хранить память и знания, но также выполнять незаменимые функции, такие как обработка информации и принятие решений. Он может представлять рассуждения и запланированные процессы и хорошо справляться с неизвестными задачами, отражая актерский интеллект. мастерствообобщаемость и Мобильность。
  • Чувствуя конец:будет умнымактерское Перцептивное пространство мастерства расширяется от чистого текста и включает в себя мультимодальные поля, такие как текст, зрение и слух, создавая актерское мастерство. мастерство может более эффективно получать и использовать информацию из окружающей среды.
  • мобильный терминал:Помимо обычного вывода текста,Это также дает актерскому мастерству возможность воплощать и использовать инструмент.,позволяют ему лучше адаптироваться к изменениям окружающей среды,Взаимодействуйте с окружающей средой посредством обратной связи,Может даже формировать окружающую среду.

LLM-based Agent Концептуальная основа состоит из трех компонентов: консоль (Brain), Чувствующая. конец(Perception)имобильный терминал(Action)

Авторы используют пример, чтобы проиллюстрировать рабочий процесс агента на основе LLM: когда человек спрашивает, будет ли дождь, окончание восприятия (Восприятие) преобразует инструкцию в представление, понятное LLM. Затем терминал управления (Мозг) приступает к рассуждениям и планированию действий на основе текущей погоды и прогнозов погоды в Интернете. Наконец, Действие отвечает и передает зонтик человеку.

Повторяя описанный выше процесс, интеллектуальный агент может непрерывно получать обратную связь и взаимодействовать с окружающей средой.

Контроллер: Мозг

В качестве основного компонента интеллектуального агента авторы представляют его возможности с пяти аспектов:

Взаимодействие на естественном языке:Язык – средство общения,Он содержит огромное количество информации。Воспользуйтесь LLMs Благодаря мощным возможностям генерации и понимания естественного языка интеллектуальные агенты могут взаимодействовать с внешним миром в течение нескольких раундов посредством естественного языка для достижения своих целей. Конкретно его можно разделить на два аспекта:

  • Генерация высококачественного текста. Обширные оценочные эксперименты показывают, что LLM могут генерировать беглый, разнообразный, новый и контролируемый текст. Несмотря на низкую успеваемость на отдельных языках, в целом имеются хорошие многоязычные навыки.
  • Понимание смысла: в дополнение к интуитивно выраженному содержанию,Язык также может передавать такую ​​информацию, как намерения и предпочтения говорящего. Подтекст помогает актерскому мастерству более эффективно общаться и сотрудничать.,Большая Модель уже показала свой потенциал в этой области.

Знание:На основе масштабного корпусного обучения LLM обладают способностью хранить огромные объемы знаний. Помимо языковых знаний, необходимы знания здравого смысла и профессиональных навыков. LLM-based Agents важный компонент.

Хотя у самих студентов LLM все еще есть такие проблемы, как истечение срока действия знаний и галлюцинации, некоторые существующие исследования могут в определенной степени облегчить их с помощью таких методов, как редактирование знаний или вызов внешних баз знаний.

память:В рамках этой статьи,Модуль памяти (Memory) хранит актерское кино мастерство Последовательность прошлых наблюдений, мыслей и действий. Благодаря специфическому механизму памяти актерское мастерство позволяет эффективно размышлять и применять предыдущие стратегии.,Позвольте ему использовать прошлый опыт, чтобы адаптироваться к незнакомой среде.

Для улучшения памяти обычно используются три метода:

  • Расширьте ограничение длины магистральной архитектуры: улучшите ограничение длины последовательности, присущее трансформаторам.
  • Подведение итогов: обобщение воспоминаний, чтобы улучшить вашу способность извлекать ключевые детали из памяти.
  • Сжатие. Эффективность извлечения данных из памяти можно повысить путем сжатия памяти с использованием векторов или соответствующих структур данных.

Кроме того, важен также метод извлечения из памяти. Только извлекая соответствующий контент, агент может получить доступ к наиболее актуальной и точной информации.

рассуждение & планирование:рассуждениеспособность(Reasoning)Для умныхактерское мастерство необходимо для сложных задач, таких как принятие решений и анализ. Бетонприезжать LLMs Вверх, то есть на основе Цепочка мыслей (CoT) представляет собой серию оперативных методов. Планирование — это часто используемая стратегия при столкновении с большими проблемами. Это помогает агентам организовать свое мышление, поставить цели и определить шаги для достижения этих целей. В конкретной реализации планирование может включать в себя два этапа:

  • План Formulation):актерское мастерство разбивает сложные задачи на более выполнимые подзадачи. Например: однократная декомпозиция с последующим последовательным выполнением, пошаговое планирование и выполнение, многопутевое планирование и выбор оптимального пути и т.д. В некоторых сценариях, требующих профессиональных знаний, актерское мастерство может быть связано с конкретной сферой Planner Интеграция модулей расширяет возможности.
  • Анализ плана: после составления плана вы можете поразмышлять над ним и оценить его сильные и слабые стороны. Это размышление обычно происходит из трех аспектов: использование внутренних механизмов обратной связи; получение обратной связи от взаимодействия с людьми и получение обратной связи от окружающей среды;

Мобильность & Обобщаемость:обладать мировыми знаниями LLMs Наделите интеллектуальных агентов мощными возможностями миграции и обобщения. Хороший агент — это не статичная база знаний, он также обладает возможностями динамического обучения:

  • Обобщение на неизвестные задачи: по мере увеличения масштаба обучения и обучающих данных LLM Удивительные способности появляются при решении неизвестных задач. Большая модель, настроенная по инструкции в zero-shot Он хорошо показал себя в тестах и ​​по многим задачам достиг результатов, не уступающих экспертам Модель.
  • Контекстное обучение Обучение): Большая Модель не только способна изучать аналогии из небольшого количества примеров в контексте, эта способность также может Расширятьприезжать мультимодальные сцены за пределами текста, для актерского мастерства. Реальные применения мастерства открывают больше возможностей.
  • Непрерывное обучение Обучение): Основная проблема непрерывного обучения — катастрофическое забывание, то есть, когда Модель изучает новую задачу, легко потерять знания по прошлым задачам. Интеллект в профильных областях актерского мастерства мастерство должно стараться избегать потери знаний в общих областях.

Конец восприятия: Восприятие

Люди воспринимают мир мультимодально, поэтому исследователи возлагают одни и те же ожидания на агентов на основе LLM. Мультимодальное восприятие может углубить понимание агентом рабочей среды и значительно повысить ее универсальность.

Ввод текста:как LLMs Самые базовые способности здесь описываться не будут.

Визуальный ввод:LLMs Он не обладает возможностями визуального восприятия и может понимать только дискретный текстовый контент. А визуальный ввод обычно содержит много информации о мире, включая свойства объектов, пространственные отношения, расположение сцены и т. д. Распространенными методами являются:

  • Преобразование визуальных данных в соответствующее текстовое описание (субтитры к изображениям): они могут быть понятны преподавателям LLM и имеют высокую интерпретируемость.
  • Кодовое представление визуальной информации: на основе визуальной основы Модель + LLMs парадигма для формирования модуля восприятия,Позвольте Модели понять содержание различных модальностей посредством операций выравнивания.,Вы можете тренироваться непрерывно.

Слуховой ввод:Слух также является частью человеческого восприятия.важный компонент.потому что LLMs Благодаря отличным возможностям вызова инструментов интуитивная идея такова: агент может LLMs В качестве центра управления он каскадно вызывает существующие наборы инструментов или экспертные модели для восприятия аудиоинформации. Кроме того, звук также можно визуально представить через спектрограмму. Спектрограммы могут отображаться в виде плоских изображений. 2D Информация, следовательно, некоторыми методами визуальной обработки может быть перенесена в речевую область.

Другой ввод:В реальном мире информация — это гораздо больше, чем просто текст.、Зрениеислушание。Авторы надеются, что в будущем,разумныйактерское Мастерство может быть оснащено более богатыми сенсорными модулями, такими как осязание, обоняние и другие органы, для получения более богатых атрибутов целевых объектов. В то же время актерское мастерство также может четко чувствовать температуру, влажность, светотени окружающей среды и принимать более Environment-aware действие.

Кроме того, агента также можно познакомить с восприятием более широкой окружающей среды: используя зрелые модули восприятия, такие как лидар, GPS и инерциальные измерительные блоки.

Действие: Действие

После того, как мозг проанализирует и примет решения, агенту также необходимо предпринять действия по адаптации или изменению окружающей среды:

Текстовый вывод:как LLMs Самые базовые способности здесь описываться не будут.

Использование инструмента:хотя LLMs Он обладает отличными знаниями и профессиональными способностями, но при столкновении с конкретными проблемами может возникнуть ряд проблем, таких как проблемы с устойчивостью и галлюцинации. В то же время инструменты, как расширение возможностей пользователя, могут оказать помощь в таких аспектах, как профессионализм, актуальность и интерпретируемость. Например, вы можете использовать калькулятор для решения математических задач и поисковую систему для поиска информации в реальном времени.

Кроме того, инструменты также могут расширить пространство действий интеллектуальных агентов. Например, мультимодальные действия можно получить, вызывая такие экспертные модели, как генерация речи и генерация изображения. Поэтому то, как сделать так, чтобы агенты стали отличными пользователями инструментов, то есть научились эффективно использовать инструменты, — это очень важное и перспективное направление.

В настоящее время основные методы инструментального обучения включают обучение на демонстрациях и обучение на основе обратной связи. Кроме того, метаобучение, курсовое обучение и т. д. также могут использоваться для предоставления агентам возможностей обобщения при использовании различных инструментов. Сделав еще один шаг вперед, интеллектуальные агенты смогут научиться создавать инструменты «самостоятельно», тем самым увеличивая свою автономию и независимость.

Воплощенное действие:Воплощенный(Embodyment)относится кактерское мастерство Умение понимать, преобразовывать окружающую среду и обновлять собственный статус в процессе взаимодействия с окружающей средой. Воплощенный Action) рассматривается как мост между виртуальным интеллектом и физической реальностью.

Традиционное обучение на основе подкрепления Agent Существуют ограничения в эффективности выборки, обобщении и сложных задачах и т. д., в то время как LLM-based Agents Представляя богатые внутренние знания о больших моделях, Embodied Agent Способны активно воспринимать и влиять на физическую среду, как люди. По степени автономности агента в выполнении задачи или Action Уровень сложности может иметь следующие атомы Action:

  • Observation Может помочь умное актерское мастерство определяет собственное положение в окружающей среде, ощущает предметы и предметы и добывает другую экологическую информацию;
  • Манипуляция заключается в выполнении каких-то конкретных задач по захвату, толканию и другим оперативным задачам;
  • Navigation Запросить умное актерское мастерство меняет свое положение в соответствии с целью миссии и обновляет свой статус в соответствии с экологической информацией.

Комбинируя эти атомарные действия, агенты могут выполнять более сложные задачи. Например, воплощенные задачи контроля качества, такие как «Арбуз на кухне больше, чем миска?» Чтобы решить эту проблему, агенту необходимо пройти на кухню и получить ответ, изучив размеры обеих.

Ограниченные высокой стоимостью оборудования физического мира и отсутствием наборов воплощенных данных, текущие исследования воплощенных действий по-прежнему в основном сосредоточены на виртуальных средах-песочницах, таких как игровая платформа «Minecraft». Таким образом, с одной стороны, авторы надеются на парадигму задачи и стандарт оценки, которые будут ближе к реальности. С другой стороны, им также необходимы дополнительные исследования по эффективному построению соответствующих наборов данных.

Агент на практике: разнообразные сценарии применения

В настоящее время агенты, получившие степень LLM, продемонстрировали впечатляющее разнообразие и высокую производительность. Знакомые примеры приложений, такие как AutoGPT, MetaGPT, CAMEL и GPT Engineer, растут с беспрецедентной скоростью.

Прежде чем представить конкретные приложения, авторы обсуждают принципы проектирования Agent in Practice:

1. Помогите пользователям освободиться от ежедневных задач и повторяющегося труда, снизить нагрузку на человека и повысить эффективность решения задач;

2. Пользователям больше не нужно давать явные инструкции низкого уровня, и они могут анализировать, планировать и решать проблемы совершенно независимо;

3. Освободив руки пользователя, попытайтесь освободить мозг: дайте полную волю своему потенциалу в передовых научных областях и завершите инновационную и исследовательскую работу.

Исходя из этого, применение агентов может иметь три парадигмы:

Три парадигмы применения агента на основе LLM: одиночный агент, мультиагент и взаимодействие человека и компьютера.

Сценарий с одним агентом

Интеллектуальные агенты, способные принимать команды на естественном языке человека и выполнять повседневные задачи, в настоящее время пользуются популярностью у пользователей и имеют высокую практическую ценность. Авторы сначала подробно остановились на его разнообразных сценариях применения и соответствующих возможностях в сценарии применения одного интеллектуального агента.

В данной статье применение единого интеллектуального агента разделено на следующие три уровня:

Существует три уровня сценариев применения одного агента: ориентированный на задачи, ориентированный на инновации и ориентированный на жизненный цикл.

  • существоватьориентированный на задачуразвертывается,актерское мастерство помогает людям-пользователям решать основные повседневные задачи. Им необходимо иметь базовое понимание команд, декомпозицию задач и способность взаимодействовать с окружающей средой. В частности, в зависимости от существующего типа задачи, актерское Практическое применение мастерства можно разделить на моделируемую сетевую среду и моделируемые жизненные сцены.
  • существоватьинновационная ориентацияразвертывается,актерское мастерство может продемонстрировать потенциал независимых исследований в передовых научных областях. Хотя это происходит из-за присущей специализированным областям сложности и отсутствия данных обучения, которые дают актерский интеллект. Строительство мастерства принесло препятствия, но уже ведется большая работа в области химии, материалов, компьютеров и т. д.
  • существоватьориентация на жизненный циклразвертывается,актерское Мастерство обладает способностью постоянно исследовать, изучать и использовать новые навыки в открытом мире и выживать в течение длительного времени. В этом разделе авторы в качестве примера берут игру «Майнкрафт». Поскольку задачи выживания в игре можно рассматривать как микрокосм реального мира, многие исследователи разработали и протестировали их как мастерство Уникальная платформа с широкими возможностями.

Мультиагентный сценарий

Еще в 1986 году Марвин Мински сделал дальновидный прогноз. В «Обществе разума» он предложил новую теорию интеллекта, утверждая, что интеллект возникает в результате взаимодействия множества более мелких агентов, выполняющих определенные функции. Например, некоторые агенты могут отвечать за выявление закономерностей, тогда как другие могут отвечать за принятие решений или генерирование решений.

Эта идея была реализована конкретно с появлением распределенного искусственного интеллекта. Мультиагентная система, как одна из основных проблем исследования, в основном фокусируется на том, как агенты могут эффективно координировать свои действия и сотрудничать для решения проблем. Автор данной статьи делит взаимодействие между несколькими агентами на следующие две формы:

В сценариях многоагентных приложений существуют две формы взаимодействия: кооперативное взаимодействие и конфронтационное взаимодействие.

Кооперативное взаимодействие:как Наиболее широко используемый тип в практическом применении.,Система кооперативного актерского мастерства может эффективно повысить эффективность выполнения задач и совместно улучшить процесс принятия решений. Конкретно,В зависимости от формы сотрудничества,Далее авторы подразделяют кооперативные взаимодействия на неупорядоченное сотрудничество и упорядоченное сотрудничество.

  • Когда все актерское мастерство свободно выражают свои взгляды, мнения.,При совместной работе в непоследовательном порядке,Это называется беспорядочное сотрудничество.
  • Когда все актерское мастерство следует определенным правилам,Например, при выражении своих мнений по одному в виде конвейера,Весь процесс сотрудничества организован,Называется упорядоченное сотрудничество.

Конфронтационное взаимодействие:разумныйактерское мастерство в «око за око» (тит for тат) для взаимодействия. Через конкуренцию, переговоры и дебаты актерское мастерство отказаться от убеждения, которое могло быть ошибочным,Сделайте содержательные размышления о своем поведении или процессе обсуждения.,В конечном итоге улучшается качество отклика всей системы.

Сценарий взаимодействия человека и компьютера

Взаимодействие человека и агента, как следует из названия, представляет собой интеллектуальный агент, который сотрудничает с людьми для выполнения задач. С одной стороны, способность агента к динамическому обучению должна поддерживаться общением, с другой стороны, производительность нынешней системы агентов в области интерпретируемости все еще недостаточна, и могут возникнуть проблемы с безопасностью, законностью и т. д., поэтому для этого требуется человек; участие. Регулирование и надзор.

В статье авторы разделяют взаимодействие человека и агента на следующие два режима:

Сценарий взаимодействия человека и Два типа компьютера: Инструктор-Исполнитель модель vs. Equal Partnership модель。

  • Instructor-Executor модель:человеккакнаставник,Давать указания и обратную связь, а актерское мастерство выступает исполнителем;,Настраивайте постепенно по инструкции, оптимизация. Эта модель в образовании、медицинский、приезжать широко используется в бизнесе и других сферах.
  • Equal Partnership модель:Есть научные наблюденияприезжатьактерское Мастерство способно проявлять эмпатию в общении с людьми или участвовать на равных в выполнении приезжающих задач. Умное актерское мастерство демонстрирует потенциал для применения в повседневной жизни и, как ожидается, будет интегрировано в человеческое общество в будущем.

Агентское общество: от личности к социальности

В течение долгого времени исследователи мечтали о создании «интерактивного искусственного общества». окружающая среда.

В статье авторы используют диаграмму для описания концептуальной основы Агентного общества:

Концептуальная основа агентского общества, разделенная на две ключевые части: агентность и среда.

В этой структуре мы можем увидеть:

  1. Левая часть:существоватьна индивидуальном уровне,актерское Мастерство демонстрирует различные формы внутреннего поведения, такие как планирование, рассуждение и размышление. Кроме того, актерское мастерство проявляет и внутренние качества личности,Охватывает три аспекта: познание, эмоции и личность.
  2. Средняя часть:одинокийактерское мастерство можно совмещать с другим актерским мастерство личности образуют группу,Работайте вместе, чтобы продемонстрировать групповое поведение, такое как сотрудничество.,Например, сотрудничество и т. д.
  3. Правая часть:Среда может быть в виде виртуальной песочницы.,Это также может быть реальный физический мир. Элементы окружающей среды включают людей и различные доступные ресурсы. За отдельное актерское мастерство,другойактерское мастерство также является частью окружающей среды.
  4. Общее взаимодействие:актерское Мастерство активно участвует во всем процессе взаимодействия, ощущая внешнюю среду и совершая действия.

Социальное поведение и личность агента

В статье рассматривается деятельность агентов в обществе с точки зрения внешнего поведения и внутренней личности:

Социальное поведение:С социальной точки зрения,Поведение можно разделить на два уровня: индивидуальный и коллективный:

  • Индивидуальное поведение составляет актерское Основа собственной деятельности и развития мастерства. Включая входные данные, представленные восприятием, и выходные данные, представленные действием, такжеактерское собственное внутреннее поведение мастерства.
  • Групповое поведение относится к двум и более актерским мастерство Поведение, возникающее в результате спонтанного взаимодействия. Включая позитивное поведение, представленное сотрудничеством, и негативное поведение, представленное конфликтом, а Также Нейтральное поведение, такое как следование за толпой и наблюдение.

Личность:включая познание、эмоцияихарактер。就像человексуществовать В процессе социализации у них постепенно формируются свои особенности.,актерское мастерство также показало так называемое «Человеческий интеллект» — это постепенное формирование личности посредством взаимодействия с группами и окружающей средой.

  • Когнитивный способности): обложки актерское мастерство Процесс приобретения и понимания знаний, исследования показывают, что на основе LLM изактерское Мастерство способно на некоторые аспекты человеческого мышления и интеллекта.
  • Эмоциональный интеллект: включает в себя субъективные чувства и эмоциональные состояния, такие как радость, гнев, печаль и радость, а также способность проявлять сочувствие и сопереживание.
  • Личность (изображение персонажа). Чтобы понять и проанализировать личностные характеристики выпускников LLM, исследователи использовали зрелые методы оценки, такие как тесты «Большая пятерка личности» и MBTI, чтобы изучить разнообразие и сложность личности.

Моделирование операционной среды общества

Агентское общество не только состоит из независимых индивидов, но также включает в себя среду, с которой они взаимодействуют. Окружающая среда влияет на восприятие, действия и взаимодействия агента. В свою очередь, агенты также изменяют состояние окружающей среды своими действиями и решениями. Для отдельного агента среда включает в себя других автономных агентов, людей и доступные ресурсы.

Здесь авторы исследуют три типа сред:

Текстовая среда:потому что LLMs полагается в первую очередь на язык как на формат ввода и вывода, поэтому текстовая среда является актерской. мастерство Самая естественная операционная платформа. Социальные явления и взаимодействия описываются посредством слов, а текстовая среда обеспечивает семантические и фоновые знания. актерское мастерство существует в таком текстовом мире и опирается на текстовые ресурсы для восприятия, рассуждения и принятия мер.

Среда виртуальной песочницы:существовать Компьютерное поле,Песочница — это контролируемая и изолированная среда.,Обычно используется для тестирования программного обеспечения и анализа вирусов. Виртуальная песочница общества «Актерское мастерство» — это платформа для моделирования социального взаимодействия и поведенческой симуляции.,Его основные особенности включают в себя:

  • Визуализация: мир можно представить с помощью простых 2D-графических интерфейсов или сложного 3D-моделирования, интуитивно отображая все аспекты моделируемого общества.
  • Расширять: Может создавать и развертывать множество различных сценариев (Интернет, игры и т. д.) для проведения различных экспериментов в сфере актерского мастерства. мастерство предлагает огромное пространство для исследования.

Реальная физическая среда:Физическая среда состоит из реальных объектов.и空间组成из有形环境,актерское мастерство наблюдать и действовать в нем. Эта среда вводит богатую сенсорную информацию (визуальную, слуховую и пространственную). В отличие от виртуальных сред, физические пространства очень важны для актерского мастерства. Мастерство поведения предъявляет больше требований. то есть актерское Мастерство должно быть адаптируемым в физической среде, создавая исполняемое управление движением.

Автор приводит пример, объясняющий сложность физической среды: представьте себе интеллектуального агента, управляющего роботизированной рукой на заводе. При управлении роботизированной рукой требуется точный контроль силы, чтобы избежать повреждения объектов из различных материалов; Агенту необходимо находиться в физическом рабочем пространстве. Перемещайтесь посередине и вовремя корректируйте траекторию движения, чтобы избежать препятствий и оптимизировать траекторию движения роботизированной руки.

Эти требования увеличивают сложность и сложность работы агентов в физической среде.

Симуляция, начни!

В статье авторы считают, что моделируемое общество должно быть открытым, устойчивым, ситуативным и организованным. Открытость позволяет агентам входить и выходить из моделируемого общества автономно; настойчивость означает, что общество имеет последовательную траекторию, которая развивается с течением времени; контекстуальность подчеркивает существование и функционирование субъектов в конкретной среде; гарантирует, что моделируемое общество имеет физический мир; как правила и ограничения.

Что касается значения моделируемого общества, то город Генеративных агентов Стэнфордского университета представляет собой яркий пример для всех — Общество агентов можно использовать для изучения возможностей группового интеллекта, например, агенты совместно организовали вечеринку в честь Дня святого Валентина; Ускорить исследования в области социальных наук, такие как наблюдение за коммуникативными явлениями путем моделирования социальных сетей. Кроме того, проводятся также исследования, направленные на изучение ценностей, стоящих за агентами, путем моделирования этических сценариев принятия решений, а также для оказания помощи в принятии решений путем моделирования воздействия политики на общество.

Кроме того, автор отметил, что эти симуляции также могут иметь определенные риски, включая, помимо прочего: вредные социальные стереотипы и предрассудки; проблемы конфиденциальности и безопасности;

Перспективные открытые вопросы

В конце статьи автор также обсуждает некоторые перспективные открытые вопросы и предлагает читателям некоторые идеи для размышления:

Как исследования интеллектуальных агентов и больших языковых моделей могут способствовать друг другу и развиваться вместе?большой Модельсуществоватьпонимание языка、принятие решения также Способность к обобщению и другие аспекты показали большой потенциал и стали актерскими. мастерство Ключевая роль в строительном процессе и актерское Прогресс мастерства также выдвигает более высокие требования к большой Модели.

Какие проблемы и проблемы принесут агенты, работающие на базе LLM?разумныйактерское мастерство Действительно ли это может быть реализовано?,Требует тщательной оценки безопасности.,Избегайте реального вреда. Автор суммирует больше потенциальных угроз,Например:незаконное злоупотребление、Риск безработицы、Влияние на благосостояние человека и так далее.

Масштабирование количества агентов Какие возможности и проблемы это принесет?существоватьв симулированном обществе,Увеличение числа людей может значительно повысить достоверность и достоверность моделирования. Однако,С ростом количества актерского мастерства,Проблемы коммуникации и распространения сообщений могут стать весьма сложными.,Искажение, непонимание или галлюцинация информации существенно снизят эффективность всей системы моделирования.

Об Интернете LLM-based Agent Приводит ли это к AGI соответствующего пути.Некоторые исследователи полагают,к GPT-4 Большая модель, представленная , была обучена на достаточном корпусе, и агент, построенный на этой основе, потенциально может стать открытым AGI Ключ от двери. Однако другие исследователи полагают, что авторегрессионное языковое моделирование (Авторегрессивное языковое моделирование) Language Моделирование) не проявляют настоящего интеллекта, потому что они просто реагируют. Более полный метод моделирования, такой как модель мира (World модель), может привести к AGI。

Эволюция роевого интеллекта. Роевой интеллект — это процесс сбора мнений множества людей и преобразования их в решения.Однако,Вслепую увеличивая актерское мастерство Производит ли количество мастерства настоящий «интеллект»? Также как согласовывать отдельное актерское мастерство,позволятьразумныйактерское мастерство Может ли общество преодолеть «групповое мышление» и личные когнитивные предубеждения?

Агент как услуга (Агент as a Service,AaaS)。потому что LLM-based Agents Она более сложна, чем сама большая модель, и малым и средним предприятиям или частным лицам ее сложнее построить локально. Поэтому поставщики облачных технологий могут рассмотреть возможность внедрения интеллектуальных агентов в форме услуг, то есть. Агент как услуга. Как и другие облачные сервисы, AaaS Имеет потенциал предоставить пользователям высокую гибкость и самообслуживание по требованию.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose