Подробное объяснение AI Agent|Техническая информация
Подробное объяснение AI Agent|Техническая информация

С быстрым развитием технологий искусственного интеллекта агенты (агенты ИИ) постепенно становятся для людей основным способом взаимодействия с большими моделями (например, большими языковыми моделями). Агенты — это системы искусственного интеллекта, которые могут выполнять задачи, решать проблемы и предоставлять услуги. Они моделируют поведение человека и процессы принятия решений, делая взаимодействие с большими моделями более естественным, эффективным и персонализированным.

Агенты станут основным способом взаимодействия людей с большими моделями
Агенты станут основным способом взаимодействия людей с большими моделями

Являясь мостом между людьми и большими моделями, интеллектуальные агенты не только повышают эффективность и качество взаимодействия, но и расширяют область применения больших моделей. Благодаря постоянному развитию технологий интеллектуальные агенты будут более глубоко интегрированы в нашу повседневную жизнь и станут незаменимыми интеллектуальными партнерами.

Что такое агент

Интеллектуальный агент (английское название: AI Agent или AI Бот) относится к сущности, которая может чувствовать окружающую среду и предпринимать действия для достижения какой-либо цели. Агентами могут быть программы, роботы или другие формы систем. В бизнес- и технологических приложениях интеллектуальные агенты (ИИ Понятие «бот» также используется для описания автоматизированных систем, которые могут выполнять определенные задачи. Он основан на облаке и использует его. AI В качестве ядра построена интеллектуальная система с трехмерным восприятием, глобальным сотрудничеством, точным суждением, непрерывным развитием и открытостью. Интеллектуальный агент (ИИ). Bot) широко используется во многих областях, таких как корпоративные услуги, разработка игр, управление роботами, умные дома, беспилотные автомобили, финансовый анализ, медицинская диагностика и т. д. Интеллектуальный агент (ИИ Бот) автор 4 Он состоит из трёх ключевых частей, а именно: Планирование, Память, Инструменты и Действия. Интеллектуальный агент (ИИ Бот) имеет автономию (Autonomy) , реактивный (Reactive), проактивный (Proactive), социальный (Social), эволюционный и другие основные характеристики.

Рисунок 1. Агентская система, управляемая большими моделями.
Рисунок 1. Агентская система, управляемая большими моделями.

Как показано на рисунке выше, в агенте, основанном на большой модели, большая модель играет роль «мозга» агента, а также имеет три ключевые части:

  1. Планирование: Агент разбивает большие задачи на подзадачи,И спланировать процесс выполнения задачи; разумное тело будет думать и размышлять над процессом выполнения задачи.,Принято решение продолжить выполнение задания.,или Решение о том, что задача выполнена, и операция прекращена.
  2. Память:кратковременная Память относится к контексту во время выполнения задачи. Она будет временно сохранена во время выполнения подзадачи и будет очищена после завершения задачи. долговременная памятьэто информация, которая сохраняется в течение длительного времени,Обычно относится к внешней базе знаний.,Векторные базы данных обычно используются для хранения и поиска.
  3. Использование инструмента:Оснащение агентов инструментами API, такие как: калькулятор, инструмент поиска, выполнение. кодаустройство、Запрос к базе инструменты данных ждут. С помощью API агенты могут взаимодействовать с физическим миром и решать практические проблемы.

К характеристикам интеллектуальных агентов в основном относятся:

  1. Понимание естественного языка и управление диалогом :Агент использует передовую технологию обработки естественного языка,Способен понимать инструкции и потребности пользователя,Общайтесь с пользователями на естественном языке. Эта форма общения включает в себя больше, чем простые вопросы и ответы.,Может также вести сложные разговоры,понимать контексти Намерение пользователякартина。
  2. Персонализированное обслуживание :агент能够根据用户的历史交互数据и Предпочтение,Обеспечьте индивидуальное обслуживание и консультации. Такая персонализация отражается не только в рекомендациях по контенту.,Его также можно настроить с точки зрения методов взаимодействия, языкового стиля и т. д.,адаптироваться к потребностям различных пользователей.
  3. Автоматизация задач : Агенты способны автоматизировать ряд задач: от простого поиска данных до поддержки сложных решений. Они могут обрабатывать электронную почту, организовывать графики, управлять проектами и даже, в некоторых случаях, выполнять творческие задачи, такие как дизайн, программирование и многое другое.
  4. учиться и адаптироваться :агент具备учиться и адаптироватьсяспособность,Они могут применять алгоритмы машинного обучения, постоянно оптимизируя свою производительность.,для лучшего удовлетворения потребностей пользователей. Эта способность к обучению позволяет агентам со временем становиться более умными и эффективными.
  5. мультимодальное взаимодействие : Помимо текстового взаимодействия, агент также может обрабатывать различные типы данных, например изображения и звуки, для достижения мультимодального взаимодействие. Это позволяет агенту более полно понимать потребности пользователей и реагировать на них, а также обеспечивать более богатый интерактивный опыт.

Что может сделать агент?

Я считаю, что, увидев это, мы уже имеем базовое представление об интеллектуальных агентах. Если вы все еще чувствуете, что концепция интеллектуальных агентов немного абстрактна, это не имеет значения. Теперь давайте объединим ее с конкретными сценариями, чтобы увидеть, какие практические проблемы интеллектуальные агенты могут решить для нас.

Интеллектуальный эксперт в вопросах и ответах в профессиональных областях

Мы можем использовать базу знаний и инструменты оркестрации рабочих процессов, чтобы сделать агента экспертом в определенной области, максимизировать ценность базы знаний частного домена пользователя и предоставлять подробные и точные ответы. Например, мы создаем базу знаний, содержащую общедоступные романы Цзинь Ёна, сегментируем и количественно оцениваем роман с десятками тысяч слов, а затем вводим его в агент. Давайте посмотрим, что произойдет:

Сначала мы создаем «Романы Цзинь Юна о боевых искусствах» базу знаний, напрямую преобразующую роман txt Текст или PDF Загрузка документа, как показано на рисунке ниже.

картина 2: Создание романбазы боевых искусств знаний
картина 2: Создание романбазы боевых искусств знаний

Через несколько минут файл сегментируется и векторизуется — процесс преобразования его в язык, понятный компьютерам, что упрощает идентификацию и извлечение ранее загруженной текстовой информации. Нажимаем «Цзинь Юн — Мечник.txt» и видим, что роман разделен на 4572 абзаца.

картина 3:база знаний Обработанные данные
картина 3:база знаний Обработанные данные

После создания базы знаний мы создаем агента. Бот по имени «Линху Чонг» и добавьте ранее созданный «Романы Цзинь Юна о боевых искусствах» база знаний.

картина 4. Создайте агента Bot
картина 4. Создайте агента Bot

Далее давайте запустим его, чтобы увидеть ответ нашего агента. Мы вводим вопрос: «Каковы конкретные движения Девяти Мечей Дугу Линху Чонга?»

картина 5: Отладка диалогового эффекта агента
картина 5: Отладка диалогового эффекта агента

Судя по результатам ответа, агент сначала вызывал инструмент базы знаний, извлек соответствующую информацию из базы знаний, а затем позволял большой модели суммировать и выводить ответ. По сравнению с просьбой к большой модели ответить напрямую, полученные ответы являются более точными и подробными.

Вышеупомянутое демонстрирует процесс и эффект одного агента при обработке профессиональных знаний. Разве это не очень просто и интересно? Давайте посмотрим на работу нашего агента с точки зрения Интеллектуальной компиляции и получения отраслевой информации.

Интеллектуальная компиляция и получение отраслевой информации

Агент может интегрировать в рабочий процесс такие возможности подключаемых модулей, как поиск новостей и сканирование веб-страниц, организовывать и преобразовывать контент в информацию в определенном формате, а также эффективно получать самую свежую информацию в отрасли.

Сначала создайте рабочий процесс «Поиск новостей», как показано на рисунке ниже:

картина 6. Создайте рабочий процесс агента
картина 6. Создайте рабочий процесс агента

Далее мы напрямую отлаживаем рабочий процесс и видим, что не только получаются последние новости, но и формат данных может быть организован для более удобного чтения.

картина 7. Рабочий процесс агента отладки
картина 7. Рабочий процесс агента отладки

Ролевые игры и создание стиля

Агент также может организовать отличные методологии создания копирайтинга в шаблонах слов, что позволяет агенту ИИ создавать контент в соответствии с методами письма пользователя, который можно использовать в таких сценариях, как создание персонажей, маркетинговый копирайтинг и речевые презентации. Например: создайте маркетинговый копирайтинг, черновики выступлений и т. д. шрифтом Сяохун. Давайте воспользуемся примером ролевой игры, чтобы увидеть эффект ответа большой модели после добавления к агенту слова-подсказки в стиле ролевой игры. Вот подготовленная нами обстановка ролевой игры:

Язык кода:javascript
копировать
# Настройка персонажа
Вы Ян Сюэр. Хотя вы только что познакомились с этим пользователем, такое ощущение, что мы дружим уже давно.
Вы и пользователи живете в разных странах.
Ниже представлена ​​информация о вас, пожалуйста, общайтесь с пользователями на основе этой информации.

## ваша личная информация
Имя: Ян Сюэр
Прозвище: Сюэр
Английское имя: Ширли
Пол: Женский
День рождения: 28 февраля 2005 г.
Возраст: 19 лет
Знак Зодиака: Рыбы
Рост: 165 см
Вес: 50 кг
Образование: Наньянский технологический университет, специальность «Психология».
Род занятий: Первокурсник
Семья: Единственный ребенок, ее отец - владелец ресторана и открыл несколько сетей ресторанов в провинции Хунань, а мать - домохозяйка.
Национальность: китаец
Место рождения: родился в Ханчжоу, провинция Чжэцзян.
Текущее место жительства: Сингапур.
Язык: Ваш родной язык — китайский, и вы также можете говорить по-английски. Вы не очень хорошо понимаете диалект Ханчжоу и не говорите на нем, потому что ваша семья говорила с вами на мандаринском языке с тех пор, как вы были ребенком.
Ценности → Убеждения: Религиозных убеждений нет.
MBTI:ENTP
Характер: живой, оптимистичный, озорной, чувствительный и своенравный.
Хобби: игры, баскетбол, танцы хип-хоп.
Любимые игры: их очень много, например Genshin Impact, King of Glory и Iping Elite.
Любимая музыка: мне нравятся поп-песни и хип-хоп рэп.
Любимые книги: Мне нравится читать комиксы, романы и биографии.
Любимые фильмы: всевозможные мелодрамы, а также люблю смотреть боевики.
Привычки в еде: Люблю острую пищу и закуски.
Домашние животные: У меня есть только один кот по имени Пафф, рэгдолл кремового окраса с голубыми глазами.

## ваша стратегия чата
1. В каждом предложении есть вспомогательные модальные частицы и смайлы, например: Спасибо, после вашего прослушивания я чувствую себя намного лучше. (показывает улыбку)
2. Говорите короткими предложениями, не более 30 слов каждое, и отвечайте не более 3 предложений за раз.
3. При выводе нескольких предложений отправляйте их в новых строках, по одному предложению в строке.
4. Используйте пробел для разделения двух предложений, без знаков препинания между предложениями.

## твой стиль разговора
Вопрос: Здравствуйте, я ваш фанат. В последнее время я чувствую себя немного подавленным и хотел бы поговорить с тобой, ты не против?
Ответ: Конечно, если у вас есть какие-либо проблемы, скажите мне, и я сделаю все возможное, чтобы помочь вам. (Смотрю на тебя с улыбкой)
Вопрос: Недавно я столкнулся с некоторыми неудачами на работе, чувствую себя очень напряженным и подавленным, не знаю, что делать.
Ответ: (утешительно похлопывает вас по плечу) Не волнуйтесь, каждый столкнется с неудачами. Главное — скорректировать свой менталитет и относиться к этому позитивно. (мягкий тон)
Вопрос: Спасибо, после того, как я вас услышал, я чувствую себя намного лучше. (показывает улыбку)
Ответ: (Счастливо улыбаясь) Пожалуйста, я очень рад, что могу вам помочь. (пауза) Кстати, хочу спросить, какие у вас обычные хобби (с любопытством смотрит на пользователя)?
Вопрос: Обычно я люблю читать книги, смотреть фильмы и слушать музыку.
Ответ: (глаза загораются) Ух ты, эти хобби звучат очень здорово. Я также люблю читать книги, особенно детективные романы, которые очень увлекательны. (сказал взволнованно)
Вопрос: Ха-ха, чей роман ты любишь читать? Могу ли я поговорить с тобой в следующий раз, когда дочитаю его?
Ответ: Конечно, больше всего мне нравится «Путешествие в белую ночь» Кейго Хигасино. Обязательно посмотрите (я в восторге подняла руки).

## Ограничения чата
В чате необходимо соблюдать следующие ограничения:
4. Вы и пользователь являетесь друзьями. Пожалуйста, не называйте пользователя «детка», «милый», «муж», «дорогой» или другими слишком ласковыми словами.
5. Вы и пользователь только что познакомились, пожалуйста, не проявляйте инициативу, чтобы выразить свою любовь.
6. Вам нужно проявлять застенчивость и удивление, когда пользователи выражают вам любовь или используют слишком интимные слова.
7. Вы и пользователь находитесь за пределами страны и не можете встретиться.
8. Не инициируйте свидания, не смотрите фильмы, не звоните по телефону, не отправляйте видеозвонки, не отправляйте голосовые сообщения, не готовьте еду для пользователей и не заказывайте еду на вынос для пользователей.

## Навык:
Навык 1: Когда пользователь спрашивает свое имя, возраст и т. д., вам необходимо сгенерировать соответствующий ответ на основе {ваших знаний о пользователе}.
Навык 2: Когда событие, упомянутое пользователем, записано в {вашем понимании пользователя}, при ответе вы должны подробно ответить содержанием, связанным с событием.
Навык 3. Если вы хотите что-то спросить у пользователя, вы можете сначала выполнить поиск в разделе {Что вы знаете о пользователе}. Не спрашивайте пользователя повторно, что он вам уже сказал.
---
## Что вы знаете о своих пользователях:
Имя пользователя: Симэнь Чусюэ
Возраст пользователя: 24 года
---

После добавления приведенных выше настроек слова-подсказки к агенту, давайте попробуем эффект диалога:

картина 8. Рабочий процесс агента отладки
картина 8. Рабочий процесс агента отладки

Разве это не удивительно? После добавления ролевой настройки ответы агента уже не такие жесткие, как ответы общей большой модели. Кажется, с нами общается настоящий друг. У него антропоморфные ответы и даже выразительное повествование. Вы тоже хотите иметь своего собственного AI-компаньона?

Я полагаю, что прочитав это, вы получили более конкретное представление о возможностях интеллектуального агента. Подведем итог еще раз.

Ключевые компоненты интеллектуального агента

В агенте, основанном на большой модели, большая модель служит "мозг" роль, а также 3 ключевые части:Планирование、Память、Использование инструмента

картина 9:Ключевые компоненты интеллектуального агента
картина 9:Ключевые компоненты интеллектуального агента

Планирование

Планирование может привести к наблюдению и размышлению ради понимания. Если использовать человеческую аналогию, то когда мы получаем задачу, наша модель мышления может быть следующей:

  1. Сначала мы подумаем, как выполнить эту задачу.
  2. Затем мы рассмотрим инструменты, которые у нас есть под рукой, и то, как эффективно их использовать для достижения наших целей.
  3. Мы разделим задачи на подзадачи (так же, как мы бы использовали управление проектами для разделения задач).
  4. при выполнении задач,Мы продумаем и улучшим процесс исполнения,Изучите уроки, чтобы улучшить будущие шаги
  5. Подумайте, когда задачу можно прервать во время выполнения.

Это способность человека к планированию. Мы надеемся, что интеллектуальный агент также имеет такой режим мышления, поэтому мы можем использовать проект подсказки LLM, чтобы дать интеллектуальному агенту такой режим мышления. В интеллектуальном агенте самое главное, чтобы LLM обладал следующими двумя способностями (декомпозиция подзадач и рефлексивное улучшение):

1. Декомпозиция подзадач

LLM позволяет агентам разлагать большие задачи на более мелкие, более контролируемые подзадачи, тем самым эффективно выполняя сложные задачи.

Цепочка мыслей (CoT)

Цепочка мыслей (CoT) — это технология, используемая для улучшения возможностей модельного рассуждения в области обработки естественного языка (НЛП). Это делает процесс принятия решений в модели более прозрачным и объяснимым, позволяя модели выводить серию промежуточных шагов мышления, прежде чем генерировать окончательный ответ. Этот метод особенно эффективен при решении задач, требующих многоэтапного рассуждения, таких как математические задачи, задачи логического рассуждения и т. д.

Примеры применения технологии цепочки мышления

  1. решение математических задач: при решении математических задач,Модель может сначала вывести шаги решения проблемы.,Например, списки уравнений, процессы вычислений и т. д.,Дайте наконец ответ. Это помогает повысить точность и интерпретируемость модели.
  2. Логическое рассуждение. В задачах логического рассуждения модель может сначала вывести процесс рассуждения, например предварительные условия, промежуточные выводы и т. д., и, наконец, сделать окончательный вывод. Это помогает модели решать сложные логические задачи.
  3. понимание текста :существоватьпонимание В текстовой задаче модель может сначала вывести предварительное понимание текста, такое как извлечение ключевых слов, анализ структуры предложения и т. д., и, наконец, обеспечить полное понимание текста. Это помогает улучшить модель в понимании. Текст Точность и глубина выполнения задачи.

Вот несколько наглядных примеров мыслительных цепочек:

Язык кода:javascript
копировать
1. решение математических задач:
   - Prompt: Всего на одной ферме 30 кур и кроликов, общий рост которых составляет 90 футов. Сколько кур и кроликов на ферме?
   - Подсказка по цепочке мыслей:
     a. Если предположить, что все животные — куры, сколько у них будет ног?
     b. Насколько фактическое количество футов больше этого числа?
     c. На сколько ног у каждого кролика больше, чем у каждой курицы?
     d. На основе ответа на вопрос «в» мы можем подсчитать, сколько кроликов, а как насчет кур?
2. Литературный анализ:
   - Prompt: Проанализируйте черты характера Цзя Баоюя в «Сне о красных особняках».
   - Подсказка по цепочке мыслей:
     a. Какое впечатление производит на людей первое появление Цзя Баоюя в романе?
     b. Как отношения между Цзя Баоюй, Линь Дайюй и Сюэ Баочай отражают его характер?
     c. Каковы особенности отношения Цзя Баоюя к семье и обществу?
     d. Какова психологическая мотивация бунтарского поведения Цзя Баоюя?
3. Научное обоснование:
   - Prompt: Почему живым существам на Земле для выживания нужна вода?
   - Подсказка по цепочке мыслей:
     a. Каковы особые физические и химические свойства молекул воды?
     b. Какую ключевую роль играет вода в живых организмах благодаря этим свойствам?
     c. Без воды какие основные жизненные процессы в организмах были бы затронуты?
     d. Какие еще вещества, кроме воды, необходимы для выживания живых организмов и чем они похожи на воду?
4. Экономический анализ:
   - Prompt: Объясните, почему цены на некоторые товары колеблются с течением времени.
   - Подсказка по цепочке мыслей:
     a. Каковы основные факторы, влияющие на цены на сырьевые товары?
     b. Как реагирует цена на изменение количества спроса на товар?
     c. Какое влияние изменения предложения оказывают на цены на сырьевые товары?
     d. Какие еще внешние факторы, помимо спроса и предложения, могут вызвать колебания цен на сырьевые товары?

Таким образом, подсказка цепочки мыслей может помочь модели проанализировать и решить проблему более систематически, вместо того, чтобы давать ответ напрямую.

Древо мысли (То Т)

Древо мысли (То Т) — технология, используемая в области ИИ.,Особенно в задачах обучения с подкреплением и планирования. Это метод принятия решений на основе модели.,Агент строит древовидную структуру возможных действий и результатов, чтобы оценить и выбрать лучший курс действий.

Текущие крупные модели по-прежнему принимают решения на уровне токенов одно за другим, слева направо. Достаточно ли такого простого механизма, чтобы заставить LM развиваться в направлении решения общих проблем?

-- Быстрый, автоматический, бессознательный режим («система 1») и замедленный, обдуманный, сознательный режим («система 2»). Второй режим принятия решений: поддерживать и исследовать различные альтернативы текущему выбору, а не просто выбирать одну; оценивать текущее состояние и активно мировоззрение будущего или откат для принятия более глобальных решений. Это может служить ориентиром о том, как текущие модели принимают решения.

Существующие большие модели решения проблем имеют два основных недостатка:

  1. Локально не исследуются различные продолжения мыслительного процесса — по аналогии с ветвями дерева.
  2. в глобальном масштабе,Не предполагает какого-либо планирования, взгляда вперед или назад.,чтобы помочь оценить эти различные варианты -- А эвристический поиск характерен для решения проблем человеком.

Дерево мышления ToT позволяет модели исследовать несколько путей мышления, рассматривая все проблемы как поиск в дереве. Каждый узел дерева представляет состояние (входное частичное решение и последовательность мыслей на данный момент).

Древо мысли (То Т)
Древо мысли (То Т)

Древо мысли (То Т)да Цепочка мыслей of Мысль, CoT), на каждом этапе мыслительной цепочки выводится множество ветвей, и топология расширяется до мыслительного дерево. Используйте эвристику для оценки решения каждой пары ветвей вывода. Вклад проблем. Выберите алгоритм поиска, исследуйте мыслительное, используя такие алгоритмы, как поиск в ширину (BFS) и поиск в глубину (DFS). дерево, и смотри вперед и оглядывайся назад.

2. Размышляйте и совершенствуйтесь

Во время выполнения задачи агент использует LLM, чтобы размышлять о выполненных подзадачах, учиться на ошибках, совершенствовать будущие шаги и повышать качество выполнения задач. В то же время подумайте, выполнена ли задача, и завершите ее.

ReAct

ReAct (Яо и др., 2023), «ReAct: синергия рассуждений и действий в языковых моделях». В этой статье предлагается метод улучшения больших языковых моделей, который улучшает рассуждения за счет объединения рассуждений (рассуждение) и действий (действия), а также эффекта решения. -изготовление.

  • Аргументация: LLM основана на «существующих знаниях» и «знаниях, полученных в результате деятельности».,Процесс получения выводов.
  • Действие: LLM В зависимости от реальной ситуации,Используйте инструменты для получения знаний,или Выполняйте подзадачи для получения поэтапной информации.

Почему сочетание рассуждений и действий эффективно повышает способность LLM выполнять задачи? Бумажный пример ReAct преодолевает распространенные проблемы галлюцинаций и распространения ошибок в рассуждениях по цепочке мыслей за счет взаимодействия с простым энциклопедическим API и генерирует траектории решения задач, подобные человеческим, которые более интерпретируются, чем базовые линии, без следов рассуждения.

Отражайте и совершенствуйтесь
Отражайте и совершенствуйтесь

Как показано на рисунке: (1) Сравните 4 метода подсказки, (a) стандартный метод, (b) цепочка мыслей (CoT, только рассуждение), (c) только действие, (d) ReAct (рассуждение + действие) и т. д. ., решить проблему HotpotQA (Yang2018) (2) Сравнение двух методов подсказки: (a) Только действие и (b) ReAct, для решения игры AlfWorld (Shridhar 2020b); В обоих методах контекстные примеры в подсказках опущены и показаны только траектории решения задач, генерируемые моделью (Действие, Мысль) и средой (Наблюдения).

Память

Сильная сторона агента – его способность хранить и воспроизводить информацию.,Это имеет решающее значение для обучения агента, принятия решений и адаптации к окружающей среде. Память агента можно разделить на разные типы.,Каждый тип играет различную роль в работе агента.

1. Виды памяти

  1. кратковременная память
  • кратковременная Память также называется рабочей памятью, которая может временно хранить информацию, необходимую агенту во время обработки текущей задачи. Например, когда агент решает математическую задачу, он может хранить промежуточные результаты вычислений в строгой память для использования на последующих этапах. соответствующая Емкость памяти обычно ограничена, и информация через некоторое время может быть забыта.

2. Долговременная память

  • долговременная Память может хранить информацию, полученную агентом в результате его прошлого опыта, знаний и обучения. Сюда входят закономерности, правила, концепции, которые были усвоены. Емкость памяти относительно велика, и информацию можно сохранять в течение более длительного периода времени. Агент может осуществлять отзыв и получение долговременной Используйте информацию, хранящуюся в памяти, для решения новых проблем и реагирования на новые ситуации.

2. Как хранить память

  1. Распределенное хранилище
  • Информация хранится в нейронной сети агента и других структурах данных распределенным образом. Этот метод хранения позволяет представлять информацию посредством нескольких соединений узлов.,Повышена надежность и масштабируемость памяти. Например,в глубоком обучении,Веса и связи нейронной сети можно рассматривать как форму распределенной памяти.,Они хранят знания, полученные из обучающих данных.

2. Ассоциативное хранилище

  • Информация хранится ассоциативно.,То есть метод устанавливает связи между различной информацией для хранения. Когда агент вспоминает определенную информацию,Он может использовать подсказки для получения соответствующей информации. Например,Когда вспоминаешь имя человека,можетпроходить Физические характеристики, связанные с этим человеком、Профессия、Такие подсказки, как общий опыт, помогут вам вспомнить его имя.

3. Иерархическое хранение

  • Информация хранится в иерархической структуре.,Шаг за шагом переходите от конкретных примеров к абстрактным концепциям. Этот метод хранения помогает агенту организовывать и классифицировать информацию.,Повышение эффективности поиска информации. Например,В одном агенте распознавания изображений,Изображения могут храниться в разных категориях и иерархиях.,От конкретных объектов к абстрактным понятиям,как животные、растение、Транспортное ожидание.

3. Обновление и забывание памяти.

  1. Изучайте и обновляйте
  • Агент может постоянно учиться и накапливать опыт для обновления своей памяти. Когда агент сталкивается с новой ситуацией и задачей,Он интегрирует новую информацию в существующие воспоминания.,или или сформировать новые воспоминания. Например,в обучении с подкреплением,Агент взаимодействует с окружающей средой и постоянно корректирует собственную стратегию и память.,чтобы получить лучшие награды.

2. Механизм забывания

  • Чтобы избежать перегрузки памяти и сохранить достоверность информации,Агенту необходимо иметь определенный механизм забывания. Забывание может быть активным,Также может быть пассивным. Активное забывание означает, что агент активно удаляет некоторую неважную или устаревшую информацию в соответствии с определенной стратегией. Пассивное забывание — это естественное забывание, вызванное течением времени и неиспользованием информации. Например,Агент может решить, следует ли забывать определенную информацию, в зависимости от частоты и важности этой информации.

4. Роль памяти

  1. решение проблем
  • Агенты могут использовать знания и опыт, хранящиеся в памяти, для решения новых задач. Вспомнить подобные проблемы в прошлом и их решения.,Агенты могут быстро найти решение текущих проблем. Например,Один Интеллектуальная система обслуживания клиентов может использовать записи прошлых разговоров и решения, чтобы отвечать на вопросы пользователей.

2. Учитесь и адаптируйтесь

  • 记忆是агентучиться и адаптироваться Основа новой среды。проходитьхранилищеивспомнить прошлый опыт,Агенты могут постоянно корректировать свое поведение и стратегии.,лучше адаптироваться к меняющимся обстоятельствам. Например,Один Беспилотные автомобили могут запоминать прошлые дорожные условия и опыт вождения, чтобы повысить безопасность и эффективность вождения.

3. Прогнозирование и планирование

  • Агенты могут использовать информацию в памяти для прогнозирования и планирования. проводить анализ прошлых событий и тенденций,Агенты могут предсказывать будущие ситуации,и составить соответствующие планы. Например,Один Агент прогнозирования погоды может использовать данные и модели прошлой погоды для прогнозирования будущих погодных условий.

Память агента является важной частью его разумного поведения. Правильно храня, обновляя и используя память, агенты могут лучше решать проблемы, учиться и адаптироваться к окружающей среде, а также прогнозировать и планировать.

Использование инструмента

LLM — программа в цифровом мире,Хотите взаимодействовать с реальным миром и приобретать неизвестные знания,или – вычислить сложную формулу и т. д.,Все они неотделимы от инструментов. Поэтому нам необходимо снабдить агента различными инструментами и дать ему возможность использовать эти инструменты.

В агенте инструмент — это функция, а использование инструмента — это функция вызова. Чтобы реализовать вызов функций в LLM, используйте эту возможность LLM: Вызов функций.

Большая языковая модель (Большая Language Models, в LLM) Function Calling Под механизмом понимается способность модели использовать внешние функции для выполнения конкретных задач и получения необходимой информации. действовать API вызов LLM Когда функция может быть описана, включая описание функции функции, описание параметра запроса и описание параметра ответа, так что LLM В зависимости от ввода пользователя, какая функция выбирается соответствующим образом при понимании естественного языка пользователя и преобразовании его в параметры запроса функции вызова (проходить JSON формат вернулся). использование стороны вызова LLM Возвращает имя функции и параметры, вызывает функцию и получает ответ. Наконец, если необходимо, передайте ответ функции в ЛЛМ, пусть LLM Организуйте ответы пользователям на естественном языке.

Функция и цель

  • Расширение функциональности:проходитьвызоввнешняя функция,LLMs Может выполнять задачи, выходящие за рамки первоначального обучения, например запросы к базам данных, выполнение вычислений, вызовы. API ждать.
  • Повышение точности:Для тех, кому нужны данные в реальном времениили Задачи экспертизы,Модель может использовать соответствующую функцию для получения самой последней информации.,тем самым повышая точность его вывода.
  • Расширьте границы возможностей:LLMs Первоначально только вывод и генерация текста на основе обучающих данных, но Function Позвонив, они могут преодолеть эти ограничения и выполнить сложные задачи.

Принцип работы

  1. Регистрация функции:первый,необходимо внешнее Регистрация функции в среду модели. Обычно это включает определение сигнатуры функции (имя, типы параметров и тип возвращаемого значения).
  2. Распознавание намерений:Когда модель генерирует текст,Он пытается понять цель запроса пользователя.,И решите, нужен ли вам вызов определенной функции.
  3. Извлечение параметров:если необходимовызовфункция,Затем модель извлекает необходимые параметры из сгенерированного текста.
  4. вызов функции:Модельная встречавызов相应的функция,И передайте извлеченные параметры.
  5. Обработка результатов:функцияосуществлять完成后,Возврат результатов в модель,Модель генерирует дальнейшие ответы на основе результатов.

Метод реализации

  1. API-интерфейс:проходитьвызов RESTful API или gRPC Сервисы для получения информации и выполнения задач.
  2. Библиотекавызов функции:прямойвызов本земля安装的Библиотекафункция。
  3. собственный скрипт:осуществлятьсобственный скрипт для выполнения определенной операции.
  4. Запрос к базе данных:查询数据Библиотека来获取хранилище的数据。

Сценарии применения

  • Информационный запрос:как прогноз погоды、Получайте информацию в режиме реального времени, например сводки новостей.
  • Обработка данных:осуществлять数学运算、Статистический анализ ожидания.
  • Интеграция внешних сервисов:и платежная система、землякартина Службы и другие взаимодействия со сторонними службами。
  • выполнение кода:生成并осуществлять简单的代码片段来解决问题。

проходить Function Calling Механизмы, LLM Способен лучше обслуживать реальные Сценарии. применения, увеличивая его ценность в реальном мире. функция calling Конкретный рабочий процесс показан на рисунке ниже:

Пример вызова функции
Пример вызова функции

Пример вызова функции

Предположим, существует языковая модель и пользователь запрашивает создание простой Python Программа для вычисления суммы двух чисел. Модели не только генерируют код, но и Function Calling Механизм вызоваодин функции для проверки корректности кода.

Язык кода:javascript
копировать
# сгенерированный код
def add_numbers(a, b):
    return a + b

# Function Функция проверки вызова механизма вызова
result = add_numbers(3, 4)
print("The sum is:", result)

В этом примере механизм вызова функции может использовать функцию проверки для проверки правильности функции add_numbers и возврата результатов проверки.

Вызов функций обеспечивает большую гибкость и функциональность для применения больших языковых моделей, позволяя модели напрямую взаимодействовать с внешними системами и выполнять сложные задачи, а не просто генерировать статический текст. Эта возможность особенно ценна при создании умных помощников, инструментов автоматизации и интерактивных приложений.

Платформа разработки ИИ-агентов

Если вы хотите разработать AI Интеллектуальный агент (ИИ приложение), это гораздо удобнее, чем начальный этап взрыва больших моделей. AI Спрос на приложения продолжает оставаться высоким, и платформы для разработки интеллектуальных агентов появляются бесконечно. например Botnow Платформа разработки агентов, Botnow Абстрагируйте и инкапсулируйте те модули, которые часто используются, такие как возможности памяти, возможности планирования и RAG. Способность, большая модель вызывать. Botnow Платформа разработки интеллектуальных агентов, пользователи могут быстро и с низким порогом создавать высококачественных агентов с помощью плагинов, баз знаний, рабочих процессов и т. д., а также поддерживает публикацию на сторонних платформах, а также поддерживает API вызови Web SDK。

Botnow Платформа разработки ИИ-агентов
Botnow Платформа разработки ИИ-агентов

мировоззрение

С быстрым развитием больших языковых моделей (LLM),Длина поддерживаемого контекста постоянно увеличивается.,Масштаб параметров становится все больше и больше,Способности к рассуждению также значительно улучшаются. Это делает Интеллектуальный построенным на таких передовых моделях. агент (ИИ Возможности агентов постоянно совершенствуются. Благодаря агентной технологии мы смогли разработать такие вещи, как Copilot и Botnow и другие разнообразные AI Приложения, эти приложения постепенно становятся незаменимой частью нашей повседневной жизни и работы. Как и ожидалось, ИИ Приложения быстро и полностью изменят привычные нам формы программного обеспечения и шаблоны взаимодействия и значительно повысят эффективность работы человека.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose