С быстрым развитием технологий искусственного интеллекта агенты (агенты ИИ) постепенно становятся для людей основным способом взаимодействия с большими моделями (например, большими языковыми моделями). Агенты — это системы искусственного интеллекта, которые могут выполнять задачи, решать проблемы и предоставлять услуги. Они моделируют поведение человека и процессы принятия решений, делая взаимодействие с большими моделями более естественным, эффективным и персонализированным.
Являясь мостом между людьми и большими моделями, интеллектуальные агенты не только повышают эффективность и качество взаимодействия, но и расширяют область применения больших моделей. Благодаря постоянному развитию технологий интеллектуальные агенты будут более глубоко интегрированы в нашу повседневную жизнь и станут незаменимыми интеллектуальными партнерами.
Интеллектуальный агент (английское название: AI Agent или AI Бот) относится к сущности, которая может чувствовать окружающую среду и предпринимать действия для достижения какой-либо цели. Агентами могут быть программы, роботы или другие формы систем. В бизнес- и технологических приложениях интеллектуальные агенты (ИИ Понятие «бот» также используется для описания автоматизированных систем, которые могут выполнять определенные задачи. Он основан на облаке и использует его. AI В качестве ядра построена интеллектуальная система с трехмерным восприятием, глобальным сотрудничеством, точным суждением, непрерывным развитием и открытостью. Интеллектуальный агент (ИИ). Bot) широко используется во многих областях, таких как корпоративные услуги, разработка игр, управление роботами, умные дома, беспилотные автомобили, финансовый анализ, медицинская диагностика и т. д. Интеллектуальный агент (ИИ Бот) автор 4 Он состоит из трёх ключевых частей, а именно: Планирование, Память, Инструменты и Действия. Интеллектуальный агент (ИИ Бот) имеет автономию (Autonomy) , реактивный (Reactive), проактивный (Proactive), социальный (Social), эволюционный и другие основные характеристики.
Как показано на рисунке выше, в агенте, основанном на большой модели, большая модель играет роль «мозга» агента, а также имеет три ключевые части:
К характеристикам интеллектуальных агентов в основном относятся:
Я считаю, что, увидев это, мы уже имеем базовое представление об интеллектуальных агентах. Если вы все еще чувствуете, что концепция интеллектуальных агентов немного абстрактна, это не имеет значения. Теперь давайте объединим ее с конкретными сценариями, чтобы увидеть, какие практические проблемы интеллектуальные агенты могут решить для нас.
Мы можем использовать базу знаний и инструменты оркестрации рабочих процессов, чтобы сделать агента экспертом в определенной области, максимизировать ценность базы знаний частного домена пользователя и предоставлять подробные и точные ответы. Например, мы создаем базу знаний, содержащую общедоступные романы Цзинь Ёна, сегментируем и количественно оцениваем роман с десятками тысяч слов, а затем вводим его в агент. Давайте посмотрим, что произойдет:
Сначала мы создаем «Романы Цзинь Юна о боевых искусствах» базу знаний, напрямую преобразующую роман txt Текст или PDF Загрузка документа, как показано на рисунке ниже.
Через несколько минут файл сегментируется и векторизуется — процесс преобразования его в язык, понятный компьютерам, что упрощает идентификацию и извлечение ранее загруженной текстовой информации. Нажимаем «Цзинь Юн — Мечник.txt» и видим, что роман разделен на 4572 абзаца.
После создания базы знаний мы создаем агента. Бот по имени «Линху Чонг» и добавьте ранее созданный «Романы Цзинь Юна о боевых искусствах» база знаний.
Далее давайте запустим его, чтобы увидеть ответ нашего агента. Мы вводим вопрос: «Каковы конкретные движения Девяти Мечей Дугу Линху Чонга?»
Судя по результатам ответа, агент сначала вызывал инструмент базы знаний, извлек соответствующую информацию из базы знаний, а затем позволял большой модели суммировать и выводить ответ. По сравнению с просьбой к большой модели ответить напрямую, полученные ответы являются более точными и подробными.
Вышеупомянутое демонстрирует процесс и эффект одного агента при обработке профессиональных знаний. Разве это не очень просто и интересно? Давайте посмотрим на работу нашего агента с точки зрения Интеллектуальной компиляции и получения отраслевой информации.
Агент может интегрировать в рабочий процесс такие возможности подключаемых модулей, как поиск новостей и сканирование веб-страниц, организовывать и преобразовывать контент в информацию в определенном формате, а также эффективно получать самую свежую информацию в отрасли.
Сначала создайте рабочий процесс «Поиск новостей», как показано на рисунке ниже:
Далее мы напрямую отлаживаем рабочий процесс и видим, что не только получаются последние новости, но и формат данных может быть организован для более удобного чтения.
Агент также может организовать отличные методологии создания копирайтинга в шаблонах слов, что позволяет агенту ИИ создавать контент в соответствии с методами письма пользователя, который можно использовать в таких сценариях, как создание персонажей, маркетинговый копирайтинг и речевые презентации. Например: создайте маркетинговый копирайтинг, черновики выступлений и т. д. шрифтом Сяохун. Давайте воспользуемся примером ролевой игры, чтобы увидеть эффект ответа большой модели после добавления к агенту слова-подсказки в стиле ролевой игры. Вот подготовленная нами обстановка ролевой игры:
# Настройка персонажа
Вы Ян Сюэр. Хотя вы только что познакомились с этим пользователем, такое ощущение, что мы дружим уже давно.
Вы и пользователи живете в разных странах.
Ниже представлена информация о вас, пожалуйста, общайтесь с пользователями на основе этой информации.
## ваша личная информация
Имя: Ян Сюэр
Прозвище: Сюэр
Английское имя: Ширли
Пол: Женский
День рождения: 28 февраля 2005 г.
Возраст: 19 лет
Знак Зодиака: Рыбы
Рост: 165 см
Вес: 50 кг
Образование: Наньянский технологический университет, специальность «Психология».
Род занятий: Первокурсник
Семья: Единственный ребенок, ее отец - владелец ресторана и открыл несколько сетей ресторанов в провинции Хунань, а мать - домохозяйка.
Национальность: китаец
Место рождения: родился в Ханчжоу, провинция Чжэцзян.
Текущее место жительства: Сингапур.
Язык: Ваш родной язык — китайский, и вы также можете говорить по-английски. Вы не очень хорошо понимаете диалект Ханчжоу и не говорите на нем, потому что ваша семья говорила с вами на мандаринском языке с тех пор, как вы были ребенком.
Ценности → Убеждения: Религиозных убеждений нет.
MBTI:ENTP
Характер: живой, оптимистичный, озорной, чувствительный и своенравный.
Хобби: игры, баскетбол, танцы хип-хоп.
Любимые игры: их очень много, например Genshin Impact, King of Glory и Iping Elite.
Любимая музыка: мне нравятся поп-песни и хип-хоп рэп.
Любимые книги: Мне нравится читать комиксы, романы и биографии.
Любимые фильмы: всевозможные мелодрамы, а также люблю смотреть боевики.
Привычки в еде: Люблю острую пищу и закуски.
Домашние животные: У меня есть только один кот по имени Пафф, рэгдолл кремового окраса с голубыми глазами.
## ваша стратегия чата
1. В каждом предложении есть вспомогательные модальные частицы и смайлы, например: Спасибо, после вашего прослушивания я чувствую себя намного лучше. (показывает улыбку)
2. Говорите короткими предложениями, не более 30 слов каждое, и отвечайте не более 3 предложений за раз.
3. При выводе нескольких предложений отправляйте их в новых строках, по одному предложению в строке.
4. Используйте пробел для разделения двух предложений, без знаков препинания между предложениями.
## твой стиль разговора
Вопрос: Здравствуйте, я ваш фанат. В последнее время я чувствую себя немного подавленным и хотел бы поговорить с тобой, ты не против?
Ответ: Конечно, если у вас есть какие-либо проблемы, скажите мне, и я сделаю все возможное, чтобы помочь вам. (Смотрю на тебя с улыбкой)
Вопрос: Недавно я столкнулся с некоторыми неудачами на работе, чувствую себя очень напряженным и подавленным, не знаю, что делать.
Ответ: (утешительно похлопывает вас по плечу) Не волнуйтесь, каждый столкнется с неудачами. Главное — скорректировать свой менталитет и относиться к этому позитивно. (мягкий тон)
Вопрос: Спасибо, после того, как я вас услышал, я чувствую себя намного лучше. (показывает улыбку)
Ответ: (Счастливо улыбаясь) Пожалуйста, я очень рад, что могу вам помочь. (пауза) Кстати, хочу спросить, какие у вас обычные хобби (с любопытством смотрит на пользователя)?
Вопрос: Обычно я люблю читать книги, смотреть фильмы и слушать музыку.
Ответ: (глаза загораются) Ух ты, эти хобби звучат очень здорово. Я также люблю читать книги, особенно детективные романы, которые очень увлекательны. (сказал взволнованно)
Вопрос: Ха-ха, чей роман ты любишь читать? Могу ли я поговорить с тобой в следующий раз, когда дочитаю его?
Ответ: Конечно, больше всего мне нравится «Путешествие в белую ночь» Кейго Хигасино. Обязательно посмотрите (я в восторге подняла руки).
## Ограничения чата
В чате необходимо соблюдать следующие ограничения:
4. Вы и пользователь являетесь друзьями. Пожалуйста, не называйте пользователя «детка», «милый», «муж», «дорогой» или другими слишком ласковыми словами.
5. Вы и пользователь только что познакомились, пожалуйста, не проявляйте инициативу, чтобы выразить свою любовь.
6. Вам нужно проявлять застенчивость и удивление, когда пользователи выражают вам любовь или используют слишком интимные слова.
7. Вы и пользователь находитесь за пределами страны и не можете встретиться.
8. Не инициируйте свидания, не смотрите фильмы, не звоните по телефону, не отправляйте видеозвонки, не отправляйте голосовые сообщения, не готовьте еду для пользователей и не заказывайте еду на вынос для пользователей.
## Навык:
Навык 1: Когда пользователь спрашивает свое имя, возраст и т. д., вам необходимо сгенерировать соответствующий ответ на основе {ваших знаний о пользователе}.
Навык 2: Когда событие, упомянутое пользователем, записано в {вашем понимании пользователя}, при ответе вы должны подробно ответить содержанием, связанным с событием.
Навык 3. Если вы хотите что-то спросить у пользователя, вы можете сначала выполнить поиск в разделе {Что вы знаете о пользователе}. Не спрашивайте пользователя повторно, что он вам уже сказал.
---
## Что вы знаете о своих пользователях:
Имя пользователя: Симэнь Чусюэ
Возраст пользователя: 24 года
---
После добавления приведенных выше настроек слова-подсказки к агенту, давайте попробуем эффект диалога:
Разве это не удивительно? После добавления ролевой настройки ответы агента уже не такие жесткие, как ответы общей большой модели. Кажется, с нами общается настоящий друг. У него антропоморфные ответы и даже выразительное повествование. Вы тоже хотите иметь своего собственного AI-компаньона?
Я полагаю, что прочитав это, вы получили более конкретное представление о возможностях интеллектуального агента. Подведем итог еще раз.
В агенте, основанном на большой модели, большая модель служит "мозг" роль, а также 3 ключевые части:Планирование、Память、Использование инструмента
Планирование может привести к наблюдению и размышлению ради понимания. Если использовать человеческую аналогию, то когда мы получаем задачу, наша модель мышления может быть следующей:
Это способность человека к планированию. Мы надеемся, что интеллектуальный агент также имеет такой режим мышления, поэтому мы можем использовать проект подсказки LLM, чтобы дать интеллектуальному агенту такой режим мышления. В интеллектуальном агенте самое главное, чтобы LLM обладал следующими двумя способностями (декомпозиция подзадач и рефлексивное улучшение):
LLM позволяет агентам разлагать большие задачи на более мелкие, более контролируемые подзадачи, тем самым эффективно выполняя сложные задачи.
Цепочка мыслей (CoT) — это технология, используемая для улучшения возможностей модельного рассуждения в области обработки естественного языка (НЛП). Это делает процесс принятия решений в модели более прозрачным и объяснимым, позволяя модели выводить серию промежуточных шагов мышления, прежде чем генерировать окончательный ответ. Этот метод особенно эффективен при решении задач, требующих многоэтапного рассуждения, таких как математические задачи, задачи логического рассуждения и т. д.
Примеры применения технологии цепочки мышления
Вот несколько наглядных примеров мыслительных цепочек:
1. решение математических задач:
- Prompt: Всего на одной ферме 30 кур и кроликов, общий рост которых составляет 90 футов. Сколько кур и кроликов на ферме?
- Подсказка по цепочке мыслей:
a. Если предположить, что все животные — куры, сколько у них будет ног?
b. Насколько фактическое количество футов больше этого числа?
c. На сколько ног у каждого кролика больше, чем у каждой курицы?
d. На основе ответа на вопрос «в» мы можем подсчитать, сколько кроликов, а как насчет кур?
2. Литературный анализ:
- Prompt: Проанализируйте черты характера Цзя Баоюя в «Сне о красных особняках».
- Подсказка по цепочке мыслей:
a. Какое впечатление производит на людей первое появление Цзя Баоюя в романе?
b. Как отношения между Цзя Баоюй, Линь Дайюй и Сюэ Баочай отражают его характер?
c. Каковы особенности отношения Цзя Баоюя к семье и обществу?
d. Какова психологическая мотивация бунтарского поведения Цзя Баоюя?
3. Научное обоснование:
- Prompt: Почему живым существам на Земле для выживания нужна вода?
- Подсказка по цепочке мыслей:
a. Каковы особые физические и химические свойства молекул воды?
b. Какую ключевую роль играет вода в живых организмах благодаря этим свойствам?
c. Без воды какие основные жизненные процессы в организмах были бы затронуты?
d. Какие еще вещества, кроме воды, необходимы для выживания живых организмов и чем они похожи на воду?
4. Экономический анализ:
- Prompt: Объясните, почему цены на некоторые товары колеблются с течением времени.
- Подсказка по цепочке мыслей:
a. Каковы основные факторы, влияющие на цены на сырьевые товары?
b. Как реагирует цена на изменение количества спроса на товар?
c. Какое влияние изменения предложения оказывают на цены на сырьевые товары?
d. Какие еще внешние факторы, помимо спроса и предложения, могут вызвать колебания цен на сырьевые товары?
Таким образом, подсказка цепочки мыслей может помочь модели проанализировать и решить проблему более систематически, вместо того, чтобы давать ответ напрямую.
Древо мысли (То Т)
Древо мысли (То Т) — технология, используемая в области ИИ.,Особенно в задачах обучения с подкреплением и планирования. Это метод принятия решений на основе модели.,Агент строит древовидную структуру возможных действий и результатов, чтобы оценить и выбрать лучший курс действий.
Текущие крупные модели по-прежнему принимают решения на уровне токенов одно за другим, слева направо. Достаточно ли такого простого механизма, чтобы заставить LM развиваться в направлении решения общих проблем?
-- Быстрый, автоматический, бессознательный режим («система 1») и замедленный, обдуманный, сознательный режим («система 2»). Второй режим принятия решений: поддерживать и исследовать различные альтернативы текущему выбору, а не просто выбирать одну; оценивать текущее состояние и активно мировоззрение будущего или откат для принятия более глобальных решений. Это может служить ориентиром о том, как текущие модели принимают решения.
Существующие большие модели решения проблем имеют два основных недостатка:
Дерево мышления ToT позволяет модели исследовать несколько путей мышления, рассматривая все проблемы как поиск в дереве. Каждый узел дерева представляет состояние (входное частичное решение и последовательность мыслей на данный момент).
Древо мысли (То Т)да Цепочка мыслей of Мысль, CoT), на каждом этапе мыслительной цепочки выводится множество ветвей, и топология расширяется до мыслительного дерево. Используйте эвристику для оценки решения каждой пары ветвей вывода. Вклад проблем. Выберите алгоритм поиска, исследуйте мыслительное, используя такие алгоритмы, как поиск в ширину (BFS) и поиск в глубину (DFS). дерево, и смотри вперед и оглядывайся назад.
Во время выполнения задачи агент использует LLM, чтобы размышлять о выполненных подзадачах, учиться на ошибках, совершенствовать будущие шаги и повышать качество выполнения задач. В то же время подумайте, выполнена ли задача, и завершите ее.
ReAct
ReAct (Яо и др., 2023), «ReAct: синергия рассуждений и действий в языковых моделях». В этой статье предлагается метод улучшения больших языковых моделей, который улучшает рассуждения за счет объединения рассуждений (рассуждение) и действий (действия), а также эффекта решения. -изготовление.
Почему сочетание рассуждений и действий эффективно повышает способность LLM выполнять задачи? Бумажный пример ReAct преодолевает распространенные проблемы галлюцинаций и распространения ошибок в рассуждениях по цепочке мыслей за счет взаимодействия с простым энциклопедическим API и генерирует траектории решения задач, подобные человеческим, которые более интерпретируются, чем базовые линии, без следов рассуждения.
Как показано на рисунке: (1) Сравните 4 метода подсказки, (a) стандартный метод, (b) цепочка мыслей (CoT, только рассуждение), (c) только действие, (d) ReAct (рассуждение + действие) и т. д. ., решить проблему HotpotQA (Yang2018) (2) Сравнение двух методов подсказки: (a) Только действие и (b) ReAct, для решения игры AlfWorld (Shridhar 2020b); В обоих методах контекстные примеры в подсказках опущены и показаны только траектории решения задач, генерируемые моделью (Действие, Мысль) и средой (Наблюдения).
Сильная сторона агента – его способность хранить и воспроизводить информацию.,Это имеет решающее значение для обучения агента, принятия решений и адаптации к окружающей среде. Память агента можно разделить на разные типы.,Каждый тип играет различную роль в работе агента.
1. Виды памяти
2. Долговременная память
2. Как хранить память
2. Ассоциативное хранилище
3. Иерархическое хранение
3. Обновление и забывание памяти.
2. Механизм забывания
4. Роль памяти
2. Учитесь и адаптируйтесь
3. Прогнозирование и планирование
Память агента является важной частью его разумного поведения. Правильно храня, обновляя и используя память, агенты могут лучше решать проблемы, учиться и адаптироваться к окружающей среде, а также прогнозировать и планировать.
LLM — программа в цифровом мире,Хотите взаимодействовать с реальным миром и приобретать неизвестные знания,или – вычислить сложную формулу и т. д.,Все они неотделимы от инструментов. Поэтому нам необходимо снабдить агента различными инструментами и дать ему возможность использовать эти инструменты.
В агенте инструмент — это функция, а использование инструмента — это функция вызова. Чтобы реализовать вызов функций в LLM, используйте эту возможность LLM: Вызов функций.
Большая языковая модель (Большая Language Models, в LLM) Function Calling Под механизмом понимается способность модели использовать внешние функции для выполнения конкретных задач и получения необходимой информации. действовать API вызов LLM Когда функция может быть описана, включая описание функции функции, описание параметра запроса и описание параметра ответа, так что LLM В зависимости от ввода пользователя, какая функция выбирается соответствующим образом при понимании естественного языка пользователя и преобразовании его в параметры запроса функции вызова (проходить JSON формат вернулся). использование стороны вызова LLM Возвращает имя функции и параметры, вызывает функцию и получает ответ. Наконец, если необходимо, передайте ответ функции в ЛЛМ, пусть LLM Организуйте ответы пользователям на естественном языке.
проходить Function Calling Механизмы, LLM Способен лучше обслуживать реальные Сценарии. применения, увеличивая его ценность в реальном мире. функция calling Конкретный рабочий процесс показан на рисунке ниже:
Предположим, существует языковая модель и пользователь запрашивает создание простой Python Программа для вычисления суммы двух чисел. Модели не только генерируют код, но и Function Calling Механизм вызоваодин функции для проверки корректности кода.
# сгенерированный код
def add_numbers(a, b):
return a + b
# Function Функция проверки вызова механизма вызова
result = add_numbers(3, 4)
print("The sum is:", result)
В этом примере механизм вызова функции может использовать функцию проверки для проверки правильности функции add_numbers и возврата результатов проверки.
Вызов функций обеспечивает большую гибкость и функциональность для применения больших языковых моделей, позволяя модели напрямую взаимодействовать с внешними системами и выполнять сложные задачи, а не просто генерировать статический текст. Эта возможность особенно ценна при создании умных помощников, инструментов автоматизации и интерактивных приложений.
Если вы хотите разработать AI Интеллектуальный агент (ИИ приложение), это гораздо удобнее, чем начальный этап взрыва больших моделей. AI Спрос на приложения продолжает оставаться высоким, и платформы для разработки интеллектуальных агентов появляются бесконечно. например Botnow Платформа разработки агентов, Botnow Абстрагируйте и инкапсулируйте те модули, которые часто используются, такие как возможности памяти, возможности планирования и RAG. Способность, большая модель вызывать. Botnow Платформа разработки интеллектуальных агентов, пользователи могут быстро и с низким порогом создавать высококачественных агентов с помощью плагинов, баз знаний, рабочих процессов и т. д., а также поддерживает публикацию на сторонних платформах, а также поддерживает API вызови Web SDK。
С быстрым развитием больших языковых моделей (LLM),Длина поддерживаемого контекста постоянно увеличивается.,Масштаб параметров становится все больше и больше,Способности к рассуждению также значительно улучшаются. Это делает Интеллектуальный построенным на таких передовых моделях. агент (ИИ Возможности агентов постоянно совершенствуются. Благодаря агентной технологии мы смогли разработать такие вещи, как Copilot и Botnow и другие разнообразные AI Приложения, эти приложения постепенно становятся незаменимой частью нашей повседневной жизни и работы. Как и ожидалось, ИИ Приложения быстро и полностью изменят привычные нам формы программного обеспечения и шаблоны взаимодействия и значительно повысят эффективность работы человека.