Chatgpt выпустил GPT, а DingTalk выпустил AI Assistant. В эпоху ИИ агент ИИ (интеллектуальный агент) является основной формой бизнес-сценариев реализации крупномасштабных моделей. Что же такое агент ИИ?
01
—
Что такое ИИ-агент?
AI Agent относится к агенту искусственного интеллекта, который представляет собой интеллектуальный агент, который может воспринимать окружающую среду, самостоятельно понимать, принимать решения и выполнять действия. AI-агент обладает способностью постепенно достигать поставленной цели, думая независимо и вызывая инструменты. Разница между большой моделью и большой моделью заключается в том, что взаимодействие между большой моделью и людьми осуществляется посредством слов-подсказок (Подсказка). То, понятно ли слово-подсказка пользователя, повлияет на эффект большой модели. Агенту ИИ достаточно дать только один, чтобы иметь возможность самостоятельно думать о цели и выполнить целевую задачу.
Большая модель содержит различные данные и большое количество данных о поведении человека в огромных данных для обучения, что позволяет большой модели моделировать человеческое взаимодействие. По мере дальнейшего роста модели появляется большая модель с возможностями контекстного обучения и цепочками мышления. способность к рассуждению и другие способности, подобные человеческому мышлению. У больших моделей также есть много проблем, таких как галлюцинации и ограничения контекста. Таким образом, большая модель используется в качестве основного мозга ИИ-агента для достижения способности разлагать сложные задачи на достижимые подзадачи и формировать интеллектуального агента с независимым мышлением, принятием решений и выполнением задач.
02
—
Архитектура системы AI-агента
Система AI Agent, основанная на большой модели, может разделить набор LLM (большая модель), памяти (Память), планирования задач (Планирование) и использования инструментов (Инструмент). В системе AI Agent на базе LLM большая модель отвечает за расчеты для мозга системы AI Agent и требует помощи от других компонентов.
1. Планирование
① Для сложных задач, требующих большего количества шагов, AI Agent может вызвать LLM для декомпозиции задач с помощью возможностей цепочки мышления. В архитектуре AI Agent декомпозиция задач и планирование основаны на возможностях больших моделей. Способность (Chain Of Thought, COT) заключается в том, чтобы шаг за шагом обдумывать оперативную модель и разлагать большие задачи на более мелкие, выполнимые подцели, чтобы эффективно решать сложные задачи.
②. С помощью системы анализа и самоанализа агенты ИИ могут постоянно совершенствовать свои возможности планирования задач. Агенты ИИ могут самокритиковать и размышлять о прошлом поведении, учиться на ошибках, а также анализировать, обобщать, уточнять и улучшать будущие действия. качество конечного результата. Структура самоанализа позволяет агентам ИИ пересматривать предыдущие решения для постоянной оптимизации. Такое размышление и уточнение могут помочь агентам улучшить свой интеллект и адаптивность.
2. Память
① Кратковременная память: все входные данные системы AI Agent станут кратковременной памятью системы. Все контекстное обучение зависит от способности модели к кратковременной памяти. Кратковременная память ограничена длиной ограниченного контекстного окна, и разные модели имеют разные ограничения контекстного окна.
② Долговременная память: когда ИИ-агент достигает своей цели, внешняя база данных векторов, к которой необходимо выполнить запрос, становится долговременной памятью системы. Долговременная память дает агентам ИИ возможность сохранять и воспроизводить неограниченное количество информации в течение длительных периодов времени. Доступ к внешним базам данных векторов можно получить с помощью быстрого поиска. AI Agent в основном выполняет множество сложных задач в течение длительного периода времени, например чтение PDF-файлов, баз знаний и т. д.
③ База данных векторов хранит данные путем преобразования их в векторы.
3. Инструменты
① AI Agent может использовать API внешних инструментов для расширения возможностей модели и получения информации за пределами больших моделей. Например, планирование, настройка задач, запрос данных и т. д.
② В больших моделях, таких как GPT, также обновлены функции плагинов, которые могут вызывать плагины для доступа к последней информации или конкретным источникам данных. Однако пользователям необходимо заранее выбрать плагины, которые им необходимо использовать. задавать вопросы, что делает невозможным естественно отвечать на вопросы. AI-агент может автоматически вызывать инструменты для использования, определять, необходимо ли вызывать внешние инструменты для выполнения задачи на основе каждого шага задачи, полученной в плане, и получать информацию, возвращаемую API-интерфейсом инструмента в большую модель для следующее задание.
Процесс использования инструмента-помощника DingTalk AI: