Были проанализированы ценность, сценарии и зрелость внедрения AI Agent в корпоративных приложениях, а также обсуждено, как будущая корпоративная ИТ-инфраструктура и архитектура могут подготовиться к будущему поколению ИИ (генеративный ИИ). В такой архитектуре AI-агент, который в конечном итоге воплощает в себе возможности приложения верхнего уровня, делится на несколько категорий, основанных на разных технических требованиях и принципах:
Большие модели — это основа генеративного ИИ, поэтому понимание, создание и генерация контента — его сильные стороны и основные возможности. На рынке C-side повсюду появилось большое количество генеративных инструментов искусственного интеллекта (включая изображения, видео, музыку), и в настоящее время это наиболее зрелая форма применения. Следует отметить, что в инструментах C-side мы часто видим различные формы простых «помощников»:
Помощник здесь несколько отличается от AI Agent в обсуждаемых здесь корпоративных приложениях:
AI Agent — это интеллектуальный агент, управляемый задачами, с автономными возможностями. Ему не только требуется основной «мозг» большой модели, но также требуются такие возможности, как планирование задач, память и использование внешних инструментов. Большинство часто встречающихся персональных помощников с искусственным интеллектом представляют собой большие модели ботов с вопросами и ответами, основанные на заранее заданных словах-подсказках. Они обычно не имеют возможности использовать инструменты без помощи других плагинов.
В настоящее время технически существует как минимум два типа ИИ-агентов, основной функцией которых является создание и генерация контента в корпоративных приложениях:
Этот тип ИИ-помощника можно реализовать просто с помощью проекта Prompt (существенной разницы с персональным помощником C-side нет):
**Этот мультиагентный помощник для совместной работы может использовать платформу Multi-Agents для упрощения разработки и внедрения. **Например, MetaGPT может сформировать команду агентов (PM, архитектор, программист, QA и т. д.) на основе задач разработки, описанных на естественном языке, следовать СОП и, наконец, выводить полные результаты разработки программного обеспечения (документы, коды, API). описания и др.).
Многие другие поддержки Agent фреймворков с открытым исходным кодом включают Microsoft AutoGen,xAgents ждать.
Один из наиболее зрелых на данный момент Agent тип. С точки зрения непрофессионала,Просто тампредприятиеприложениесередина,проходить "плагин" Частная база знаний для расширения резерва знаний крупных моделей для обеспечения диалогового доступа к частным знаниям предприятия на естественном языке.(соответствующий AI Agent из Одна из основных способностей:постоянная память),Решить проблему галлюцинаций, вызванную недостаточными знаниями предметной области при столкновении с предприятием-приложением.
Помощники по обмену знаниями обычно полагаются на большие модели. Реализована схема **RAG (Retrival Enhanced Generation)**, которая, по сути, представляет собой быстрый проект: **Передавая соответствующий контекст частных знаний при вводе большой модели, большая модель может понимать, обобщать, организовывать и отвечать на вопросы пользователя. вопрос. **Просто контекст частных знаний здесь нуждается в помощи модели встраивания (Embedding Модель), векторная база данных (Вектор Store), разделение загрузки документов (Документ Loader&Splitter)Подождите, пока соответствующие технологии будут получены.。
Инфраструктура технической реализации помощника по знаниям выглядит следующим образом:
Реализация AI-ассистента на основе решения RAG может быть реализована непосредственно через код. Конечно, для упрощения процесса разработки и управления рекомендуемые инструменты включают в себя:
Важность анализа данных и бизнес-аналитики (BI) в повседневной деятельности средних и крупных предприятий не вызывает сомнений. Будь то простой анализ финансовых данных или сложный анализ клиентских и операционных данных, необходимы профессиональные инструменты. Проблемы традиционных инструментов BI, такие как высокие барьеры в использовании, чрезмерная зависимость от технических отделов и длительные циклы производства результатов, можно облегчить в эпоху ИИ с помощью возможностей больших моделей.
Помощник по анализу данных на основе большой модели (Data Agent)дасуществоватьпредприятиеприложениесерединапроходить Воляпреобразование естественного язык заменяется анализом данных языка или кода, например, для API Звонки, доступ к базе данных и даже написание кода анализа данных для достижения цели получения данных, анализа данных и визуализации результатов.。его реализация База Архитектура и принципы следующие::
Будь то для местных Excel Анализ файла данных,или Исследователь анализирует реляционные данные в базе данных.,Другие анализируют неструктурированные данные в Интернете.,В настоящее время технические методы реализации анализа данных в крупномасштабных проектах в основном основаны на этих трех методах.,преобразование естественного языка API, передача SQL и интерпретатор кода (преобразование в код)。
Вот несколько рекомендуемых инструментов и проектов для создания помощников по анализу данных в дополнение к Langchain:
нужно вниманиеизда:Помощник по анализу данные во многом зависят от большой модели и преобразования. естественного язык манипулирования данными (SQL или Python код и др.). Конечно, при определенных условиях даже модели и оперативные проекты, специально оптимизированные под этот сценарий, имеют высокую вероятность провала.(например Text2SQL В настоящее время самый высокий показатель успеха 80% о). Следовательно, при фактической реализации необходимо провести комплексную оценку на основе сценария, сложности и требований к надежности.
в корпоративных приложениях AI Ассистенты часто нуждаются в интеграции с существующими приложениями (CRM, OA). System) интегрируется и взаимодействует для выполнения задач пользователя или управления бизнес-процессами. Например: если вам нужно AI Чтобы помочь вам подать заявку на оплату в системе совместного офиса, вам необходимо вызвать интерфейс офисной системы или, если вам нужно использовать Интернет для получения последнего финансового отчета листинговой компании, вам необходимо позвонить на стороннюю платформу; общедоступный интерфейс. Это AI Agent Еще одна важная способность: использование инструментов.
**AI приложение / Помощник по инструментами является возможность осуществлять преобразование естественного языкизменить на предприятиеприложениеили, которое открыто для Интернета API Основание для звонка Agent форма. **Конечно, такие вызовы в сценариях сложных задач зачастую не единичны. Его основная структура и принципы:
Основной принцип приложенияпомощникиз относительно прост:,其复杂性主要体现существоватьбольшой Модельвернопреобразование естественного языка API способность,в реальном использовании,В основном это отражает следующие два аспекта:
В ходе реальных испытаний выяснилось, что разные большие модели имеют большие различия в своих возможностях в этом отношении, и даже самые лучшие модели имеют определенные погрешности. Например, они иногда не могут определить правильный инструмент.
Строительная компания основебольшой Модельизприложениепомощникчас,Есть некоторые инженерные вопросы, которые необходимо учитывать.,Эти Проблема в прототипированииили ВОЗтестчаслегко упустить из виду:
Некоторые инструменты и рекомендации по созданию приложенияпомощникиз:
аналогичный RPA (Роботизированная автоматизация процессов) AI агент. Его основная возможность — **автоматизация. Web Действия и процессы просмотра веб-страниц, манипулирования и исследования для упрощения web Просмотр доступа и операций。Для частных лиц его можно использовать в качестве личного цифрового помощника, а простой разговор может сделать AI Помогите вам завершить Web Просматривайте и действуйте, например, бронируя билеты онлайн. Для бизнеса вы можетекакпредприятиеизцифровой сотрудник,Упростить повседневную работу с высокой повторяемостью, фиксированными процессами и правилами, а также с большими объемами внешних операционных задач. **Например, пакетная обработка заказов, пакетный контакт с клиентами, пакетное сканирование веб-сайтов и т. д.,Повышение эффективности,Уменьшите процент ошибок.
традиционный RPA Роботы также используются для выполнения этой работы. AI форма, благодаря этому AI Робот, работающий в программном обеспечениииз Верхний уровень – это операционный уровень.,Преимущество в том, что процесс интуитивно понятен, прост и его можно настроить.,И это не навязчиво для приложения, но его недостаток в том, что оно сильно связано с интерфейсным приложением;,Каждая задача требует тщательной настройки и отладки в соответствии с интерфейсом внешнего приложения.,Плохая адаптивность.
После появления крупных моделей дайте эту категорию RPA Интеллект также приносит новыеиз Оптимизируйте пространство。Использование возможностей понимания и аналитического рассуждения больших моделей может позволить AI Более разумно планировать и декомпозировать процесс задачи, а затем завершать выполнение с помощью браузера и в дальнейшем можно использовать такие инструменты, как; GPT-4V Такая визуальная модель обеспечивает более разумное понимание элементов и функций интерфейса, обеспечивает полностью автономные интеллектуальные операции и обладает более сильными адаптивными возможностями.
Основные принципы и архитектура агента, реализующего автономные веб-операции:
Создайте настоящее приложениеиз Web Agent Необходимо использовать собственные возможности браузера。Поскольку внешнее приложение не может напрямую взять на себя управление браузером для реализации операции,Обычно требует использования плагинов браузера.,Например, Chrom Extensionie с помощью API браузера обеспечивает навигацию по веб-сайту и автоматизацию операций с веб-страницами.,Например, нажмите на элемент интерфейса,или или форма ввода один.
Веб-агент в проекте OpenAgents, представленный ранее, представляет собой агент LLM, реализованный на основе браузера Chrom и расширений, который можно использовать в качестве справочного материала.
Конечно, из-за неопределенности выходных данных больших моделей текущий Web Agent Все еще находится на исследовательской и экспериментальной стадии.,Существует большая вероятность отказа или неправильной эксплуатации.,действительныйприложениесередина Необходимо повторить в зависимости от ситуациитести оценка。
Последний тип ИИ-агента, строго говоря, представляет собой комбинацию вышеперечисленных основных возможностей агента.
Идеальный ИИ-агент — после того, как бросит ему набор инструментов и некоторые знания.,С помощью великих Модельиз способностей понимания и рассуждения,Полностью автономное планирование и декомпозиция задач,Этапы задачи проектирования,И разумно используйте различные инструменты,Получить знания,Выходной контент,Завершить задачу。нонаходится впредприятиеприложениесередина,Поскольку знания предприятия, приложение, потребности бизнеса сильно различаются.,И сама Великая Модель из неопределенности,если ты это сделаешь,Тогда результат очень вероятенда «Открой слепой ящик» Такой же неуправляемый. Так что их становится все больше и больше Agents В проекте следует подчеркнуть причину управляемости, то есть возможность AI Больше контроля над процессом выполнения и деталями агента, чтобы позволить AI Следуйте проверенным человеком рабочим процессам для выполнения задач.
Например, в сценарии автоматической проверки резюме HR, представленном ранее, вам может потребоваться более подробно определить весь автоматизированный рабочий процесс, включая:
В актуальном приложении это основе LLM Рабочий процесс может быть запущен непосредственно диалоговым роботом, обращенным к пользователям, а также может быть запущен полностью в фоновом режиме;
Внедрить такие автоматизированные рабочие процессы AI Интеллектуальные агенты, помимо того, что полагаются на Langchain/LlamaIndex Такой LLM Помимо непосредственной настройки среды разработки, вы также можете обратиться к некоторым проектам с открытым исходным кодом:
Выше, да корпоративных приложенияхбольшой Модель AI Agent Кратко обсуждаются несколько типов, отличающихся от уровня технических принципов. На самом деле, каждый тип здесь — это сложная тема, которую можно изучить подробно. Некоторые типы подробно обсуждались в предыдущих статьях, и мы также уделим им внимание в будущем. AI Agent Технологические тенденции и разработки и продолжайте делиться ими в будущем.