Приложение для крупных моделей: 6 основных типов ИИ-агентов для крупных моделей в корпоративных приложениях, необходимых для обновления корпоративной аналитики.
Приложение для крупных моделей: 6 основных типов ИИ-агентов для крупных моделей в корпоративных приложениях, необходимых для обновления корпоративной аналитики.

Приложение для крупных моделей: 6 основных типов ИИ-агентов для крупных моделей в корпоративных приложениях, необходимых для обновления корпоративной аналитики.

Были проанализированы ценность, сценарии и зрелость внедрения AI Agent в корпоративных приложениях, а также обсуждено, как будущая корпоративная ИТ-инфраструктура и архитектура могут подготовиться к будущему поколению ИИ (генеративный ИИ). В такой архитектуре AI-агент, который в конечном итоге воплощает в себе возможности приложения верхнего уровня, делится на несколько категорий, основанных на разных технических требованиях и принципах:

  • Помощник по созданию и генерации
  • предприятие Знаниепомощник
  • Помощник по анализу данных
  • приложение / Помощник по инструментам
  • Помощник по веб-операциям
  • Пользовательский помощник по процессам

1. Помощники по созданию и генерации

Большие модели — это основа генеративного ИИ, поэтому понимание, создание и генерация контента — его сильные стороны и основные возможности. На рынке C-side повсюду появилось большое количество генеративных инструментов искусственного интеллекта (включая изображения, видео, музыку), и в настоящее время это наиболее зрелая форма применения. Следует отметить, что в инструментах C-side мы часто видим различные формы простых «помощников»:

Помощник здесь несколько отличается от AI Agent в обсуждаемых здесь корпоративных приложениях:

AI Agent — это интеллектуальный агент, управляемый задачами, с автономными возможностями. Ему не только требуется основной «мозг» большой модели, но также требуются такие возможности, как планирование задач, память и использование внешних инструментов. Большинство часто встречающихся персональных помощников с искусственным интеллектом представляют собой большие модели ботов с вопросами и ответами, основанные на заранее заданных словах-подсказках. Они обычно не имеют возможности использовать инструменты без помощи других плагинов.

В настоящее время технически существует как минимум два типа ИИ-агентов, основной функцией которых является создание и генерация контента в корпоративных приложениях:

  1. Генерация контента одним агентом。простойодин Чисодай Модельизгенеративная способностьпроходить API Интегрируйтесь в другие процессы и бизнес-процессы, заменяя и упрощая часть работы, изначально выполняемой вручную. например:
  • В системе управления онлайн-обучением искусственный интеллект используется для автоматического создания экзаменационных вопросов/работ на основе программного обеспечения.
  • В процессе цифрового маркетинга ИИ используется для создания точных маркетинговых слов и даже написания маркетинговых планов.
  • анализ рынка AI Agent на на основе Интернет-поискаили Отчет об анализе рынка генерации открытых данных
  • Предприятие электронной коммерции с помощью AI Автоматическое создание сводок по продуктам в пакетном режиме
  • Медиаиндустрияпроходить AI Создание сводок новостей, использование академических платформ; AI Создать реферат на бумаге

Этот тип ИИ-помощника можно реализовать просто с помощью проекта Prompt (существенной разницы с персональным помощником C-side нет):

  1. Генерация контента на основе сотрудничества нескольких агентов (возможно, людей)。типичныйиздля компании-разработчика программного обеспечения для виртуальных роботов,AI Agent занимает несколько должностей в области разработки программного обеспечения.,сотрудничать друг с другом для выполнения определенной задачи по разработке программного обеспечения.

**Этот мультиагентный помощник для совместной работы может использовать платформу Multi-Agents для упрощения разработки и внедрения. **Например, MetaGPT может сформировать команду агентов (PM, архитектор, программист, QA и т. д.) на основе задач разработки, описанных на естественном языке, следовать СОП и, наконец, выводить полные результаты разработки программного обеспечения (документы, коды, API). описания и др.).

Многие другие поддержки Agent фреймворков с открытым исходным кодом включают Microsoft AutoGen,xAgents ждать.

2. Помощник по корпоративным знаниям

Один из наиболее зрелых на данный момент Agent тип. С точки зрения непрофессионала,Просто тампредприятиеприложениесередина,проходить "плагин" Частная база знаний для расширения резерва знаний крупных моделей для обеспечения диалогового доступа к частным знаниям предприятия на естественном языке.(соответствующий AI Agent из Одна из основных способностей:постоянная память),Решить проблему галлюцинаций, вызванную недостаточными знаниями предметной области при столкновении с предприятием-приложением.

Помощники по обмену знаниями обычно полагаются на большие модели. Реализована схема **RAG (Retrival Enhanced Generation)**, которая, по сути, представляет собой быстрый проект: **Передавая соответствующий контекст частных знаний при вводе большой модели, большая модель может понимать, обобщать, организовывать и отвечать на вопросы пользователя. вопрос. **Просто контекст частных знаний здесь нуждается в помощи модели встраивания (Embedding Модель), векторная база данных (Вектор Store), разделение загрузки документов (Документ Loader&Splitter)Подождите, пока соответствующие технологии будут получены.。

Инфраструктура технической реализации помощника по знаниям выглядит следующим образом:

Реализация AI-ассистента на основе решения RAG может быть реализована непосредственно через код. Конечно, для упрощения процесса разработки и управления рекомендуемые инструменты включают в себя:

  • LangChain или LlamaIndex Large Модель основная разработка приложений База framework。эти двое База Рамки для большого количестваиз Модель、Загрузчик документов、векторная база данные, встроенная модель и т. д. абстрактно инкапсулированы.,И чтобы RAG приложение процесс поиска знаний, Подскажите Сборка и другие процессы были упрощены, что может значительно упростить процесс разработки.
  • **Другая категория — это те, у кого есть определенные нестандартные возможности. RAG приложение Строительная платформа. **По сравнению со средой разработки «База», она обеспечивает более полную RAG инструменты создания приложений, такие как управление и обслуживание частной базы знаний, тестирование, оркестровка процесса диалога, настройка слов и другие возможности. Здесь рекомендуются два проекта, один из них — основе Langchain построен Langcahin-Chatchat;другой FastGPT,Последний используется для коммерческих операций из приложения SaaS.,Вы можете испытать это сами.

3. Помощник по анализу данных

Важность анализа данных и бизнес-аналитики (BI) в повседневной деятельности средних и крупных предприятий не вызывает сомнений. Будь то простой анализ финансовых данных или сложный анализ клиентских и операционных данных, необходимы профессиональные инструменты. Проблемы традиционных инструментов BI, такие как высокие барьеры в использовании, чрезмерная зависимость от технических отделов и длительные циклы производства результатов, можно облегчить в эпоху ИИ с помощью возможностей больших моделей.

Помощник по анализу данных на основе большой модели (Data Agent)дасуществоватьпредприятиеприложениесерединапроходить Воляпреобразование естественного язык заменяется анализом данных языка или кода, например, для API Звонки, доступ к базе данных и даже написание кода анализа данных для достижения цели получения данных, анализа данных и визуализации результатов.。его реализация База Архитектура и принципы следующие::

Будь то для местных Excel Анализ файла данных,или Исследователь анализирует реляционные данные в базе данных.,Другие анализируют неструктурированные данные в Интернете.,В настоящее время технические методы реализации анализа данных в крупномасштабных проектах в основном основаны на этих трех методах.,преобразование естественного языка API, передача SQL и интерпретатор кода (преобразование в код)

Вот несколько рекомендуемых инструментов и проектов для создания помощников по анализу данных в дополнение к Langchain:

  • **DB-GPT:** Мощный проект с открытым исходным кодом от отечественной команды, целью которого является переосмысление взаимодействия с данными. Он включает в себя полную реализацию внешнего и внутреннего проекта, а также реализует интерактивный анализ данных в нескольких сценариях. Включает анализ базы данных, Excel Анализ, анализ дашбордов и т. д. Еще одной особенностью проекта является большая серверная масштабируемая архитектура управления. Также уделяется внимание тонкой настройке. Text2SQL Модель и оценка проектов с открытым исходным кодом.
  • **OpenAgents:** Data Agent — проект с открытым исходным кодом, разработанный командой из Гонконга, — одна из важных реализаций агента. В настоящее время он в основном реализует анализ данных локальных документов со структурированными данными. Его особенностью является то, что он предоставляет на выбор два метода анализа данных: один основан на SQL, а другой — на интерпретаторе кода.
  • **OpenInterpreter:** На данный момент это самый мощный интерпретатор с открытым исходным кодом. Он прекрасно копирует реализацию интерпретатора кода OpenAI, но его можно полностью развернуть и использовать локально. Рекомендуется использовать его для локального анализа и визуализации данных. .

нужно вниманиеизда:Помощник по анализу данные во многом зависят от большой модели и преобразования. естественного язык манипулирования данными (SQL или Python код и др.). Конечно, при определенных условиях даже модели и оперативные проекты, специально оптимизированные под этот сценарий, имеют высокую вероятность провала.(например Text2SQL В настоящее время самый высокий показатель успеха 80% о). Следовательно, при фактической реализации необходимо провести комплексную оценку на основе сценария, сложности и требований к надежности.

4. Помощник по приложениям/инструментам

в корпоративных приложениях AI Ассистенты часто нуждаются в интеграции с существующими приложениями (CRM, OA). System) интегрируется и взаимодействует для выполнения задач пользователя или управления бизнес-процессами. Например: если вам нужно AI Чтобы помочь вам подать заявку на оплату в системе совместного офиса, вам необходимо вызвать интерфейс офисной системы или, если вам нужно использовать Интернет для получения последнего финансового отчета листинговой компании, вам необходимо позвонить на стороннюю платформу; общедоступный интерфейс. Это AI Agent Еще одна важная способность: использование инструментов.

**AI приложение / Помощник по инструментами является возможность осуществлять преобразование естественного языкизменить на предприятиеприложениеили, которое открыто для Интернета API Основание для звонка Agent форма. **Конечно, такие вызовы в сценариях сложных задач зачастую не единичны. Его основная структура и принципы:

Основной принцип приложенияпомощникиз относительно прост:,其复杂性主要体现существоватьбольшой Модельвернопреобразование естественного языка API способность,в реальном использовании,В основном это отражает следующие два аспекта:

  • Можете ли вы понять это на основе контекста и точно сопоставить то, что вам нужно использовать? API (один или несколько)
  • Может ли он точно извлечь или сгенерировать каждый API Параметры вызова

В ходе реальных испытаний выяснилось, что разные большие модели имеют большие различия в своих возможностях в этом отношении, и даже самые лучшие модели имеют определенные погрешности. Например, они иногда не могут определить правильный инструмент.

Строительная компания основебольшой Модельизприложениепомощникчас,Есть некоторые инженерные вопросы, которые необходимо учитывать.,Эти Проблема в прототипированииили ВОЗтестчаслегко упустить из виду:

  • Решения по оптимизации для слишком большого количества API на предприятии。из-за необходимостипроходить Prompt намекать LLM Эти API информация, слишком много API Описания могут вызывать переполнение контекста и большое количество; API Взаимное вмешательство увеличит частоту ошибок в рассуждениях. Ранее было представлено решение по оптимизации: с помощью семантического поиска векторной библиотеки каждый раз извлекается только релевантная для этой задачи информация. API опиши и потом отдай LLM иметь дело с.
  • **Необходимо разработать стандартизированный, легко расширяемый и легко подключаемый инструмент. / Плагинная архитектура. **Его можно гибко и быстро расширять Agent из «Инструментарий», при добавлении новых инструментов легко настраивается и даже автоматически генерируется. Agent Динамически расширяйте возможности новых инструментов.

Некоторые инструменты и рекомендации по созданию приложенияпомощникиз:

  • LangChain:LangChain серединаиз Agent Компоненты, необходимые для сборки нескольких Инструменты инкапсулируют и упрощают процесс использования инструментов, позволяя вам сосредоточиться на Tools Просто создайте его.
  • Assistants API:этотда OpenAI Последняя официальная сборка релиза AI помощникиз API, если у вас есть условия, вы также можете основе Эта сборкапредприятие AI помощник, воспользуйтесь всеми преимуществами его мощного gpt4 Модель. Среди них использование инструментов в основном отражается в использовании Function Calling Функция поддержки.
  • OpenAgents:Проектсерединаиз Plugins Agent Достигнута открытость для большого числа API умное использование и может быть гибко настроено для добавления новых Плагин, вы можете обратиться к его реализации.
  • **Цзи Цзяньюнь: **Похоже на зарубежные Zapier изплатформа. Платформа соединяет большое количество отечественных SaaS приложение и интернет-платформы, такие как "инструмент". Таким образом, вы можете просто подать одиниз после настройки его в своем из AI помощниксерединапроходить API Присоединяйтесь к этим инструментам, которые могут значительно расширить ваши возможности. AI помощникиз «Библиотека инструментов».

5.Веб-помощник

аналогичный RPA (Роботизированная автоматизация процессов) AI агент. Его основная возможность — **автоматизация. Web Действия и процессы просмотра веб-страниц, манипулирования и исследования для упрощения web Просмотр доступа и операций。Для частных лиц его можно использовать в качестве личного цифрового помощника, а простой разговор может сделать AI Помогите вам завершить Web Просматривайте и действуйте, например, бронируя билеты онлайн. Для бизнеса вы можетекакпредприятиеизцифровой сотрудник,Упростить повседневную работу с высокой повторяемостью, фиксированными процессами и правилами, а также с большими объемами внешних операционных задач. **Например, пакетная обработка заказов, пакетный контакт с клиентами, пакетное сканирование веб-сайтов и т. д.,Повышение эффективности,Уменьшите процент ошибок.

традиционный RPA Роботы также используются для выполнения этой работы. AI форма, благодаря этому AI Робот, работающий в программном обеспечениииз Верхний уровень – это операционный уровень.,Преимущество в том, что процесс интуитивно понятен, прост и его можно настроить.,И это не навязчиво для приложения, но его недостаток в том, что оно сильно связано с интерфейсным приложением;,Каждая задача требует тщательной настройки и отладки в соответствии с интерфейсом внешнего приложения.,Плохая адаптивность.

После появления крупных моделей дайте эту категорию RPA Интеллект также приносит новыеиз Оптимизируйте пространство。Использование возможностей понимания и аналитического рассуждения больших моделей может позволить AI Более разумно планировать и декомпозировать процесс задачи, а затем завершать выполнение с помощью браузера и в дальнейшем можно использовать такие инструменты, как; GPT-4V Такая визуальная модель обеспечивает более разумное понимание элементов и функций интерфейса, обеспечивает полностью автономные интеллектуальные операции и обладает более сильными адаптивными возможностями.

Основные принципы и архитектура агента, реализующего автономные веб-операции:

Создайте настоящее приложениеиз Web Agent Необходимо использовать собственные возможности браузера。Поскольку внешнее приложение не может напрямую взять на себя управление браузером для реализации операции,Обычно требует использования плагинов браузера.,Например, Chrom Extensionie с помощью API браузера обеспечивает навигацию по веб-сайту и автоматизацию операций с веб-страницами.,Например, нажмите на элемент интерфейса,или или форма ввода один.

Веб-агент в проекте OpenAgents, представленный ранее, представляет собой агент LLM, реализованный на основе браузера Chrom и расширений, который можно использовать в качестве справочного материала.

Конечно, из-за неопределенности выходных данных больших моделей текущий Web Agent Все еще находится на исследовательской и экспериментальной стадии.,Существует большая вероятность отказа или неправильной эксплуатации.,действительныйприложениесередина Необходимо повторить в зависимости от ситуациитести оценка。

6. Пользовательский помощник по процессам

Последний тип ИИ-агента, строго говоря, представляет собой комбинацию вышеперечисленных основных возможностей агента.

Идеальный ИИ-агент — после того, как бросит ему набор инструментов и некоторые знания.,С помощью великих Модельиз способностей понимания и рассуждения,Полностью автономное планирование и декомпозиция задач,Этапы задачи проектирования,И разумно используйте различные инструменты,Получить знания,Выходной контент,Завершить задачу。нонаходится впредприятиеприложениесередина,Поскольку знания предприятия, приложение, потребности бизнеса сильно различаются.,И сама Великая Модель из неопределенности,если ты это сделаешь,Тогда результат очень вероятенда «Открой слепой ящик» Такой же неуправляемый. Так что их становится все больше и больше Agents В проекте следует подчеркнуть причину управляемости, то есть возможность AI Больше контроля над процессом выполнения и деталями агента, чтобы позволить AI Следуйте проверенным человеком рабочим процессам для выполнения задач.

Например, в сценарии автоматической проверки резюме HR, представленном ранее, вам может потребоваться более подробно определить весь автоматизированный рабочий процесс, включая:

  • Основные этапы работы и постановка целей
  • **Используйте «Модель» для каждого шага. **
  • Инструменты, доступные для каждого шага
  • Знания и документы, которые можно импортировать и переносить
  • Другие необходимые ограничения и инструкции

В актуальном приложении это основе LLM Рабочий процесс может быть запущен непосредственно диалоговым роботом, обращенным к пользователям, а также может быть запущен полностью в фоновом режиме;

Внедрить такие автоматизированные рабочие процессы AI Интеллектуальные агенты, помимо того, что полагаются на Langchain/LlamaIndex Такой LLM Помимо непосредственной настройки среды разработки, вы также можете обратиться к некоторым проектам с открытым исходным кодом:

  • С помощью чего-то вроде Flowise или ВОЗ FastGPT Такойиметь LLM Возможность визуальной оркестровки процессов в рамках или платформе позволяет более интуитивно и просто настраивать процессы задач.
  • С помощью чего-то вроде SuperAGI Это позволяет быстро и легко настроить LLM Процесс из Agent рамки для достижения

Выше, да корпоративных приложенияхбольшой Модель AI Agent Кратко обсуждаются несколько типов, отличающихся от уровня технических принципов. На самом деле, каждый тип здесь — это сложная тема, которую можно изучить подробно. Некоторые типы подробно обсуждались в предыдущих статьях, и мы также уделим им внимание в будущем. AI Agent Технологические тенденции и разработки и продолжайте делиться ими в будущем.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose