Проектирование и практика применения агентов на основе Workflow
Проектирование и практика применения агентов на основе Workflow

В 2023 году на рынке появится множество продуктов, связанных с большими моделями. Компания Prompt AI в Сан-Франциско привлекла 5 миллионов долларов США. Neuronicx из Сингапура стала самым известным поставщиком услуг по учетным записям GPT в мире. Различные внутренние веб-сайты-оболочки зарабатывают деньги. реклама и членство. Горшки полны. После этого такие поставщики услуг, как Wenxinyyan, Tongyi Qianwen и Zhipu Qingyan, быстро снизили порог использования больших языковых моделей в Китае. Byte выпустила Doubao, первое мобильное приложение для обычных пользователей, которое выдвинуло использование больших моделей на первый план. Порог еще больше снижается. В 2024 году начинающая компания Cognition Labs выпустила Devin, первого в мире полностью интеллектуального программиста искусственного интеллекта, а Byte выпустила coze. Разработка больших моделей вышла на новый уровень, позволяя обычным пользователям, не программирующим, создавать приложения, которые удовлетворения собственных потребностей на основе крупных моделей.

Разработка приложений для крупных моделей прошла несколько стадий, и в настоящее время я думаю, что она находится на стадии 3.5. Этап 1.0, режим чата, разрабатывает чат-робота на базе большой модели и добавляет к чат-роботу соответствующие вспомогательные функции, чтобы завоевать расположение пользователя. Типичным продуктом является ChatGPT. Этап 2.0, модель с одним агентом, основан на модели чата для разработки приложений, что позволяет выполнять интеллектуальное и автономное выполнение приложений при достижении определенной цели. Он представляет собой структуру LangChain и типичный продукт AutoGPT. На этом этапе вся парадигма программирования изменилась: от «написания кода для реализации требований» к «написанию кода для управления требованиями реализации ИИ». Этап 3.0, мультиагентная модель, еще больше углубляет единую модель. На основе теории разделения труда теории систем реализация задачи разбивается на совместный процесс, в котором разные агенты играют разные роли для выполнения задачи. цели, поскольку игра одной роли позволяет агенту получать более точные результаты в меньшем диапазоне, поэтому эффект генерации мультиагента будет лучше, чем у одного агента, представленного фреймворком AutoGen, LangGraph и типичный продукт Девина.

Сегодня основные голоса на нашем рынке начинают уделять особое внимание рабочему процессу, пытаясь объединить рабочий процесс с мультиагентностью, чтобы приложения больших моделей выдавали лучшие результаты. Я называю этот этап 3.5. Он хотя и не меняет парадигму, но формирует основную модель развития и исключает возможность других моделей.

Что такое рабочий процесс?

На самом деле, в своей работе мы часто сталкиваемся с рабочим процессом. Например, когда мы делаем интеграцию CI/CD, мы будем использовать режим конвейера для оркестрации. Проще говоря, WorkFlow — это язык графовой структуры для организации процессов выполнения программного и аппаратного обеспечения. Его цель — организовать процесс выполнения, включая порядок между каждым исполнительным узлом, управление ветвями, направление потока данных, параметры выполнения и т. д., и теперь во многих случаях мы используем графические интерфейсы для завершения этой оркестровки. Поэтому мы иногда называем это. «логическая визуализация», которая является частью нижнего кода. Помимо программного обеспечения, рабочий процесс также может использоваться в аппаратных системах. Знаменитый node-red — это инструмент оркестрации, который обслуживает интеллектуальное оборудование. На абстрактном уровне рабочий процесс отделен от конкретных деталей реализации и, как и UML, может рассматриваться как специальный DSL. В области искусственного интеллекта мы часто используем графовые структуры в качестве целевой структуры данных рабочих процессов. Например, LangGraph — это концепция инфраструктуры (узлы и ребра), разработанная на основе диаграмм конечных автоматов.

Знакомство с сопутствующим продуктом

На рынке есть продукты, позволяющие обычным людям (не программистам) реализовать разработку Агентов. Среди них я рекомендую три продукта: diify, fastgpt и coze. Они обеспечивают режим разработки рабочего процесса. В то же время их цели в области разработки продуктов — продукты уровня 3.5. Давайте кратко рассмотрим концепции дизайна этих трех продуктов. (Сравнительная таблица ниже)

coze (отечественная версия кнопки)

В отличие от других приложений, цель использования coze заключается не в чате, а в создании собственного приложения-агента (хотя многие люди используют его как приложение для чата на первом этапе). Когда мы входим в основной интерфейс coze, мы можем напрямую реализовать определенную обработку через традиционный интерфейс чата. Это очень интересно, это чат, но это чат, используемый для создания приложений. Далее, coze предоставляет хранилище ботов и хранилище плагинов. Магазин ботов используется для отображения агентов, созданных другими. Магазин плагинов аналогичен GPT и представляет собой исходный материал, используемый вами для создания агентов. Наконец, coze обеспечивает личное и командное пространство. Характерной чертой является то, что командное пространство поддерживает совместную работу над проектом агента.

В пространстве пользователи могут начать разработку собственных приложений-агентов. Пользователи могут разрабатывать пять типов вещей: бот, плагин, рабочий процесс, база знаний и карточка (пользовательский интерфейс тела сообщения). Бот — финальная форма, которую мы разработали и которую можно выпустить. После релиза его можно будет искать не только в магазине ботов, но и в креслах-мешках. За исключением остальных четырех вещей Бота, можно понять, что они представляют собой разработанные полуфабрикаты и в конечном итоге будут использоваться в Боте. Более того, coze также предоставляет панель анализа данных ботов, которая, на мой взгляд, весьма обширна. Похоже, что все выпущенные до сих пор Боты не имеют модели начисления, и я не знаю, какая у них будет модель получения прибыли в будущем. (Говорят, что самая большая проблема, с которой в настоящее время сталкиваются большие модели, — это не вычислительная мощность, а данные. Также возможно, что Byte позволяет пользователям хранить данные на платформе таким образом.)

Причина, по которой Coze объясняется так подробно, заключается в том, что два продукта, которые будут представлены следующими, имеют примерно одинаковые идеи дизайна продукта и соответствующие концепции.

Далее мы сосредоточимся на части worflow (рабочего процесса).

С точки зрения пользовательского интерфейса дизайн конфигурации отличается от традиционных инструментов/платформ рабочего процесса. Раньше мы концентрировались на процессе, поэтому разместили конфигурацию в правой части интерфейса. После выбора узла разверните интерфейс конфигурации справа. настроить его. Теперь пользовательский интерфейс конфигурации процесса нового поколения изменен для настройки непосредственно на узле, что делает панель каждого узла богаче. Его ссылка может иметь несколько входов и несколько выходов (как импорт, так и экспорт узла могут быть связаны с несколькими другими узлами. Причина, по которой он может это сделать, заключается в том, что ему необходимо настроить распределение данных внутри узла, что можно учитывать). как процесс и конфигурация. Найдите баланс между.

Судя по предоставленным возможностям, узлы рабочего процесса coze происходят из трех источников: базовые узлы, плагины и другие рабочие процессы. Базовые узлы содержат базы знаний и также могут быть разработаны. Я думаю, что это также очень богато и всеобъемлюще. В частности, рынок плагинов, который позволяет вам использовать плагины, созданные другими, предоставляет безграничные возможности. На данный момент он уже имеет очень многофункциональные узлы и уже может выполнять очень сложные рабочие процессы.

Он может отлаживать один узел или пилотировать весь конвейер. После публикации его можно использовать в качестве материала для других ботов или рабочих процессов.

Dify

Сама Dify представляет собой платформу, предназначенную для создания агентских приложений. Он обеспечивает рынок приложений,Что интересно, вы можете напрямую добавить приложение в рабочую область, изменить его и опубликовать как свое собственное приложение.,Это соответствует игровому процессу сообщества Винсента Ту.,Импорт DSL также может поддерживаться при создании приложений.,Также изюминка. Он предоставляет ряд встроенных инструментов.,Но рынка инструментов нет. Для пользователей,Вы можете использовать приложения разработкиAgent, базы знаний и специальные инструменты на dify. Приложения агентов можно разделить на чат-помощников, приложения для генерации текста, агентов.,Приложения для генерации текста могут ссылаться на базы знаний.,Агент может обращаться к инструментам на основе этого,Ни один из них нельзя организовать с помощью рабочего процесса. Только чат-помощник может выбрать режим конфигурации или режим рабочего процесса для разработки. Dify поддерживает только одиночную игру,И лимит ниже.

Концепция навигации Dify не очень ясна, и потребуется некоторое время, чтобы разобраться в ней, когда вы начнете.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose