В 2023 году на рынке появится множество продуктов, связанных с большими моделями. Компания Prompt AI в Сан-Франциско привлекла 5 миллионов долларов США. Neuronicx из Сингапура стала самым известным поставщиком услуг по учетным записям GPT в мире. Различные внутренние веб-сайты-оболочки зарабатывают деньги. реклама и членство. Горшки полны. После этого такие поставщики услуг, как Wenxinyyan, Tongyi Qianwen и Zhipu Qingyan, быстро снизили порог использования больших языковых моделей в Китае. Byte выпустила Doubao, первое мобильное приложение для обычных пользователей, которое выдвинуло использование больших моделей на первый план. Порог еще больше снижается. В 2024 году начинающая компания Cognition Labs выпустила Devin, первого в мире полностью интеллектуального программиста искусственного интеллекта, а Byte выпустила coze. Разработка больших моделей вышла на новый уровень, позволяя обычным пользователям, не программирующим, создавать приложения, которые удовлетворения собственных потребностей на основе крупных моделей.
Разработка приложений для крупных моделей прошла несколько стадий, и в настоящее время я думаю, что она находится на стадии 3.5. Этап 1.0, режим чата, разрабатывает чат-робота на базе большой модели и добавляет к чат-роботу соответствующие вспомогательные функции, чтобы завоевать расположение пользователя. Типичным продуктом является ChatGPT. Этап 2.0, модель с одним агентом, основан на модели чата для разработки приложений, что позволяет выполнять интеллектуальное и автономное выполнение приложений при достижении определенной цели. Он представляет собой структуру LangChain и типичный продукт AutoGPT. На этом этапе вся парадигма программирования изменилась: от «написания кода для реализации требований» к «написанию кода для управления требованиями реализации ИИ». Этап 3.0, мультиагентная модель, еще больше углубляет единую модель. На основе теории разделения труда теории систем реализация задачи разбивается на совместный процесс, в котором разные агенты играют разные роли для выполнения задачи. цели, поскольку игра одной роли позволяет агенту получать более точные результаты в меньшем диапазоне, поэтому эффект генерации мультиагента будет лучше, чем у одного агента, представленного фреймворком AutoGen, LangGraph и типичный продукт Девина.
Сегодня основные голоса на нашем рынке начинают уделять особое внимание рабочему процессу, пытаясь объединить рабочий процесс с мультиагентностью, чтобы приложения больших моделей выдавали лучшие результаты. Я называю этот этап 3.5. Он хотя и не меняет парадигму, но формирует основную модель развития и исключает возможность других моделей.
В отличие от других приложений, цель использования coze заключается не в чате, а в создании собственного приложения-агента (хотя многие люди используют его как приложение для чата на первом этапе). Когда мы входим в основной интерфейс coze, мы можем напрямую реализовать определенную обработку через традиционный интерфейс чата. Это очень интересно, это чат, но это чат, используемый для создания приложений. Далее, coze предоставляет хранилище ботов и хранилище плагинов. Магазин ботов используется для отображения агентов, созданных другими. Магазин плагинов аналогичен GPT и представляет собой исходный материал, используемый вами для создания агентов. Наконец, coze обеспечивает личное и командное пространство. Характерной чертой является то, что командное пространство поддерживает совместную работу над проектом агента.
В пространстве пользователи могут начать разработку собственных приложений-агентов. Пользователи могут разрабатывать пять типов вещей: бот, плагин, рабочий процесс, база знаний и карточка (пользовательский интерфейс тела сообщения). Бот — финальная форма, которую мы разработали и которую можно выпустить. После релиза его можно будет искать не только в магазине ботов, но и в креслах-мешках. За исключением остальных четырех вещей Бота, можно понять, что они представляют собой разработанные полуфабрикаты и в конечном итоге будут использоваться в Боте. Более того, coze также предоставляет панель анализа данных ботов, которая, на мой взгляд, весьма обширна. Похоже, что все выпущенные до сих пор Боты не имеют модели начисления, и я не знаю, какая у них будет модель получения прибыли в будущем. (Говорят, что самая большая проблема, с которой в настоящее время сталкиваются большие модели, — это не вычислительная мощность, а данные. Также возможно, что Byte позволяет пользователям хранить данные на платформе таким образом.)
Причина, по которой Coze объясняется так подробно, заключается в том, что два продукта, которые будут представлены следующими, имеют примерно одинаковые идеи дизайна продукта и соответствующие концепции.
Далее мы сосредоточимся на части worflow (рабочего процесса).
С точки зрения пользовательского интерфейса дизайн конфигурации отличается от традиционных инструментов/платформ рабочего процесса. Раньше мы концентрировались на процессе, поэтому разместили конфигурацию в правой части интерфейса. После выбора узла разверните интерфейс конфигурации справа. настроить его. Теперь пользовательский интерфейс конфигурации процесса нового поколения изменен для настройки непосредственно на узле, что делает панель каждого узла богаче. Его ссылка может иметь несколько входов и несколько выходов (как импорт, так и экспорт узла могут быть связаны с несколькими другими узлами. Причина, по которой он может это сделать, заключается в том, что ему необходимо настроить распределение данных внутри узла, что можно учитывать). как процесс и конфигурация. Найдите баланс между.
Судя по предоставленным возможностям, узлы рабочего процесса coze происходят из трех источников: базовые узлы, плагины и другие рабочие процессы. Базовые узлы содержат базы знаний и также могут быть разработаны. Я думаю, что это также очень богато и всеобъемлюще. В частности, рынок плагинов, который позволяет вам использовать плагины, созданные другими, предоставляет безграничные возможности. На данный момент он уже имеет очень многофункциональные узлы и уже может выполнять очень сложные рабочие процессы.
Он может отлаживать один узел или пилотировать весь конвейер. После публикации его можно использовать в качестве материала для других ботов или рабочих процессов.
Сама Dify представляет собой платформу, предназначенную для создания агентских приложений. Он обеспечивает рынок приложений,Что интересно, вы можете напрямую добавить приложение в рабочую область, изменить его и опубликовать как свое собственное приложение.,Это соответствует игровому процессу сообщества Винсента Ту.,Импорт DSL также может поддерживаться при создании приложений.,Также изюминка. Он предоставляет ряд встроенных инструментов.,Но рынка инструментов нет. Для пользователей,Вы можете использовать приложения разработкиAgent, базы знаний и специальные инструменты на dify. Приложения агентов можно разделить на чат-помощников, приложения для генерации текста, агентов.,Приложения для генерации текста могут ссылаться на базы знаний.,Агент может обращаться к инструментам на основе этого,Ни один из них нельзя организовать с помощью рабочего процесса. Только чат-помощник может выбрать режим конфигурации или режим рабочего процесса для разработки. Dify поддерживает только одиночную игру,И лимит ниже.
Концепция навигации Dify не очень ясна, и потребуется некоторое время, чтобы разобраться в ней, когда вы начнете.