Мастер-подсказка в одной статье: универсальный фреймворк + навыки оптимизации + общие индикаторы
Мастер-подсказка в одной статье: универсальный фреймворк + навыки оптимизации + общие индикаторы

С появлением больших моделей в 2023 году возник «Проект Подсказки». Как самое важное оружие для эффективного использования больших моделей, качество Подсказки оказывает решающее влияние на эффект модели. Однако в большом количестве статей по теме в Интернете в основном перечислены несколько техник «Проекта Подсказки», и систематических изложений мало. Прочитав это, люди все еще не знают, с чего начать.

В этой статье мы надеемся объединить наш практический опыт работы с «Быстрым проектом» для более систематического рассмотрения «Быстрого проекта». Я надеюсь, что это поможет каждому шаг за шагом эффективно использовать большие модели.

01. Напишите впереди

1.1 Прошлое и настоящее Prompt и GPT

Большинство крупных языковых моделей, которые мы сегодня обсуждаем, относятся именно к 2023 году. “ChatGPT” Многочисленные модели, появившиеся после вспышки, а не широкий Transformer Все модели под архитектуру. и Prompt Понятие также сопровождается “GPT” Модельиз Развитие возникаетиз。нам нужно понять Prompt Вам нужно знать, что это такое Prompt прошлой и настоящей жизни, это должно начинаться с GPT Развитие .

Как показано на рисунке выше, с момента рождения Transformer в 2017 году на основе этой архитектуры модели, представленные BERT, и модели, представленные GPT, развивались с чрезвычайно высокой скоростью. После появления BERT в 2018 году языковые модели начали менять сферу НЛП и быстро получили широкое распространение на рынке. Сегодня эти языковые модели по-прежнему являются наиболее широко используемыми моделями в области НЛП. Сегодня мы рассматриваем GPT как GPT. представитель Различные большие модели также являются одними из них.

от GPT из Перспективы развития,Условно мы можем разделить его на 4 этапа.," GPT1 - GPT2 - GPT3 - ChatGPT ",мы можемкот Этот процесс развитиясерединаучитьсяприезжать Prompt Как он родился, чтобы лучше понять Prompt。

Этап 1: GPT-1 родился в Transformer исходный,Самая ранняя версия на основе Transformer., созданная по архитектуре, которая использует и BERT такой жеизпарадигма,проходить "pretrain + finetune" из Способ,Во-первых, позвольте Модельсуществовать использовать большой объем немаркированных данных для наблюдения и обучения.,Полное предварительное обучение,Затем используйте контролируемые данные для точной настройки.,к Эта уступка Модель Можетк Подходит для различных задач。существоватьэтотдобрыйпарадигма Вниз BERT Будучи двусторонней моделью, она может полностью получать контекстную информацию, что позволяет ей показывать более точные и стабильные эффекты в различных задачах. GPT Как односторонняя модель, она лучше генерирует задачи. Однако, поскольку на этом этапе разработка большой модели все еще находится на ранних стадиях, размер модели и эффект еще не выросли, поэтому генерация становится нестабильной. GPT В больших масштабах он не применялся. По сей день даже GPT показал потрясающие результаты, но в настоящее время BERT Классовая модель по-прежнему остается моделью, которая чаще используется различными предприятиями.

Этап 2: Сравните GPT-1,GPT-2 впервые предложил новую парадигму,Когда мы расширяем масштаб Модели и увеличиваем обучающие данные,позволять Модельсуществоватьодин позвонил WebText После завершения предварительного обучения на наборе данных, состоящем из миллионов веб-страниц, модель больше не требует контролируемых данных и может выполнять различные задачи. существовать OpenAI из Blog серединамы можемксмотретьприезжать,существует командаResearch ProcessсерединаDiscovery,Улучшите масштаб и объем обучающих данных модели.,Это может значительно улучшить эффект Моделисуществовать миссию с нулевым выстрелом серединаиз.,Это такжесуществоватьсегодня считается правильным scaling law из впервые обнаружил, что, хотя феномен разумного возникновения еще не родился в когда. Некоторые люди также интерпретируют это, потому что BERT существования показал отличные результаты в различных областях, GPT Вынужденная найти новое направление развития, она также заложила основу для появления сегодняшних смартфонов. Исходя из этого, GPT включен с BERT Совершенно другая парадигма, и проводить исследования и разработки в рамках новой парадигмы, уделяя особое внимание Модельсуществовать. zero-shot серединаиз Эффект。

Этап 3: Вместе GPT-2 Увеличение размера обучающих данных Модели, масштабирование идей,GPT-3 использовал 570G из Обучающие данные, до приезда GPT-2 из 15 раз количество параметров еще более удивительно из 1750Б, да GPT-2 из 116 раз。Количество параметров увеличивается scaling law Демонстрируя свою мощь, Модельсуществовать показала ошеломляющие результаты во всех областях, особенно в существовании. zero-shot аспект,на пресс-конференциипроходитьрисованной UI Пример внешнего кода генерации графов на данный момент впечатляет. ГПТ-3 существовать 2020 Выпущен в конце года, когда Transformer Пройдя 4 года разработки, BERT Категория «Модель» широко использовалась в различных приложениях и стала абсолютно популярной. Однако в этом случае существуют GPT-3 Релиз по-прежнему стал самым заметным событием в этой области, даже если Проблем много, но эффект все равно превосходит все ожидания.

Этап 4: После этого все будут хорошо знакомы с историей.,На основе OpenAI, существующего GPT-3, мы провели оптимизацию для разных сценариев.,существования «Множественных раундов диалога» родилась изооптимизациясередина «ChatGPT»,Тогда это стало самой горячей темой в мире,также считается AI Отправная точка маркетизации. ГПТ-3 После того, как из Модель перестанет быть открытым исходным кодом и никакие статьи не будут опубликованы публично, мы сможем существовать только Blog Получите некоторую информацию, которая не будет здесь распространяться.

Наконец, давайте сделаем Подвести Итого, по перспективам разработки месторождения мы видим возможность передвижения. 3 Различные парадигмы исследований и разработок:

  1. До Трансформатора: Обучение под наблюдением (поезд)
  2. GPT1 & BERT: предварительное обучение без присмотра (предварительное обучение) + Контролируемая тонкая настройка (finetune)
  3. GPT2 & GPT3: предварительное обучение без присмотра (предварительное обучение) + Быстрый

Мы ясно видим, что условия проживания различны. Возможности моделей и исследования и разработки становятся все менее и менее зависимыми от "тренироваться" из процесса, но в большей степени опирается на «Предварительная подготовка», зависит от "Модель" книгателоизспособность。существовать BERT Согласно представленной парадигме, мы также можем кпроходить "тонкая настройка" Уровень существующего параметра влияет на Модель. И приезжать к “GPT3” Для представителя парадигмы также есть Мы теперь используем существуизбольшой Модель, мы больше не полагаемся на "тонкая настройка" изWAY отладка Модель, но проводить "входить" прямое воздействие "выход" из КАЧЕСТВА И КАК ПРОЖИВАТЬ середина, чтобы получить хорошее из "входить" то есть “Prompt проект" Нужно что-то сделать.

к Он, я от развития с точки зрения перспективы говорил о Prompt изпрошлой и настоящей жизни, Подскажите Откуда оно берется и зачем оно нам нужно “Prompt проект», я надеюсь, что это поможет всем лучше понять Подскажите, об этом подробно расскажу ниже. Prompt Что это такое.

1.2 Что такое подсказка?

Prompt переводится как «подсказка», с. "zero-shot" из концепций дополняют друг друга, "нулевой выстрел" то нет обучения непосредственно к Модели из прикладного метода, и Prompt то есть относится к способу задавать вопросы. от Посмотрите на эту концепцию "трафарет" Возможно, правильнее было бы назвать это «из», зачем мне его использовать? "намекать" А что насчет этого слова?

Фактически, когда впервые появилось понятие существования, еще не существовало “Prompt” В этом названии существует раннее издание середина, которое часто называют «Формат ввода (формат)» или «Введите трафарет (шаблон)», но по мере развития области, особенно существования GPT-3 После этого подскажите Имя постепенно определилось, и все согласились. "намекать" изконцепцияи Его функция болеедобавлятьсоответствующий,Это особенно удобно в контексте существования большого языка.,Поэтому постепенно оно стало признанным титулом из.

Что Prompt приезжатьконецсуществоватьподскажи что Шерстяная Ткань?от Интерпретация серединой парадигмы из предыдущей статьи показывает, что применение Модели из все больше склоняется к «Предварительная подготовка» из-за частичного тильта подавляющее большинство способностей должно существовать. «Предварительная подготовка» этапы составляютиз,скорее, чемпроходитьдальшеизтренировочная сборка。Исходя из этой идеи существовать, подскажите подобен ключу к разблокировке способностей Модели, позволяя этим «Предварительная подготовка» Сценический состав и возможности предназначены только для моего использования. Поэтому, подскажите то есть существовать подсказки Модель вспоминает способность приезжать во время предварительного обучения.

мы можем поставить "Знание" и "способность" Идя дальше от декомпозиции, мы больше всего надеемся на возможность использовать Модельиз (понятно, Подвести). итог,генерировать,рассуждение,e.t.c.),а не знания.исейчассуществовать Становится все жарче и жарчеиз RAG Технология та же, мы предпочитаем вводить знания извне, чтобы Модель могла их опробовать, в то время как способности полностью зависят от этапа предварительного обучения. То, что мы хотим сделать, это передать Prompt Используйте крупномасштабные возможности для решения проблем и делайте эти возможности более точными, а не превращайте их в базу знаний. Если люди сравнивают, они также могут прийти к такому же выводу. Люди могут собирать информацию извне и принимать решения разумно, вместо того, чтобы помещать все знания в свою голову. Сэм Altman существоватьранние интервьюсередина Также упомянитеприезжать,Неправильно использовать большую Моделькогда в качестве поисковой системы.,Интеллектуальная производительность является ключом к большому успеху.

В общем, подскажите то естьсуществоватьнести Показыватьбольшой Модель "помнить" Он обладает определенными способностями и может помочь нам решить проблемы в соответствующих ситуациях. Prompt Одно из основных понятий инженерии.

1.3 Почему мы не можем полагаться на обучение? Что не так с тонкой настройкой?

В дополнение к большой модели с закрытым исходным кодом,В настоящее время существует небольшое приложение с открытым исходным кодом. Модель также является распространенным приложением.,Тогда он родился LoRa Такая технология обучения позволяет пройти обучение с меньшими затратами. Означает ли это, что на нас больше нельзя полагаться. Подскажите, но проходит как раньше "тонкая настройка" изпарадигмаотлаживать Модель Шерстяная ткань?

Во-первых, это вопрос стоимости,Prompt Рождение этой новой парадигмы связано с большими размерами крупного бизнеса, что не позволяет нам оказывать достаточное влияние на параметры при небольших затратах. Даже если открытый исходный код небольшой, мы в основном используем его. LoRa Этот тип «Дополнительные параметры» из способа тонкой настройки. Поэтому для моделиApplyС точки внимание, учитывая стоимость проживания, мы вообще не можем его закончить "тренироваться" из процесса.

Во-вторых, существует проблема эффективности.если мыиспользовать LoRa При такой точной настройке технологии влияние параметров очень ограничено. В настоящее время это скорее рассматривается как процесс «выравнивания», и он также может вызвать проблему «забывания». А если хотите провести доводку, пусть Модель освоит. «Знание», это не очень хорошая идея, это означает, что вам нужно постоянное обучение, чтобы обновлять свои знания, и вам нужно тренироваться в разных областях. Обучение нескольких разных из Моделей одновременно не является надежным процессом, в отличие от «чрезвычайно длинного контекста из Модели». добавлять “RAG” Считается более надежным из способов.

наконец,Это также ненадежно в долгосрочной перспективе, и идеи НИОКР,большой Модельсейчассуществовать Оглушительныйиз Эффектоснован на “scaling law” из Интеллект возникает,сущностьвсе ещесуществовать приложение большое Модель предтренировочного этапа из способностей. Или «Открытый исходный код»все еще“Закрытый исходный код”Модель,Необходимо ввести количество параметров из увеличения записи или другими способами.,Пусть способности Модели продолжают улучшаться.,И в настоящее время он продолжает экспоненциальный рост. существуют В этом случае,Чрезмерная зависимость от обучения, основанного на выполнении задач, не является устойчивой в долгосрочной перспективе.,Потому что суть Модельиз не в том, чтобы проводить обучение для развития способностей.,Но входные данные включают возможность планирования,И существуют в соответствии с измерением задачи. Даже приложение Модельиз с открытым исходным кодом,В долгосрочной перспективе обучение не будет основываться на измерении задачи.

Поэтому обучение и отладка не могут заменить Prompt из функции,И эта парадигма существования показала недостатки во многих аспектах.,Это такжедоказывать Понятно Prompt Инженерное дело Важность, Подскажите Это ключ к применению возможностей Модели в рамках новой парадигмы.

1.4 Зачем писать эту статью?

сбольшойModel оказался крупнейшей горячей точкой в ​​мире, и “Prompt проект" Оно всегда было одним из самых популярных направлений своего середина. Еще в начале развития существования многие люди начали призывать к созданию. “Prompt инженер" с позиций, похоже, существование хорошо прописано под новую эпоху Подскажите, грамотное его использование – одна из самых важных вещей в каждой сфере. существуют такие из фона, подскажите Соответствующих исследований накоплено и весьма достаточно. У нас накопилось множество статей и курсов как внутри компании, так и за ее пределами, среди которых наиболее популярные. 《Prompt Engineering Guide», и г-н Нг Энда из «ChatGPT Prompt Engineering for Разработчики", оба верны. “Prompt проект" Дается подробное введение, которое является очень важным учебным материалом. Что Почему я до сих пор пишу эту статью Шерстяная ткань?

Все эти статьи и руководства имеют общую проблему.,Большинство из них перечисляют Навыкиза,Например《Prompt Engineering Руководство》середина перечисляет большое количество Навыков, сообщая вам, какие ксуществовать Prompt середина “увеличиватьдобавлять Пример”,“увеличиватьдобавлять Роль” и т. д. Но не существует систематической структуры или стандартизированного рабочего процесса, который мог бы рассказать каждому, как шаг за шагом выполнить задачу. «Подскажите», как начать и закончить “Prompt проект" с работы.

Поэтому в данной статье предпринята попытка объединить наш опыт исследований и разработок и систематизировать “Prompt проект" работа в процессе Подвести В результате, приехав в какой-то стандартизированный рабочий процесс и внедрив такую ​​структурированную организацию, можно добиться лучших результатов. “Prompt” Управляйте им, и пусть «Подсказка» станет краеугольным камнем большого приложения, делая его более надежным, эффективным и масштабируемым. Специфический точки зрения,мы поставитьот0приезжать1 полный Prompt Процесс разбит на 5 этапов. Используем единый итрафарет, решаем самые сложные задачи на начальном этапе. Prompt Запишите задачу и шаг за шагом объедините ее с практическим применением, чтобы систематически решать ее. “Prompt проект" с работы.

Мы надеемся, что применение нашего подхода может улучшить Prompt Инженерное обеспечение эффективности труда, снижение Prompt Технологии из затрат на применение и решений Prompt Катастрофакуправлятьизвопрос。позволятьбольшой Цзяду Можеткот0приезжать1из Завершенобольшой Модельизотлаживать,И пусть лучше будет применена большая Модельсуществовать в различных областях середина.

02. Подскажите универсальный каркас

существоватьписать Prompt час,от0приезжать1из составил первое издание Prompt Зачастую это самый сложный вариант, основанный на существующих Prompt Оптимизация с использованием различных методов относительно проста. хорош в решении «Математические задачи» из Мы существуем сталкиваемся с такой предвзятостью «Проблемы гуманитарных наук» Задача такая же трудная, как написать сочинение в детстве. Как показано на рисунке выше, для решения этой проблемы мы использовали набор "Универсальный шаблон", поставьте Prompt разделить на «Определить роль + Опишите проблему + Ставьте цели + Дополнительные требования» Ожидается, что эти четыре части будут структурированы и разделены для завершения этого самого сложного шага. Какая бы задача ни стояла перед собой, этот трафарет может получить «проход» из. Быстрый. Ниже я подробно объясню, как получается этот трафарет и почему он эффективен.

Правильно и Prompt Функция и позиционирование подробно обсуждались в главе 1 середина существования, подсказка. из функциито есть Вызов возможностей Модели на основе наших вопросов, мы должны задать вопрос из метода, четко дать Модели знать, чего мы хотим, каковы наши цели, исходя из этой базовой идеи, Подсказать Он должен включать в себя следующие пункты:

  1. в чем проблема:первыйты должен сказать Модельтыизвопрос Что это такое Что?,Какова ваша миссия?,Постарайтесь как можно более четко описать свои потребности.
  2. что ты задумал:Внизлапшатынуждаться Рассказыватьбольшой Модель Что делать конкретно,Например, сделать руководство,написать кусок кода,Редактировать статью,и т. д.
  3. Каковы требования:наконец Часто нам нужно добавить к задачам какие-то требования,Например, нажмите конкретный выходной формат.,Укажите ограничение длины,Только выводить что-то,и т. д.

Благодаря этому 3 Мы опишем часть «Зачем тебе большая модель?» Описание понятное, и эта идея очень естественна. Даже если это не большая модель, но вы хотите, чтобы другие выполнили за вас определенную задачу, вам часто придется через это пройти. 3 Четко опишите проблему частично. Так как это только первое издание Prompt,Не нужно описывать это слишком подробно,Незачемиспользовать Навык,Просто опишите эти части четко и лаконично. Вот несколько примеров:

Пример 1. Создание сводки о продукте в чем Проблема: Ваша задача помочь мне составить краткое описание продукта. что ты задумался: Я предоставлю вам документ с требованиями к продукту и отзывы пользователей о продукте. Используйте эту информацию, чтобы обобщить функции продукта и текущую ситуацию, а также составить для меня краткое описание продукта. Каковы требования:Пожалуйста, постарайтесь максимально подробно описать продукт.из Функции,И написано в непринуждённом и юмористическом стиле.,Аннотация не должна превышать 50 слов.

Пример 2. Создание комментариев к коду в чем Проблема: Ваша задача — помочь мне генерировать комментарии к моему коду. Что ты собираешься делать: у меня есть python Код требует от вас анализа содержимого кода и добавления дополнительных комментариев к коду. Каковы Требования: Объедините содержимое кода и добавьте как можно более подробные комментарии. Не пропускайте ни одного комментария. Пожалуйста, укажите «к» для каждого комментария. “comment:” в качестве префикса.

Пример 3. Создание тестовых примеров в чем Проблема:Ваша задача помочь мне спроектировать продукт из Тестовые. случаи.

что ты задумал: Я предоставлю вам документ с требованиями к продукту, и вам нужно будет написать тестовые примеры на основе требований и описаний функций.

Каковы требования: Объедините потребности серединной функции из структуры.,Отсортируйте контрольные точки,И есть тестовые примеры иерархического вывода,Убедитесь, что не пропущены все функции и контрольные точки.

Выше приведены 3 простых шага, чтобы каждый мог почувствовать это более интуитивно. 3 Часть значения, существование практического применениясерединаэто 3 Часть контента будет более сложной, чем в примере середина. Это просто для иллюстрации структуры рамки. Фактическое содержание не имеет справочной ценности. Содержание каждой части будет подробно описано в главе 3 середина.

существовать После четкого описания задачи,Нам нужно запланировать возможность выполнения наших задач,Разные задачи требуют разных способностей.,Это часто зависит от мышления из раскола. Можем ли мы представить,Когда мы просим новичка помочь нам выполнить задачу, нам нужно разбить задачу на части.,и расскажите ему, что нужно делать на каждом этапе пути,к Идите сюдапозволять Он выполнил комплексиз Задача。длябольшой Модель С точки взгляд, это когда, конечно, тоже пробная версия, даже очень простая в использовании, это существование Глава 5 из “CoT” середина также еще раз упомянет о прибытии.

тыкогда Ран Можеткискусственныйиз Завершено Это своего рода раскол,Объясните большой модели один за другим,Но этот подход не универсален,Каждое поле имеет свои уникальные и специализированные возможности.,Для каждой задачи свой рабочий процесс,поэтому Это решение не подходит дляприезжатьгенерализрамкакогдасередина。Хорошая большая модель способности из вызова также существует, сохраните ярлык, Чтото есть"Роль",Он как большая Модель с «пакетом возможностей».,А вот способность Модель очень легко назвать.Каждыйодин Роль,Все они соответствуют персонажу, имеющему несколько способностей.,Мы можем установить характер,"намекать"большой Модельиспользовать Этот персонаж соответствует способности,Эта и предыдущая статья "Подскажите Что это такое?" Введение середины с идеей очень хорошо сочетается, что полностью указывает на то, что это «Подсказка». Быстрое получение эффекта, простое выполнение «намекать» вызывает великую Модель, предварительно обученную способностям, которая также есть "Роль" настолько полезна из-за разума.

Благодаря этому мы, наконец, получим возможность добраться из “Шаблон запрос», обеспечивает это единство изображения, мы можем выполнить большинство из них Prompt Первое изданиеизписать,позволятьбольшой Домсуществоватьлапшаверно Все виды Задачачас Можетк Эффективныйиз Завершеноот0приезжать1изпытаться,Вместо того, чтобы столкнуться с дилеммой, когда у вас нет другого выбора, кроме как писать.

Помимо эффекта, Prompt Также подойдет структурированное из расщепления Prompt Руководство нам очень помогло Prompt Библиотека — это уже не большой блок текста, а отдельная на4 таблицы «таблица ролей», «таблица проблем», «таблица целей», «таблица требований». сообщить Таким образом мы можем добиться значительного улучшения Prompt изгибкость,И динамично комбинируйте 4 элемента для выполнения различных задач.,Перед этим существованием стоят сложные задачи,илипроходитьмного Модельрешатьвопросчас,Обеспечит стабильную и эффективную поддержку.

03. Доработка каркаса

существование Глава 2середина Мы ясно дали понять “Prompt проект" Из шага первого, проводим израмку, существуем любая задача, которую мы можем выполнить. Prompt от 0 приезжать 1 Написано из, и это первое издание из Prompt Это все еще только прототип. Поскольку информация в каждой части не является полной, она часто не может оправдать наши ожидания. Prompt изскелет,Нам все еще нужно и дальше пополнять нашу плоть и кровь.,Ниже я приведу более подробную разбивку каждой части рамки.,Приводить контент к завершению шаг за шагом, улучшая эффект Модельиз.

3.1 Установление ролей

и Глава 2 середина Да "Роль" изпониматьпоследовательный,«Роль» можно назвать «пакетом способностей» или «синтаксическим сахаром».,Нам больше не нужно подробно описывать каждую возможность.,Декомпозируйте задачи более детально,ида Можеткпроходить import "Роль" изWAY,используйте это "Роль" За ним соответствуют различные способности. Что Как нам настроить Установить роль, этот "пакет способностей" неправильный? ткань?

У каждого есть опыт подбора персонала,Можем ли мы представить,Большая Модельто есть мы хотим набрать людей,Нам нужно установить модель способности.,чтобы завершить назначенное работы.нассуществовать При приеме на работу обычно все ясноиз Требовать,существованиеJDсерединадолжно иметь четкое описание,этот Как это найтиприезжатьнаиболее подходящийизкандидаты。В этом ибольшой Модельиз характер настройки одинаковый,Нам нужно четко и ясно описать роль,достаточный талант "намекать" Большая модель позволяет большой модели знать, какие возможности вызывать.

Представим себе существующий набор персонала JD середина,Что мы будем просить. Обычно включает в себя: должность,уровень образования,Опыт проекта,профессиональные навыки,Почетные наградыи т. д.Мы можем полностью следовать этой идее и создать языковой шаблон, который поможет нам создавать персонажей.

кэто я следующийсуществоватьиспользоватьиз Рольтрафарет,КогдаRAN Подскажите, структура очень гибкая,Отображать из Пример только для справки:

Шаблон роли:

Сейчас вы являетесь отличным из{{вы хотите изстатуса}},иметь{{тыхочуизуровень образования}},И иметь {{вы хотите должность и опыт работы}},Ваш рабочий контент: {{ипроблема, связанная с рабочим контентом}},В то же время у вас есть следующие способности: {{Вам нужны изспособности}}

Пример: психолог-консультант.

Теперь существуешь ты отличный из {{Психологический консультант}}, имеет {{Психологическое консультирование, клиническая психология и другие специальности со степенью магистра или доктора философии}}, и имеют {{Многократный Годизопыт в области психологического консультирования, существующие различные типы психологических консультационных агентств, клиник или больниц, накопили богатый опыт клинической практики}}, содержание вашей работы {{для咨询者处причинакаждыйдобрый心причинавопрос,И помогут вам консультанты найти подходящее решение}},В то же время у вас есть следующие способности:

{{

  1. Экспертиза: Вы должны иметь солидные знания в области психологии.,Включая теоретическую систему, методы лечения, психологические измерения и т. д.,Мы можем предоставить вам профессиональную и целенаправленную консультацию.
  2. Коммуникация Навык: У вас должна быть отличная коммуникация Навык,Умеет слушать, понимать и понимать потребности консультантов,При этом вы можете правильно выражать свои мысли.,Дайте консультанту возможность принять и принять ваши предложения.
  3. Эмпатия: у вас должно быть сильное сочувствие.,Способность понять боль и замешательство с точки зрения консультанта.,от и одарить их искренней заботой и поддержкой.
  4. Непрерывное обучение: у вас должно быть желание продолжать обучение.,Будьте в курсе последних исследований и разработок в области психологии.,Постоянно обновляйте свои знания и навыки,Чтобы мы могли лучше обслуживать вас и наших консультантов.
  5. Хорошая трудовая этика: у вас должна быть хорошая трудовая этика.,Уважайте частную жизнь спрашивающего,Следуйте профессиональным стандартам,Обеспечить безопасность и эффективность консультационного процесса.

}}

кначальствоэто Простойиз Пример,Изменение характера персонажа часто требует от писателя определенного понимания персонажа.,Это может помочь вам лучше и завершить ваш итрафарет.,Но если ты не понимаешь, что хочешь настроить роль,Я не знаю, как заполнить эту информацию,Как мы можем получить эту информацию?

Мы выбрали кандидата "вербовка JD" из идей, из информации о наборе персонала на сайте набора персонала, которая дополняет наши данные.Например,Я хочу попросить Большую Модель помочь мне выполнить квест «Финансовый анализ».,Раньше у меня не было знаний в этой области,В настоящее время информацию о вакансиях можно найти на сайте по подбору персонала.,Завершите изнастройки персонажа:

Пример: финансовый анализ

Теперь существуешь ты отличный из{{консультант по финансовому анализу}},Обладать {{степенью магистра в области финансов, экономики и т. д. и докторской степенью}},И иметь {{восемь леткначальствоиз опыта финансового анализа,существуют Различные типы компаний провели первоначальный финансовый анализ фондов,Вывод финансового отчета и другие работы,Накоплен богатый практический опыт}},Содержание вашей работы – анализ данных об инвестициях и финансировании.,от Management Perspective Design Анализ данных рамки Система отчетности}},В то же время у вас есть следующие способности:

{{

  1. Профессиональные знания: у вас хорошие навыки анализа данных, а также богатые навыки финансового анализа и отчетности.
  2. Сильная способность анализировать и решать проблемы, а также сильные мыслительные способности.
  3. Иметь сильные способности к обучению и сильную самомотивацию.
  4. любопытный,Готов бросить вызов самому себе,Постоянно исследуйте новые области.
  5. серединасвободно говорит по-английски,Отличные навыки письма на английском языке,Хорошие коммуникативные навыки.

}}

кначальство,то есть С помощью "вербовка JD” Выполните роль в совершенно незнакомой сфере, и обычно С точки Персонажи и задания тесно связаны между собой. Чем глубже мы понимаем персонажей, тем лучше мы сможем настроить персонажей, соответствующих нашим ожиданиям. Даже если мы можем использовать этот метод, чтобы охватить всю историю, мы не можем использовать этот метод, чтобы получить результат. детали. “Prompt проект" серединалюдииз предыдущего опыта по-прежнему очень важен.

3.2 Опишите проблему & Ставьте цели

Проблема описана “Опишите проблему” и “Ставьте цели” Он состоит из двух частей и представляет собой Prompt середина Самый информативныйбольшойизчасть,Это также наиболее важная часть задачи.,насхотетьЧетко опишите работу, которую мы хотим, чтобы большая Модель выполняла.Только таким образом результаты работы веб-сайта смогут максимально соответствовать ожидаемым результатам.

Помимо того, что описание ясное и недвусмысленное, эта часть заслуживает особого внимания. естьверноЗадача из декомпозиции,Особенно важно это существование на сложных задачах. Если нам нужна большая модель, задача слишком сложна,Сначала нам нужно вручную разделить задачи,И постарайтесь максимально подробно описать задачу, включая различные ее части.,этоти Обычно используетсяиз “CoT” изоптимизация аналогичным способом, проводить повороты сложное Разделение Задача разделена на несколько подразделов для усиления эффекта Модельиз.

Мы также можем рассматривать это разделение как измерение задачи и согласовывать его.,когданасобобщатьизязыкописать предмет Задачачас,Подразумевается много базовых знаний и ожиданий. Например, когда мы хотим, чтобы нам помогла большая Модель «Сделай путеводитель»., мы надеемся, что он сможет нам помочь «Спланировать маршрут», «Собрать информацию», «Забронировать отель» и т. д., и эта информация часто включается в существование «Путеводитель» когдасередина。Если мы не знаем четко, как разделить задачи,Большая Модель не знает, какие именно части должна включать в себя наша миссия.,Поэтому согласованность этого измерения задачи очень важна.Позвольте мне привести несколько примеров ниже:

Пример 1: Пожалуйста, помогите мне создать путеводитель по Шэньчжэню. Пожалуйста, помогите мне создать путеводитель по Шэньчжэню. Вот несколько основных шагов и способов мышления:

  1. Исследование и сбор информации: Найдите туристическую информацию о Шэньчжэне.,Включает в себя основные туристические достопримечательности,когда Место из Культура и история,изысканная еда,транспорт,Проживание и т. д.
  2. Планируйте поездку: собирайте информацию на основе ваших данных,Спланируйте свой маршрут. Подумайте, куда вы хотите пойти,сколько времени у тебя есть,Вы из бюджета и т. д. Убедитесь, что ваш маршрут реалистичен и выполним.
  3. Бронированиетранспортиоставаться:один разты Конечно Понятнотыизпутешествие,ты Можеткначинать Бронированиетыизтранспортиоставаться。Сравнительно разныеиз Параметры,Найдите жилье, подходящее именно вам.
  4. Подготовьте необходимые вещи: в соответствии с вашим маршрутом и погодой в Синьцзяне.,Подготовьте необходимые вам предметы,Например, одежда,туфля,камера,Карты и т. д.

Пример 2: Пожалуйста, помогите мне разработать тестовые примеры в соответствии с моими потребностями.

Пожалуйста, помогите мне разработать тестовые примеры в соответствии с моими потребностями.,Разработка тест-кейса — это систематизация процесса,Вот несколько основных шагов и способов мышления:

  1. пониматьнуждаться:первый,Вам необходимо иметь глубокое понимание требований и функций программного обеспечения. Это включает в себя чтение документа с требованиями,Понимание пользовательских историй,или менеджер проекта и разработчик для обсуждения.
  2. Определите объем тестирования. Определите, какие функции и возможности необходимо протестировать. Это может включать нормальную работу,крайние случаи,Обработка ошибок и т. д.
  3. Разработайте стратегию тестирования. Определите, как вы будете тестировать эти функции. Это может включать модульное тестирование, интеграционное тестирование, тестирование системы, тестирование производительности и т. д.
  4. Написание тест-кейсов: для каждого теста,Напишите подробное описание тестовых случаев. Оно должно включать ожидаемые входные данные.,Ожидаемый результат,И как выполнить тест.
  5. Обзор тестовых примеров: Обзор тестовых примеров,ªУбедитесь, что они заполнены,точный,и легкопонимать。

Разбиение сложных задач часто бывает очень эффективным.,не только Можеткпродвигатьбольшой Модельизрассуждениеспособность,Вы также можете сделать большой вывод Моделиза более подходящим для ваших требований (выравнивание).,Но для этого необходимо иметь определенное понимание предыдущих задач.,Только тогда такое разделение может быть завершено. Но если вы не знакомы с задачами, с которыми вам придется иметь дело,Как выполнить этот шаг. Как уже говорилось выше, середина выражает понятие из,Мы надеемся получить набор общих методов.,Пусть каждый существует и сможет выполнить любую задачу, с которой он сталкивается.,Таким образом, вам необходимо найти более универсальный метод.

Фактически, вы можете позволить большой модели помочь вам выполнить этот шаг.Этот типпохожий Agent серединаиз Planning Я подумал, пусть Большая Модель поможет вам решить сложную задачу. Вы можете киспользовать это простоиз Prompt Чтобы выполнить эту задачу:

Разделение задач Prompt: {{тыхотеть做из Задача}},какие шаги необходимы,Как думать?

Пример: Я надеюсь, что Большая Модель поможет мне написать отчет о финансовом анализе фонда. входить: Какие шаги необходимы для подготовки отчета о финансовом анализе фонда и как вы должны об этом думать? Выход: Подготовить отчет о финансовом анализе фондаэтос участиеммногоиндивидуальныйшагизпроцесс,нуждатьсявернофондизфинансовое состояние、инвестиционная стратегия、Рыночная среда и другие углубленныеиз Исследоватьипонимать。к Вот некоторые основные шагиидумать Способ:

  1. Сбор данных: сначала,Вам необходимо собрать средства из финансовых данных,включая, помимо прочего, средстваизчистая стоимость、Урожай、Портфель、Коэффициент расходов и т. д. Эти данные обычно доступны в годовых и квартальных отчетах фондовых компаний.
  2. Анализ данных: Анализ данных, собранных о прибытии.,Включая расчет и сравнение доходности фонда, риска, распределения инвестиционного портфеля и т. д. Вы можете киспользовать некоторые инструменты финансового анализа,Такие как Для выполнения этих расчетов используется Excel или специализированное программное обеспечение для финансового анализа.
  3. Сравнение фондов: сравните эффективность фонда с его аналогами или эталонным индексом.,смотретьсмотретьфондизповерхностьсейчасда否超过市场平均水平。этот Можеткпомощьтыпониматьфондиз Взаимноверноповерхностьсейчас。
  4. Анализ рыночной среды: рассмотрим фонд из инвестиционной среды,В том числе экономические условия, Тенденции отрасли、Изменения в политике и т. д. Эти факторы могут повлиять на эффективность фонда.
  5. фонданализ менеджера:Исследоватьфондменеджеризинвестиционная стратегияи历史поверхностьсейчас,Посмотрите, смогут ли они добиться хорошей прибыли в различных рыночных условиях.
  6. Написание отчета: организуйте результаты анализа в отчете.,включатьтыиз主хотеть发сейчас、Фонд «Достоинства и недостатки»、И ваш прогноз будущей деятельности фонда.

существуют Выполните эти шагичас,тынуждаться保持客观икритическийиздумать。Нетхотеть只смотретьфондиз过去поверхностьсейчас,Вместо этого попытайтесь понять причины эффективности фонда. также,Вам также необходимо рассмотреть возможность выхода на рынок из-за неопределенности.,Поэтому будьте осторожны, делая прогнозы.

3.3 Дополнительные требования

Мы прошли вышеописанное “Опишите проблему&Ставьте цели” четко описать Понятнонасиз Задача,Далее нам часто необходимо выдвинуть какие-то требования для наших задач.,Скажите начальнику, что вы от него хотите, а чего не следует делать,этотчастои Модельсуществоватьприложениесерединаизточныйтарифы тесно связаны。нас Обычно используетсяиз Требовать Можетспособный有如Вниз几добрый:

  1. Лимит слов.
  2. Структура вывода (структурированный вывод, вывод Json).
  3. существоватьвыходсерединаисключать xxx。
  4. существоватьвыходсередина Содержит только xxx。

Пусть большая Модель соответствует нашим требованиям.,Тем более, что существующий уровень «Формат» позволяет выпускать большие Модельизы в соответствии с нашими правилами.,Это очень важно для крупных промышленных применений. Как сделать большую Модель более послушной,Пусть это будет соответствовать нашим требованиям. Шерстяная ткань?

первый,мы можем поставить Требоватьпомещатьсуществовать Prompt изнаконец。большойязык Модельиз Суть в томсуществовать Завершить текст,Более поздние результаты, скорее всего, будут основаны на более близком контексте.,еслииспользовать "LIME" Так из Модель объясняет анализ алгоритма, расстояние между текстами ближе, масса часто больше, такое существует. Transofrmer серединаиз Attention масса Вы также можете четко увидеть, куда приезжать, на киз. Со временем эта и большой Модельсуществовать фаза предварительного обучения середина завершения миссии также становится более существенной, хотя сейчас существует большой Модельсуществовать. SFT На этапе будут разнообразные задания-тренинги, но суть их такова: Еще установлено, что существус обучен задаче контролируемого «дополнения текста», поэтому его естественным изложением является более близкий к тексту контроллер. Так что поставь запрос на существование Prompt изнаконец Можетк Очень эффективенизпомощьбольшой Модельстать больше"покорный".

Во-вторых,Мы также можем использовать наши навыки «программирования», чтобы сделать его еще более «программирующим».существовать«Определить роль»из частичного середина, мы говорим «Роль», когда большой пакет возможностей Моделиза, мы можем кпроходи ть Настройте персонажа на использование способностей большой Моделииз. Какие способности Что есть, чтобы сделать большую Модель более «послушной» Шерстяная. ткань?нас Все знают“большой Модель”существовать“программирование”方лапшатакже展сейчасвне Понятношоклюдиизспособность,иэтотиндивидуальныйспособностьточно Можетк Воля“Нечеткийизискусствопричинавопрос”становиться“точныйиз数причинавопрос”,Это позволяет каждому соблюдать наши требования.

Специфический точки зрения,то есть конвертировать наш запрос в "кодирование" задачи, например:

Пожалуйста, перечислите 10 стран и верните их в виде списка.

Пожалуйста, перечислите 10 стран и верните их в виде список.. Мне нужно представить этот список, чтобы приезжать python кодсередина,пожалуйстастрого придерживаться python Список из Формат для вывода.

Пример 2. Экспортируйте 10 стран.,и содержит эти 10 стран из "имен","население","Расположение".

Пожалуйста, укажите 10 стран.,и содержит эти 10 стран из "имен","население","Расположение".我нуждаться Воляэтотделитьсяданныевестивходитьприезжать python Код середина, поэтому, пожалуйста, к Json Формат вывода Json Формат следующий:

'''

{"имя": имя, "население": население, "должность": местоположение, }

'''

Пример 3: Пожалуйста, выведите для меня краткое описание продукта. Количество слов не должно превышать 50 слов.

Пожалуйста, выведите мне краткую информацию о продукте. Мне нужно представить это резюме, чтобы приезжать python Код середина, размер этой переменной равен 50, поэтому содержание сводки не должно превышать 50 символов. Это вводит большие возможности «программирования» модели таким образом, что мы можем к Мо дель выдвигает более точные требования к контроллеру и преобразует наши задачи в более точные способы решения задач программирования, делая большую модель более "покорный".

3.4 (Дополнительно) Формат важен

Помимо ввода контента,Также важно ввести из Формат,Четкая структура оказывает большое влияние на большой эффект Модельиз.Кромеувеличиватьдобавлятьподходящийиз «пустая строка» позволятьструктурные измененияизпрозрачный,Мы также можем добавить несколько «идентификаторов», чтобы различать каждую часть.,Например:#,<>,```,[],-。同часбольшой Модельтакже есть MarkDown Мы также можем использовать аналитические навыки MarkDown грамматическая прогрессия Prompt Структура отделки.

Из-за влияния «Формата» на Модель из,Все больше исследований фокусируется на этом направлении.,Чтосередина “LangGPT” Он широко использовался. Ланг ГПТ предложил структурированный из Prompt Шаблон, может проходить набор структурированных изтрафаретов, построенных Формат ясно из Prompt。

Пример: пример LangGPT

# Роль: установите имя роли, заголовок первого уровня и глобальную область действия.

## Профиль: установите введение роли, дополнительный заголовок и область действия — абзацы.

- Автор: yzfly устанавливает имя автора подсказки для защиты прав оригинальной работы подсказки.

- Версия: 1.0 Установите номер версии Prompt и запишите версию итерации.

- Language: серединаискусство настраиватьязык,серединаискусствовсе еще English

- Описание: кратко опишите сеттинг персонажа, предысторию, навыки и т. д. в одном или двух предложениях.

### Навык: установите навыки, подробно описанные ниже.

1. xxx

2. xxx

## Правила Установите правила, подробности описаны ниже.

1. xxx

2. xxx

##Рабочий процесс,Как общаться с пользователями,взаимодействие

1. Позвольте пользователям "форма:[], тема:[]" из режима определяет форму и тему поэзии.

2. Дана тема для пользователя,создавать стихи,Включите заголовок и стих.

##Initialization Установите шаги инициализации, подчеркните prompt Функции и связи между каждым содержимым определяют поведение инициализации.

как роль <Role>, строго придерживаться <Rules>, Использовать по умолчанию <Language> Поговорите с пользователем. Затем представьтесь и сообщите пользователю <Workflow>。

Мы от “LangGPT” из Примерсередина можно увидеть в разделе «Приехать», где для обозначения Prompt Содержимое организовано таким образом, чтобы вы могли четко видеть функции каждой части и различать их. Мы можем учиться у “LangGPT” Пары разделителей изиспользовать, применяются против Форматиз, пусть то же самое из Prompt Лучше покажите эффект.

3.5 Резюме (структура)

Мы ставим «Уточнение структуры» разделено на 4 шага, и существующая середина предлагает общий практический метод для каждого шага:

  1. Роль:проходить Рольтрафаретивербовка JD Завершите роль.
  2. вопрос&Цель:существоватьбольшой Модельиз Вспомогательный Вниз拆точка Задача。
  3. Требования: Благодаря навыкам программирования большая Модель может лучше соответствовать требованиям.
  4. Формат отделки: комбинирование LangGPT Идея состоит в том, чтобы разумно использовать разделители, чтобы Prompt Структура ясна.

На данный момент мы завершили Prompt основная частьчастьизписать,лапшавернолюбойодин Задача Все Можеткпроходитьэтоткомплект униформыиз Это довольно хороший способ завершить одиниз Подскажите, и передайте нашу Prompt Структурированные из раскола, мы сейчас существуем и можем лучше управлять нами. Подскажите и обеспечьте лучшую поддержку для приложений верхнего уровня.

04. Добавьте в кадр дополнительную информацию (RAG)

начальствоискусствосерединанасужепроходить “Prompt рамка" и "Рамкаиз Утонченность" законченный Prompt Основная часть написана, если мы хотим существовать на основе этой дальнейшей оптимизации. Подскажите, что еще можно сделать?

большой Модельизрассуждение,根книганачальствовсе еще На основе пользовательского вводаизинформационное разбирательстворассуждение,Более полную информацию мы предоставляем,большой Модельтем лучшеиз Завершенопродвигать。поэтому,Сделать Модельиз более эффективной,Нам просто нужно предоставить больше информации.Введение в первые две главыиз“рамка",только Содержит только Понятно Prompt середина "статической" информации, а затем далее расширять эту часть информации. Так же, как и час, нам также необходимо добавить элемент, который меняется в зависимости от задачи. Из "динамической" информации эти две части информации дополняются. естьдальшеоптимизация Prompt из Основная идея.

«Добавьте больше информации, чтобы эффект был лучше» Эта идея очень очевидна, но какую информацию мы хотим добавить? Как добавить комментарий Шерстяная ткань?

Чтобы добавить в сценарий соответствующую информацию, необходимо включить "Поиск" из вакансий, приходите и найдите место, подходящее из информации в соответствии с вашими потребностями, и скажите «приехать» "Поиск" Мне приходится издавать громкие звуки из “RAG” .

4.1 RAG

RAG Существующие технологии в последнее время получили широкое распространениеизсосредоточиться на, постепенно стал применяться в различных практических сценариях. Утро существует ChatGPT В начале вспышки РАГ Уже много приезжатьизсосредоточиться на,Все давно знают, что приезжать,Невозможно полагаться на знания по внедрению параметров.,Дать Модели возможность динамически приобретать знания.,Это очень важно не только для большой профессиональной сферы.,Это одинаково важно для общей области знаний, связанной с масштабируемостью и своевременностью существования середина.

Аналогия с человеческим интеллектом,Человеческому мозгу не обязательно хранить все знания в мозгу середина,Вместо этого вы можете получить знания, ища и ища.,Сноваиспользоватьстелоиз Действуйте разумнорассуждение,Наконец пришел к выводу, что приезжать. Когда вы воспользуетесь крупными производителями моделей часов, вы обнаружите, что они содержат поиск по шагам.,Получение и приобретение знаний очень важно для великого эффекта Модели.

И технология, лежащая в основе этого поиска есть “RAG”,Он может киспользовать большую способность модели проявлять семантическое сходство таким образом.,Эффективный поиск по текстовым данным,И увеличьте его до параметра Приезжатьбольшой Модельиз и введите его в когдасередина.

с технической точки зрения картинка выше такая RAG Наиболее примитивной по структуре является также RAG Основная часть, «Встраивание+векторная база данных» изWAY,RAG Сопоставление семантических измерений текстовых данных можно выполнять без присмотра. Эта идея существует уже давно. Word2Vec Пришло времяприезжать Понятноприложение,Векторы слов уже можно использовать для сопоставления размеров «слова».,Сегодня Большая Модель улучшила это измерение, добавив все текстовые данные.

В настоящее время уже существует множество вариантов прямого использования RAGрамок, таких как: LangChain, Milvus, LlamaIndex, Pincone Все они предлагают нестандартные решения. И очень хочу позволить RAG Станьте точным и простым в использовании, все еще есть много достойных мест,тряпка У фреймворка также уже есть несколько оптимизированных версий.

Настоящее время RAG Технология была полностью разработана. Она не ограничивается семантическим сопоставлением сама по себе, но выпущено множество версий, а также добавлен дополнительный элемент, такой как “Rewrite”, "Memory" Такой из модуля, для RAG Студенты, интересующиеся технологиями, могут прочитать этот опрос: https://arxiv.org/pdf/2312.10997.

если Мы отприложениеугловой весновыйсмотретьсмотреть RAG , нетрудно найти его суть есть поисковая техника,только RAG Использовать Большие возможности модели позволяют получить более строгие семантические измерения. И если мы не знаем, как Встраивание, базы векторов нет и использоваться она не будет РЭГ, мы можем еще завершить поиск?

Ответ, очевидно, да, из , поиск все еще очень зрелый технический модуль, даже если это самый традиционный «Соответствие ключевых слов» также Можетквычислитьискусствокнига间из Взаимнопохожийстепень,Реальностьсейчас Поискиз Эффект。Поэтому Р.А.Г. Это не единственное техническое решение. Нам не обязательно оставаться здесь в ловушке. Когда условия недостаточны, мы можем найти наиболее подходящий режим поиска в зависимости от сценария и отработать его. RAG мысли, существование ввод серединадобавить автора дополнительная информация является основной мыслью.

Выше я совмещаю RAG представил «Как добавить дополнительную информацию?», я подробно расскажу об этом ниже. «Какую информацию мы хотим добавить?».

4.2 Пример (несколько выстрелов)

Few-shot Это базовая парадигма обучения без присмотра по сравнению с методом прямого опроса, One-shot. Будет предоставлен пример: мало выстрелов встречанестидлямногоколичество полосы Пример Сноваруководитьнестипросить,к Это улучшает эффект Модельиз. Этот метод предоставления,существовать Никакой специальной подготовкииз情况Вниз Можеткочень хорошийизпродвигать Модельизточныйсекси Стабилизироватьсекс,Существуют различные большие статьи «Модель середина», которые также можно рассматривать как приезжающие сюда из сравнения.,Различные задачи середина могут показать лучшие результаты.

для Few-shot С точки внимание, больше всего критикуют из немного есть,когда после того, как вы предоставите пример,Модель ответит больше, обратившись к Примеру.,И существование в некоторой степени снижает собственные мыслительные способности Модели.Few-shotсерединаиз Примероченьбольшой程степеньпродвигать Понятно Модельрезультатиз Конечносекс,И определенность повлияет на уровень интеллекта, показанный Моделью.,Специально для основанной на представлениях модели изучения большого языка (Уверенность или интеллект: выберите одно!,Yann Le Cun)。

Как нам смягчить этот недостаток Шерстяная ткань?КромепроходитьPromptверно Модельвне руководства,Это также хороший способ превратить Пример в «Меньше, но эффективнее».,далее приводится дополнительная ссылка из Примера,Увеличьте ценность каждого Примера.,Также уменьшите количество Примеров.,Может эффективно уменьшить большую Модель уверенности,И этот способ сводит к минимуму негативные последствия Примера.

Для того, чтобы добиться проживания «Меньше, но эффективнее» из эффекта требуется помощь “RAG” Выполнено таким образом.проходитьпродвигать Поискиз Эффект,Более точно задачу, наиболее похожую на задачу приехать, мы можем найти из Примера (или контрпримера),По сравнению со статическим из Пример С точки зрения,Это может значительно улучшить понимание Модели предыдущих задач.,к Это улучшает эффект «Модельсуществовать специальное задание серединаиз».

4.3 Память

Кромесуществоватьвходитьсерединаувеличиватьдобавлять "пример" снаружи,Также мы можем добавить добавление "История",длябольшой Модельувеличиватьдобавлять "память" 。"память" Можетксоставитьбольшой Модельсуществоватьинтеграция знанийидлинныйпамять Аспекты существуютсуществоватьиз Очевидные недостатки,И именно в этом сила человеческого мозга. Человеческий мозг способен непрерывно интегрировать знания,Формируйте сильную долговременную память,Обеспечьте поддержку нашему мышлению и принятию решений.

существоватьодин раздиалог Внутриизначальство Вниздля Можеткназывается“короткий срокпамять”,Содержание исторического диалога можно назвать «долговременной памятью».,Сцена существования, когдаиз напоминает эти воспоминания,Может добавить необходимый контекст к предыдущему диалогу,Сообщите Модели больше необходимой справочной информации.,Уже когда предыдущая миссия середина выполнялась лучше. Этот способ нарушения «Ограничения длины контекста»,Не только существование специальных задач середина дает эффект,существуют дольше в течение жизненного цикла,позволять Модель Можетк История планированияиз“диалог Внутри Позволять”также считается Модель Постоянно развиватьсяиз Способ№1。

Например,существоватьначальствокартинаизпримерсередина,когдабольшой Модель выполняет задание по рекомендации фильмачас и вспоминает исторические воспоминания.,Определите пользовательские тенденции по типам фильмов и времени просмотра фильмов.,этотнекоторая информациявстречасуществовать Модельрассуждениеизпроцесссерединаодеялодобавлятьвходитьприезжатьвходитьсередина,к Эта рекомендация дает результаты, которые в большей степени соответствуют ожиданиям.

мы можемк По каждому турудиалогизвходить,использовать“RAG”технология,Динамический изот банка памяти середина Получите подходящий из контентного адаптера входной середина,Сделайте большую перекрестную задачу «Модель»,Получите исторические данные за разные периоды.этотсуществовать Общее поле Можеткосуществлять знанияизпройти,Установить связи между знаниями,существует профессиональная сфера серединаface «Профессиональные понятия/профессиональная лексика» некоторое время, помимо того, что она опирается на ручную обработку профессиональных знаний из,Исторические данные середина осадков из профессиональных знаний также очень эффективны из информации.,Внедрение исторических данных исключает зависимость от искусственных данных.,существоватьиспользовать процесс серединапостоянно совершенствовать Модель профессиональных знаний и понимания,Это такжедаоченьмного Аргументискусствосерединанестиприезжатьиз“проходитьдлинныйпамятьпозволять Моделься развиваюсь”из Мысль。

"память" Это один из очень важных модулей рассуждения, существующий Agent Строительство также сыграло важную роль.Связанные с исследованиями также существуют, продолжают развиваться,Рамка управления памятью (MemGPT) также становится все более широко используемой в промышленности.,рождение Понятно Можетмногоделатьлюди Впечатляющийизпамятьрамка。

Например,Ученые из Университета штата Огайо и Стэнфордского университета провели интересное исследование.,Есть надежда, что у искусственного интеллекта будет «мозг памяти», подобный человеческому гиппокампу. с точки зрения нейробиологии,Имитирует функцию гиппокампа человека, существует долговременная память серединаиз.,Разработан инструмент под названием HippoRAG из Модель.,Способен интегрировать и искать знания так же эффективно, как человеческий мозг.

Они используют большой язык. Модель процесса обработки информации.,И используйте график знаний для заполнения «индекса памяти».,вестивходить Понятно Поиск Модельсоединитьязык Модельи График знаний。когда Модельперениматьприезжатьновыйиз Запросчас,Сначала выполняется запрос середина для извлечения ключевых понятий.,Затемсуществовать График знанийначальствоприложение “Personalized PageRank” Алгоритм выполняет расширение и поиск понятий, моделируя способность ассоциативной памяти гиппокампа. Наконец, Модель сравнивает узлы по их важности. passage Выполните сортировку и поиск, а также выполните «завершение шаблона». Эксперименты показали, что этот «мозг памяти» может отвечать на множество вопросов и ответов, а также на другие потребности. «Интеграция знаний» Задание значительно улучшено.

4.4 Работа с профессиональными сферами

Большая Модель хорошо отвечает на общие вопросы, исходя из своих знаний.,Но мне кажется, что я не настолько хорош в знаниях в профессиональной сфере.,И для моделииз ПРОМЫШЛЕННЫХ ПРИЛОЖЕНИЙ С точками зрения,Нам часто приходится сталкиваться с особыми задачами в рамках определенной профессиональной области.,Это требует большого понимания необходимых профессиональных знаний и профессиональных методов.,И существовать, запланировать их в нужное время,к Это промышленное применение середина обеспечивает стабильные результаты,Это также стало одной из самых больших проблем с большими приложениями Model.

Расширение знаний в профессиональных областях имеет решающее значение для эффективности применения в профессиональных областях.,к Наш недавний пример практики применения Года большой Модельсуществовать «тестовое поле» из,Мы надеемся, что все помогут испытуемым выполнить тестовую работу.,Например «Написать/Проверить» Тестовые случаи.

Для выполнения столь относительно профессиональной полевой задачи,Вам необходимо знать достаточно знаний в предметной области,Например, тестовые примеры по критериям проверки,Часто используемые методы испытаний,Различные методы проектирования вариантов использования,И необходимые знания ведения бизнеса. Чтобы позволить большой Модели иметь эти опоры,Сначала нам нужно сотрудничать с экспертами в предметной области.,Систематизировать знания, связанные с тестовой областью,Правильное управление этими знаниями является основой для их успешного применения.

в это время,Профессиональные областииз Знаниеиспецифический Задача Отдых Связанный。Например,верно «Проверка варианта использования» Задача С точки зрения,Наше исследование представляет собой проверку варианта использования, найденный вариант использования середина, сохранение существующей проблемы.,Такое сокращение вариантов использования приводит к проблеме пропуска тестирования. поэтому,Давайте отправимся,Анализируйте проблемы, пропущенные при тестировании,Определите контрольные точки в одно и то же время и определите проблему на основе статуса варианта использования и профессиональных знаний.,Четкое определение проблемы курса делает его более подходящим для нашей профессиональной области.

Помимо вышеупомянутого обобщения профессиональных знаний,Мы также надеемся, что эта информация будет добавлена ​​в динамику,Использование метода RAG в сочетании с динамической базой знаний конкретной задачи середина вводит необходимые знания.Например,Когда пользовательский ввод середина содержит определенную профессиональную лексику или бизнес-концепцию, нам необходимо динамически идентифицировать их прибытие.,и объяснить и дополнить их,Для этого может потребоваться использовать «Плагин».,Что касается контента, связанного с «Плагином», я раскрою существование «Агента», связанного с статьями середина, подробно.,Больше никаких подробностей здесь нет.

Или «статическое знание» все еще “двигатьсясостояние Знание”,Все организовано путем применения профессиональных знаний из,Восполнить недостатки в профессиональной сфере,Нам необходимо перевести «профессиональные знания» в «общие знания». Рассказывать Модельбольшой Модель,позволятьбольшой Модельлучшеиз Работа с профессиональными сферами。этот一шагчастонуждаться领域专Домизмеждувходитькиверно Знаниеизлюдиработааккуратный,Зачастую это один из важнейших факторов, определяющих верхнюю границу эффективности игры.

4.5 Резюме (добавить дополнительную информацию)

эта глава,Мы дополнительно увеличиваем информацию о способах улучшения эффекта Модельиз.,И в двух вопросах проанализированы способы увеличения расхода информации:

  1. Как добавить информацию об контроллере: RAG,или Другие методы поиска.
  2. увеличиватьдобавлятькакая информация:
    • Пример(Few-Shot)
    • История (память)
    • Профессиональные знания, знание предметной области, знание бизнеса

Наша дополнительная информация,существоватьвходить层лапшаначальствозаконченный Prompt изотлаживать,接Вниз来Сразунуждатьсяпозволять Модельв соответствии снасизвходитьруководитьрассуждение,ирассуждениекнигателоиз Эффекттакжеда影响Модель Эффекточень重хотетьизпоэтому,поговорим об этом ниже,каксуществоватьвходитьиз Базаначальствопродвигать Модельизрассуждениеспособность。

05. Пусть большие модели думают лучше (CoT)

5.1 Что такое ЦТ

2022 Год,существовать Google Опубликована статья «Цепочка мыслей». Prompting Elicits Reasoning in Large Language Models》серединапервыйнестивне,проходитьпозволятьбольшой Модельпостепеннорассуждение,Разложить сложную задачу на несколько подзадач.,И приступаем к поэтапному рассуждению,проходитьэтотдобрый Способ Можетк Существеннопродвигатьбольшой Модельизсексспособный。этотдобрыйрассуждениеметод Сразуодеялосказатьдля Цепочка мыслей(Chain of Thought)。

отличается от традиционного Prompt проходитьконтрольвходитьпрямойконецприезжатьконецизпридетсяприезжатьвыход,Прямо сейчасinput ——> output из Способ,CoT законченот ввода приезда в цепочку мышления, а затем приезда вывода из картографирования,Прямо сейчасinput——> reasoning chain ——> output

с CoT С момента своего создания CoT Изменяемость была проверена бесчисленными работами, как показано на рисунке ниже, вы можете видеть, приезжать, по сравнению с прямым Prompt, CoT Значительные улучшения во всех задачах на рассуждение.

5.2 ЦТ реализации

начальствокартина展Показывать Понятно几добрый Нет同парадигма ВнизверноCoTиз Реальностьсейчас。для Zero-Shot С точки зрения只нуждаться Простойизодно предложение “Let's think step by step” Сразу Можеткпозволять Модельшаг за шагомдумать;для Few-Shot С точки зрения,В дополнение к поэтапному представлению идей при задании вопросов,Также содержит пошаговые мысли из Примера.,Это не только может заставить людей думать шаг за шагом,возвращаться Можеткпроходить Пример Рассказыватьбольшой Модельдолженкакшаг за шагом;для Agent С точки зрения,насне толькопроходить Исправлятьвходитьиз Способ Реальностьсейчас Вместо этого в CoT задачи делятся вручную и делятся на несколько раундов диалога. CoT Внедрение процесса моделирования прибытия, когда середина, для достижения общего измерения задачи CoT。

Как показано на рисунке выше, CoT Структура в основном линейная, задачи распределяются линейно и выполняются последовательно. И с CoT Связанный Исследоватьиз Постоянное развитие,Цепочка мыслей из формы не ограничивается линейным существованием из формы.,Вместо этого получается форма дерева.,поверхность,Графика и другие типы,У его представительской должности середина есть PoT,Tab-CoT,ToT,GoT-Rationale Подождите, на картинке ниже наглядно показаны сходства и различия этих методов:

5.3 ЦТ из приложения

CoT Суть состоит в том, чтобы разделить весьма неопределенную и сложную задачу на несколько в высшей степени детерминированных подзадач, тем самым повышая эффективность и надежность всей системы. от “zero-shot” и “few-shot” Парадигма середина, CoT Это своего рода рассуждения Навыка, и от “Agent” Представление о парадигме, CoT Это больше похоже на идею моделирования, которая также CoT Больше основных идей. Когда мы сталкиваемся со сложной задачей, недостаточно просто преобразовать входные данные. Нам также необходимо разложить измерение задачи. CoT из способа моделирования.

Например, если мне нужна большая модель, которая поможет мне написать статью, у меня есть два подхода:

  1. Входная информация – выходная статья.
  2. Вводная информация – Схема вывода – Улучшение содержания структуры – При необходимости корректировка – Вывод статьи.

Только этот пример прост из разделения,Но это также может значительно улучшить эффект существования. Вот пример нашей реальной работы:,Мы надеемся, что Da Model поможет испытуемым написать «тестовые примеры».,дляэтотиндивидуальный Задача С точки взгляд, самый интуитивный метод есть Пучок "нуждаться" В качестве входных данных позвольте каждому выполнить проектирование тестов и сгенерировать «тестовые примеры» в соответствии с требованиями. Однако сложность и неопределенность требований сильно затруднили выполнение задачи, поэтому мы представили ее. CoT Мысль разделила задачи.

Как показано на рисунке выше, мы разделим эту сложную задачу на на3 этапа(на самом деле Каждый этап будет разделен на несколько подэтапов.)。Сначала проанализируйте потребности,аккуратныйнуждаться Внутри Позволять,иотнуждатьсясередина抽取功способный点и测试вернослон;Затем разработка вариантов использования основывается на этих функциональных точках:писатьвариант использованиянаборизобщая структура,к И каждый вариант использования и тестовые точки,Прямо сейчасвариант использованиязаголовок;Наконец, заполните варианты использования,в соответствии снуждатьсяивариант использованиязаголовокписатьвариант использованияизшагиожидалрезультат。наспроходитьэтотдобрый Способ,Разделите задачу на 3 этапа,Илиот“НИОКР”все Перспектива «приложения» очень помогла нам в решении наших задач.

с точки зрения "НИОКР",когдамы поставить После разбивки задачи на несколько этапов мы легко найдем середина “Самый простой” со сцены. Например, при существовании ссылки середина на рисунке выше проанализировать требования относительно сложно, и «Создать шаги на основе заголовка» 则Взаимноверно Простой,к Это можно использовать в качестве отправной точки, чтобы избежать наиболее сложных данных на ранней стадии.,Давайте быстро достигнем эффекта применения приложения.этотдобрый НИОКРИдеии非тольковерноэтотиндивидуальный Задачаэффективный,для Предыдущая статьясерединанестиприезжатьиз «Написание статьи» из примера "Схема вывода” и «Отрегулируйте по мере необходимости» 显Ранда Даже Простойизребенок Задача,Возьмите на себя инициативу от существования, прорвите эти пункты,Это также может помочь нам быстрее достичь результатов.

с точки зрения «Приложения»,Несмотря на то, что большая Модель показала чрезвычайно потрясающий эффект,Но недостатки существования применения серединаиз также весьма очевидны.,Все также постепенно пришли к пониманию того, что приезжать имеет большие возможности и ограничения. На основе оценки существующей Модели из,“людисовместная работа машин(copilot)” Все больше и больше людей считают, что это лучший способ. и «Взаимодействие человека и машины» этосовместное производствоизпроцесс,еслибольшой Модельтолькотолькодаконецприезжатьконециз Завершеноодин Задача,Людям трудно вмешаться,И когда мы разделим измерения задачи на,Каждая подзадача может координироваться другими. Например,существовать“вариант использованиягенерировать”середина,Люди могут сначала проанализировать потребности,Позвольте Модели разработать вариант использования,использовать этот вид взаимодействия человека и машины из модели приложения.,Мы можем сделать так, чтобы большое приложение «Модельсуществовать» вступило в силу быстрее.

06. Дополнительные навыки

Предыдущая статья середина, у нас есть Китай Prompt Основные этапы отладки также являются стандартным рабочим процессом, который может нам помочь. 0 приезжать 1 из Завершено Prompt изписатьиотлаживать:“Prompt рамка" - «Уточнение рамки» - «Добавить дополнительную информацию» - “CoT”и正如开篇часнестиприезжатьиз,Prompt Существует так много связанных из Навык, и они постоянно обновляются вместе с версией Модельиз. О них мы говорили в предыдущей статье середина. “Prompt проект" из главного шага и мысли и существования над ней, все еще есть немало Навыков для проведения дальнейшей изоптимизации,Далее я выберу некоторые наиболее важные моменты для разговора.

6.1 Использование параметров для контроля достоверности модели

В дополнение к настройке входа Модельиз,большой Дом一定注意приезжать Понятнобольшой Моделькроме2индивидуальный参数Можеткрегулировать:Температура,Top-PЭти два параметра также тесно связаны с эффектом больших моделей.контроль着большой Модельвыходиз Конечносекс。большой Модельиз Суть в томсуществовать Token из вероятностного пространства середина, чтобы сделать выбор, и следующий результат будет основан на вероятностном выборе. Токен, и это 2 параметры естьсуществовать контролирует этот процесс.

Температураэтоположительные действительные числа,для контролягенерироватьискусствокнигаизслучайныйсексимного Образецсекс。существоватьгенерироватьпроцесссередина,Модель назначит вероятность каждому возможному следующему слову.,и отрегулировать температуру,Тогда вы сможете влиять на форму этих распределений вероятностей. Когда температура около 0 часов,выходискусствокнигавстречастать большедобавлять Конечно,Модель с большей вероятностью выберет слова с большей вероятностью из,этот Можетспособный导致генерироватьизискусствокнига质量较высокий,номного Образецсексниже。когдатемператураоколо 1 час,По мере увеличения случайности выходного текста Модель будет выбирать слова с более сбалансированным распределением вероятностей середина, что может сделать сгенерированный текст более разнообразным, но качество может быть не таким хорошим, как у вывода при более низких температурах. Температура более 1 часа,Случайность выходного текста еще больше увеличится, Модель с большей вероятностью будет выбирать слова с меньшей вероятностью.

Top-p это 0 приезжать 1 действительные числа между,выражает другоегенерировать Стратегия,Он выбирает слова-кандидаты на основе распределения вероятностей из кумулятивной вероятности. Конкретно,Модель будет сортировать словарный запас по вероятности,Затем выберите подмножество,Составьте кумулятивную вероятность этого подмножества из не менее п, когда p около 1 часа,генерироватьизискусствокнига Воля Включатьпочти все Можетспособныйизсловарный запас,ведущие к более высокомуизслучайныйсексимного Образецсекс。когда p меньшечас,генерироватьизискусствокнига Воля Содержит только Иметь более высокий Вероятностьизсловарный запас,Уменьшите случайность и улучшите качество вывода. Однако,Слишком низкое значение p может привести к тому, что модель будет слишком консервативной.,генерироватьизискусствокнига过于重复илимонотонный。

для удобствапонимать,Мы можем привести абстрактный пример,Помогите всем понять. Предположим, у нас есть модель языка,этосуществовать Прогнозирование предложенийсерединаизследующее слово。насвходитьиз ПредложениеЯ люблю есть яблоки____,Что Что?Модель Можетспособныйвстречадлябананраспространять 0.4 из Вероятность,дляапельсинраспространять 0.2 из Вероятность,дляЯлираспространять 0.2 из Вероятность,дляКитайская капустараспространять 0.1 из Вероятность,дляредисраспространять 0.1 из вероятности.

еслинаснастраиватьTop-P = 0.8,Затем мы выберем как можно больше слов по вероятности,И пусть вероятность изtotal и будет меньше 0,8. Поэтому мы выберем «Банан», «Апельсин», «Да, груша»., а если на контроллере «Китайская капуста» Тогда кумулятивная вероятность превысит порог 0.8。

наконец Модельвстречасуществовать «Банан», «Апельсин», «Да, груша» середина случайным образом выбирает слово. существует Этот пример середина, у нас есть 50% из Вероятность будет выбрана «Банан», 25% из вероятностного выбора «Апельсин», 25% из вероятностного выбора «Яли». На этом этапе вероятность быть «Температура» затронутый.

Подвести итог С точки зрения,Температура (Temperature) и Top-p – это детерминированный контроль выхода Модели из,Мы можем выполнять отладку в соответствии с конкретными сценариями применения.,Когда нам нужна Модель для определения стабильности. Выходной результат:,Мы можем настроить более высокую степень уверенности,Улучшение стабильности приложения «Модель». Но когда нам нужна Модель для предоставления нескольких результатов,илинадеятьсяпозволять Модельболее творческийчас,Нам нужно больше разнообразия.

6.2 Позвольте большой модели помочь вам оптимизировать

Мы можем предоставить нам все виды Навыкоптимизации из Prompt,Чтобольшой Модель Может Нет Можеткпомощьнассдвигатьсяоптимизациянасиз Prompt Шерстяная ткань?этотиндивидуальный Исследоватьнаправлениес ChatGPT к Мне уделяется много внимания на,И существующая эпоха великой модели стала приезжать все больше и больше из приложений,Он не только способен противостоять другим Prompt Для оптимизации вы также можете поискать жилье. Prompt заявление,магияиз Создать универсальныйиз Эффект。Например,существовать “Zero-Shot COT” Ли из Что предложение “Let's think step by шаг», Google использовал этот метод, чтобы найти место. Лучше: «Возьмите a deep breath and work on this problem шаг за шагом", пусть GSM8Kиз результатов непосредственноот 71.8% Рост приезжать 80.2%。этотиндивидуальный Исследоватьнаправлениевозвращатьсясуществоватьбыстрыйизразвиватькогдасередина,Многие алгоритмы родились,Ниже мы выберем несколько наиболее классических ее алгоритмов.,Я надеюсь, что это поможет каждому лучше понять эту область.

APE — его самый классический алгоритм.,Основная идея такова: из набора кандидатов середина выбирает лучшего из Prompt.,Сновасуществоватьэтотнекоторый Prompt выступал поблизости «Разведочный поиск». Процесс заключается в том, чтобы сначала создать несколько больших моделей. Подскажите, затем заработайте на обучающем наборе и сохраните несколько лучших. Подскажите, наконец-то существуют эти высокие баллы Prompt выступал поблизости выборка, моделирование “Monte-Carlo Search” В процессе оптимизации достигается получение наиболее идеального результата. Prompt。

APO Алгоритм представлен «Градиентный спуск» изметод,пройти учебный набор получил приехатькогда фронт Подскажите изградиент,существоватьприложение«Градиентный спуск»из Способпридетсяприезжатьновыйиз Подскажите, наконец-то с APE Отбор проб проводится таким же образом, а окончательный результат приезжают. Prompt。

OPRO Алгоритм более сложный изиспользовать LLMs В качестве устройства оптимизации. Традиционная итеративная оптимизация Различные технологии, OPRO Описание и руководство на естественном языке задач по оптимизации, преподавание LLMs из руководства,В сочетании с предыдущими решениями, чтобы найти жильеиз,постоянногенерировать Даженовыйиз Стратегия。

6.3 Дополнительные советы

Как упоминалось в начале этой статьи, приезжатьиз,В этой статье предпринята попытка объединить наш опыт исследований и разработок.,систематическийизгребень “Prompt” Для сопутствующих работ попробуйте использовать набор общих израмок, т. Prompt Разбор инженерно-технических работ и Подвести итог. Но так же, как эта Главаиз готов,Помимо существующих единых израмок, существуют также различные Навык.,Это может послужить вишенкой на торте.,В этой части Навык Или накопилось множество статей как внутри компании, так и за ее пределами.,А потому что Навык слишком много,Поэтому существование в данной статье не обсуждается.,Здесь Подвести итогисерединаиз 3 важных способа,Большую роль сыграла наша практика середина:

  1. сi Консистенция:многопозволять Модельвыходмногоиндивидуальныйотвечать,Затемсуществовать LLM изответов много раз середина выбирает ответы, которые появляются несколько раз из.
  2. Отражение:проходитьпозволятьбольшой Модель Оцениватьссебяизвыходруководить Корректирование,Получите лучший доход от продукции.
  3. Генерация знаний:позволятьбольшой Модельгенерировать вопросы Связанныйиз Знание,Задайте еще один вопрос,нестивысокийбольшой Модельотвечатьизточный Ставка。

дляэтотчасть Навык,Если у меня будет возможность, я представлю это в отдельной статье.,Эта статья больше не будет расширяться,Если вас интересуют эти методы, вы можете изучить наиболее распространенные из них из «База знаний», подсказка «Инженерное руководство».

07. Методы оптимизации и общие показатели

Эта статья существовала в надежде познакомить с ней всех. “Prompt” отладка метода, в то время как “Prompt отлаживать" По сути, это делается для того, чтобы задача «Модельсуществовать середина» имела лучший эффект, и это включает в себя эффект перемещения от оценки, когда мы имеем “Prompt” Как после обновления я могу определить, улучшился ли эффект модели? верно AI У меня есть некоторое представление о технологиях. Должно быть, я очень хорошо знаком с этой частью, но я никогда с ней не сталкивался. AI Технологии из одноклассника, все еще Необходимо добавить некоторые базовые знания, связанные с отладкой,Вспомогательныйбольшой Домлучшеиз Завершено Модельотлаживатьс работы.

Чтобы судить об эффекте больших Модельиз,Во-первых, нужны данные, подтверждающие,Во-вторых, необходимо определить показатели измерения эффекта. Расчет большой Моделисуществовать тестовые данные по показателю из является основой для оценки эффекта большой Моделииз.,Здесь я привожу некоторые часто используемые индикаторы.,Используется для измерения эффективности различных задач.

Проблема классификации

  1. Точность:Правильная классификацияиз Выборка составляет общее количество образцов.из Пропорция。
  2. Точность:又сказатьдля Проверьте точно Ставка,Правильная классификация – это соотношение положительных проб к числу проб, признанных положительными.
  3. Отзывать:又сказатьдля Проверить все Ставка,Доля правильно классифицированных положительных образцов к числу реальных положительных образцов.
  4. F1 Score:да精确Ставкаиотзывать Ставкаизбаланс,Наиболее часто используемый индекс оценки.

генерировать вопросы

  1. BLEU:Сравниватьгенерироватьданныеиотметкаданныесередина n-gram из Степень перекрытия.
  2. METEOR:и BLEU При сравнении учитывается не только точностьиотзывать Ставка,Также рассматриваетсягенерироватьрезультатизпорядок слов。
  3. Растерянность:Все тестовые образцыиз Потери перекрестной энтропии усредняются, а затем экспоненциально,Используется для измерения прогностической способности Модели на тестовых данных. Чем меньше путаница,Это показывает, что тем лучше прогнозирующая способность Модельиз.
  4. Скорость принятия:длягенерировать Задача С точки Однако ожидаемые результаты часто не ясны, и в качестве показателя оценки часто используется коэффициент ручного внедрения, который можно далее разделить на «коэффициент прямой доступности» и «коэффициент модифицированной доступности».

для Особенный Задача С точки зрения,Для каждой задачи существует необходимость подготовки собственного независимого набора данных перед отладкой.,Содержит каждый ввод, соответствующий ожидаемому результату.,Различные индикаторы представляют собой разные способы оценки сходства «Ожидаемых результатов» и «реальных результатов».идлякакой-то общийиз NLP Способность С точки зрения,В отрасли также существуют наборы данных с открытым исходным кодом.,Он используется для измерения эффективности различных общих способностей в Модели (текстовая аннотация).,семантическое понимание,диалог,e.t.c.),Если вы отлаживаете общую возможность,или Недостаточно данных о задаче,Вы можете киспользовать эти наборы данных,Здесь я также выбираю некоторые из его середина, чтобы сделать простое введение:

Английский набор данных

  1. GLUE Benchmark: одиннабор成Понятно九индивидуальный独立Задачаиз Оцениватьработа具,для измерения Модельверно Британияискусство句ребенокизпониматьспособность。它включать语义Рольотметка(SRL)、с Ранязыкрассуждение(NLI)、Семантическое сходство текста (STS) и другие задачи.
  2. SuperGLUE Benchmark: GLUE из Преемник, SuperGLUE Включая более сложные задачи понимания языка, такие как рассуждения на естественном языке из нескольких источников, задачи взаимного вывода слов и т. д.
  3. SQuAD:один для машинного чтенияпониматьизданныенабор,Включать Из Википедииискусствоглавагенерироватьизвопроси Отвечать。
  4. CoQA:одиндиалог型просить答данныенабор,для тестирования Модельсуществоватьдиалогсредасерединаизпониматьспособность。
  5. MNLI:одиниспользуется дляс Ранязыкрассуждение(NLI)Задачаизбольшойшкаладанныенабор,Включатьсуществоватьмногодобрый Нет同领域итипизискусствокнигасерединаруководитьрассуждениеиз Задача。
  6. CommonsenseQA:одинвопросотвечатьданныенабор,основной тест Модельизздравый смыслпониматьспособность。
  7. RACE:одинчитатьпониматьданныенабор,Содержит большое количество статей и вопросов, извлеченных из экзамена по английскому середина.
  8. Winograd Schema Challenge:одиндля тестирования Модельсуществовать处причинануждатьсяздравый смыслирассуждениеспособностьиз句ребенок解析вопросначальствоизповерхностьсейчас。
  9. GSM8K:один Математика начальной школыискусствоназвание словаизданныенабор。Долженданныенабородеяло创建вне来,дадля Понятноподдерживатьотвечать Чтонекоторыйнуждатьсямногошаграссуждениеиз基книга数学вопросиз Задача。
  10. MAWPS:одинсуществовать Проволокаизматематические словавопроссклад,Цель — предоставить единую тестовую платформу для оценки различных алгоритмов. Это позволяет автоматически создавать наборы данных с определенными характеристиками.,Предоставляет инструменты для корректировки наборов данных, словарного запаса и дублирования шаблонов, а также фильтрации онлайн-корпораций на наличие неграмматических проблем.
  11. SVAMP:одинлапша向小学级别изматематические словавопрос(MWP)изнабор задач。каждый MWP Каждый из них содержит краткое повествование на естественном языке, которое описывает состояние мира и поднимает некоторые неизвестные величины и вопросы. СВАМП серединаизпримерсуществоватьрешать MWP из Нет同方лапша测试один Модель,напримервопросчувствительныйсексимощныйбольшойизрассуждениеспособность。

набор текстовых данных середина

  1. ChineseGLUE: один с английским GLUE Похоже на: изсередина NLP Оцениватьработа具,Включать Понятномногодобрыйсерединаискусствоязыкпонимать Задача。
  2. LCQMC: Крупномасштабный набор данных для сопоставления текстовых вопросов изсередины, в основном используемый для изучения и улучшения системы ответов на вопросы и ответы на тексты середины.
  3. DuConv: Набор данных системы серединного текстового диалога, используемый для построения набора текстовых данных системы диалога, который характеризуется способностью генерировать несколько раундов диалога.
  4. WebQA: Крупномасштабный набор текстовых вопросов и ответов, который в основном включает вопросы, заданные на естественном языке, и соответствующие ответы.
  5. CMRC 2018: Крупномасштабный набор данных машинного машинного чтения изсередина, аналогичный английскому изSQuAD.

08. Напишите в конце

8.1 Резюме

В этой статье предпринята попытка объединить наш опыт исследований и разработок.,Систематически разобрался с работой, связанной с «Быстрым проектом» из,придетсяприезжать Понятно Стандартизированный рабочий процесс,помощьбольшой Дом Можеткот0приезжать1из Завершеноодин Prompt написание и отладка, а также применение такого структурированного разделения, расширенного Prompt изManagement.насизработа作流Можеткточкадля 5 шаг, соответствующий статье «Раздел 2-Раздел 6» из 5 Главы:

  1. проходить Шаблон запросанапиши первую версию Prompt。
  2. Уточнить шаблонкаждыйчасть Внутри Позволять,аккуратный Prompt Формат
  3. использовать RAG Добавить дополнительную информацию(few-shot,память,профессиональные знания).
  4. использовать CoT увеличиватьмощный Модельрассуждениеспособность。
  5. использоватьДополнительные советыпостояннооптимизация。

Мы думаем, что существует большой модельный проект середина.,«Скорость» должна стать краеугольным камнем проживания,Эффективный, стабильный и масштабируемый. для большого инженера-модельера С точки зрения,“Prompt” Это также необходимый базовый навык. Я надеюсь, что эта статья поможет вам легче начать работу. Prompt из Связанныйработа作,Пусть все пишут Подскажите, каждый может стать Prompt инженер.

8.2 Планирование последующих действий

В этой статье принят “Prompt” работа из Сплита и Подвести итог,систематическийизпредставил “Prompt проект" Из методов работы предлагается набор общих рабочих процессов, которые помогут каждому выполнить “Prompt” При написании и отладке работы этот набор методов также был реализован в нашем реальном приложении середина.

с технической точки зрения,Научно-исследовательские и опытно-конструкторские работы, связанные с Моделью, можно условно разделить на три части: «входить» — «рассуждение» — «тренироваться».,книгаискусствофокуссуществоватьодин Модельиз "входить" Частично, да “Prompt проект" Связанное из Навык обсуждалось. Но одной только отладки на уровне ввода недостаточно. Часть вывода также является ключевой частью, влияющей на эффект «Агент. Технологии», «Мультимодельное сотрудничество», «Модельное планирование». И другие темы оказывают решающее влияние на эффект большой Модели.

поэтому,Подписывайтесь на менявстречафокуссуществовать Модельрассуждениеизчасть,к “Agent технология" В качестве ключевого момента,Начать обсуждение“Модельрассуждение”,“Модель Планирование” Сопутствующие темы, по "LangChain", "Dify" и другие рамки рассуждений, а также “Agent” Обычно используетсярамкаруководить Обсуждать,Все еще начиная с точки зрения приложения,Изучите мои мысли об этих технологиях,к И как быстро реализовать существующее приложение середина.

-End-

Автор оригинала|Лю Цунвэй

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose