В этой главе представлены крупные модельные агенты в финансовой сфере.,и разобраться с финансамиLLMсвязанные ресурсы。Крупные модельные агенты в финансовой сфере в настоящее время ориентированы наиндивидуальные решения по торговле акциямиЭтот относительно простой сценарий,Нет необходимости рассматривать сложные сценарии портфелей с несколькими активами.。Торговые решения упрощаются до комплексных суждений о положительном и отрицательном влиянии изменений цен на активы на различную рыночную информацию, включая технические аспекты, новости, фундаментальные показатели и т. д. в различных рыночных условиях.
Наиболее значительным преимуществом использования крупных модельных агентов является,заключается в эффективной обработке огромных объемов информации,хранилище,и ассоциации с соответствующей исторической информацией。По общему мнению, не стоит сравнивать широту знаний и эффективность работы с Агентом. Давайте посмотрим, какая информация финансового рынка используется в этих двух статьях и как ее обрабатывать, обдумывать и формировать торговые решения.
FINMEM: A PERFORMANCE-ENHANCED LLM TRADING AGENT WITH LAYERED MEMORY AND CHARACTER DESIGN https://github.com/pipiku915/FinMem-LLM-StockTrading
FinMeM использует текстовую модальную информацию для вызова различной информации о финансовых рынках с разной своевременностью, важностью и актуальностью посредством дифференциации, а также позволяет модели изучать отдельных агентов, принимающих решения по торговле акциями, посредством тонкой настройки.
Профиль FinMem — это глобальная команда торгового агента, аналогичная системной подсказке и состоящая из двух частей.
Хотя он и называется модулем памяти, на самом деле он включает в себя весь процесс сбора, хранения, вызова, обобщения и отражения информации.
Нижняя часть на рисунке выше — это настоящая часть хранилища Memroy. В этой статье используются только три источника данных на финансовом рынке.
В реальных сценариях подразделений на самом деле гораздо больше, чем эти. Своевременность варьируется от длинных до коротких, таких как исследовательские отчеты, макроданные, отраслевые данные, роуд-шоу, институциональные опросы, объявления, политика, новости, различные технические индикаторы рынка и т. д. Уровень сложности намного выше. Поэтому я лично считаю, что, возможно, более целесообразно определять своевременность непосредственно в соответствии с источником данных. В конце концов, своевременность разных источников данных почти всегда различна.
在召回以上другой Своевременностьсодержание时из打分сортировать Эта стратегия основана на стратегии восстановления воспоминаний, связанных с агентами в Стэнфорд-Тауне.(Для студентов, которые не знакомы с этим, пожалуйста, прочтите здесь.LLM Agent: мир, в котором есть только интеллектуальные агенты)。Ядро основано только на Актуальностьвыполнить вызов памяти вСвоевременностьНе допускается в чувствительных зонах。Поэтому содержание отзывасортировать Оценки будут основаны на нескольких факторах,Здесь, по сути, традиционный поиск и реклама опираются на явную обратную связь.,сортировать Сделайте это сложнее。Здесь из-за относительного отсутствия явной прямой обратной связи,Поэтому я просто использовалАктуальность,свежесть,важностьЭти три параметра оценки суммируются。
Расчет свежести будет зависеть от вышеуказанного наслоения Своевременности.,Различные уровни финансовых данных,会有другойизсвежесть Формула расчета。ЯдроСвоевременность更длинный,Влияние этой информации на цены активов на финансовых рынках длится дольше.,Информация менее чувствительна ко времени,Поэтому его экспоненциальное затухание происходит медленнее при расчете свежести.。Например, срок действия оповещения может истечь в тот же день.,А эффект от годового отчета может длиться несколько месяцев. На подготовку документов ушло по 2 недели каждая.,Квартальные и годовые коэффициенты в виде экспоненциального убывания.
Актуальностьиспользуется здесьtext-embedding-ada-002вычислитьcosineрасстояние。иважность论文同样做了другой系数из时间衰减,Но мне правда не понятна операция случайной выборки коэффициента $v_l$ по разным распределениям.,Но хаха, это детали и не важные.,Давайте сосредоточимся на структуре,Посмотрите на кадр~
При иерархическом хранении информации следующим шагом будет проведение серии процессов вызова, обобщения и анализа информации при ежедневном принятии торговых решений.Здесь мы используем примеры из статьи в2023-01-24дневная торговляTSLA,inquery="Can you make an investment decision on TSLA on 24.01.2023», последующий процесс выглядит следующим образом
В сводке сначала будет использоваться описанная выше логика оценки и сортировки на основе запроса, чтобы вызвать соответствующую информацию из хранилища, и суммировать каждую часть информации на основе следующей подсказки. На выходе получается сводка новостей, а также положительные, отрицательные и нейтральные вероятности новостей об активе. Сумма вероятностей равна 1. Здесь вы можете напрямую взять logprobs для нормализации. Один человек считает, что непосредственное использование метки с наибольшей вероятностью при отбрасывании новостей с более высоким значением энтропии может быть менее шумным.
В данной статье в качестве наблюдения за рынком используется только фактор импульса отдельных акций, который представляет собой совокупное увеличение и уменьшение в течение N дней подряд. Обучающая выборка даст импульс следующего дня с целью позволить модели узнать, какие настроения в новостях приведут к будущим изменениям цен, в то время как тестовая выборка представляет собой импульс за последние 3 дня с целью позволить модель предсказывает будущие изменения цен. Лично я считаю, что здесь обучение и тестирование должны быть согласованы, то есть обучающие выборки также обеспечивают фактор динамики исторических 3 дней. Таким образом, технические индикаторы также будут использоваться в последующих размышлениях.
Отражение разделено на две части:
Окончательное торговое решение будет основано на профиле текущей большой модели, отзыве информации Top-K, историческом накопленном доходе и расширенном обдумывании, чтобы принять окончательное торговое решение (Купить, ПРОДАТЬ, ДЕРЖАТЬ). Так называемая фаза обучения фактически опирается на изменения реальной цены актива для получения более точного расширенного мышления (осмысление торговых решений). На этапе тестирования можно использовать исторические результаты мышления, сохраненные на этапе обучения. В этой части кажется, что логика FinAgent более ясна. Друзья, которые в замешательстве, могут посмотреть процесс FinAgent позже.
Мультимодальный фундаментальный агент для финансовой торговли: расширенный инструментами, диверсифицированный и универсальный Только статьи без открытого исходного кода
FinAgentдарешения по торговле акциями типа агент, который добавляет модальную информацию о изображении,В основном включает в себя следующие модули
FinAgent в некоторой степени отсылает к FinMeM. Идеи в чем-то схожи, но структура ввода и вывода Prompt более понятна и ближе к реальному рынку. Вот несколько основных отличий.
Модуль MI представляет собой модуль сбора, анализа и обобщения информации, а также распознавания эмоций для конкретных финансовых организаций (аналогично сводке FinMeM, но с добавлением привязки к исторической информации). Он разделен на две части: текущая рыночная информация (Latest MI) и историческая рыночная информация (Past MI). Первый отражает последние движения активов, а второй использует тот факт, что история на финансовых рынках будет продолжать повторяться. Например, последний выпуск продукта Apple поднял цену акций APPL на 5%. Если сегодня общественное мнение покажет, что Apple выпустила еще один новый продукт, мы можем ожидать аналогичного положительного эффекта.
Первая — это рыночная информация дня, которая в основном касается следующих вещей:
В документе используются подсказки в формате XML для переноса различных типов информации. Подсказки всего Lastest MI следующие: iframe будет заполнять конкретные системные инструкции, описания задач, как анализировать положительное и отрицательное воздействие активов. для анализа и обобщения, формирования запросов и вывода. Конкретное содержимое iframe слишком длинное. Обратитесь непосредственно к Приложению G к документу.
Далее следует раздел исторической информации о рынке, который в основном выполняет следующие функции:
В статье не приводятся конкретные данные, а приводятся лишь общие результаты анализа:
После сбора информации мы вошли в модуль рефлексии, который также был разделен на два этапа: низкоуровневый и высокоуровневый. Первый основан на вышеуказанном рынке. Intelligence提供из舆情正负面影响和股价变动,Атрибуция краткосрочных, среднесрочных и долгосрочных изменений цен на акции(похожийFinMeMиз及时анализировать)。Последний основан наMarket Intelligence,Исторические и текущие размышления низкого уровня,верноАтрибуция торговых решений(похожийFinMeMиз延伸思考)。论文只提供了简化后из Эффектследующее
Давайте поговорим о вводе и выводе низкого и высокого уровня подробно ниже.
Состав подсказки низкоуровневого отражения следующий:
1. Войдите
2. Выход
Потому что это предполагает мультимодальное понимание графиков K-линий.,В этой статье используетсяGPT-4Vчтобы завершить вышеизложенноеpromptинструкция。специфическийPromptинструкция,Подробности см. в Приложении G.
Подсказка для отражения высокого уровня построена следующим образом.
1. Войдите
2. Выход
модуль окончательного решения,вхождение и дополнительные технические индикаторы на основе трех вышеуказанных модулей,Дополнительная информация, такая как мнения аналитиков.,Принимайте торговые решения. Подсказка строится следующим образом
1. Войдите
2. Выход
Наконец, давайте поговорим об оценке эффекта. Здесь в качестве индекса оценки используется совокупная доходность отдельных сделок с акциями. По сравнению с правилами торговли на основе технических индикаторов, решением на основе RL и вышеупомянутым FinMem. значительное улучшение годовой доходности и улучшения коэффициента Шарпа, в основном то же самое при максимальном восстановлении.
В то же время в документе был проведен эксперимент по удалению, чтобы сравнить эффекты использования только M (рыночная информация MI), только использования T (взгляды покупателя и продавца инструментов + технические аспекты), а также добавления размышлений и принятия торговых решений. Данные более интересны. Эффекты от использования только M и T практически одинаковы. Основное улучшение связано с модулем отражения. Однако вывод здесь во многом связан с рынком. Ха-ха, экспериментальный вывод на рынке США не может быть напрямую перенесен на акции А~.
Если вы хотите увидеть более полный обзор статей, связанных с большими моделями, данными и платформами точной настройки и предварительного обучения, а также приложениями AIGC, перейдите на Github. >> DecryPrompt