В 2017 году я тогда участвовал в техническом форуме моей компании и упомянул, что с помощью искусственного интеллекта журналы мониторинга могут обеспечить более своевременные оповещения и даже ранние предупреждения. Однако на тот момент была только идея по этому направлению и не было представления о том, как это реально сделать и реализовать. Прошло семь лет, и даже сегодня эта тема по-прежнему является основной темой в области исследований и разработок, но общедоступного технического решения до сих пор не существует. Когда два дня назад я изучал доводку модели, у меня внезапно появилось вдохновение. Возможно, это идея, способная воплотить в жизнь ожидания, которые у меня были на протяжении многих лет.
Давайте сначала поговорим о выводе: используйте идеи мультимодального обучения, используйте журналы как временные ряды и согласовывайте их с текстом.
Самый ранний метод использования искусственного интеллекта для мониторинга также является основным в современной области мониторинга. Он в основном использует большие данные для сопоставления правил, а затем дополняет их анализом соответствующих моделей для достижения эффектов раннего предупреждения. Однако это решение всегда имеет недостатки: не только недостаточную точность, но и недостаточную своевременность.
После того, как LLM стал мейнстримом, я просто подумал, что раз логи текстовые, то все логи надо отдать большой модели, а затем надо добавить некоторые текстовые описания, чтобы большая модель могла активно реализовывать закономерности между логами. Однако эффект от этого решения очень плохой, поскольку понимание журналов большой моделью все еще остается на текстовом уровне, и она не может по-настоящему понять связь между журналами. Это еще дальше от достижения нашей цели раннего предупреждения.
Два дня назад у меня внезапно появилось вдохновение. Поскольку мультимодальность может понимать изображения, даже видео и временные ряды, почему журналы мониторинга, которые представляют собой естественные временные ряды, должны рассматриваться как текст? Позвольте ему вернуться к своей исходной природе, использовать журналы мониторинга в качестве исходного домена, текст в качестве целевого домена, согласовать и сопоставить последовательности журналов с текстами на естественном языке и реализовать тот же процесс обучения, что и мультимодальность.
Точно так же, как когда мы обучаем статистические диаграммы текстовым описаниям, мы сначала токенизируем материалы исходной области. Здесь мы в основном полагаемся на разделение временных интервалов в качестве токенов. Затем мы реализуем выравнивание текста и используем текст для описания характеристик самого интервала и изменений между ними. особенность интервалов. Приведем простой для понимания пример, если у нас есть следующая картина:
Нам нужно обучить модель, чтобы она соответствовала тексту, который можно полностью выразить на естественном языке. Например
В октябре 2002 года осадки были распределены неравномерно в некоторых городах моей страны, в том числе 23 мм в Пекине и 23 мм в Нанкине... Осадки в восточных городах были значительно выше, чем в западных городах...
Я помню, что на уроке китайского языка в средней школе у нас был специальный урок о том, как описывать содержимое таких диаграмм и анализировать их. По сути, я думаю, что это похоже на тот класс, описывающий диаграммы на естественном языке. Среди них необходимо описать не только явные числовые значения, но и невидимые правила. Например, в данных за год необходимо описать не только значение xx в xx году, но также соотношение и степень подъема и падения между предыдущим и последующим годами, например, такое описание, как «внезапное увеличение на xx%». ".
Когда мы получим соответствующий весовой параметр посредством такого обучения, завершим механизм перекрестного внимания и сопоставим журнал временных рядов с описанием в текстовой области, тогда мы сможем позволить большой модели понять период времени, в котором я прошел. Какой контент хотите ли вы отображать журналы интервального мониторинга? На этом основании для большой модели будет легче судить, соответствуют ли эти журналы определенным правилам, требующим раннего предупреждения.
Мы также можем использовать архитектуру рабочего процесса для разделения понимания последовательностей журналов и анализа ранних предупреждений, чтобы мы могли использовать небольшие модели для более профессиональных задач, тем самым достигая повышения производительности.
Конечно, это всего лишь идея, и я ее не реализовал. Если вам это интересно, пожалуйста, оставьте свои мысли в разделе комментариев ниже.