Big Data Flink Advanced (4): Сравнение сценариев приложений Flink и других платформ вычислений в реальном времени.
Big Data Flink Advanced (4): Сравнение сценариев приложений Flink и других платформ вычислений в реальном времени.

Сравнение сценариев приложений Flink и других платформ вычислений в реальном времени.

1. Сценарии применения Flink

В реальном производственном процессе постоянно генерируется большой объем данных, таких как данные финансовых транзакций, данные интернет-заказов, данные GPS-позиционирования и т. д. в соответствии с、сигнал датчика、Данные, генерируемые мобильными терминалами、Данные сигнала связи и т. д., а также привычный мониторинг сетевого трафика.、серверпроизведеноДанные журнала,Самое общее, что объединяет эти данные, — это то, что они генерируются из разных источников данных в режиме реального времени.,а затем передаются в последующие системы анализа.。Для этих чиселв соответствии с Типы в основном включаютв реальном времени Интеллектуальные рекомендации、Сложная обработка событий、Обнаружение мошенничества в режиме реального времени、Хранилище данных реального времени и тип ETL、Типы анализа потоковых данных、в реальном времениОтчетТип и т. д.в реальном временибизнес-сценарий,И у Флинка очень хорошая поддержка для подобных сценариев.

1. Интеллектуальные рекомендации в режиме реального времени.

Интеллектуальная рекомендация будет использовать алгоритм рекомендаций для обучения модели на основе исторического покупательского поведения пользователя, чтобы прогнозировать товары, которые пользователь может приобрести в будущем. Для частных лиц система рекомендаций играет роль фильтрации информации. Для сервера веб-приложений система рекомендаций играет роль удовлетворения персонализированных потребностей пользователей и повышения удовлетворенности пользователей. Сама система рекомендаций также быстро развивается. Помимо все более совершенных алгоритмов, все более жесткими становятся и требования к латентности и оперативности. Используйте потоковые вычисления Flink, чтобы помочь пользователям создавать интеллектуальную систему рекомендаций, работающую в режиме реального времени, выполнять вычисления в реальном времени по индикаторам поведения пользователей, обновлять модель в реальном времени, прогнозировать показатели пользователей в реальном времени и отправлять прогнозируемую информацию на веб-сайт Wep/ Конец приложения, чтобы помочь пользователям получить С другой стороны, желаемая информация о продукте также помогает компаниям увеличить продажи и создать большую ценность для бизнеса.

2. Сложная обработка событий

Что касается сложной обработки событий, то наиболее распространенные случаи в основном сосредоточены в промышленной сфере, например, обнаружение неисправностей датчиков транспортных средств, механического оборудования в режиме реального времени и т. д. Эти виды бизнеса обычно имеют очень большие объемы данных и предъявляют очень высокие требования к своевременности обработки. обработка данных. Используя CEP (комплексную обработку событий), предоставляемую Flink, для извлечения шаблонов событий и применяя Sql Flink для преобразования данных о событиях, в систему потоковой передачи встроен механизм правил в реальном времени. Как только событие запускает правило тревоги, возникает тревога. немедленно передаются в нижестоящую систему оповещения для обеспечения быстрого раннего предупреждения о сбоях оборудования и мониторинга состояния транспортного средства.

3. Обнаружение мошенничества в режиме реального времени

В финансовой сфере часто происходят различные виды мошенничества, такие как мошенничество с кредитными картами, мошенничество с заявками на получение кредита и т. д. Как обеспечить безопасность пользователей и средств компаний, является общей проблемой, с которой сталкиваются многие финансовые компании и банки в последние годы. . Поскольку методы мошенничества, используемые преступниками, продолжают расширяться, традиционных методов борьбы с мошенничеством уже недостаточно для решения проблем, с которыми сталкиваются в настоящее время. Раньше на вычисление показателей поведения пользователей на основе данных транзакций, а затем на выявление пользователей, подозреваемых в мошенничестве с помощью правил, а затем на расследование и рассмотрение дела могло уйти несколько часов. В этом случае средства могли уже быть переведены преступниками. таким образом предоставление предприятий и пользователей приводит к большим экономическим потерям. Использование технологии потоковых вычислений Flink позволяет завершить расчет показателей поведения при оценке мошенничества в течение миллисекунд, а затем выполнить оценку правил или прогнозирование модели потока транзакций в режиме реального времени. Таким образом, как только в транзакции обнаруживается подозрение на мошенничество. транзакция может быть перехвачена в режиме реального времени, чтобы избежать экономических потерь, вызванных несвоевременной обработкой.

4. Хранилище данных в реальном времени и ETL

В сочетании с автономным хранилищем данных, используя преимущества потоковых вычислений и гибкие возможности обработки SQL, потоковые данные можно очищать, объединять и структурировать в режиме реального времени, дополняя и оптимизируя автономное хранилище данных. С другой стороны, в сочетании с возможностями обработки данных ETL в реальном времени и технологией потоковых вычислений с отслеживанием состояния можно максимально снизить сложность логики корпоративного планирования в процессе расчета автономных данных, эффективно и быстро обрабатывать статистические результаты, которые предприятиям нужны и помогают предприятиям лучше получать результаты анализа данных в реальном времени.

5. Потоковый анализ данных

Рассчитывайте различные показатели данных в режиме реального времени и используйте результаты в режиме реального времени для своевременной корректировки стратегий, связанных с онлайн-системами. Он имеет большое количество приложений в области доставки различного контента и беспроводной интеллектуальной передачи данных. Технология потоковых вычислений обеспечивает сценарии анализа данных в реальном времени, помогая предприятиям анализировать различные показатели веб-приложений или приложений приложений в реальном времени, включая распространение версий приложений, обнаружение и распространение сбоев и т. д. Она также обеспечивает многомерный анализ поведения пользователей и поддерживает Журналы Независимый анализ помогает разработчикам усовершенствовать операции на основе технологии больших данных, улучшить качество и удобство продуктов, а также повысить интерес пользователей.

6. Анализ отчетов в режиме реального времени.

Анализ отчетов в реальном времени — это одно из решений для статистики отчетов, принятое многими компаниями в последние годы, и наиболее важным приложением является отображение на большом экране в реальном времени. Результаты, полученные в реальном времени с помощью потоковых вычислений, передаются непосредственно во фронтенд-приложение, а преобразование важных показателей отображается в реальном времени. Самый типичный случай — мероприятие Double Eleven на Taobao. Каждый год во время торгового фестиваля Double Eleven, помимо сумасшедшего шоппинга, больше всего бросается в глаза постоянно скачущий общий объем транзакций на большом экране Double Eleven на Tmall. На всем вычислительном звене, от размещения заказа на Tmall до сбора данных, расчета данных и проверки данных, все время соединения, отображаемое на большом экране Double Eleven, сжимается в течение 5 секунд, а пиковая производительность вычислений достигает трех сотни тысяч заказов в секунду и несколько резервных копий расчета потока ссылок для обеспечения надежности. В других отраслях компании также создают свои собственные системы отчетности в режиме реального времени, что позволяет компаниям полагаться на свои собственные бизнес-данные для быстрого извлечения большей ценности данных и тем самым лучше обслуживать операции компании.

С января 2019 года Alibaba постепенно вернула Blink, поддерживаемый внутри компании, сообществу с открытым исходным кодом Flink. Количество добавленных кодов в настоящее время превышает 1 миллион строк. В последней версии Flink1.15 Blink и Flink также были объединены. Пользователями Flink являются отечественные компании, включая Tencent, Xiaomi, Huawei, Bytedance и другие, а также иностранные компании, включая Uber, eBay, Netflix и другие.

2. Сравнение других платформ вычислений реального времени

Согласно предыдущему описанию, мы знаем, что Flink в основном обрабатывает потоковые данные, ориентируясь на область вычислений в реальном времени. До Flink в области больших данных в реальном времени существовали Storm и SparkStreaming. Storm — это ранний фреймворк для потоковых вычислений, а позже появился SparkStreaming. Для поддержки SQL Spark позже появился StructuredStreamig, отличный фреймворк для вычислений в реальном времени. Так в чём же различия между этими фреймворками? Ниже мы сравниваем три платформы вычислений в реальном времени с разных точек зрения:

продукт

Модель

API

Поддержка SQL

EventTime

Гарантированные сроки

механизм отказоустойчивости

Управление статусами

задерживать

Колебание

Storm

Нативный (данные обрабатываются сразу после ввода)

Комбинированный API (Базовый API)

Ранние версии не поддерживают более поздние версии.

Ранние версии не поддерживают более поздние версии.

Хотя бы один раз (хотя бы один раз)

Механизм подтверждения

никто

Низкий

Маленький

SparkStreaming

Mico-Batching (разделение данных маленькой партии)

Декларативный API (инкапсулированный API высокого уровня)

Не поддерживается

Не поддерживается

Ровно один раз (точный один раз)

Отказоустойчивость на основе SparkCheckpoint

На основе DStream

середина

большой

Structured Streaming

Native/Mico-Batching

Декларативный API (инкапсулированный API высокого уровня)

поддерживать

поддерживать

Ровно один раз (точный один раз)

Отказоустойчивость на основе SparkCheckpoint

На основе набора данных/DataFrame

середина

большой

Flink

Нативный (данные обрабатываются сразу после ввода)

Декларативный (с инкапсулированным API высокого уровня)

поддерживать

поддерживать

Ровно один раз (точный один раз)

Отказоустойчивость на основе FlinkCheckpoint

На основе операций

Низкий

большой

  • Модель:StormиFlinkреальноизодин за другимиметь дело счислов соответствии с,А SparkStreaming — это микропакетная обработка.,Обработка одного пакета данных за раз (Маленький пакет),Структурированная потоковая передача поддерживает микропакетную обработку, представленную позже в Spark, также поддерживает непрерывную обработку (непрерывную).,В настоящее время все еще экспериментальный,Производительность в реальном времени не так хороша, как у Flink.
  • API : Storm использует базовые API для разработки. Например, чтобы реализовать простую операцию суммирования, вам нужно самостоятельно написать много бизнес-логики, в то время как SparkStreaming, StructuredStreaming и Flink предоставляют инкапсулированные функции высокого порядка, которые можно использовать напрямую; очень удобно.
  • SQL поддерживаются: обработка потоковых данных Early StormНе руководствоSQL, последняя версия утвержденияSQL обрабатывает потоковые данные,SparkStreamingНе поддерживаетсяSQLиметь дело с,StructuredStreamingпод наблюдениеSQL, позже запущенный Spark, обрабатывает потоковые данные,Flink также поддерживает SQL для обработки данных в реальном времени.
  • EventTime поддерживаются: Storm Early и обработка данных в реальном времени SparkStreamingНе поддерживаетсявремя события,Обработка данных Storm после реального времени поддерживает время события,Аналогичным образом, StructuredStreaming, который был представлен позже Spark, обрабатывает потоковые данные, а также поддерживает время события.,Flink родился и начал обрабатывать данные в реальном времени во время события подтверждения.
  • Гарантированные сроки:在числов соответствии симеть дело саспект,Шторм может справиться хотя бы один раз,Но нет гарантии, что оно будет обработано только один раз.,Это приведет к проблемам с обработкой дублирования данных.,Итак, для нужд подсчета класса,Могут возникнуть некоторые ошибки,SparkStreaming, StructuredStreaming и Flinkподдержка Семантика однократной обработки данных.
  • механизм отказоустойчивости:Stormможет пройти Механизм подтверждение реализует механизм данных отказоустойчивости, в то время как SparkStreaming, StructuredStreaming и Flink могут реализовать механизм через механизм CheckPoint отказоустойчивости。
  • Управление статусами:Stormне реализовано в Управление статусами, реализует SparkStreaming На основе DStreamиз Управление статусами, StructuredStreamingподдерживать На основе набора данных/DataFrameиз Управление статусами, а Flink реализует На основе операцийиз Управление статусами。
  • задерживать:表示числов соответствии симеть дело сиззадерживать Состояние,Storm и Flink обрабатывают фрагмент данных после его получения.,Обработка данных очень гибкая; как SparkStreaming, так и StructuredStreaming представляют собой микропакетную обработку;,Эффективность обработки данных будет относительно высокой,Несмотря на то, что StructuredStreamingподдержка Непрерывная непрерывная обработка,Но пока он находится на стадии эксперимента.,Задержка обработки данных выше, чем у Flink,Flink имеет самую низкую задержку обработки данных в реальном времени.
  • Колебаниеколичество:Stormиз Колебаниеколичество На самом деле нет Низкий,Просто по сравнению с некоторыми другими фреймворками объем SparkStreaming, StructuredStreaming и Flink относительно высок.
boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose