Раскройте аналитические возможности Postgres с помощью интеграции с DuckDB.
Раскройте аналитические возможности Postgres с помощью интеграции с DuckDB.

Вдохните жизнь в свои рабочие нагрузки с данными, интегрировав Postgres со встроенным механизмом быстрых запросов.

Переведено с Unleashing Postgres for Analytics With DuckDB Integration,Пол Лоуренс.

Postgres Экосистема процветает, что делает ее Лучший выбор разработчиков Для новых рабочих нагрузок с данными и инструментов баз данных. о "Почему Postgres побеждает" Об этом написано много, и есть много веских причин (включая его масштабируемость) использовать Postgres Возможность масштабирования для новых вариантов использования по мере возникновения необходимости, например. pg vector способный удовлетворить различные AI нуждаться.

хотя Postgres существовать OLTP Рабочая нагрузка разумная, но Postgres Все еще существуют проблемы с точки зрения высокопроизводительного анализа больших коллекций данных (OLAP). Хотя есть некоторые решения, модифицированные ядром Postgres решить OLAP рабочую нагрузку или использовать Postgres Некоторые функции, но каждое решение существуетиспользовать. Postgres Существуют присущие проблемы, затраты и ограничения, связанные с ветвлением.

вместе с Postgres Пользователи все чаще ищут Postgres родной OLAP Решения, сдвиг акцента на недорогие хранилища данных и появление новых стандартов форматов данных, Crunchy Data Начните разработку нового масштабируемого решения Postgres Чтобы удовлетворить эти потребности, наше решение использует преимущества. Postgres Известные мощные возможности расширения,а также Встроенный Новый победитель среди быстрых механизмов запросов——DuckDB

Люблю Postgres и нуждаюсь в анализе

Мы помогаем организациям развертывать Postgres. С этой точки зрения пользователи успешно развертывают Postgres в различных сценариях использования. На самом деле, когда нас спрашивают о случаях использования, которые решает Postgres, нам трудно ответить, потому что ответ заключается в том, что мы действительно видели их все.

но этосуществовать OLTP в контексте. ОЛАП Исторически «еще одна рабочая нагрузка», Postgres существуют. Для этого нет конкуренции. Да, есть некоторые решения, но особенно вместе. Миграция пользователей в облако и облачные методы, не так уж и много Postgres роднойрешение。

Мы видели это воочию: многие Crunchy Bridge Клиенты – они любят Постгрес — использование Postgres руководить OLTP Работайте с загрузкой, но используйте различные инструменты Воляданные, скопированные на различные сторонние аналитические платформы для управления аналитическими запросами. существуюти Эти клиенты обсуждают свои потребности, когда переезжают на Воляданные. Postgres Не устраивает, но лучшего варианта нет. Можем ли мы построить его?

Обрабатывайте свои данные там, где они находятся, и анализируйте их в S3.

чтобы построить собственный анализ решений Postgres - Очевидно, что нам нужен современный формат для размещения и организации решающих решений, а также организации использования. Две важные тенденции определяют наше направление:

  • данные все большесуществовать S3. S3 и подобные облачные библиотеки получили широкое распространение как недорогая и долговечная платформа. Их можно бесконечно расширять,И доступ к нему возможен откуда угодно. Пользователи могут одновременно предоставлять свой контент множеству различных механизмов.
  • Открытые стандарты форматов файлов и таблиц становятся победителями. Хотя многие озера данных все еще являются «S3 в CSV файл", но нравится Parquet и Iceberg Такие форматы анализа и оптимизации стремительно набирают популярность.

конечно,Перспектива разделения ихранилищ (данных) Volya Query Engine (Computing) породила множество проектов библиотек данных. Это дает возможность воляданным хранилищам с небольшими затратамисуществовать место.,Эффективный одновременный запрос данных,Без необходимости перемещать его в механизм запросов.

В конечном итоге мы пришли к выводу, что S3 (с кэшированием) является подходящим уровнем хранения для аналитических данных, а мощная интеграция S3 с PostgreSQL предоставляет средства для решения этих вариантов использования.

Масштабируемость Postgres снова делает его победителем

Postgres Расширение Postgres в состоянии вместе с Решение новых вариантов использования по мере возникновения необходимости. путем загрузки PostGIS Расширения, Постгрес Станьте ведущей базой данных для управления пространственными данными. Постгрес Можно использовать Citus Поддерживается расширенное сегментирование или используйте pgvector Преобразуйте его в векторную базу данных. каждый Postgres У всех пользователей есть свои любимые расширения, и многие пользователи могут использовать ряд расширений, не задумываясь о Postgres Расширьте возможности фреймворка.

Воля Postgres расширен для поддержкиВнешние механизмы запросов в полной мере используют эту расширенную функциональность.。использовать Postgres «Перехватчики» позволяют нам прозрачно разбивать планы запросов на части, которые можно «передать» этому внешнему независимому механизму запросов, что позволяет нам использовать преимущества существующих специализированных механизмов для этих конкретных рабочих нагрузок. существуют В этом случае мы используем DuckDB, будущий победитель в области встроенных механизмов запросов.

Для тех, кто не знаком с DuckDB Зависит от Hannes Mühleisen и Mark Raasveldt существовать Centrum Wiskunde & Informatica (CWI) развиваться, и Зависит от DuckDB Labs Активно развивается благодаря большому вкладу сообщества. Дак ДБ стала ведущей встроенной системой запросов, использующей современные OLAP технологическая пара Parquet ифайл хранилищ объектов руководит быстрым поиском. Паркет Файл поддерживает сжатые столбчатые данные, что делает его воля строк исторических временных рядов из транзакционных данных. Postgres Архивировать в эффективную форму на длительный срок OLAP Идеальный формат для использования.

Это означает, что мы можем сделать это, используя Postgres Расширять Воля DuckDB и Postgres Интегрированная идентификация может быть сведена к DuckDB Векторизует часть плана запроса для параллельного выполнения в функции "руководить" и создает часть, которая будет передана DuckDB соответствующий SQL Запрос. Аналогично мы используем PostgreSQL Комбинация хуков для реализации фильтров、полимеризация、присоединитьсяи Более сложные структуры запросов。существоватьв некоторых случаях,В других случаях весь запрос может существовать;,Мы объединяем разные подпланы.

Преимущества нативных решений Postgres

Но зачем выбирать Postgres руководитьанализировать?вместе с Postgres Принятие продолжает расти, и пользователи всех типов учатся использовать Postgres руководить разработкой приложений OLTP требования, предусмотренные для данных аналитических запросов Postgres Родной опыт имеет много преимуществ.

Как пользователь, вы существуете S3 вданные Воля отображается в виде таблицы и можно по всем критериям PostgreSQL Таблица запрашивает их вместе и другие PostgreSQL Функции и расширения в сочетании с универсальной простотой использования включают в себя:

  • контроль доступа
  • вид
  • Материализовать вид
  • Запрос данных о производительности с помощью pg_stat_statements
  • использовать PL/pgSQL () изхранилищепроцесс
  • использовать pg_cron периодические задания
  • упорство NVMe и кэш-памяти
  • Инструменты информационной панели

Если Воля Postgres Расширение поддержки внешних механизмов запросов для аналитических запросов звучит немного сложно, и это, вероятно, правда. Тем не менее, поскольку Результаты Воля доступны в виде размещенной службы, пользователи могут извлечь выгоду из функций этого решения, не беспокоясь о низкоуровневых деталях, таких как перехваты или запросы. С точки зрения пользователя, все, что вы видите, это возможность быстро раскрыть существующее хранилище. S3 данные для использования стандарта Postgres руководить Запрос。Crunchy Bridge Обеспечивает управляемую производственную готовность Postgres все преимущества и ориентированность на разработчиков UX, ныне существующий, имеет расширенный функционал для поддержки Зависит от DuckDB Обеспечивает поддержку быстрых аналитических запросов.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose