DataHub — это современный каталог данных, предназначенный для обеспечения сквозного обнаружения данных, наблюдения за ними и управления данными. Эта расширяемая платформа метаданных создана для разработчиков, способных справляться со сложностями быстро развивающейся экосистемы данных, и помогает специалистам по работе с данными максимально эффективно использовать общую ценность данных в своих организациях.
Ниже приводится DataHub когда前功能из概述。Посмотреть нашидорожная карта,Посмотрите, что произойдет дальше.
Стек данных поиска
Унифицированный поиск DataHub отображает результаты в базах данных, озерах данных, платформах бизнес-аналитики, хранилищах функций машинного обучения, инструментах оркестрации и т. д.
Отслеживать сквозное происхождение
Быстро поймите сквозной путь ваших данных, отслеживая происхождение между платформами, наборами данных, конвейерами ETL/ELT, диаграммами, информационными панелями и т. д.
Понимание последующих зависимостей критических изменений
Используйте анализ воздействия, чтобы заранее определить, на какие организации могут повлиять существенные изменения.
Обзор метаданных 360° с первого взгляда
объединитьтехнологияилогикаЮаньданные,Обеспечивает обзор объектов данных на 360°.
генерироватьСтатистика набора данныхпонятьданныеиз形状и分布
从远大前程等инструментзахватить историюРезультаты проверки данных
использовать DataHub изИстория версий архитектурызапись для отслеживанияданные物理结构随时间из变化
Современное управление данными
Управление в режиме реального времени
операционная основаПоддерживает следующие варианты использования в режиме реального времени:
·уведомить:когда DataHub Создавайте уведомления для конкретной организации при возникновении изменений. Например, отправьте электронное письмо группе управления, когда тег «PII» добавляется к любому ресурсу данных.
·Интеграция рабочего процесса:Воля DataHub Интеграция во внутренний рабочий процесс организации. Например, если в наборе данных предлагается конкретная метка или термин, создайте Jira билеты.
·Синхронизация: будетDataHub Изменения, внесенные в 3 квадратная система. Например, теги, добавленные в DataHub, отражаются в Snowflake.
·Обзор:Кто делает обзор DataHub Какие изменения произошли с течением времени.
Управление собственностью объекта
Быстро и легко назначайте право собственности на объекты пользователям и группам пользователей.
Использование тегов, глоссариев и полей
Предоставьте владельцам данных возможность управлять своими объектами данных путем:
1.Этикетка:非正式из、松散控制из标签,Используется как инструмент поиска и нахождения. Формального централизованного управления не существует.
2.Глоссарий терминов:具有可选层次结构из受控词汇表,Обычно используется для описания основных бизнес-концепций и показателей.
3.домен:精选из顶级文件夹或类别,Широко используется в сетках данных.,Организуйте сущности по отделам (например, финансы, маркетинг) или продуктам данных.
Управление DataHub
Создание пользователей, групп и политик доступа
Администраторы DataHub могут создавать политики, определяющие, кто и какие действия может выполнять с какими ресурсами. При создании новой политики вы сможете определить следующее:
·Тип стратегии- Платформа (Вверх DataHub Разрешения платформы (т. е. управление пользователями, группами и политиками) или метаданные (возможность манипулировать правами собственности, тегами, документами и т. д.)
·Тип ресурса- Укажите типы ресурсов, такие как наборы данных, информационные панели, конвейеры и т. д.
·Разрешения- Выберите набор разрешений, например «Редактировать владельца», «Редактировать документ», «Редактировать ссылку».
·пользователи и/или группы- Назначайте соответствующих пользователей и группы. Вы также можете назначать политики владельцам ресурсов независимо от того, к какой группе они принадлежат;
UI
Создавайте, настраивайте, планируйте и выполняйте пакетный прием метаданных с помощью пользовательского интерфейса DataHub. Это упрощает импорт метаданных в DataHub за счет минимизации накладных расходов, необходимых для работы пользовательских конвейеров интеграции.
Исходная ссылка: https://datahubproject.io/docs/features.