Раскрыта архитектура безопасности EasyMR: как управлять безопасностью данных Hadoop
Раскрыта архитектура безопасности EasyMR: как управлять безопасностью данных Hadoop

В 2017 году американское кредитно-рейтинговое агентство Equifax подверглось хакерской атаке, в результате которой произошла утечка конфиденциальной информации 140 миллионов человек;

В 2020 году цепочка поставок программного обеспечения SolarWinds подверглась атаке вредоносного кода с участием нескольких отраслей и стран;

В 2022 году Администрация киберпространства Китая наложила на компанию Didi огромный штраф в размере 8,026 млрд юаней на основании Закона о безопасности данных и других законов и постановлений, что стало сигналом тревоги в отношении безопасности данных для интернет-компаний.

В последние годы безопасность данных быстро становится темой, вызывающей серьезную озабоченность в современный информационный век. Сегодня, с быстрым развитием цифровизации, все сферы неотделимы от поддержки данных, и вопросы безопасности данных стали важной задачей. Различные организации и частные лица, включая предприятия, правительства и академические учреждения, должны защищать свои данные от таких рисков, как утечка, потеря, подделка или неправильное использование.

В качестве необходимой технологии для выхода в область больших данных Hadoop обычно развертывается в интрасети пользователя из-за своих бизнес-характеристик. Поэтому на ранней стадии проектирования не уделялось слишком много внимания проектированию безопасности, а больше внимания уделялось реализации. бизнес.

как ведущийПоставщик услуг цифрового базового программного обеспечения и приложенийКенгуру Облако,Мы всегда придавали большое значение вопросу безопасности данных.,декабрь 2022 г.,Самостоятельное исследованиеМеханизм вычислений больших данных EasyMR начальствоДобавлены универсальные возможности предотвращения безопасности приложений с большими данными и управления разрешениями на данные.

Исходя из этого, EasyMR может быть достигнутоРазвертывание служб управления и контроля безопасности в один клик,Один кликвключатьбольшие данныекластеркомпонентысертификация безопасность, управление пользователями и контроль разрешений Служить.

В этой статье вы узнаете, как EasyMR управляет безопасностью данных Hadoop.

Проблемы безопасности Hadoop

самое раннее развертывание Кластер Hadoopне рассматривал Безопасностьвопрос,еще нетвключать Безопасность Во время аутентификации,Hadoop Имя пользователя, предоставленное клиентом, используется в качестве учетных данных пользователя. Обычно тот, кто инициирует задачу Unix пользователь. Онлайн-службы развертывания компьютеров обычно используют единую учетную запись. При развертывании кластера с единой учетной записью все выполнение выполняется. Hadoop Все пользователи задачи являются суперадминистраторами кластера, поэтому очень легко могут возникнуть ошибки.

Даже если кластер развернут с учетной записью администратора, злоумышленники все равно могут выдавать себя за учетную запись администратора на клиенте. Поскольку кластер продолжает расширяться, Поскольку спрос на использование кластера увеличивается в различных ведомствах, вопрос кластерной безопасности становится весьма важным. Проблемы безопасности Hadoop обычно включает в себя следующие два аспекта:

· Аутентификация пользователя(Authentication) То есть для проверки личности пользователя, Подтвердите, что пользователь является тем, за кого себя выдает, Сюда входит аутентификация пользователей и служб.

· Авторизация пользователя (Авторизация) — это контроль разрешений, разрешающий или запрещающий доступ к определенным ресурсам и определенным пользователям доступа. Авторизация пользователя основана на аутентификации пользователя. Без надежной аутентификации пользователя не существует авторизации пользователя.

Как EasyMR берет на себя обеспечение безопасности Hadoop

Сертификация безопасности для EasyMR Hadoopоснован на Kerberos реализованный, интегрированный LDAP Пользовательская система. Kerberos Это сетевой протокол аутентификации. Пользователям нужно только ввести данные аутентификации, и проверка может получить доступ к множественному доступу путем получения билетов. Kerberos Службы единого входа в систему машины также могут быть выполнены на основе этого протокола.

Hadoop Он не создает учетную запись пользователя самостоятельно, а использует Протокол Керберосдля аутентификации пользователей,от Kerberos Получите учетную запись пользователя из информации о пользователе в сертификате, Таким образом, это не имеет ничего общего с учетной записью, которую использует реальный пользователь.

EasyMR берет на себя безопасность Hadoop, используя в основном следующие два метода управления учетными записями:

Управление учетными записями кластера

Первоначально мы использовали одну учетную запись в качестве администратора кластера, и эта учетная запись представляла собой единую учетную запись для входа в Интернет. Это создавало большие риски для безопасности, и нам нужно было использовать специальную учетную запись для управления кластером. Здесь возникает вопрос: сколько учетных записей эксплуатации и обслуживания нам нужно? Простой метод — использовать специальную учетную запись эксплуатации и обслуживания. Представители CDH и Apache также рекомендуют разделить учетные записи по службам для запуска кластера.

Учитывая, что детальный контроль позволяет эффективно избежать ошибок в работе, EasyMR следует официальным рекомендациям использовать несколько учетных записей, использовать Hadoop в качестве одной и той же группы пользователей и использовать отдельных пользователей для каждого компонента. Если вы переходите от одной учетной записи эксплуатации и обслуживания к развертываниям с несколькими учетными записями, вам необходимо учитывать связанные проблемы с правами доступа к файлам, включая локальные части и части HDFS. Соответствующие изменения можно внести, когда безопасное развертывание будет подключено к сети.

EasyMR компоненты Служить Информацию о текущем пользователе можно настроить вУровень обслуживания пакета продуктовВниз,На рисунке ниже используется Служить hdfs_namenode Например:

Управление учетными записями пользователей

Учитывая, что в каждой команде будут разные группы, каждая группа будет использовать Hadoop Для выполнения требований по обработке больших данных требуется определенная степень многопользовательской среды. Основное внимание здесь уделяется вопросам разрешения данных и операций EasyMR. Интегрированный Система службы каталогов LdapServer,Его функциональные преимущества конкретно отражены в следующем:

• LdapServer может снизить нагрузку на менеджеров учетных записей пользователей при выполнении ряда сложных и утомительных задач, таких как создание учетных записей, их перезапуск, управление разрешениями и аудит безопасности, когда они сталкиваются с такими проблемами, как большое количество пользователей и быстрый рост.

• LdapServer может решить проблемы безопасности доступа к многоуровневым и многотипным системам и базам данных. Все политики управления учетными записями настраиваются на стороне сервера, обеспечивая централизованное обслуживание и управление учетными записями.

• LdapServer может полностью наследовать и использовать функцию аутентификации личности существующей системы управления учетными записями в организации платформы и реализовать разделение управления учетными записями и управления контролем доступа, повышая безопасность аутентификации доступа на платформе больших данных.

Как EasyMR развертывает безопасность Hadoop

EasyMR могу поддержать Hadoop,Hive,Spark,Компонент Ranger включает функциональность Kerberos.,каждыйкомпонентыизвключать В принципе операция та же。Вниз Лицом к лицувключатьHadoop Kerberos Давайте возьмем эту функцию в качестве примера, чтобы познакомить вас с EasyMR. Конкретно как развернуть Hadoop Безопасный.

Подготовить упаковку продукта

Установить пакеты продуктов

● Установите Zookeeper, openldap, kdc, службы Hadoop.

На примере установки службы Hadoop выберите службу, которую необходимо установить, и нажмите «Далее»;

Укажите узел, на котором необходимо развернуть каждую службу, и нажмите, чтобы выполнить развертывание;

После завершения развертывания вы можете проверить права доступа к каталогу и пользователю, запускающему компонент на узле.

Включите безопасность Kerberos

После развертывания службы необходимо по порядку открыть Kerberos.

● переключатель зоопарка

Сначала на странице услуги выберите услуги смотрителя зоопарка,Находится в конфигурации развертывания Switch Переключите элемент, переключите состояние переключателя и дождитесь результата включения переключателя.

● Переключатель Hadoop.

На странице «Услуги» выберите hadoop pkg Служба, найденная в конфигурации развертывания Switch Переключите элемент, переключите состояние переключателя, дождитесь включения переключателя. После успешного включения переключателя Hadoop. Kerberos Функция успешно включена.

Авторизация приложения

Авторизация обычно определяется приложением. Настраивая некоторые атрибуты в базе данных LDAP, приложение может принимать решения об авторизации. После того, как EasyMR развернет LdapServer, управление платформой автоматически свяжет информацию о соединении LdapServer. Пользователям нужно только выбрать соответствующее соединение LdapServer и щелкнуть мышью, чтобы загрузить билет под соответствующим пользователем.

Адрес для скачивания «Белой книги по отраслевой практике управления данными»:https://fs80.cn/380a4b

Друзья, которые хотят узнать или получить дополнительную информацию о продуктах Kangaroo Cloud для работы с большими данными, отраслевых решениях и историях клиентов, посетите официальный сайт Kangaroo Cloud:https://www.dtstack.com/?src=sztxkfz

Адрес проекта:https://github.com/DTStack

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose