[Третья годовщина ES] Заметки новичка о начале работы с Elasticsearch
[Третья годовщина ES] Заметки новичка о начале работы с Elasticsearch

до этого,Я действительно не понимаюElasticsearch,Я тоже случайно наткнулся на это, читая статью.Elasticsearchслово,Но не вникал в это,Просто зная, что такое существует,Его можно использовать для поиска,Давайте выясним это сегодня на мероприятии, посвященном третьей годовщине ES.

Кто такой Elasticsearch?

Если вы ничего не знаете об Elasticsearch, первый шаг — зайти в Baidu!

результат:

Tencent Cloud Elasticsearch Service (ES) — это высокодоступный, масштабируемый, полностью управляемый облачный сервис Elasticsearch, основанный на поисковой системе с открытым исходным кодом Elasticsearch. Он включает в себя Kibana и распространенные плагины, а также интегрирует расширенные функции, такие как безопасность, SQL и машинное обучение. , сигнализации и мониторинг (X-Pack).

Но результат был неудовлетворительный. Если я это сказал, то я этого не сказал, или я не знал, что я сказал! Ты так же сбит с толку, как и я, ха-ха! Что такое высокая доступность? Что такое масштабируемый? трава

Когда я сталкиваюсь с чем-то слишком официальным, я обычно продолжаю искать, есть ли какой-нибудь народный текст. Если его нет, я проверяю понимание других друзей, а затем сам суммирую его.

ВотВысокая доступностьФактически речь идет оElasticsearch ServiceПредоставили нам несколько вариантов развертывания,Он может защитить от сбоев, вызванных какими-либо факторами, без остановки службы.,COS Стратегия резервного копирования данных позволяет регулярно создавать резервные копии данных, чтобы обеспечить быстрое восстановление в случае потери данных из-за непредвиденных обстоятельств. Кроме того, существуют такие стратегии, как оптимизация ядра для обеспечения стабильности кластера, которая может всесторонне обеспечить безопасность данных и стабильность обслуживания.

иМасштабируемыйотносится кElasticsearch ServiceПредоставляет различные типы спецификаций узлов.иносители данных,Мы можем выбрать в соответствии с бизнес-потребностями компании.,По мере развития бизнеса,Можно динамически настраивать конфигурацию кластера для расширения или сжатия.,Обеспечение потребностей развития бизнеса в режиме реального времени,и эффективно контролировать расходы.

Подводя итог примерно:

Elaticsearch,сокращенно ES,ES — распределенная полнотекстовая поисковая система.,Он может не только хранить данные в режиме реального времени,Данные также можно получить,Его масштабируемость очень хорошая,Это то, что было упомянуто ранееМасштабируемый,Может быть расширен до сотен серверов,Обработка петабайт данных. ES также разработан на Java и использует Lucene в качестве ядра для реализации всех функций индексирования.,на самом делеElaticsearchНижний слой по-прежнемуLucene,Грубо говоряElaticsearchПросто тамLuceneТам оболочка снаружи,Давайте избежим некоторых утомительных операций,Это облегчает начало работы.

Рейтинг Elasticsearch в поисковых системах очень высок. Вы можете нажать на ссылку ниже, чтобы просмотреть его.

Пожалуйста, нажмите: рейтинг в поисковых системах

Происхождение — Лусене

Luceneоснован наjavaязык развитпоисковая Класс библиотеки системы, созданный в 1999 году, в 2005 году стал Apache. Лучшие проекты с открытым исходным кодом,

Lucene обладает преимуществами высокой производительности и простоты расширения.,Но есть ограничения,Например: его можно разработать только на основе языка Java, кривая изучения интерфейса библиотеки классов крутая, а нативная версия не поддерживает горизонтальное расширение.,В это времяElasticsearchрождение Понятно。

рождение

Elasticsearch — это распределенная поисковая система с открытым исходным кодом, созданная на основе Lucene. В 2004 году Шей Бэнон разработал Compass на основе Lucene. В 2010 году Шав Банон переписал Compass и назвал его Elasticsearch, который поддерживает распространение и может расширяться по горизонтали.

Сокращает время обучения полнотекстовому поиску и может вызываться на любом языке программирования. Преимущество Elasticsearch в конкуренции с основной библиотекой Lucene заключается в том, что она идеально инкапсулирует основную библиотеку Lucene и создает дружественный Restful-API. Разработчикам не нужно уделять слишком много внимания базовому механизму, и они могут использовать его прямо из коробки. . Механизмы сегментирования и копирования напрямую решают проблемы производительности и высокой доступности в кластере.

Никакого сравнения, никакого вреда: Elaticsearch VS Solr

Solr является первым, основанным на Lucene Продукты для поисковых систем с полными базовыми библиотечными функциями появились гораздо раньше, чем Эластичный поиск. Если вы просто ищете существующие данные, Solr работает быстрее.

Elaticsearch и solr Всеоснован наLucene,Все они являются инкапсуляцией Lucene. Elaticsearch и solr также являются очень хорошими инструментами.,Просто для разных сценариев,Иметь разные преимущества. Просто выберите хорошее дерево для жизни!

контраст:

  • Elasticsearch работает лучше, чем Solr, в поисковых приложениях в реальном времени, но значительно более эффективен, чем Elasticsearch, при обработке общих поисковых приложений.
  • Elasticsearch поддерживает только формат файлов json, а Solr поддерживает больше форматов данных, таких как JSON, XML и CSV.
  • По мере увеличения объема данных эффективность поиска Solr будет снижаться, в то время как Elasticsearch не имеет явных изменений.

Каковы сценарии использования?

  • поиск

Поиск также очень распространен в повседневной жизни. Службы поиска на месте, основанные на больших объемах данных, такие как поиск продуктов в торговых центрах, магазинах программного обеспечения и поиск внутри предприятий, являются необходимыми способами эффективного получения информации. Elasticsearch Service Он имеет функцию полнотекстового поиска, хорошую поддержку как структурированных, так и неструктурированных данных, а также обеспечивает простой и удобный в использовании RESTful API Клиенты на разных языках помогают пользователям быстро создавать стабильные сервисы поиска и интегрировать их в существующие бизнес-структуры. Одним словом: Используйте везде, где есть поиск!

Большое количество компаний в Китае сейчас используют Elasticsearch, например Didi, Toutiao, Ele.me, 360 Security и другие известные компании. Помимо поиска, его можно комбинировать с Kibana, Logstash, Beats и Elastic Stack для использования в платформе анализа больших данных в реальном времени для анализа некоторых журналов, мониторинга индикаторов и других полей.

  • Управление журналами и анализ

Серверы веб-сайтов, мобильные устройства, Интернет вещей Журналы, созданные датчиками и другим оборудованием, имеют такие проблемы, как рассредоточенность узлов, разнообразие типов и большие масштабы. Это создает большие проблемы для работы, такие как ненормальное обнаружение проблем и бизнес-анализ с помощью журналов. Тенсент Облако Elasticsearch Service поставлять Понятно Эластичный и масштабируемый、Централизованное решение для хранения данных, работающее в квазиреальном времени,и функция полнотекстового поиска,Удобное унифицированное управление и запрос логов,Помогите пользователям быстро обнаружить и обнаружить проблемы,Повышайте эффективность решения проблем.

ES широко используется. Например, Wikipedia, Github, Sina и т. д. используют ES для реализации поиска.

Начать установку

Перейдите прямо на официальный сайт, чтобы скачатьES:https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.2.zip

После распаковки вы получите следующий каталог:

имя каталога

главная роль

bin

Каталог bin содержит некоторые команды запуска, то есть сценарии. Какие команды используются в Windows, а какие — в Linux?

config

config хранит файл конфигурации ES-сервера.

lib

Пакет jar файла библиотеки хранится

modules

Вот несколько расширенных модулей

plugins

Плагины по ES можно разместить здесь

После завершения распаковки найдите файл Elasticsearch в каталоге bin и дважды щелкните его. Когда вы увидите, что запуск успешно запущен, порт по умолчанию — 9200;

Некоторые концепции в ES

  • индекс индекс

Индекс — это набор документов с одинаковыми атрибутами. Его также можно рассматривать как набор типов,мыпоиск,При обновлении и удалении,Это имя необходимо использовать. в кластере,Вы можете определить столько координат, сколько захотите.

  • тип тип

В индексе можно определить один или несколько типов. Тип — это логическая классификация/разделение вашего индекса. Семантика полностью зависит от вас. Обычно тип определяется для документов, имеющих общий набор полей. По аналогии с базой данных это эквивалентно таблице

  • полеполе

Оно эквивалентно полю в таблице данных, классифицируя и идентифицируя данные документа по различным атрибутам.

  • документдокумент

Документ представлен в формате JSON, который эквивалентен фрагменту данных в таблице в базе данных.

  • картографирование

Сопоставление — это способ обработки данных, и правила имеют некоторые ограничения.,Например, тип данных поля, значение по умолчанию, анализатор, индексировано ли оно и т. д.,Их можно установить в картографировании.,Для базы данные — это определение структуры таблицы.

  • кластеркластер

Кластер организован одним или несколькими узлами.,Вместе они владеют всеми данными,И вместе обеспечить функцию индексации ипоиска. Кластер идентифицируется уникальным именем.,Имя по умолчанию — «elasticsearch». имя важно,Поскольку узел может указать только имя кластера,Присоединяйтесь к этому кластеру.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose