Однако многие друзья не совсем понимают взаимосвязь и технические принципы векторных баз данных и RAG. Эта статья даст вам глубокое понимание новой векторной базы данных в эпоху RAG.
01.
Широкий спектр применения RAG и его уникальные преимущества
Типичную структуру RAG можно разделить на две части: извлекатель и генератор. Процесс извлечения включает в себя сегментацию данных (например, документы), встраивание векторов (вложение) и построение индексов (векторы фрагментов), а затем соответствующие результаты вызываются посредством векторного поиска. , а процесс генерации использует расширенный запрос на основе результатов поиска (Контекст) для активации LLM для генерации ответов (Результат).
https://arxiv.org/pdf/2402.19473
Ключом к технологии RAG является то, что она сочетает в себе лучшее из обоих подходов:Поисксистема Могу предоставить конкретные、Связанныйизфактиданные,Генерирующая модель обеспечивает гибкое построение ответов.,и интегрироваться в более широкоеизконтекстиинформация。Эта комбинация делает RAG Модели очень эффективны при обработке сложных запросов и генерировании информативных ответов, что делает их полезными в вопросно-ответных системах, диалоговых системах и других приложениях, требующих понимания и генерации естественного языка. По сравнению с оригинальной большой моделью, с RAG Могут формировать естественные дополнительные преимущества:
Хотя передовые исследования крупномасштабных моделей также направлены на решение вышеупомянутых проблем, таких как точная настройка на основе частных данных и улучшение возможностей обработки длинных текстов самой модели, эти исследования помогают способствовать развитию крупномасштабных моделей. Технология масштабных моделей. Однако в более общих сценариях RAG по-прежнему остается стабильным, надежным и экономически эффективным выбором, главным образом потому, что RAG имеет следующие преимущества:
Поэтому, на мой взгляд, по мере углубления исследований крупномасштабных моделей технология RAG не будет заменена, а наоборот, сохранит важную позицию еще долгое время. В основном это связано с его естественной взаимодополняемостью с LLM, что позволяет приложениям, созданным на основе RAG, проявить себя во многих областях. Ключом к улучшению RAG является с одной стороны улучшение возможностей LLM, а с другой стороны оно опирается на различные улучшения и оптимизации поиска (Retrival).
02.
Основа для поиска RAG: векторные базы данных
В отраслевой практике поиск RAG обычно тесно интегрирован с векторными базами данных, что также привело к появлению решения RAG на основе ChatGPT + Vector Database + Prompt, называемого стеком технологий CVP. Это решение использует базы данных векторов для эффективного извлечения соответствующей информации для улучшения больших языковых моделей (LLM). Преобразуя запросы, сгенерированные LLM, в векторы, система RAG может быстро находить соответствующие записи знаний в базе данных векторов. Этот механизм поиска позволяет LLM использовать новейшую информацию, хранящуюся в базе данных векторов, при возникновении конкретных проблем, эффективно решая проблемы задержки обновления знаний и иллюзий, присущих LLM.
Хотя в области поиска информации существует множество технологий хранения и поиска, включая поисковые системы, реляционные базы данных, базы данных документов и т. д., векторные базы данных стали первым выбором в отрасли в сценариях RAG. За этим выбором стоит превосходная способность векторных баз данных эффективно хранить и извлекать большое количество встроенных векторов. Эти векторы внедрения генерируются моделями машинного обучения и способны не только характеризовать несколько типов данных, таких как текст и изображения, но также собирать их глубокую семантическую информацию. В системе RAG поисковой задачей является быстрый и точный поиск информации, наиболее соответствующей семантике входного запроса, а векторные базы данных выделяются существенными преимуществами при обработке многомерных векторных данных и выполнении быстрого поиска по сходству.
Ниже приводится горизонтальное сравнение векторных баз данных, представленных поиском векторов, с другими техническими вариантами, а также анализ ключевых факторов, которые делают их основным выбором в сценариях RAG:
первый вПринцип реализацииаспект,Вектор – это Модель, кодирующая форму семантического значения.,Библиотека векторных данных позволяет лучше понять семантический контент запроса.,Потому что они используют возможности глубокого обучения для кодирования текстовых значений.,Не только соответствие ключевых слов. извлечь выгоду из AI В ходе разработки модели семантическая точность также постоянно улучшается. Благодаря использованию сходства векторов на расстоянии для представления семантического сходства она превратилась в. NLP Основная форма, такая идеографичная embedding Он стал первым выбором для обработки носителей информации.
Во-вторых вЭффективность поискааспект,Поскольку информацию можно представить в виде многомерного вектора,Добавлен специальный метод оптимизации индекса и метода квантования для векторов.,Может значительно улучшить эффективность поиск и сокращение затрат на хранение, поскольку по мере роста объема данных библиотеку векторных данных можно расширять по горизонтали, сохраняя при этом время отклика запроса, необходимое для обработки огромных объемов данных. RAG Системы имеют решающее значение, поэтому векторные базы данных лучше справляются с обработкой чрезвычайно крупных неструктурированных данных.
Что касаетсяспособность к обобщениюэто измерение,Большинство традиционных поисковых систем, реляционных библиотек или библиотек документов могут обрабатывать только текст.,Плохая способность обобщать и расширять,Библиотека векторных данных не ограничивается текстовыми данными.,Он также может обрабатывать изображения, аудио и другие неструктурированные типы данных из встроенных векторов.,Это делает RAG Системы могут быть более гибкими и универсальными.
последний вобщая стоимость владенияначальство,По сравнению с другими вариантами,Библиотека векторных данных из развертывания более удобна и проста в использовании.,Это также обеспечивает богатство API, упрощающий интеграцию с существующими платформами и рабочими процессами машинного обучения, что делает его популярным среди многих. RAG Его любят разработчики приложений.
Векторный поиск стал идеальным средством извлечения RAG в эпоху больших моделей благодаря своей способности к семантическому пониманию, высокой эффективности поиска и поддержке обобщения для мультимодальностей. С дальнейшим развитием искусственного интеллекта и моделей внедрения эти преимущества могут стать более заметными. в будущем.
03.
Требования к векторным базам данных в сценариях RAG
Хотя векторные базы данных стали важным способом поиска, с развитием приложений RAG и спросом людей на высококачественные ответы поисковые механизмы по-прежнему сталкиваются со многими проблемами. Здесь мы возьмем в качестве примера самый простой процесс построения RAG: в состав поисковика входит предварительная обработка корпуса, такая как сегментация, очистка данных, внедрение и т. д., затем построение и управление индексами и, наконец, поиск похожих элементов с помощью векторного поиска. предоставлено для запроса на расширенную генерацию. Функции большинства векторных баз данных сосредоточены только на управлении построением индексов и поисковых вычислениях и дополнительно включают функции внедрения моделей.
Но в более сложных сценариях RAG, поскольку качество отзыва напрямую влияет на качество вывода и релевантность сгенерированной модели, векторная база данных как основа средства извлечения должна нести большую ответственность за качество поиска. Чтобы улучшить качество поиска, здесь на самом деле существует множество методов инженерной оптимизации, таких как выбор chunk_size, нужно ли перекрытие для сегментации, как выбрать модель внедрения, нужны ли дополнительные теги контента, добавлять ли лексически основанные поиск для гибридного поиска и т. д. Выбор сортировки, переранжирования и т. д. Многие из этих задач могут быть учтены в векторной базе данных. Требования к поисковой системе векторных баз данных можно абстрактно описать так:
Сценарий RAG предъявляет строгие требования к эффекту отзыва векторной базы данных. Он не только требует базовых возможностей, таких как высокоточный и быстрый отклик, но также требует способности обрабатывать мультимодальные данные и более продвинутых возможностей, таких как интерпретируемость. и возможности отладки, гарантирующие, что генеративные модели выдают точные и релевантные результаты на основе высококачественных результатов отзыва. С точки зрения мультимодальной обработки, интерпретируемости поиска и возможности отладки векторным базам данных еще предстоит многое изучить и оптимизировать, и разработчикам приложений RAG также срочно необходимо комплексное решение для достижения высококачественных результатов поиска.