Ноутбук NotebookLM с искусственным интеллектом производства Google, персонализированный продукт искусственного интеллекта на основе RAG
Ноутбук NotebookLM с искусственным интеллектом производства Google, персонализированный продукт искусственного интеллекта на основе RAG

Google запустил экспериментальный продукт NotebookLM — персонализированный продукт-помощник с искусственным интеллектом на основе RAG. На основе достоверной информации, предоставленной пользователями через RAG, он помогает пользователям получить представление о справочном контенте и изучить его, а затем использует искусственный интеллект для организации заметок и их преобразования. в то, что в конечном итоге нужно пользователям. Конечная цель вашего плана, блога, бизнес-плана и т. д.

В предыдущем блоге,упомянутый в то время:"Границы поисковых продуктов ИИ ни в коем случае не ограничиваются поиском. Сверху вниз, как лучше понять реальные потребности пользователей, и вплоть до того, как решать сложные проблемы с помощью комбинации агентов, чтобы предоставить пользователям сквозную информацию. заканчивать персонализированными решениями."。googleВот этотNotebookLM Это также больше соответствует этой идее. Он предоставляет персонализированный помощник по ведению заметок на основе информации, предоставленной пользователем, в сочетании с технологией поиска. Однако в целом он сдержан и подчеркивает надежность, то есть следует за информацией. предоставляется пользователем и не объединяет его с преимуществами поиска Google.

Теперь приступим к делу. Давайте познакомимся с функциями NotebookLM и попробуем.

Официальное введение

NoteboolLM
NoteboolLM

Официальное введениеда,NotebookLM да一个基于Информация о доверии пользователя(也就да用户自己提供из文档)изперсонализация(私人из)ИИпомощник。

В настоящее время NotebookLM предоставляет услуги только в США, и для этого требуется волшебство.

Функции

  • виртуальный научный сотрудник: Пользователи могут загружать документы, связанные с проектом NotebookLM. 会立即成为这些信息из专家。说人话就да,NotebookLMРазберу документ,Разделить на куски,Это понимает содержание документа.
виртуальный научный сотрудник
виртуальный научный сотрудник
  • Помогите пользователям получить представление об информации (Go from information to insight) NotebookLM Предлагая новый мощный интерфейс, который позволяет пользователям легко переходить от чтения к вопросам и написанию, AI Помощники всегда готовы помочь на каждом этапе пути. Загрузить документыназад,Пользователи могут задавать вопросы в поле вопросов.,NotebookLMпроходитьRAGспособность отвечать,И можете просмотреть содержимое справочного документа.
Помогите пользователям получить представление об информации
Помогите пользователям получить представление об информации

Если контент, на который отвечает машина, одобрен пользователем,Пользователи могут отвечать наСохранить в заметки,Итак, представьте себе совместную модель,То есть пользователь сначала загружает справочный документ для изучения.,然назадТолько то, на что вы обращаете внимание(其实就да整理大纲)Задать вопрос,Наконец, сохраните эти ответы в заметках.

Сохранить в заметки
Сохранить в заметки

Задав все волнующие вас вопросы, вы получите много полезных и ценных заметок. На основе этих фрагментов вы можете:

  • Быстрый проектсодержание,Выберите упорядоченные заметки (сохраненные выше).,NotebookLM Это может помочь пользователям быстро преобразовать его в схемы, сообщения в блогах, бизнес-планы и т. д.
Быстро составляйте контент
Быстро составляйте контент

Заявление о конфиденциальности

Google подчеркивает, что личные данные пользователей не будут использоваться для обучения NotebookLM, поэтому любая личная или конфиденциальная информация останется конфиденциальной, если только пользователь не решит поделиться ресурсами с соавторами.

Оценка отрасли

  • Тьяго Форте (автор книги «Создание второго мозга») называет NotebookLM «лучшим программным обеспечением, когда-либо созданным для использования искусственного интеллекта в творческой работе».

Опыт работы с ноутбукомLM

После просмотра Официального введения давайте начнем с него.

Создать новый блокнот

Сначала создайте новый блокнот и измените имя на «Искусственный интеллект и поисковая система».

Создать новый блокнот
Создать новый блокнот

Загрузить справочные документы

Здесь мы загружаем PDF-файл Ван Шусена «Технологии поисковых систем» в качестве справочного документа.

Вы можете напрямую загружать PDF-файлы или текстовые файлы, выбирать их из Google Cloud Drive или напрямую копировать текст.

Загрузить документы
Загрузить документы

Знакомство с документацией

Давайте начнем задавать вопросы. Нам нужно разобраться в поисковых системах и искусственном интеллекте. Давайте начнем задавать вопросы:

Вопрос: Каков принцип работы поисковой системы?

поисковая системаиз原理
поисковая системаиз原理

Видно, что NotebookLM относительно хорошо реагирует на ссылки поисковых систем, включая такую ​​информацию, как трехуровневые воронки.

Нажмите на цитату, чтобы просмотреть исходный текст.

Цитата Посмотреть исходный текст
Цитата Посмотреть исходный текст

Теперь, когда мы понимаем основные связи, давайте посмотрим, какую технологию использует каждая деталь.

Вопрос: Конкретные методы обработки запросов в поисковых системах.

поисковая системасерединаQuery Обработка специфическими методами обработки
поисковая системасерединаQuery Обработка специфическими методами обработки

Ответы нестабильны, отвечайте только на английском, но контент по-прежнему надежен.

Далее поинтересуемся техническим решением отзыва.

Вопрос: Какие решения для поиска обычно используются в поисковых системах и какие технологии искусственного интеллекта? Пожалуйста, ответьте на китайском языке.

Попробуйте здесь и добавьте инструкции по ответу на китайском языке.

поисковая Отзыв системы (Поисковая) часть
поисковая Отзыв системы (Поисковая) часть

Ответ был довольно хороший, и он предложил три решения отзыва и использованные технологии. Мы сохранили их и продолжили задавать вопросы.

Вопрос: Подробное введение в трехуровневую воронку ранжирования в поисковых системах и принятую модельную схему. Ответ на китайском языке.

Сортировка поиска
Сортировка поиска

Трехуровневую воронку представили, но ответ на типовое решение был так себе.

Быстрый проектсодержание

Презентация вопросов и ответов подошла к концу, и мы приступили к систематизации заметок, сохраненных после приведенных выше вопросов. Обратите внимание, что вы можете добавлять сюда заметки самостоятельно и записывать свои мысли в любое время.

С помощью приведенных выше вопросов мы сохранили 4 заметки и выбрали:

Выбрать заметку
Выбрать заметку

можно увидеть,Система даетПодвести итогСоздайте схемуОбъединить в заметкии другие функции,Давайте попробуемСоздать учебное пособие

учебное пособие
учебное пособие

Система формирует учебное пособие, включающее в себя контроль качества, отзыв, сортировку и т. д.

Давайте попробуем другие и выберем эти четыре:

Вопрос: Создайте блог на основе этого содержимого, выведите его в уценке и ответьте на китайском языке.

Смотрите готовый продукт ниже

Язык кода:javascript
копировать
## поисковая Как работает система

Пользователь вводит запрос в поле поиска, поисковая система возвращает несколько документов и представляет их пользователю по порядку. С момента нажатия пользователем кнопки поиска до просмотра окончательных результатов поиска проходит около сотен миллисекунд. В этот период поисковая система выполнила множество вычислений, и мы называем эту серию шагов расчета «поисковая». системасвязь”。поисковая Системная связь обычно имеет трехуровневую структуру воронки: прослушивание отзыва, грубый отбор и точный отбор.

**поисковая Системная ссылка в основном состоит из трех основных этапов: **

1. **Обработка текста запроса (Query Processing)**
    
    - **Сегментация слов.** Разделите слово запроса на несколько слов, например разделите слова «рекомендация по зимней толстовке» на слова «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
    - **Вес слова:** вычисление важности каждого слова в слове запроса, используемом для стратегии потери слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
    - **Переписывание слова запроса.** Создавайте другие выражения с тем же семантическим значением, что и исходное слово запроса, например переписывая «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
    - **Идентификация намерения.** Определите цель запроса пользователя, например, хочет ли пользователь найти близлежащие рестораны или узнать об определенном новостном событии. Сюда входит чувствительность ко времени, которая проверяет, предпочитает ли пользователь новый контент (например, «последние новости»), и региональное намерение, которое учитывает местоположение пользователя и географическую значимость документа (например, «рестораны рядом со мной»).
2. **Извлечение**
    
    - **Воспоминание текста:** Это самый основной и важный канал воспоминания. При вызове текста в основном используется инвертированный индекс, структура данных, которая записывает «слово → список документов, содержащих это слово». Учитывая термин запроса, система сначала сегментирует его на слова, а затем использует инвертированный индекс для поиска документов, содержащих эти слова. Чтобы улучшить скорость запоминания, производится расширение синонимов, например, «зима» расширяется до «зима». Кроме того, при вызове текста также необходимо учитывать расстояние между словами, а также вес слов, чтобы исключить нерелевантные документы.
    - **Векторный отзыв:** Это важная схема отзыва, появившаяся в последние годы. Она преодолевает ограничения отзыва текста и может вызывать документы, которые семантически связаны, но не соответствуют тексту. Суть векторного вызова заключается в представлении слов запроса и документов в виде векторов соответственно, а затем вычислении сходства между векторами. Система предварительно вычисляет векторные представления всех документов и использует технологию индексации приближенного ближайшего соседа (ANN) для ускорения процесса поиска. Векторное запоминание можно разделить на корреляционное запоминание и персонализированное запоминание. Разница между ними заключается в разных целях обучения. Модель. Первое соответствует показателю корреляции, а второе — поведению пользователя.
    - **Отзыв офлайн:** Это решение использует простаивающие вычислительные ресурсы для получения высококачественного индекса «слова запроса → список документов» в автономном режиме для онлайн-воспоминания. Существует множество методов офлайн-запоминания, таких как: анализ журналов воздействия, использование документов с высоким рейтингом и высоким рейтингом кликов на страницах результатов онлайн-поиска для создания индексов, выполнение поисковых ссылок в автономном режиме, вызов и сортировка большого количества терминов запроса; и сортировка. Результаты сохраняются в виде индексов; используйте модель NLP, например doc2query, для поиска терминов запроса, тесно связанных с документом в автономном режиме, и создания индекса.
3. **Сортировать (Ranking)**
    
    - **Вспомнить прослушивание:** Быстро извлекайте десятки тысяч документов из сотен миллионов библиотек документов, используйте простые правила и правила для оценки документов и выбирайте тысячи документов с наивысшими оценками для перехода на следующий уровень сортировки. Чтобы контролировать объем вычислений, при напоминании о релевантности прослушиваний обычно используются башни-близнецы для сопоставления слов запроса и документов с векторным пространством соответственно и расчета векторного сходства. Модель рейтинга кликов также использует структуру с двумя башнями, которая использует характеристики пользователя, характеристики слова запроса и характеристики документа для оценки вероятности клика пользователя. Прослушивание припоминаний может проводиться с использованием правил или простого линейного слияния оценок корреляции и других характеристик или без модели слияния.
    - **Грубый ряд:** Выберите сотни документов из тысяч документов, полученных в ходе повторного прослушивания, в качестве набора кандидатов для получения высокого рейтинга. При грубом скрининге используется немного больший размер модели, чтобы более точно оценить релевантность документа условиям запроса и оценить вероятность клика пользователя, чем при повторном прослушивании. На грубом этапе ранжирования можно использовать глубокую нейронную сеть (DNN) или модель BERT для расчета показателя релевантности, а также модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT для объединения релевантности, рейтинга кликов и других функций для получения окончательного балла.
    - **Тонкий ряд:** Fine Ranking использует глубокие нейронные сети для оценки сотен документов, сортировки их по степени слияния и, наконец, отображения на странице результатов поиска. Модель, используемая для точного ранжирования, является самой крупной. Вы можете использовать модель BERT для расчета корреляции и модель DNN для оценки рейтинга кликов. Модель Fusion обычно использует модель GBDT, которая объединяет несколько показателей, таких как релевантность, рейтинг кликов, качество контента, своевременность, региональность, персонализация и т. д., чтобы в конечном итоге определить рейтинг документов.

**Технология искусственного интеллекта находится в поиске Применение в программе отзыва системы: **

- **Причастие:** Разделите слово запроса на несколько слов, например разделите «рекомендация по зимней толстовке» на «зима», «толстовка» и «рекомендуется». Методы глубокого обучения, такие как BERT, показали хорошие результаты в задачах сегментации слов.
- **Вес слова:** Рассчитайте важность каждого слова в запросе для использования в стратегии удаления слов при вызове текста. Вес слов можно определить с помощью аннотации вручную или с помощью машинного обучения. Модель.
- **Слово запроса переписано:** Создайте другие выражения, имеющие ту же семантику, что и исходный термин запроса, например, замените «побочные эффекты» на «побочные реакции». Переписывание слов запроса может быть основано на правилах, списках синонимов, списках гипонимии или может быть создано с использованием модели глубокого обучения.
- **Модель семантического соответствия:** При вызове векторов слова запроса и документы встраиваются в векторное пространство и вычисляется сходство векторов. Обычно используемые модели включают модель башен-близнецов, BERT и т. д.
- **Приблизительный поиск ближайшего соседа (ANN):** Он используется для вызова векторов, чтобы быстро найти документы, наиболее похожие на представление вектора слова запроса в крупномасштабных библиотеках документов.

Совместное использование решений множественного отзыва и технологии ИИ может улучшить поисковую Отзыв системы Ставка,Представляйте пользователям более актуальные документы.

Следует отметить, что,Предоставленная информация не детализирует конкретный Модельный план для каждого этапа трехуровневой воронки.,Например, используемая структура модели BERT, количество слоев и функций активации модели DNN, количество и глубина деревьев модели GBDT и другая информация. Если вам нужно знать эти детали,Возможно, потребуется обратиться к другим источникам. Готовый продукт:

Обзоры ноутбуковLM

преимущество:

  • Хорошее дизайнерское решение продукта,Может записывать спорадические мысли фрагментами.,Организуйте и усовершенствуйте контент для спорадических мыслей с помощью RAG.,Наконец, обобщите содержание спорадического мышления и выведите его.,Помогите пользователям достичьКомплексное приложение

Оптимизированные направления:

  • Если посмотреть на этот фрагмент, то можно увидеть, что он по-прежнему фрагментирован в соответствии с длиной текста, и никакой семантически структурированной фрагментации не происходит.
  • Поддерживает импорт веб-страниц и заметок.
  • Добавьте переключатель веб-поиска, чтобы установить область поиска, например Википедию.
  • поддержание языка
  • Сгенерированный контент пока не поддерживает модификацию.
  • Представляем больше многорежимных возможностей,Входной разъем поддерживает многорежимный вход,Выход поддерживает многорежимный вывод персонализации.

Подвести итог

NotebookLM 给了我们一个很好изLLM时代изpersonalized AI Пример продукта: хороший посадочный продукт RAG. Во многих случаях способность остается способностью благодаря интерактивным инновациям. best software ever created for leveraging AI in your creative work"。

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose