LLM Technology Panorama: обязательное техническое руководство для технических специалистов. Одна картинка дает вам полный обзор от инфраструктуры до приложений искусственного интеллекта.
LLM Technology Panorama: обязательное техническое руководство для технических специалистов. Одна картинка дает вам полный обзор от инфраструктуры до приложений искусственного интеллекта.

LLM Technology Panorama: обязательное техническое руководство для технических специалистов. Одна картинка дает вам полный обзор от инфраструктуры до приложений искусственного интеллекта.

LLM Карта технологий (LLM Tech Map) – это систематическое и графическое представление технологий, связанных с LLM.,Основными особенностями этой карты являются“Сосредоточьтесь на технической перспективе”,Не требуй послушания LLM Мы собираем информацию с промышленной точки зрения, но надеемся, что люди, которые занимаются соответствующей работой или хотят узнать больше о LLM Технический человек обладает быстрым восприятием.

LLM Карта технологий (LLM Tech Карта) из инфраструктуры, большая модель, Агент, ИИ Программирование, инструменты и платформы, а также вычислительная мощность обобщены для разработчиков. LLM Наиболее популярные и сложные области технологий, а также сопутствующие программные продукты и проекты с открытым исходным кодом.

Основная ценность: помогите техническим специалистам быстро понять основную технологию и ключевые направления LLM.

1. Инфраструктура

LLM Карта технологий (LLM Tech Инфраструктурная часть карты в основном включает в себя следующие аспекты:

  • Векторная база данных:Векторная база данные — это база, специализированная для хранения и извлечения векторных данных. данные, это может быть LLM Обеспечьте эффективные возможности хранения и поиска.
  • база поддержка вектора данных: традиционная база данных обычно не поддерживает хранение и извлечение векторных данных, база данных Поддержка векторов данных может использоваться для традиционных баз данных. data добавляет возможности хранения и поиска векторных данных.
  • Каркас Большой Модели, тонкая настройка (Fine Tuning): разработка для Большой Модели.
  • Тренировочная платформа Big Model с инструментом

1.1 База данных векторов

  • Milvus
  • Pinecone
  • Weaviate
  • Chroma
  • Qdrant
  • Vespa
  • Vald
  • Faiss
  • ScaNN
  • Vearch
  • AquilaDB
  • Marqo
  • LanceDB
  • Annoy
  • NucliaDB
  • DeepLake
  • MongoDB

1.2 Поддержка векторов базы данных

  • pgvector
  • Redis Vector
  • Elastic
  • SingleStoreDB
  • Solr
  • OpenSearch
  • ClickHouse
  • Rockset
  • Cassandra
  • Lucene
  • Neo4j
  • Kinetica
  • Supabase
  • Timescale

1.3 Структура большой модели и точная настройка (Fine Tuning)

  • OneFlow
  • LMFlow
  • LoRA
  • Alpaca-LoRA
  • PEFT
  • ChatGLM-Efficient-Tuning
  • LLaMA-Efficient-Tuning
  • P-tuning v2
  • OpenLLM
  • h2o-llmstudio
  • xTuring
  • finetuner
  • YiVal

1.4 Платформа и инструменты для обучения крупных моделей

  • Pytorch
  • BMtrain
  • colossalAI
  • Tensorflow
  • PaddlePaddle
  • MindSpore
  • Deepspeed
  • XGBoost
  • Transformers
  • Apache MXNet
  • Ray

2. Большая модель

LLM Карта технологий (LLM Tech Большая модельная часть карты в основном включает в себя следующие аспекты:

  • Большая Модель Китая зарегистрирована и онлайн: Большая Модель с лицензией на предоставление услуг,Следует отметить, что большинство названий крупных моделей и соответствующих продуктов различаются.
  • Известная большая Модель: по всему миру,Выпустил ряд известных крупных моделей.,Эти большие Модели добились прорывного прогресса в различных областях.
  • Известный Модельприложение:LLM Он использовался в различных сценариях применения, включая генерацию текста, машинный перевод, ответы на вопросы, рассуждения на естественном языке и т. д.

2.1 Большая модель Китая

  • Вэньсинийян
  • жаворонок
  • GLM
  • Цзидонг Тайчу
  • Байчуань
  • Новое каждый день
  • ABAB большой Модель
  • Генеральная модель ученого
  • Модель Хуньюань Да

2.2 Известные большие модели

  • Llama 2
  • OpenLLaMA
  • Байчуань
  • Модель Тонг И Да
  • Вэньсинийян
  • StableLM
  • MOSS
  • Dolly
  • BLOOM
  • Falcon LLM
  • ChatGLM
  • PaLM 2
  • Пангу
  • GPT-4
  • Stable Diffusion
  • DALL·E 3

2.3 Известные приложения для больших моделей

  • ChatGPT
  • Claude
  • Cursor
  • Mochi Diffusion
  • Midjourey
  • DragGAN
  • Bard
  • Bing

3.AI Agent(LLM Agent)

AI-агент — это вычислительный объект или программа, которая может работать автономно и выполнять определенные задачи. Он способен воспринимать окружающую среду с помощью датчиков, принимать решения на основе полученной информации, а затем предпринимать действия с помощью исполнительных механизмов. Агент LLM — это интеллектуальный агент, созданный на основе технологии LLM. Его можно использовать для различных задач, таких как взаимодействие машин с ChatGPT, послойный анализ информации и автоматическое выполнение задач, таких как виртуальный город, состоящий из роботов.

  • Основные функции
    • Автономность: ИИ Агенты обладают способностью думать и действовать независимо и могут выполнять задачи без прямого руководства человека.
    • Интерактивность: ИИ-агент может взаимодействовать с окружающей средой или другими агентами, что особенно важно в таких сценариях, как игры, диалоговые системы и системы рекомендаций.
    • Цель: AI-агент разработан с четкими целями или намерениями, и его поведение направлено на достижение этих целей.
    • Адаптивность: ИИ-агент может корректировать свое поведение в соответствии с изменениями в окружающей среде, чтобы адаптироваться к новым ситуациям.
    • Эволюция: С развитием технологий ИИ Функции и уровень интеллекта Агента также постоянно совершенствуются.
  • Технические характеристики
    • AI Основное различие между Агентом и Большой Моделью заключается в том, что взаимодействие Большой Модели с людьми основано на подсказках, а ИИ Агенту нужно только поставить цель, и он сможет думать независимо и действовать в соответствии с этой целью.
    • AI Основной движущей силой Агента является большая Модель, и на ее основе добавляются планирование, память и инструмент (Инструмент Используйте) три ключевых компонента.
  • Тип С точки зрения режима работы AI Агентов можно разделить на следующие три типа:
    • Один агент: ориентирован на выполнение одной задачи или серии связанных задач и не требует взаимодействия с другими агентами.
    • Мультиагентность: предполагает сотрудничество и взаимодействие между несколькими агентами для выполнения более сложных задач.
    • Гибридный агент (агент взаимодействия человека и компьютера): объединяет взаимодействие людей и интеллектуальных агентов для более эффективного выполнения задач.
  • Rivet
  • JARVIS
  • MetaGPT
  • AutoGPT
  • BabyAGI
  • NexusGPT
  • Generative Agents
  • Voyager
  • GPTeam
  • GPT Researcher
  • Amazon Bedrock Agents

4. Программирование ИИ

Программирование искусственного интеллекта — это процесс использования языков и технологий компьютерного программирования для создания, обучения и оптимизации алгоритмов искусственного интеллекта. Он охватывает сбор, очистку, преобразование данных, а также выбор и применение алгоритмов. Программирование искусственного интеллекта является ключом к созданию интеллектуальных систем будущего. Имитируя способности человеческого интеллекта, компьютеры могут выполнять решения и задачи, аналогичные людям. Языки программирования, такие как Python, стали распространенным инструментом для программирования ИИ благодаря своим мощным библиотекам обработки данных и лаконичному синтаксису.

  • codeium.vim
  • Cursor
  • GitHub Copilot
  • Comate
  • StableCode
  • CodeGeeX
  • TabbyML
  • CodeArts Snap
  • Code Llama
  • CodeFuse
  • Цзян Зия
  • CodeShell

5. Инструменты и платформы

LLM Карта технологий (LLM Tech Инструменты и платформы Map) в основном включают в себя следующие аспекты:

  • LLMOps: Проще говоря (то, о чем сейчас все говорят),То есть «быстро перейти от большой Модели к приложению».
  • Платформа агрегации Большой Модели: объединяет возможности Большой Модели и предоставляет услуги.
  • Инструмент разработки: Другой инструмент LLM, связанный с разработкой.

5.1 LLMOps

  • BentoML
  • LangChain
  • Dify.ai
  • Semantic Kernel
  • Arize-Phoenix
  • GPTCache
  • Flowise

5.2 Платформа агрегирования крупных моделей (☆)

  • Gitee AI
  • SOTA!Модель
  • Magic ModelScope
  • Hugging Face

5.3 Инструменты разработки

  • v0
  • txtai
  • Jina-AI
  • Deco
  • imgcook
  • Quest AI
  • CodiumAI
  • Codeium Vim
  • Project IDX
  • MakerSuite

6.Вычислительная мощность

Обучение и развертывание моделей LLM требуют больших вычислительных мощностей, а вычислительная мощность является ключевым фактором в развитии технологии LLM.

  • NVIDIA
  • рост
  • AMD
  • Хайгуан
  • Куньлунь ядро
  • Тяньшу Чжисинь
boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose