Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
image.png
image.png

1. Прошлая и настоящая жизнь DeepSeek

1.1 Что такое Дип Сик?

DeepSeek — компания, занимающаяся исследованиями и разработками технологий искусственного интеллекта и стремящаяся создавать высокопроизводительные и недорогие модели искусственного интеллекта. Его цель — сделать технологию искусственного интеллекта более инклюзивной и дать возможность большему количеству людей использовать мощные инструменты искусственного интеллекта.

1.2 Рождение DeepSeek-V3

DeepSeek-V3 — это модель искусственного интеллекта последнего поколения, выпущенная DeepSeek. Его предшественником является DeepSeek-V2.5. После постоянной оптимизации и обновлений версия V3 добилась качественного скачка в производительности, скорости и стоимости. Запуск DeepSeek-V3 означает, что отечественные модели искусственного интеллекта технически способны конкурировать с ведущими международными моделями (такими как GPT-4o).

1.3 Почему важен DeepSeek-V3?

  • локализация:DeepSeek-V3 Разработано независимо в Китае. AI Модель, разрушающая монополию иностранных технологий и предоставляющая больше выбора отечественным предприятиям и разработчикам.
  • Дух открытого исходного кода:DeepSeek-V3 Он не только открывает исходный код весов моделей, но также обеспечивает поддержку локального развертывания, что позволяет разработчикам свободно настраивать и оптимизировать модели.
  • Инклюзивный ИИ:DeepSeek-V3 Цена очень доступная, по сравнению с зарубежными моделями, такими как GPT-4o), который дешевле в использовании и подходит для малых и средних предприятий и индивидуальных разработчиков.

2. Основные преимущества DeepSeek-V3

2.1 Высокая производительность

DeepSeek-V3 имеет 671 миллиард параметров (671B). Хотя активировано только 37 миллиардов параметров (37B), его производительность очень близка к лучшим международным моделям. DeepSeek-V3 продемонстрировал сильные возможности в области знаний, вопросов и ответов, обработки длинных текстов, генерации кода, математических возможностей и т. д.

  • Пустяки:существовать MMLU、GPQA В интеллектуальных задачах, таких как DeepSeek-V3. производительность близка к Клод-3,5-Сонет-1022 (международная топ-модель).
  • Обработка длинного текста:существовать DROP、LongBench v2 При оценке текста одинаковой длины DeepSeek-V3 Средняя производительность превосходит другие модели.
  • генерация кода:существовать算法类代码场景(нравиться Кодфорс),DeepSeek-V3 Намного опережая другие модели с открытым исходным кодом.
  • Математические способности:существовать美国数学竞赛(AIME 2024) и Китайская математическая лига средних школ (CNMO 2024)середина,DeepSeek-V3 Превосходит все модели с открытым и закрытым исходным кодом.

2.2 Высокая скорость генерации

Скорость генерации DeepSeek-V3 была увеличена с 20 TPS (генерация 20 токенов в секунду) предыдущего поколения до 60 TPS, увеличение скорости в 3 раза. Это означает, что пользователи могут получить более плавный интерактивный опыт при использовании DeepSeek-V3.

2.3 Доступная цена

API-сервис DeepSeek-V3 очень доступен:

  • Введите токены:за миллион tokens Просто нужно 0.5 мета(попадание в кэш) или 2 мета (промах в кеше).
  • Выходные токены:за миллион tokens Просто нужно 8 Юань.

Для сравнения, GPT-4o намного дороже (возможно, десятки долларов за миллион токенов). Низкая стоимость DeepSeek-V3 делает его доступным для большего числа малых и средних предприятий и индивидуальных разработчиков.

2.4 Открытый исходный код и локальное развертывание

DeepSeek-V3 не только раскрывает вес модели, но и поддерживает локальное развертывание. Разработчики могут настраивать и оптимизировать модель в соответствии со своими потребностями и даже развертывать ее на своих серверах, предоставляя им полный контроль над конфиденциальностью данных.


3. Сравнение DeepSeek-V3 и GPT-4o

3.1 Сравнение производительности

  • Пустяки:DeepSeek-V3 По задачам знаний производительность близка к ГПТ-4о, особенно в китайских Пустяках (типа C-SimpleQA) работает лучше.
  • Обработка длинного текста:DeepSeek-V3 Превышает среднюю производительность при измерении длинного текста GPT-4o。
  • генерация кода:DeepSeek-V3 Лидерство в сценариях алгоритмического кода GPT-4o, но немного уступает в сценариях инженерного кода.
  • Математические способности:DeepSeek-V3 Отличные результаты в математических соревнованиях GPT-4o。

3.2 Скорость генерации

  • DeepSeek-V3:60 TPS, скорость предыдущего поколения 3 раз.
  • GPT-4o:Скорость Генерация не разглашается, но ожидается, что она будет исчисляться десятками TPS уровень.

3.3 Сравнение цен

  • DeepSeek-V3:за миллион Введите токены 0.5 мета(попадание в кэш)/ 2 Долларов (промахов в кэше) на миллион Выходные токены 8 Юань.
  • GPT-4o:за миллион tokens Это может стоить десятки долларов.

3.4 Открытый и закрытый исходный код

  • DeepSeek-V3:Модель с открытым исходным кодом,Поддержка локального развертывания,Разработчики могут свободно настраивать его.
  • GPT-4o:модель с закрытым исходным кодом,Пользователи могут только пройти API Вызвано, локальное развертывание и настройка не могут быть выполнены.

4. Потенциал DeepSeek-V3

4.1 Рост отечественного ИИ

Запуск DeepSeek-V3 означает, что отечественные модели искусственного интеллекта технически способны конкурировать с ведущими международными моделями. Его успех не только повышает уверенность отечественных технологий искусственного интеллекта, но и открывает больше возможностей для отечественных предприятий и разработчиков.

4.2 Сторонники инклюзивного ИИ

Низкая стоимость DeepSeek-V3 и открытый исходный код делают его инструментом для внедрения инклюзивного ИИ. Как малые и средние предприятия, так и отдельные разработчики могут воспользоваться мощными возможностями искусственного интеллекта по низкой цене.

4.3 Будущее направление развития

  • Мультимодальная поддержка:DeepSeek Планы на будущее V3 В модель добавлены мультимодальные функции (такие как обработка изображений и звука) для дальнейшего повышения практичности модели.
  • Способность глубокого мышления:DeepSeek Возможности рассуждения и мышления модели будут продолжать оптимизироваться, чтобы она могла решать более сложные задачи.
  • Общественное здание:Поддерживается открытым исходным кодом и сообществом,DeepSeek Надеюсь на сотрудничество с глобальными разработчиками для продвижения AI Развитие технологий.

5. Резюме

DeepSeek-V3 — это отечественная модель искусственного интеллекта с высокой производительностью, доступной ценой и поддержкой с открытым исходным кодом. Он продемонстрировал возможности, сравнимые с ведущими международными моделями (такими как GPT-4o) с точки зрения вопросов и ответов, обработки длинных текстов, генерации кода и математических возможностей. В то же время его низкая стоимость и открытый исходный код делают его образцом для инклюзивного ИИ.

Ожидается, что в будущем, благодаря постоянной оптимизации и расширению функций DeepSeek-V3, он сыграет важную роль в большем количестве областей и станет эталоном отечественных технологий искусственного интеллекта. Как предприятия, так и отдельные разработчики могут пользоваться высокопроизводительными и недорогими услугами искусственного интеллекта с помощью DeepSeek-V3.


Справочная ссылка

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose