Как запустить основные языковые модели Llama 2 локально и получить удаленный доступ без общедоступного IP-адреса
Как запустить основные языковые модели Llama 2 локально и получить удаленный доступ без общедоступного IP-адреса
С быстрым ростом популярности ChatGPT и открытой Sora эра больших языковых моделей открыла новую главу в области искусственного интеллекта. Широко используются большие языковые модели, включая чат-роботов, интеллектуальную службу поддержки клиентов, автоматический перевод, помощников по написанию сообщений и т. д. Они могут генерировать соответствующие ответы на основе введенного пользователем текста и предоставлять персонализированные предложения и услуги. В настоящее время большинство продуктов с большими языковыми моделями основаны на Интернете. Если мы хотим развернуть нашу собственную большую языковую модель локально, как работать? Вот большая языковая модель Llama 2, которую можно развернуть и запустить локально.

Llama 2 — это модель большого языка с открытым исходным кодом. Данные обучения достигли уровня 7B. Она хорошо работает в одно- и многораундовых диалогах с длиной контекста 4 КБ. Для развертывания и запуска Llama 2 необходимо использовать платформу. Оллама.

Ollama — это мощная платформа, предназначенная для развертывания больших языковых моделей (LLM) в контейнерах Docker. Его основная функция — упростить процесс развертывания и управления LLM внутри контейнеров Docker. Ollama позволяет пользователям легко запускать большие языковые модели с открытым исходным кодом локально, предоставляя простые инструкции по установке.

Большую языковую модель Llama2 можно легко запустить с помощью фреймворка Ollama. При этом для облегчения взаимодействия с моделью необходимо развернуть интерактивный веб-интерфейс Chatbot-Ollama.

Chatbot-Ollama — это интерфейсное приложение для чат-бота, основанное на платформе Ollama. Он использует интерфейсы и функции, предоставляемые платформой Ollama, для интеграции больших языковых моделей (LLM) в чат-ботов, что позволяет им взаимодействовать с пользователями и предоставлять различные услуги чат-ботов.

Chatbot-Ollama подключен к большой языковой модели Llama2, работающей в локальной среде Ollama, что позволяет нам легко создавать чат-боты локально. Chatbot-Ollama также развертывается локально на основе докера. Локальное развертывание может быть ограничено только локальным доступом и не может быть выполнено. обеспечить удаленный доступ другим, нам также необходимо установить инструмент проникновения в интранет cpolar, чтобы к локальному чат-роботу можно было получить удаленный доступ.

Cpolar — это мощное программное обеспечение для проникновения в интрасеть, которое может бесперебойно работать в нескольких операционных системах, включая Windows, MacOS и Linux. Поэтому независимо от того, какую операционную систему вы используете, вы можете легко проникнуть через HTTP локального сервера интрасети, HTTPS и TCP. порты протоколов сопоставляются с портами адресов общедоступной сети, что позволяет пользователям общедоступной сети легко получать доступ к вашим службам интрасети без развертывания на сервере общедоступной сети.

Ниже мы используем Synology Docker, чтобы продемонстрировать, как объединить представленные выше технологии для запуска локального чат-бота и публикации его в общедоступной сети для доступа. Локальное развертывание требует более высокой конфигурации оборудования. серверное оборудование.

1. Извлеките соответствующий образ Docker.

Для запуска Llama 2 требуется образ Ollama, а для взаимодействия с языковой моделью требуется внешний интерфейс Chatbot-Ollama, поэтому нам нужно получить эти два образа Docker. В этом примере версию Synology невозможно найти и загрузить напрямую. в интерфейсе Docker панели управления Synology, поэтому используйте командную строку для загрузки образа. Сначала откройте ssh-соединение Synology, затем используйте инструменты для подключения к Synology через ssh и выполните следующие команды Docker, чтобы получить их.

* Команда «Вытащить изображение Олламы»

Язык кода:javascript
копировать
sudo docker  pull ollama/ollama:latest

*Потяните команду зеркала Chatbot-Ollama.

Язык кода:javascript
копировать
sudo docker  pull ghcr.io/ivanfioravanti/chatbot-ollama:main

После успешного извлечения мы увидим два извлеченных изображения в интерфейсе Docker. Давайте начнем запускать два изображения. Сначала запустите ollam.

2. Запустите образ Олламы

Выберите изображение, нажмите «Выполнить», чтобы войти в интерфейс конфигурации, имя задавать не нужно, достаточно имени по умолчанию, а затем нажмите «Далее».

Введите порт для внешнего доступа, который соответствует внутреннему порту контейнера. Просто введите 11434 и нажмите «Далее».

Затем нажмите «Готово», чтобы запустить ollama.

После запуска откройте интерфейс контейнера, и вы увидите работающую службу. Затем начните загрузку и запуск модели Llama 2, щелкните, чтобы выбрать контейнер ollamа, и нажмите «Операция».

Затем откройте терминал и войдите в командный интерфейс терминала.

Затем выберите добавить командный интерфейс bash слева.

Затем в командном интерфейсе bash,осуществлятьollama run llama2Заказ,Затем дождитесь загрузки,Наконец-то появляется успех, значит скачать Беги Лама 2. Модель прошла успешно. После завершения загрузки можно закрыть окно оллама. Контейнер запускается и запускает Llama Модель 2 успешна. Теперь запустите образ чат-бота и настройте внешний интерактивный интерфейс.

3. Запустите образ чат-бота Ollama.

Выберите скачанный нами образ и нажмите «Выполнить», чтобы начать настройку.

Имя может быть задано по умолчанию, просто нажмите «Далее».

Установите внешний порт. В этом примере установите 3001. Вы можете настроить его самостоятельно. Этот порт также является портом для веб-доступа в нашем браузере.

Затем установите переменную среды,Эта переменная представляет собой адрес подключения к нашему фреймворку Беги Оллама, указанному выше.,Устанавливаем локальный адрес:http://Synology IP-адрес локальной сети: 11434Вот и все,После завершения настройки нажмите Далее,Затем просто нажмите Готово,chatbot Образ Ollama успешно запущен. Далее мы получаем к нему доступ локально.

4. Локальный доступ

Выше мы запускаем и устанавливаем внешний порт чат-бота ollamа на 3001 (конкретный порт зависит от ваших собственных настроек). Затем мы получаем доступ к порту 3001 Synology в браузере и видим наше веб-взаимодействие. Интерфейс, в то же время используемая модель llama2, показан выше. Введите текст ниже, чтобы начать разговор. Таким образом, локально развернутый робот будет завершен. Скорость ответа зависит от конфигурации устройства. используйте сервер с высокой конфигурацией для запуска развертывания. Локально. После завершения мы настраиваем удаленный доступ. Далее устанавливаем инструмент cpolar, чтобы к нашему интерфейсу чат-робота можно было получить удаленный доступ без публичного IP-адреса!

5. Установите Cpolar на Synology.

Щелкните адрес загрузки Cpolar Synology Suite ниже, чтобы загрузить соответствующую версию Synology Cpolar Suite.

https://www.cpolar.com/synology-cpolar-suite,

Открыть SynologyЦентр пакетов,Нажмите на правый верхний уголРучная установкакнопка。

Выберите установочный пакет пакета cpolar, который мы скачали локально, и нажмите «Далее».

Нажмитесоглашатьсякнопка,Затем нажмите «Далее»

Наконец нажмите «Готово».

После завершения установки,во внешнем браузере,мы проходимIP-адрес Synology в локальной сетидобавлять9200Доступ к портуCpolarизWebИнтерфейс управления,Затем введите свою учетную запись электронной почты и пароль Cpolar для входа в систему. Если у вас нет учетной записи, вы можете перейти на официальный сайт для регистрации:

cpolarОфициальный адрес сайта:https://www.cpolar.com/

6. Настройте адрес общедоступной сети.

Нажмите «Управление туннелем» — «Создать туннель» на левой панели управления, чтобы создать туннель общедоступного адреса чат-бота!

  • Имя туннеля: имя можно настроить. Будьте осторожны, чтобы не дублировать существующее имя туннеля.
  • Протокол: выберите http
  • Локальный адрес: 3001 (порт для локального доступа)
  • доменное nameType: Свободный выбор случайного доменного имени имя
  • Регион: Выберите Китай

Нажмитесоздавать

После успешного создания туннеля щелкните статус слева — Список онлайн-туннелей, чтобы просмотреть сгенерированный адрес доступа к общедоступной сети. Существует два метода доступа: http и https. Ниже мы используем сгенерированный http-адрес для доступа.

7. Доступ к общедоступной сети

Используйте http-адрес, сгенерированный cpolar выше, и получите к нему доступ в браузере. Вы также можете увидеть основной интерфейс чат-робота. Доступ к общедоступному сетевому адресу не требуется. Для публикации нашего локального чат-робота не требуется общедоступный IP-адрес или облачный сервер. общественная сеть для доступа!

краткое содержание

Для лучшей демонстрации мы использовали туннель, сгенерированный cpolar в вышеупомянутом процессе, а его общедоступный сетевой адрес был сгенерирован случайным образом.

Преимущество этого случайного адреса в том, что он устанавливается быстро и может быть немедленно использован. Однако его недостатком является то, что URL-адрес генерируется случайными символами и его нелегко запомнить (например: 3ad5da5.r10.cpolar.top). Кроме того, этот адрес будет меняться случайным образом в течение 24 часов, что делает его более подходящим для временного использования.

Обычно я использую фиксированное имя субдомена второго уровня, поскольку надеюсь, что когда я отправлю URL-адрес коллегам или клиентам, это будет фиксированный и легко запоминающийся публичный адрес (например:chatbot.cpolar.cn), что позволяет это более формально и удобно. Общайтесь и сотрудничайте.

8. Фиксированный адрес общедоступной сети.

Поскольку туннель, созданный с помощью Cpolar выше, использует случайный адрес общедоступной сети, он будет меняться случайным образом в течение 24 часов, что не способствует долгосрочному удаленному доступу. Поэтому мы можем настроить для него имя субдомена второго уровня. Этот адрес является фиксированным и не будет меняться случайным образом [ps: cpolar.cn был сохранен].

Обратите внимание, что вам необходимо обновить пакет cpolar до базового пакета или выше, а пропускная способность, соответствующая каждому пакету, различна. [cpolar.cn зарегистрирован]

Войдите на официальный сайт cpolar.,Нажмите «Зарезервировать» слева.,Выберите сохранение дочернего доменного имени второго уровня., установить вторичное дочернее доменное имя имя имя, нажмите для сохранения, после успешного резервирования поддочернее доменное второго уровня сохранится. имяимя

После успешного резервирования скопируйте имя субдомена второго уровня, которое было успешно зарезервировано.

Вернитесь в интерфейс управления веб-интерфейсом Cpolar, нажмите «Управление туннелями» — «Список туннелей» на левой панели управления, найдите туннель, который вы хотите настроить, и нажмите «Изменить» справа.

Измените информацию о туннеле и настройте в туннеле успешно зарезервированное имя поддомена второго уровня.

  • доменное nameType: выберите дополнительный подтип доменное. имя
  • Sub Домен: укажите дочерний домен второго уровня, который был успешно сохранен. имя

Нажмитевозобновлять(Уведомление,Просто нажмите один раз, чтобы обновить,Повторно отправлять не нужно)

После завершения обновления откройте список онлайн-туннелей. В это время вы можете видеть, что адрес общедоступной сети изменился, а имя адреса также стало фиксированным именем поддомена второго уровня.

Наконец, мы используем фиксированный http-адрес общедоступной сети для доступа и видим, что тот же доступ является успешным. Таким образом, устанавливается фиксированный и постоянный адрес общедоступной сети!

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose