InvokeAI: лучший веб-интерфейс для стабильного распространения?
InvokeAI: лучший веб-интерфейс для стабильного распространения?

Сегодня я хочу показать вам один из лучших веб-интерфейсов для Stable Diffusion, которые я когда-либо видел.

Его очень легко настроить и он очень интуитивно понятен в использовании. Это новый WebUI, он очень сфокусирован, очень полезен, и, кстати, самое удивительное, что он разработан для работы на Windows Mac и Linux и может быть адаптирован к AI-изображению графического процессора. только с памятью 4G. Создайте приложение.

Теперь я хочу показать вам, как легко это настроить, перейдите на эту страницу: https://github.com/invoke-ai/InvokeAI,вы можете скачатьinvoke Сценарий установки AI имеет сценарии установки для Linux Mac и Windows на странице выпуска (https://github.com/invoke-ai/InvokeAI/releases/tag/v2.2.3):

Загрузите и установите

Сейчас,В качестве примера возьмем установку в Linux. первый,скачатьinvokeAI-src-installer-2.2.3-linux.zip。Этот файл содержит толькоinstall.shскачать脚本和README.md。Весь процесс относительно прост и надежен.,Вам нужно только иметь бесперебойную сеть,Выполнить один разinstall.shВот и все。Установлено по умолчанию,Требуется около 20 ГБ дискового пространства.,Сюда входят полные операционные среды Python и pytorch.,Работающий интерфейс и серверная часть самого WebUI,И различные рекомендуемые модели ИИ.

Единственными двумя случаями, когда требовалось ручное вмешательство, были:

  1. Вам необходимо один раз выбрать каталог установки модели и выходной каталог содержимого.,и некоторые конфигурации по умолчанию,Соответствующий ввод будет записан вhomeв каталоге.invokeaiдокумент
Язык кода:javascript
копировать
Loading Python libraries...

Welcome to InvokeAI. This script will help download the Stable Diffusion weight files
and other large models that are needed for text to image generation. At any point you may interrupt
this program and resume later.

** INITIALIZING INVOKEAI RUNTIME DIRECTORY **
Select a directory in which to install InvokeAI's models and configuration files [/home/ubuntu/invokeai]: /apps/invokeAI
Select the default directory for image outputs [/apps/invokeAI/outputs]: /apps/invokeAI/outputs

InvokeAI models and configuration files will be placed into "/apps/invokeAI" and image outputs will be placed into "/apps/invokeAI/outputs".
Accept these locations? [y] y

You may change the chosen directories at any time by editing the --root and --outdir options in "/home/ubuntu/.invokeai",
You may also change the runtime directory by setting the environment variable INVOKEAI_ROOT.

The NSFW (not safe for work) checker blurs out images that potentially contain sexual imagery.
It can be selectively enabled at run time with --nsfw_checker, and disabled with --no-nsfw_checker.
The following option will set whether the checker is enabled by default. Like other options, you can
change this setting later by editing the file /home/ubuntu/.invokeai.
Enable the NSFW checker by default? [y] n

The next choice selects the sampler to use by default. Samplers have different speed/performance
tradeoffs. If you are not sure what to select, accept the default.
Default sampler to use? (ddim, k_dpm_2_a, k_dpm_2, k_euler_a, k_euler, k_heun, k_lms, plms) [k_heun]:

The number of denoising steps affects both the speed and quality of the images generated.
Higher steps often (but not always) increases the quality of the image, but increases image
generation time. This can be changed at run time. Accept the default if you are unsure.
Default number of steps to use during generation? [20]:
Creating the initialization file at "/home/ubuntu/.invokeai".

2. Вам необходимо согласиться с соответствующим лицензионным соглашением в вашей учетной записи Huggingface и предоставить токен Huggingface для загрузки.

Язык кода:javascript
копировать
Welcome to InvokeAI. This script will help download the Stable Diffusion weight files
and other large models that are needed for text to image generation. At any point you may interrupt
this program and resume later.

** DOWNLOADING DIFFUSION WEIGHTS **
You can download and configure the weights files manually or let this
script do it for you. Manual installation is described at:

https://github.com/invoke-ai/InvokeAI/blob/main/docs/installation/INSTALLING_MODELS.md

You may download the recommended models (about 10GB total), select a customized set, or
completely skip this step.

Download <r>ecommended models, <a>ll models, <c>ustomized list, or <s>kip this step? [r]: 
** LICENSE AGREEMENT FOR WEIGHT FILES **

To download the Stable Diffusion weight files from the official Hugging Face 
repository, you need to read and accept the CreativeML Responsible AI license.

This involves a few easy steps.

1. If you have not already done so, create an account on Hugging Face's web site
   using the "Sign Up" button:

   https://huggingface.co/join

   You will need to verify your email address as part of the HuggingFace
   registration process.

2. Log into your Hugging Face account:

    https://huggingface.co/login

3. Accept the license terms located here:

   https://huggingface.co/runwayml/stable-diffusion-v1-5

   and here:

   https://huggingface.co/runwayml/stable-diffusion-inpainting

    (Yes, you have to accept two slightly different license agreements)

Press <enter> when you are ready to continue:
(Fetching Hugging Face token from cache...not found

4. Thank you! The last step is to enter your HuggingFace access token so that
   this script is authorized to initiate the download. Go to the access tokens
   page of your Hugging Face account and create a token by clicking the 
   "New token" button:

   https://huggingface.co/settings/tokens

   (You can enter anything you like in the token creation field marked "Name". 
   "Role" should be "read").

   Now copy the token to your clipboard and paste it at the prompt. Windows
   users can paste with right-click.
   Token: 
Password: *************************************

** DOWNLOADING WEIGHTS **
* v1-5-pruned-emaonly.ckpt: Downloading...

Рекомендуемый метод здесь — временно приобрести хост на AWS или GCP, поскольку в соответствии с конфигурацией по умолчанию вся установка программного обеспечения требует большого количества программного обеспечения, многие из которых необходимо загружать непосредственно с github иhuggingface, а также из сети отечественных поставщики облачных услуг. Нисходящий трафик обычно медленный, но восходящая полоса пропускания достаточна.

Следует отметить, что если мы используем зарубежный метод упаковки и загрузки, каталоги, которые необходимо упаковать, включают:

  • каталог установки вызова AI
  • homeв каталоге.cacheОглавление(В основном~/.cache/torch/hub/checkpoints/checkpoint_liberty_with_aug.pthдокумент,Вы также можете загрузить его самостоятельно на Tencent Cloud.,Немного медленнее,занимает несколько минут)

Моя личная практика такова, что загрузка среды Linux на GCP занимает около 20 минут. После упаковки отправка сжатого пакета размером более 20 ГБ из GCP в Tencent Cloud занимает всего более 30 минут. Это намного быстрее, чем загрузка напрямую из Tencent Cloud.

Выбор сервера

Может быть, вам интересно, почему я выбрал Tencent Cloud? Основная причина заключается в том, что сервер, используемый для рисования ИИ, должен иметь достаточные вычислительные ресурсы, если вы хотите получить хороший опыт. Если компьютер, который вы используете каждый день, не достаточно мощный, на этапе опыта я рекомендую выбирать облако, особенно Tencent Cloud.

потому чтоБесплатный опытный центр Tencent Cloudначальство,Вот лучшие модели, которые я пока вижу:

Бесплатная пробная версия на 15 дней в январе и 30 дней за 99 юаней. Для той же конфигурации я увидел на Alibaba Cloud минимальную цену в месяц со скидкой 40%, которая по-прежнему стоит более 2000 юаней.

Опыт бега

Просто зайдите в файл после того, как распаковали его.InvokeAI的Оглавление,осуществлятьinvoke.shВот и все运行:

Язык кода:javascript
копировать
ubuntu@VM-0-6-ubuntu:/apps/invokeAI$ ./invoke.sh 
Do you want to generate images using the
1. command-line
2. browser-based UI
3. open the developer console
Please enter 1, 2, or 3: 2

Starting the InvokeAI browser-based UI..
* Initializing, be patient...
>> Initialization file /home/ubuntu/.invokeai found. Loading...
>> InvokeAI runtime directory is "/apps/invokeAI"
>> patchmatch.patch_match: INFO - Compiling and loading c extensions from "/apps/invokeAI/src/pypatchmatch/patchmatch".
>> patchmatch.patch_match: WARNING - patchmatch failed to load or compile.
>> patchmatch.patch_match: WARNING - Refer to https://github.com/invoke-ai/InvokeAI/blob/main/docs/installation/INSTALL_PATCHMATCH.md for installation instructions.
>> Patchmatch not loaded (nonfatal)
>> GFPGAN Initialized
>> CodeFormer Initialized
>> ESRGAN Initialized
>> Using device_type cuda
>> Current VRAM usage:  0.00G
>> Scanning Model: stable-diffusion-1.5
>> Model Scanned. OK!!
>> Loading stable-diffusion-1.5 from /apps/invokeAI/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt
   | LatentDiffusion: Running in eps-prediction mode
   | DiffusionWrapper has 859.52 M params.
   | Making attention of type 'vanilla' with 512 in_channels
   | Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
   | Making attention of type 'vanilla' with 512 in_channels
   | Using faster float16 precision
   | Loading VAE weights from: /apps/invokeAI/models/ldm/stable-diffusion-v1/vae-ft-mse-840000-ema-pruned.ckpt
>> Model loaded in 61.56s
>> Max VRAM used to load the model: 2.17G 
>> Current VRAM usage:2.17G
>> Current embedding manager terms: *
>> Setting Sampler to k_heun

* --web was specified, starting web server...
>> Initialization file /home/ubuntu/.invokeai found. Loading...
>> Started Invoke AI Web Server!
>> Default host address now 127.0.0.1 (localhost). Use --host 0.0.0.0 to bind any address.
>> Point your browser at http://127.0.0.1:9090

Его рабочий интерфейс выглядит следующим образом:

Функции

А теперь самое интересное: они встроили множество функций в WebUI, поэтому я хочу показать вам слева: у вас есть режим преобразования текста в изображение, который очень интуитивно понятен в использовании, у вас есть режим преобразования изображения в изображение. , еще и очень практично. Но эти функции, если вы привыкли использовать автоматический стабильный диффузионный веб-интерфейс 1111, эта часть может вас не удивить.

на самом деле,Что заставило меня попробовать InvokeAI,В основном它提供了一个比DreamStudioУлучшенная функциональность холста,Здесь можно рисовать,Это лучший инструмент для рисования, который я когда-либо видел,Таким образом, вы можете получить сумасшедшие хорошие результаты.

Одно предложение итог,То есть он может изменять существующие работы на холсте.,Создавайте креативные проекты, которые можно расширять по желанию.

Например, следующая цифровая работа:

Я могу расширить правый верхний угол холста до области того же стиля и добавить другие элементы:

Они также собираются добавить режим узла, в котором вы сможете соединять разные узлы для создания изображения. Я даже не могу себе представить, насколько это будет потрясающе.

У них будет режим постобработки, так что это будет шокирующе.

Они также хотят провести обучение по текстовой инверсии и Dreambooth здесь:

Но вам придется терпеливо ждать обновлений этих функций.

Подвести итог

По мере того, как этот рынок становится все более популярным, в сообществе появляется все больше и больше инструментов в попытке снизить начальную стоимость рисования ИИ и сократить путь к началу работы. Только когда рисование с использованием ИИ сможет по-настоящему принести пользу широкой публике, требуя только базовых знаний и творческого подхода к рисованию, а не опыта машинного обучения, эта отрасль действительно станет инновационной индустрией восхода солнца, а не просто индустрией рассказывания историй, нарезки лука-порея, недолговечной концепции?

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose