Научите вас шаг за шагом, как создать веб-сайт для создания текста, изображений и видео.
Научите вас шаг за шагом, как создать веб-сайт для создания текста, изображений и видео.

С момента выпуска модели Stable Diffusion в прошлом году «генерация текста и изображений с помощью искусственного интеллекта» действительно стала технологией, которую могут использовать обычные люди.

Однако в последнее время некоторые пользователи сети используют реальные фотографии в Интернете, чтобы постоянно кормить модель для самостоятельного обучения. Результаты его обучения могут быть настолько фальшивыми, что вы даже не узнаете, какие снимки были созданы ИИ или сделаны реальными людьми.

Чтобы принести пользу большинству читателей, эта статья научит вас, как создать собственный реальный веб-сайт с искусственным интеллектом с нуля.

1. Создайте свой собственный веб-сайт с искусственным интеллектом.

Я уже написал статью,Вы можете развернуть веб-сайт для создания воспроизводимых текстовых изображений локально.。Здесь мы также можем использовать его напрямуюGitHubсклад:stable-diffusion-webui

  1. Установите Python 3.10.6 на свой компьютер. Если другие версии Python уже установлены, вы можете использовать conda для установки дополнительной версии виртуальной среды 3.10:
Язык кода:javascript
копировать
conda create -n novelai python==3.10.6 
  1. Загрузите код для этого репозитория:
Язык кода:javascript
копировать
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
  1. Установите соответствующую версию Pytorch для графического процессора и войдите на сайт напрямую:https://pytorch.org/get-started/locally/, скопируйте соответствующую команду

Войдите в только что созданную виртуальную среду «novelai»:

Выполните команду прямо сейчас:

Язык кода:javascript
копировать
./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
  1. После успешной установки вы можете проверить, может ли работать ваша собственная версия Pytorch.

  1. Введите папку кода репозитория Github, который вы только что скачали, и установите сторонние зависимости:
Язык кода:javascript
копировать
python -m pip install -r requirements.txt

2. Загрузка модели

После того, как у вас есть веб-сайт, вам необходимо скачать соответствующую модель ИИ для его эффективной генерации.

Некоторые пользователи сети использовали большое количество фотографий в Интернете для тренировки моделей и поделились ими на сайте.

https://civitai.com/

Этот знаменитый сайт известен как «Станция С», и на нем собрано множество неожиданных моделей.

На этом сайте мы можем найти множество уже обученных моделей. Например, найдите модель, которая генерирует изображения реальных людей: ChilloutMix.

Загрузив соответствующую модель с веб-страницы, поместите ее в каталог проекта: models/Stable-diffusion.

3. Скачайте китайский плагин

Проект Stable-Diffusion-Webui также поддерживает загрузку сторонних плагинов. Например, мы можем скачать соответствующий китайский плагин.

Адрес его загрузки следующий:

https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN

После входа на указанный выше сайт мы можем скачать установочный пакет плагина:

Затем разархивируйте файл и поместите его в каталог расширений:

Затем вам необходимо перезапустить веб-сервис:

Здесь в расширении проверяем плагин:

В разделе «Настройки» найдите zh_CN. Наконец, вам нужно перезапустить веб-страницу, чтобы изменения вступили в силу:

4. Создайте фотографию своего реального человека

Запустите основную программу «launch.py» и подождите определенное время, пока не появится адрес веб-страницы.

После открытия URL-адреса иногда модель может не обновиться, поэтому попробуйте перезапустить ее несколько раз.

Вам нужно выбрать модель, которую вы только что скачали: ChilloutMix.

Таким образом, мы завершили предварительную работу по развертыванию. Далее я подробно научу вас, как создавать нужные вам картинки.

4.1 Создание реальных изображений

На станции c многие мастера использовали promt для генерации изображений, поэтому мы можем обратиться к ним.

Например, найдите красивую картинку и скопируйте следующие слова-подсказки:

Слова-подсказки помещаются в поле слов-подсказок, а отрицательные слова-подсказки помещаются в соответствующее поле. При этом настройте соответствующие параметры, и наконец вы сможете генерировать реальные картинки:

4.2 Генерация изображений разных стилей

На станции C также доступно для скачивания множество моделей Лоры. Это небольшая модель, которая поможет вам скорректировать свой стиль рисования. В основном он используется в Prompt.

Например, модель Lora Genshin Impact мы можем скачать на сайте:

После завершения загрузки поместите модель в путь models/Lora:

Следуйте инструкциям на рисунке. После выбора модели в поле вы увидите конкретную подсказку:

предпринимать шагиПодскажите слова в 4.1Присоединяйтесь здесь,Вы можете создать картинку в стиле Genshin:

4.3 Создание анимационного видео

Для начала необходимо установить плагин“deforum”,Этот плагин может создавать видеоанимацию из нескольких сгенерированных изображений.

https://github.com/deforum-art/deforum-for-automatic1111-webui

В текущем каталоге стабильного распространения выполните следующую команду

Язык кода:javascript
копировать
git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extensions/deforum

Вы обнаружите, что в расширениях появились новые плагины:

В то же время перезапустите новую веб-страницу и обнаружите дополнительную опцию deforum:

Сначала мы можем выполнить простую генерацию в слове-подсказке, оператор заполнен по умолчанию:

Язык кода:javascript
копировать
{
    "0": "tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera",
    "30": "anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong",
    "60": "a beautiful coconut --neg photo, realistic",
    "90": "a beautiful durian, trending on Artstation"
}

Окончательно сгенерированное видео выглядит следующим образом:

Шаблон слова подсказки объясняется следующим образом:

Язык кода:javascript
копировать
//Abstracted Example
{
    "0": "Prompt A --neg NegPompt"
    "12": "Prompt B" 
}

Где «0» и «12» указывают ключевые кадры, которые необходимо разрешить при интерполяции.

Подсказки A и B являются положительными подсказками, а NegPrompt — отрицательными.

Конечно, мы также можем напрямую использовать модель, загруженную со станции C выше, для создания живой анимации.

5. Пусть изображения, которые вы создадите, говорят сами за себя

Из вышесказанного мы получили сгенерированное изображение

Затем мы сможем использовать это изображение для создания собственного видео с речью ИИ.

Войдите по этому URL:

https://studio.d-id.com/

Выберите изображение, которое вы только что создали, затем введите то, что вы хотите сказать, и оно будет создано:

Наконец, вы можете получить более реалистичное видео разговора ИИ реального человека.

С помощью этой технологии двумерные видеоролики или даже видеоролики с речью реального человека можно создавать партиями. Это революционная технология для отрасли AICG. Я считаю, что в будущем эту технологию можно будет продвигать во многих областях.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose