CVPR2024 | Для дальнейшего улучшения качества реконструкции сверхвысокого разрешения Китайский университет науки и технологий предлагает семантический дискриминатор SeD для изображений сверхвысокого разрешения, исходный код которого скоро станет открытым.

Shortcuts

Calendar Appointments

Invoice App Manage Accounts

User App Manage Users

Role Management Permission

Dashboard Analytics

Setting Account Settings

FAQs FAQs & Articles

Modals Useful Popups
- Notification
  8 New
- - Congratulation Lettie 🎉
    Won the monthly best seller gold badge
    
    1h ago
  - CF
    
    Charles Franklin
    Accepted your connection
    
    12hr ago
  - New Message ✉️
    You have new message from Natalie
    
    1h ago
  - Whoo! You have new order 🛒
    ACME Inc. made new order $1,154
    
    1 day ago
  - Application has been approved 🚀
    Your ABC project application has been approved.
    
    2 days ago
  - Monthly report is generated
    July monthly financial report is generated
    
    3 days ago
  - Send connection request
    Peter sent you connection request
    
    4 days ago
  - New message from Jane
    Your have new message from Jane
    
    5 days ago
  - CPU is running high
    CPU Utilization Percent is currently at 88.63%,
    
    5 days ago
- View all notifications

CVPR2024 | Для дальнейшего улучшения качества реконструкции сверхвысокого разрешения Китайский университет науки и технологий предлагает семантический дискриминатор SeD для изображений сверхвысокого разрешения, исходный код которого скоро станет открытым.

https://arxiv.org/abs/2402.19387 https://github.com/lbc12345/SeD

Обзор этой статьи

Создать конфронтациюсеть（GAN）широко использовался для восстановления сверхразрешения изображений.（SR）По заданиюиз Яркая текстура。Дискриминатор позволяет сетям SR изучать распространение реальных высококачественных изображений состязательно обученным способом.。Однако,Это обучение распределению слишком грубое.,Уязвим к виртуальным текстурам.,Это приводит к противоречивым результатам.

Чтобы решить эту проблему,наспредложил SeD Простой, но эффективный семантический дискриминатор, который поощряет SR Сеть изучает более детальные распределения, вводя семантику изображения в качестве условий.。Конкретно,Наша цель — извлечь семантику изображений из обученных семантических экстракторов.。безразличныйизсемантически,Дискриминатор может адаптивно различать настоящие и поддельные изображения по отдельности.,Тем самым помогая сети SR изучить более детальные семантически-ориентированные текстуры. Чтобы получить точную и богатую семантику,Мы используем преимущества недавно популярной предварительно обученной визуальной модели (PVM) с обширным набором данных.,Его семантические особенности затем включаются в дискриминатор через тщательно разработанный модуль пространственного перекрестного внимания. таким образом,Наш предлагаемый семантический дискриминатор позволяет сетям SR генерировать более реалистичные и приятные изображения.。Для двух типовых задач（Прямо сейчас SR Обширные эксперименты с RealSR) демонстрируют эффективность предложенного нами метода.

Вклад в эту статью

Мы отмечаем, что мелкозернистая генерация текстур с учетом семантики важна для SR из важности и путем включения предварительно обученной визуальной модели (PVM) из семантики были объединены в дискриминатор, впервые предложенный для SR Задача из смыслового восприятия дискриминатор (SeD) 。
Чтобы лучше использовать семантическое руководство дискриминатора, мы предлагаем семантический блок слияния (SeFB) SeD, который извлекает семантику на уровне пикселей и деформирует семантические функции изображения в дискриминаторе посредством перекрестного внимания.
Обширные эксперименты над двумя типичными задачами SR, а именно SR классического изображения и SR реального изображения, показывают эффективность предлагаемого нами SeD. Кроме того, наш SeD можно легко интегрировать во многие тесты методов SR на основе GAN по принципу «подключи и работай».

План этой статьи

Общая структура предлагаемого семантического дискриминатора (SeD) показана на рисунке 2. Учитывая изображение с низким разрешением

𝐼_𝑙

, мы можем сначала получить изображение сверхвысокого разрешения

𝐼_s

. Затем используйте дискриминатор 𝐷, чтобы отличить

𝐼_𝑠

и изображения высокого разрешения

𝐼_ℎ

, сила SR Сеть генерирует реалистичные изображения 。Однако,Обычные дискриминаторы учитывают только грубое распределение изображения и игнорируют семантику изображения.。Это приведет к SR Сеть производит фейковые или ещё хуже текстуры.

Перспективная генерация текстур должна удовлетворять своей семантической информации. поэтому,Наша цель — реализовать семантический дискриминатор, который использует изображения с высоким разрешением.

𝐼_h

семантика как условие。здесь,Мы используем модель Big Vision в качестве семантического экстрактора.,Выражено как𝜙。насиз ЦельВключение более мелкозернистой генерации текстур с учетом семантики,Его цель –

P(I_s | \phi(I_h)) = P(I_h | \phi(I_h))

Поэтому, как показано на рисунке 2, изображение с высоким разрешением

𝐼_ℎ

Будет передан в фиксированный предварительно обученный семантический экстрактор для извлечения семантики.

𝜙(𝐼_ℎ)

, а затем модуль SeFB преобразует функции изображения со сверхвысоким разрешением и функции изображения с высоким разрешением и отправляет их в дискриминатор. Основываясь на функциях семантической осведомленности, дискриминатор может осуществлять измерения распределения с учетом семантики.

Semantic Excavation

насПринять предварительно обученную модель CLIP «RN50» в качестве семантического экстрактора.。Конкретно,«РН50» состоит из четырех слоев.,По мере увеличения количества слоев,Функция разрешения понижена,Семантика становится более абстрактной. Чтобы изучить, какой слой больше подходит для нашего семантического анализа,Мы систематически экспериментируем на этих четырех слоях.,и пройтиЭксперименты показали, что семантические характеристики третьего слоя оптимальны.。

Semantic-aware Fusion Block

Архитектура SeFB показана на рисунке 2(c). Наша цель — переместить текстуру с учетом семантики из изображения в дискриминатор, тем самым заставляя дискриминатор сосредоточиться на распределении текстуры с учетом семантики. Следовательно, на рисунке 2(c) семантика

𝑆_ℎ

передается в модуль самообслуживания, а затем подается в качестве запроса в модуль перекрестного внимания.

Extension to Various Discriminators

в этой статье,мы предложим SeD Включен в два популярных дискриминатора, в том числе patch-wise дискриминатор и Pixel-wise дискриминатор。Как показано на картинке Как показано на рисунке 2(d), фрагментированный семантический дискриминатор состоит из трех SeFB и два сверточных слоя. Для попиксельного дискриминатора мы следуем подходу и используем U-Net Архитектура как основа. Мы используем предложенный нами метод на этапе выделения неглубоких признаков. SeFB Замените исходный сверточный слой.

Эксперимент в этой статье

Рекомендация

Категории

Модель сеть Открытый исходный код Архитектура sed

Новые посты

Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.

Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).

Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)

Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.

Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!

Идеальная интеграция Cursor и DeepSeek API

DeepSeek V3 снижает затраты на обучение больших моделей

Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).

DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».

Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.

Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле