Введение в обнаружение малых целей YOLOv8
Введение в обнаружение малых целей YOLOv8

Обнаружение небольших целей Yolo, эксклюзивная первая инновация (оригинальная), подходит для различных серий Yolo, таких как Yolov5, Yolov7, Yolov8 и т. д. В статье колонки представлены все этапы и исходный код, которые помогут вам легко улучшить обнаружение небольших целей.

Ключевые моменты:Читая эту колонку,Позже вы сможете объединить его со своим собственным небольшим набором данных для обнаружения целей.,Выполняйте магические модификации в разных местах сети (магистраль, головка, обнаружение, потеря и т. д.).,Достигайте небольших целей, увеличивайте баллы и внедряйте инновации! ! !

1. Введение в обнаружение малых целей

1.1 Определение малых целей

1) Если взять в качестве примера определение объекта COCO общего набора данных в области обнаружения объектов, маленькие объекты относятся к размеру менее 32×32 пикселей (средние объекты относятся к 32*32-96*96, а большие объекты относятся к больше 96*96); 2) В реальных сценариях применения обычно предпочтительнее использовать соотношение относительно исходного изображения, чтобы определить: произведение длины и ширины поля метки объекта, разделенное на произведение длины и ширины всего изображения, а затем открыть квадратный корень. Если результат меньше 3%, просто назовите это малыми целями;

1.2 Трудности

1) Количество образцов, содержащих мелкие цели, невелико, что потенциально позволяет модели обнаружения целей уделять больше внимания обнаружению средних и крупных целей;

2) Площадь, охваченная мелкими целями, меньше, поэтому места расположения мелких целей не будут разнообразными. Мы полагаем, что это затрудняет проверку возможности обобщения обнаружения небольших объектов;

3) Проблема сопоставления якорей сложна. В основном это касается метода, основанного на привязке. Поскольку поле gt и привязка небольшой цели очень малы, поле привязки и gt слегка смещаются, и IoU становится очень низким, что позволяет легко оценить его как отрицательную выборку. по сети;

4) Они не только мелкие, но и сложные, с различной степенью непроходимости, размытости и незавершенности;

Подождите, пока трудности

2. Небольшой целевой набор данных для этого столбца.

Адрес загрузки набора данных:

Single-frame InfraRed Small Target

Размер набора данных: 427 изображений, 3-кратное улучшение данных было выполнено для получения 1708 изображений, а окончательный обучающий набор, набор проверки и тестовый набор были случайным образом назначены как 8:1:1.

Оглавление

1. Введение в обнаружение малых целей

1.1 Определение малых целей

1.2 Трудности

2. Небольшой целевой набор данных для этого столбца.

3. Направление оптимизации трудоёмкости малых целевых колонн.

3.1 Разумное улучшение данных

3.2 Многомасштабная сеть

3.2.1 Многоголовочный детектор

3.2.2 Эффективное двунаправленное межмасштабное соединение BiFPN и объединение взвешенных функций

3.2.3 Поймайте все маленькие цели до больших, GiraffeDet, легкий детектор целей с легкой основой и тяжелой шейкой.

3.2.4 Модуль многоветвевой свертки RFB

3.2.5 ЗОЛОТО-ЙОЛО, далеко впереди

3.3 оптимизация потерь

3.3.1 Wasserstein Distance Loss

3.4 Механизм внимания

3.4.1 Механизм внимания SEAM

3.4.2 Многомасштабный термоядерный модуль «подключи и работай» EVC

3.4.3 Сеть агрегирования контекста и уточнения функций для обнаружения небольших целей

3.4.4 Эффективное многомасштабное внимание для межпространственного обучения EMA ICASSP2023 |

3.4.5 Динамическое разреженное внимание BiFormer CVPR 2023

3.4.6 LSKblockAttention | ICCV 2023

3.4.7 Триплет Внимание

3.4.8 Приоритетное путаница (CPCA) |

3.4.8 Многомасштабный MultiSEAM

3.4.9 Легкое внимание MobileViTAttention | ECCV2022

3.4.10 Операция свертки внимания рецептивного поля

3.4.11 Dual-ViT: многомасштабный трансформер двойного видения

3.5 Варианты свертки

3.5.1 SPD-Conv

3.5.2 Деформируемая свертка DCNv3 CVPR2023

3.5.3 Новая частичная свертка (PConv) | CVPR2023 FasterNet

3.5.4 ODConv | ICLR 2022

3.5.5 Динамическая свертка змеи ICCV2023

Посмотреть подробности:https://blog.csdn.net/m0_63774211/article/details/132322340

layers

parameters

GFLOPs

kb

mAP50

yolov8

168

3005843

8.1

6103

0.755

Wasserstein loss

168

3005843

8.1

6103

0.784

yolov8_smallob

207

2921172

12.2

6137

0.878

yolov8_SEAM

219

3109331

8.3

6331

0.785

yolov8_SPD

174

3598739

49.2

7394

0.875

yolov8_EVC

217

7293523

11.5

14513

0.779

yolov8_BiFPN

168

3005849

8.1

6104

0.766

yolov8_ContextAggregation

195

3008092

8.1

6121

0.759

yolov8_EMA

192

3006739

8.1

6114

0.766

yolov8_DCNV3

264

2892317

7.9

5892

0.765

yolov8_MCALayer

209

2545659

7.2

5194

0.769

yolov8_BiFormerBlock

204

3356179

22.4

6800

0.758

yolov8_LSKblockAttention

201

3343333

8.7

6784

0.775

yolov8_GPFN

216

2986131

8.1

6079

0.766

yolov8_C2f_Pconv

177

2716883

7.6

5537

0.758

yolov8_ODConv

179

3012110

7.9

6121

0.76

yolov8_TripletAttention

201

3006443

8.2

6120

0.79

yolov8_ChannelAttention

171

3137427

7.8

6428

0.815

yolov8_DySnakeConv

229

3356287

8.5

6822

0.77

yolov8_MultiSEAM

325

5742291

11711

0.87

yolov8_MobileViTAttention

241

3957659

11.1

7992

0.799

yolov8-RFA

258

3019439

8.2

6166

0.765

yolov8_BasicRFB

303

3440235

8.9

7040

0.762

yolov8_RepViTBlock

186

3338387

7.9

6771

0.791

yolov8-goldyolo

359

6015123

11.9

12123

0.768

yolov8_DualAttention

186

4604819

8.3

9236

0.766

Следите за личными сообщениями, чтобы получить исходный код.

https://blog.csdn.net/m0_63774211/article/details/132322340

я участвуюНа третьем этапе специального тренировочного лагеря Tencent Technology Creation 2023 года будет проводиться конкурс сочинений. Соберите команду, чтобы выиграть приз!

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose