Представляем сбалансированную точность и взвешенный F1
Представляем сбалансированную точность и взвешенный F1

Давайте сначала рассмотрим показатели точности, отзыва и F1:

  • точностьдля результата прогноза,Доля правильных прогнозов для каждой категории Модель.
  • Отзыватьдля образцов этикеток,Сколько представителей каждой категории было предсказано правильно.
  • F1 Точность дроби Отзыватьмелодииисреднийценить
  • Определите матрицу путаницы для результатов двоичной классификации,Вертикальная ось сверху вниз — результат прогноза. 1 и 0, горизонтальная ось слева направо — это реальная метка 1 и 0. Диагональная линия сверху слева вниз справа: TP, TN. Диагональная линия снизу слева направо вверх: FN, FP.
  • 其实就是Разные знаменатели,точность — это количество выборок для результата прогнозирования каждой категории.,А «Отзывать» — это количество образцов в каждой метке образца категории.
Вставьте сюда описание изображения
Вставьте сюда описание изображения

Зачем использовать сбалансированную точность и взвешенную F1?

  • первый,Нам необходимо понимать, что эти два показателя используются для оценки производительности для модели классификации. в машинном обучении,Нам часто приходится иметь дело с несбалансированными наборами данных.,То есть,В некоторых категориях гораздо больше образцов, чем в других. в этом случае,Традиционные показатели точности могут вводить в заблуждение,Поскольку Модель может иметь тенденцию прогнозировать категории с большим количеством,Чтобы получить более высокую точность прибытия,Но для более мелких категорий,Его прогностическая эффективность может быть плохой
  • В это время,Сбалансированная Вот тут-то и пригодится точность. Сбалансированная Точность — это среднее значение точности всех категорий, которое придает равную важность каждой категории, независимо от количества образцов в этой категории. Следовательно, он может лучше отражать производительность Модели по категориям, особенно при работе с несбалансированными наборами данных.
  • Тогда давайте посмотрим на Взвешенный F1 ценить。F1 ценить — это модулированное среднее значение «Точность» и «Отзывать» (отзыв), которое также учитывает точность «Модель» и «Отзывать». Взвешенный F1 ценить за каждую категорию F1 ценить выполняет Взвешенное усреднение, а веса обычно представляют собой количество выборок в каждой категории. Поэтому Взвешенный F1 ценить может отражать производительность в каждой категории и придавать больший вес категориям с большим количеством образцов.

в общем,Сбалансированная точностьи Взвешенный F1 Значения являются очень важными показателями при оценке эффективности моделей классификации. Они могут помочь нам более полно и точно понять эффективность модели.

Сбалансированная точность(Balanced Accuracy)

Сбалансированная точность используется для обработки несбалансированных по меткам наборов данных в задачах двоичной классификации. Он определяется как среднее значение запоминания, полученного по каждой категории.

balanced_accuracy_score Функция scikit-learn Реализация в библиотеке, которая вычисляет сбалансированную точность, чтобы избежать переоценки производительности для наборов данных с несбалансированными метками. Когда параметры adjusted установлен на False При оптимальное значение сбалансированной точности равно 1, худшее значение 0. Вот часто используемый пример расчета:

Язык кода:javascript
копировать
from sklearn.metrics import balanced_accuracy_score

y_true = [0, 1, 0, 0, 1, 0]
y_pred = [0, 1, 1, 0, 0, 0]

balanced_accuracy_score(y_true, y_pred, adjusted=False)

В некоторой исследовательской литературе предлагаются альтернативные определения сбалансированной точности. scikit-learn верно Сбалансированная точность Определение,Это эквивалентно точности_score со сбалансированными по классам весами выборки.,и имеет те же желательные свойства, что и двоичный случай. Для задач двоичной классификации,Сбалансированная точность — это среднее арифметическое значение чувствительности (истинно положительный показатель) и специфичности (истинно отрицательный показатель).。Конкретная формула расчета выглядит следующим образом.:

\texttt{balanced-accuracy} = \frac{1}{2}\left( \frac{TP}{TP + FN} + \frac{TN}{TN + FP}\right )

Если классификатор одинаково хорошо работает с обоими классами, то термин упрощается до традиционной точности (т. е. количества правильных прогнозов, разделенного на общее количество прогнозов). Сбалансированная точность варьируется от 0 до 1. Если установлено значение «Adjusted=True», оно будет перенастроено на диапазон

\frac{1}{1 \ -\ n\_classes}

до 1 со случайной оценкой производительности 0.

Взвешенный F1 ценить(Weighted F1)

Оценка F1 — это широко используемый индикатор для оценки эффективности прогнозирования модели в задачах двоичной классификации с учетом точности и полноты. Показатель F1 представляет собой среднее гармоническое значение точности и полноты, его значение варьируется от 0 до 1, где 1 означает, что и точность, и полнота являются идеальными, а 0 означает, что ни точность, ни полнота не достигаются.

\texttt{F1-Score} = 2 \times \frac{Precision \times Recall}{Precision + Recall}

Существует множество вариантов Фракции F1.,включатьВзвешенный F1 дробь, макрос F1 Фракции и микро F1 Фракция,Они подходят для задач многомерной классификации или сценариев, в которых необходимо классифицировать категории.

  • Макрос F1 Доля в среднем по каждой категории F1 Рассчитывается фракция (Макрос придает всем категориям одинаковый вес, тем самым придавая недостаточно представленным категориям более высокий вес), где каждой категории присваивается равный вес. Этот подход предполагает, что все категории одинаково важны, хотя в практических приложениях это может быть не так.
  • Каждому тестовому примеру гарантированно будет присвоена ровно одна категория в задаче классификации.,микроскопический F1 Фракция, эквивалентная точности
  • Взвешенный F1 Фракция для каждой категории F1 Фракция рассчитывается независимо, но при усреднении Взвешенный основывается на количестве экземпляров каждой категории. Этот метод учитывает проблему дисбаланса классов и, следовательно, является более реалистичной метрикой оценки. Если в случае дисбаланса классов вы хотите придать больший вес более крупным классам, тогда Взвешенный F1 Фракция – хороший выбор.

scikit-learn Библиотека реализована f1_score расчет функции F1 Score, общий пример кода выглядит так:

Язык кода:javascript
копировать
import numpy as np
from sklearn.metrics import f1_score

# Ground truth (true labels)
y_true = np.array([0, 1, 2, 0, 1, 2, 0, 1, 2])
# Predicted labels from your classifier
y_pred = np.array([0, 1, 2, 0, 1, 2, 0, 2, 2])  # The 8th label is misclassified

# Calculate Macro F1 Score
macro_f1 = f1_score(y_true, y_pred, average='macro')
print(f"Macro F1 Score: {macro_f1}")

# Calculate Micro F1 Score
micro_f1 = f1_score(y_true, y_pred, average='micro')
print(f"Micro F1 Score: {micro_f1}")

# Calculate Weighted F1 Score
weighted_f1 = f1_score(y_true, y_pred, average='weighted')
print(f"Weighted F1 Score: {weighted_f1}")

Выберите вид, который означает ценить,зависит от обстоятельств,включать不同类别的重要性и Комплексное рассмотрение распределения выборки。верно于микроскопический、Макроси Взвешенныйсредний F1 Для четкого объяснения дробей вы можете обратиться к этой статье. Towards Data Science блог. С помощью простых примеров вы сможете понять среднее значение микроскопического и среднее значение макроси Взвешенного в классификации по нескольким категориям. F1 Концепция дробей.


📚️ Справочные ссылки:

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose