Что такое recall
Полнота (recall) — это метрика в машинном обучении и статистике, которая измеряет способность модели классификации находить все релевантные случаи в данных. Другими словами, он показывает, какую долю объектов из всех истинно положительных объектов модель смогла правильно классифицировать как положительные.
Определение и формула:
Определяется как отношение числа истинно положительных результатов (true positives, TP) к сумме истинно положительных и ложно отрицательных результатов (false negatives, FN):
\[ \text{Recall} = \frac{TP}{TP + FN} \]
Зачем это нужно:
Особенно важен в ситуациях, где пропуск истинно положительных результатов может иметь серьёзные последствия. Например, в медицинской диагностике важно обнаружить как можно больше реальных случаев заболевания, чтобы назначить соответствующее лечение.
Пример:
Представим, что у нас есть тест на обнаружение болезни, и в группе из 100 человек 30 действительно болеют. Если тест правильно идентифицировал 25 из них как больных, полнота теста будет:
\[ \text{Recall} = \frac{25}{30} \approx 0.83 \]
Для расчёта полноты можно использовать функцию `recall_score` из библиотеки `sklearn.metrics`:
```python
from sklearn.metrics import recall_score
# Истинные метки
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]
# Предсказанные метки
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 0, 1]
# Расчет полноты
recall = recall_score(y_true, y_pred)
print("Recall:", recall)
```
Полнота показывает, насколько хорошо модель способна обнаруживать положительные случаи среди всех возможных положительных случаев. Это ключевой показатель в областях, где критически важно не упустить ни одного положительного случая.
April 14, 2024, easyoffer