Что такое recall

Полнота (recall) — это метрика в машинном обучении и статистике, которая измеряет способность модели классификации находить все релевантные случаи в данных. Другими словами, он показывает, какую долю объектов из всех истинно положительных объектов модель смогла правильно классифицировать как положительные.

Определение и формула:

Определяется как отношение числа истинно положительных результатов (true positives, TP) к сумме истинно положительных и ложно отрицательных результатов (false negatives, FN):

\[ \text{Recall} = \frac{TP}{TP + FN} \]

Зачем это нужно:

Особенно важен в ситуациях, где пропуск истинно положительных результатов может иметь серьёзные последствия. Например, в медицинской диагностике важно обнаружить как можно больше реальных случаев заболевания, чтобы назначить соответствующее лечение.

Пример:

Представим, что у нас есть тест на обнаружение болезни, и в группе из 100 человек 30 действительно болеют. Если тест правильно идентифицировал 25 из них как больных, полнота теста будет:

\[ \text{Recall} = \frac{25}{30} \approx 0.83 \]

Для расчёта полноты можно использовать функцию `recall_score` из библиотеки `sklearn.metrics`:

```python
from sklearn.metrics import recall_score

# Истинные метки
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 1]

# Предсказанные метки
y_pred = [1, 0, 1, 0, 0, 1, 0, 1, 0, 1]

# Расчет полноты
recall = recall_score(y_true, y_pred)
print("Recall:", recall)
```

Полнота показывает, насколько хорошо модель способна обнаруживать положительные случаи среди всех возможных положительных случаев. Это ключевой показатель в областях, где критически важно не упустить ни одного положительного случая.

April 14, 2024, easyoffer