<h2><font color="#004D7F" size=6>Módulo 4. Fase de tratamiento de datos</font></h2>



<h1><font color="#004D7F" size=5>1.1. Calcular métricas en clasificación</font></h1>

<br><br>
<div style="text-align: right">
<font color="#004D7F" size=3>Manuel Castillo-Cara</font><br>
<font color="#004D7F" size=3>Machine Learning con Python</font><br>

---

<h2><font color="#004D7F" size=5>Índice</font></h2>
<a id="indice"></a>

* [1. Introducción](#section1)
    * [1.1. Librerías y CSV](#section11)
* [2. 2. Matriz de confusión para clasificación desbalanceada](#section2)
* [3. Precision](#section3)
    * [3.1. Ejemplo](#section31)
* [4. Recall](#section4)
    * [4.1. Ejemplo](#section41)
* [5. F-1](#section5)
    * [5.1. Ejemplo](#section51)
* [6. Reporte de clasificación](#section6)

In [1]:
# Permite ajustar la anchura de la parte útil de la libreta (reduce los márgenes)
from IPython.core.display import display, HTML
display(HTML("<style>.container{ width:98% }</style>"))

---

<a id="section1"></a>
# <font color="#004D7F"> 1. Introducción</font>

Como medida de rendimiento, el Accuracy es inapropiado para problemas de clasificación desequilibrados (clase desbalanceada). Una alternativa al uso de Precision y Recall para problemas de clasificación. Por tanto, en este tutorial veremos:
* **Precision** que cuantifica el número de predicciones de clase positivas que realmente pertenecen a la clase positiva.
* **Recall** que cuantifica el número de predicciones de clase positivas hechas de todos los ejemplos positivos en el conjunto de datos.
* **F-Measure** que proporciona una puntuación única que equilibra Precision y Recall en un solo número.


<a id="section11"></a>
## <font color="#004D7F"> 1.1. Librerías y CSV</font>

En esta lección, se muestran varias métricas de evaluación de algoritmos diferentes para problemas de Machine Learning de clasificación y regresión. En cada código, el conjunto de datos se descarga directamente del repositorio de UCI Machine Learning.
* **Clasificación**: se usará el conjunto de datos de Pima Indians Diabetes. Este es un problema de clasificación binaria donde todas las características de entrada son numéricas.

In [1]:
# Clasification problem
import numpy as np
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
filename_clas = 'data/pima-indians-diabetes.data.csv'
names_clas = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] 
df_clas = pd.read_csv(filename_clas, names=names_clas)
array_clas = df_clas.values
X_clas = array_clas[:,0:8]
Y_clas = array_clas[:,8]

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section2"></a>
# <font color="#004D7F"> 2. Matriz de confusión para clasificación desbalanceada</font>

Para los problemas de clasificación desequilibrada, la clase mayoritaria se denomina típicamente resultado negativo (p. Ej., Como "sin cambio" o "resultado negativo de la prueba"), y la clase minoritaria se denomina típicamente resultado positivo (p. Ej., "Cambio" o "Resultado positivo de la prueba").

La matriz de confusión proporciona más información no solo sobre el rendimiento de un modelo predictivo, sino también sobre qué clases se predicen correctamente, cuáles incorrectamente y qué tipo de errores se están cometiendo.

La matriz de confusión más simple es para un problema de clasificación de dos clases, con clases negativas (clase 0) y positivas (clase 1). En este tipo de matriz de confusión, cada celda de la tabla tiene un nombre específico y bien entendido, resumido de la siguiente manera:

<img src="https://encrypted-tbn0.gstatic.com/images?q=tbn%3AANd9GcSvjU6mLyJMnt67UECZZTdtC6JEPR_iJpDRd46fqvg1wvgDRY9Y" alt="cross-validation" width="500">

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section3"></a>
# <font color="#004D7F"> 3. Precision</font>

Las métricas de Precision y Recall se definen en términos de las celdas en la matriz de confusión, específicamente términos como verdaderos positivos y falsos negativos:

La Precisión es una métrica que cuantifica el número de predicciones positivas correctas realizadas, por lo tanto, calcula la precisión para la clase minoritaria. 

Se calcula como la relación de ejemplos positivos predichos correctamente dividida por el número total de ejemplos positivos que se predijeron. 

$$Precision = \frac{TruePositives}{(TruePositives + FalsePositives)}$$

El resultado es un valor entre 0.0 para no precisión y 1.0 para precisión total o perfecta.

<a id="section31"></a>
## <font color="#004D7F"> 3.1. Ejemplos</font>

### Ejemplo 1: Clasificación Binaria

Un modelo hace predicciones y predice 120 ejemplos como pertenecientes a la clase minoritaria, 90 de los cuales son correctos y 30 de los cuales son incorrectos. La precisión para este modelo se calcula como:

$$Precision = \frac{TruePositives}{(TruePositives + FalsePositives)} = \frac{90}{(90 + 30)} = \frac{90}{120} = 0,75$$

El resultado es una precisión de 0,75, que es un valor razonable pero no sobresaliente.

### Ejemplo 2: Clasificación Binaria

Considere el mismo conjunto de datos, donde un modelo predice 50 ejemplos que pertenecen a la clase minoritaria, 45 de los cuales son verdaderos positivos y cinco de los cuales son falsos positivos. Podemos calcular la precisión para este modelo de la siguiente manera:

$$Precision = \frac{TruePositives}{(TruePositives + FalsePositives)} = \frac{45}{(45 + 5)} = \frac{45}{50} = 0,90$$

En este caso, aunque el modelo predijo muchos menos ejemplos como pertenecientes a la clase minoritaria, la proporción de ejemplos positivos correctos es mucho mejor.

### Ejemplo 3: Clasificación Multiclase
Un modelo hace predicciones y predice 70 ejemplos para la primera clase minoritaria, donde 50 son correctos y 20 incorrectos. Predice 150 para la segunda clase con 99 correctos y 51 incorrectos. La precisión se puede calcular para este modelo de la siguiente manera:

$$Precision = \frac{TP1 + TP}{((TP + TP) + (FP1 + FP)} = \frac{50+99}{((50+99) + (20+51))} = \frac{149}{220} = 0,677$$

Podemos ver que el cálculo métrico de Precision se escala a medida que aumentamos el número de clases minoritarias.

<div class="alert alert-block alert-info">
    
<i class="fa fa-info-circle" aria-hidden="true"></i>
La Precision puede ser calculada usando la función Sklearn [`precision_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_score.html).
</div>

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section4"></a>
# <font color="#004D7F"> 4. Recall</font>

Recall cuantifica el número de predicciones positivas correctas hechas de todas las predicciones positivas que podrían haberse realizado. A diferencia de Precision, que solo comenta las predicciones positivas correctas de todas las predicciones positivas, Recall  proporciona una indicación de predicciones positivas perdidas.

En un problema de clasificación desequilibrada con dos clases, Recall se calcula como el número de verdaderos positivos dividido por el número total de verdaderos positivos y falsos negativos.

$$Recall = \frac{TruePositives}{(TruePositives + FalseNegatives)}$$

El resultado es un valor entre 0.0 para no precisión y 1.0 para precisión total o perfecta.

<a id="section41"></a>
## <font color="#004D7F"> 4.1. Ejemplos</font>

### Ejemplo 1: Clasificación Binaria

Un modelo hace predicciones y predice 90 de las predicciones de clase positivas correctamente y 10 incorrectamente. Podemos calcular Recall para este modelo de la siguiente manera:

$$Recall = \frac{TruePositives}{(TruePositives + FalsePositives)} = \frac{90}{(90 + 10)} = \frac{90}{100} = 0,9$$

Tiene buen Recall

### Ejemplo 2: Clasificación Multiclase
Un modelo predice 77 ejemplos correctamente y 23 incorrectamente para la clase 1, y 95 correctamente y cinco incorrectamente para la clase 2. Podemos calcular el recuerdo para este modelo de la siguiente manera:

$$Precision = \frac{TP1 + TP2}{((TP1 + TP2) + (FN1 + FN2)} = \frac{77+95}{((77+95) + (23+5))} = \frac{172}{200} = 0,86$$

<div class="alert alert-block alert-info">
    
<i class="fa fa-info-circle" aria-hidden="true"></i>
La Precision puede ser calculada usando la función Sklearn [`recall_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.recall_score.html).
</div>

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section5"></a>
# <font color="#004D7F"> 5. F-1</font>

F-1 proporciona una forma de combinar precisión y recuperación en una sola medida que captura ambas propiedades.

$$F-1 = \frac{(2 \times Precision \times Recall)}{(Precision + Recall)}$$

El resultado es un valor entre 0.0 para no precisión y 1.0 para precisión total o perfecta.

<a id="section51"></a>
## <font color="#004D7F"> 5.1. Ejemplos</font>

### Ejemplo 1: Clasificación Binaria

Consider a model that predicts 150 examples for the positive class, 95 are correct (true positives), meaning five were missed (false negatives) and 55 are incorrect (false positives).

$$Precision = \frac{95}{(95 + 55)} = 0,633$$

$$Recall = \frac{95}{(95 + 5)} = 0,95$$

Podemos ver que tenemos un excelente Recall pero un mal Precision. Veamos el F-Measure

$$F-1 = \frac{(2 \times 0,63 \times 0,95)}{(0,95 + 0,63)} = 0,759$$

<div class="alert alert-block alert-info">
    
<i class="fa fa-info-circle" aria-hidden="true"></i>
La Precision puede ser calculada usando la función Sklearn [`f1_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html).
</div>

<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<a id="section6"></a>
# <font color="#004D7F"> 6. Reporte de clasificación</font>

Como hemos visto anteriormente, scikit-learn nos proporciona una función que nos otorga todas las métricas vistas hasta ahora que es `classification_report()`.

En el ejemplo podemos ver que tenemos unas buenas métricas para la clase 0 pero, sin embargo, para la clase 1 no tenemos un buen desempeño.

In [2]:
# Cross Validation Classification Report
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report

test_size = 0.33
seed = 7
X_train, X_test, Y_train, Y_test = train_test_split(X_clas, Y_clas, 
                            test_size=test_size, random_state=seed)
model = LogisticRegression(solver='lbfgs', max_iter=1000)
model.fit(X_train, Y_train)
predicted = model.predict(X_test)
report = classification_report(Y_test, predicted) 
print(report)

              precision    recall  f1-score   support

         0.0       0.81      0.88      0.84       162
         1.0       0.74      0.63      0.68        92

    accuracy                           0.79       254
   macro avg       0.78      0.75      0.76       254
weighted avg       0.78      0.79      0.78       254



<div style="text-align: right"> <font size=5>
    <a href="#indice"><i class="fa fa-arrow-circle-up" aria-hidden="true" style="color:#004D7F"></i></a>
</font></div>

---

<div style="text-align: right"> <font size=6><i class="fa fa-coffee" aria-hidden="true" style="color:#004D7F"></i> </font></div>