Perfilado de sección

  • Antes de trabajar con proyectos reales en machine learning, es importante trabajar la fase de optimización, para obtener mejores resultados de los algoritmos de machine learning, y forecasting, para trabajar las predicciones de nuestros datos no etiquetados. Antes de ello, deberemos conocer dos aspectos avanzados que nos proporciona Python, el primero es la herramienta Pipeline y, el segundo, es como resolver problemas avanzados de procesamiento de datos muy comunes.

    En este sentido las secciones principales de trabajo en esta sección serán:

    1. Procesamiento avanzados de datos. Trataremos problemas avanzados muy típicos que nos vamos a encontrar a la hora de trabajar con un proyecto, estos son, valores NaN, One-Hot Encoding y escalamiento en la clase para problemas de regresión.
    2. Fase de optimización. Aprenderemos las tres formas en que se pueden ajustar los parámetros de un algoritmo de machine learning en Python.
    3. Fase forescasting. Una vez escogido y optimizado nuestro modelo, deberemos guardarlo para poder realizar predicciones de los datos no etiquetados.
    4. Plantilla para proyectos. Finalmente, y antes de empezar a desarrollar los proyectos de machine learning, se expone una plantilla de trabajo, la cual puede ser utilizada para cualquier trabajo de modelado predictivo.