Resumen
En este curso de especialización, aprende cómo entrenar modelos de aprendizaje automático (Machine Learning) a partir de bases de datos gigantes. Para ello, emplea las capacidades de distribución de procesos de Apache Spark 3.0 dentro de la plataforma de analítica unificada Databricks.
Especialízate en el ámbito del Machine Learning, revisa las principales nociones de la temática implementando código Python y PySpark. También, trabaja en el ciclo de vida de modelos de predicción, segmentación, clasificación y recomendación por medio de técnicas de ingeniería de variables, análisis exploratorio de datos, búsqueda de hiperparámetros, validación cruzada, pipelines y métricas de evaluación que permite estimar el grado de confianza de los modelos previo a la puesta en producción.
Finalmente, ejecuta un proyecto en donde pondrás en práctica los conocimientos adquiridos utilizando datos de alta dimensionalidad.
Beneficios
- Metodología innovadora de enseñanza con enfoque práctico y dinámico (Learning by doing).
- Recibe una certificación Open Badge validada mediante tecnología blockchain y verificable internacionalmente.
- Camino de aprendizaje enfocado en una de las profesiones con mayor demanda laboral en la actualidad.
- Emplea herramientas en la nube sin la necesidad de instalar software en tu ordenador.
- Trabaja con grandes volúmenes de datos, utilizando datasets reales.
- Revisa el contenido de las sesiones al acceder a las grabaciones y materiales.
- Interactúa de forma dinámica con los instructores, realizando consultas a través de un canal de comunicación privado.
Perfil de Salida
Al finalizar este curso tendrás la capacidad de:
- Comprender los conceptos relacionados al entrenamiento de modelos Machine Learning.
- Utilizar herramientas de ingeniería de variables incluidas en Spark.
- Interpretar métricas de evaluación para encontrar un modelo campeón.
- Entrenar modelos con datos de alta dimensionalidad por medio de Spark.
- Buscar los hiperparámetros óptimos para minimizar el error de modelos predictivos.
- Versionar los modelos entrenados por medio de MLflow.