Machine Learning
con Spark

Especialízate y aprende cómo entrenar modelos de aprendizaje automático (Machine Learning) implementando código Python y PySpark. Trabaja en el ciclo de vida de modelos de predicción, segmentación, clasificación y recomendación con la herramienta del momento: Apache Spark.

arrow

Curso

Aprende y certifícate

En este curso de especialización, emplea las capacidades de distribución de procesos de Apache Spark 3.0 dentro de la plataforma de analítica unificada Databricks.

Trabaja en el ciclo de vida de modelos por medio de técnicas de ingeniería de variables, análisis exploratorio de datos, búsqueda de hiperparámetros, validación cruzada, pipelines y métricas de evaluación que permite estimar el grado de confianza de los modelos previo a la puesta en producción.

Finalmente, ejecuta un proyecto en donde pondrás en práctica los conocimientos adquiridos utilizando datos de alta dimensionalidad.

Al finalizar este curso tendrás la capacidad de:

Comprender los conceptos relacionados al entrenamiento de modelos Machine Learning.
Utilizar herramientas de ingeniería de variables incluidas en Spark.
Interpretar métricas de evaluación para encontrar un modelo campeón.
Entrenar modelos con datos de alta dimensionalidad por medio de Spark.
Buscar los hiperparámetros óptimos para minimizar el error de modelos predictivos.
Versionar los modelos entrenados por medio de MLflow.

INICIO:

14 de septiembre al
18 de noviembre

MODALIDAD:

Online en vivo

HORARIO:

martes y jueves – 18h30 a 20h30 (GTM-5: Bogotá, Lima, Quito)

DURACIÓN:

35 horas distribuidas
en 10 semanas

CLASES:

Sincrónicas

BENEFICIOS:

Clases grabadas, material en la plataforma, Software sin necesidad de instalación y certificado Open Badge.

Inscríbete
Consulta precios en tu moneda local, descarga nuestro brochure
forma

TEMARIO: Machine Learning con Spark

Herramientas para Ciencia de Datos
Herramientas para Ciencia de Datos

Se abordará el uso y manejo de las plataformas de trabajo y se analizarán los principales conceptos asociados al campo del Machine Learning.

Pre- procesamiento e ingeniería de variables
Pre- procesamiento e ingeniería de variables

Empleando diversas fuentes de información, se implementarán procesos de inspección y limpieza de datos. Se aplicará el análisis exploratorio de datos (EDA) mediante el uso de consultas interactivas y métodos de visualización nativas de Databricks. Empleando pipelines de MLlib, se analizarán las principales técnicas de transformación de datos para que estos puedan ser consumidos por los algoritmos de aprendizaje automático.

Modelamiento de Machine Learning
Modelamiento de Machine Learning

Trabajaremos en el entrenamiento, ajuste de hiperparámetros y métricas de evaluación de los algoritmos de Machine Learning utilizando PySpark y bases de datos de alta dimensionalidad. Observaremos los beneficios de trabajar con plataformas distribuidas en la nube con énfasis en la gobernanza y versionamiento de modelos utilizando MLflow.

¿Tienes más dudas?
Consulta con un asesor
facebook
linkedin
youtube
whatsapp
whatsapp