Resumen
Adquiere todas las destrezas que se requieren dentro de la ingeniería de datos empleando las principales nubes: Microsoft Azure, Amazon Web Services (AWS) y Google Cloud Platform (GCP). Además de aprende a los fundamentos esenciales sobre el manejo de Apache Spark 3.0 y el trabajo en notebooks dentro de la plataforma de Analítica Unificada Databricks.
Adquiere esta especialización en Ingeniería de Datos para extraer, transformar y procesar datos a gran escala. En este sentido, te especializarás en:
Ingeniería de Datos Multicloud:
- Aprende a utilizar los servicios en la nube para la ingesta, procesamiento y delivery de múltiples fuentes de datos.
- Domina las funcionalidades ofrecidas por los principales proveedores de servicios de computación en la nube: Google, Amazon y Microsoft.
- Desarrolla un conocimiento práctico de las tareas realizadas por un ingeniero de datos por medio de la construcción de pipelines.
- Ejecuta la construcción de ETLs al trabajar con datos provenientes de batch y streaming.
Ingeniería de Datos con Spark:
- Crear data pipelines.
- Procesar distintos tipos de datos provenientes de múltiples fuentes estructuradas y no estructuradas.
- Extracción de Datos incluyendo el uso de esquemas, manejo de registros corruptos y código paralelizado
- Trasformación y cargas con funciones definidas por el usuario, uniones de tablas eficientes y escritura de bases de datos paralelas.
- Puesta en producción mediante el procesamiento de flujos, estrategias de recuperación de jobs y estrategias de automatización como la integración con una API de REST.
Los cursos que se incluyen en este pack son los siguientes:
Valoraciones
No hay valoraciones aún.