Especialización en Ingeniería de Datos con Apache Spark

$997.00

*Precio en dólares.

¡Inscripciones abiertas!

Fechas:

  • Databricsk Quickstart: 27 de marzo al 05 de abril de 2023.
  • Ingeniería de Datos con Spark: 04 de abril al 23 de mayo de 2023

Horarios: Clases sincrónicas lunes, miércoles y viernes en horario de 19h30 a 21h30 (GTM-5: ECU, CO, PE) y 18h30 a 20h30 MX.

Duración:

  • Ingeniería de Datos Multicloud: 90 horas (70 horas clases sincrónicas y 20 horas clases asincrónicas)
  • Ingeniería de Datos con Spark: 35 horas (25 horas clases sincrónicas y 10 horas clases asincrónicas)
Categorías: , ,

Resumen

Adquiere todas las  destrezas que se requieren dentro de la ingeniería de datos empleando las principales herramientas del mercado como Spark y Databricks. Adquiere esta especialización en Ingeniería de Datos para extraer, transformar y procesar datos a gran escala. En este sentido, te especializarás en:

Databricks Quickstart:

  1. El curso introduce la herramienta cloud Databricks QuickStart, los estudiantes aprenderán las funcionalidades principales del Workspace Databricks, incluyendo el almacenamiento de datos, aprovisionamiento de clústers, seguridades, jobs, monitoreo, entre otros.
  2. Además, revisaran la librería Koalas, misma que permite utilizar la API de Pandas para ejecutar pipelines de datos en modo distribuido sobre clústers de Spark con Python puro.
  3. Finalmente, conocerán cómo construir pipelines de datos en tiempo real con Spark Streaming y Kafka.

Ingeniería de Datos con Spark:

  1. Crear data pipelines.
  2. Procesar distintos tipos de datos provenientes de múltiples fuentes estructuradas y no estructuradas.
  3. Extracción de Datos  incluyendo el uso de esquemas, manejo de registros corruptos y código paralelizado
  4. Trasformación y cargas con funciones definidas por el usuario, uniones de tablas eficientes y escritura de bases de datos paralelas.
  5. Puesta en producción mediante el procesamiento de flujos, estrategias de recuperación de jobs y estrategias de automatización como la integración con una API de REST.

Los cursos que se incluyen en este pack son los siguientes:

  1. Databricks Quickstart
  2. Ingeniería de datos con Spark

 

Revisa los programas

Detalles importantes

Modalidad: Masterclass online en vivo.

Dirigido a:

Profesionales con formación en Informática, Telecomunicaciones, Software, Ingenierías, Inteligencia de Negocios, Bases de Datos e Ingenieros de Datos.

Requerimientos técnicos

El participante deberá contar con:

  • Un navegador Chrome o Firefox
  • Acceso a internet
  • Tarjeta de crédito para acceder a los recursos gratuitos que ofertan los proveedores de servicios en la nube

Requisitos de hardware y software:

  • Un equipo con al menos: 6GB de RAM y 2 CPUs
  • Sistema operativo Windows, MacOS o Linux

Preguntas Frecuentes

Valoraciones

No hay valoraciones aún.

Solo los usuarios registrados que hayan comprado este producto pueden hacer una valoración.

También te recomendamos…