Carrera Ingeniería de Datos con Spark

Current Status
Not Enrolled
Precio
Cerrado
Get Started
This course is currently closed

¡Bienvenidos a la Carrera Ingeniería de Datos con Spark!

En este programa formativo, identificaremos los fundamentos esenciales sobre el manejo de Apache Spark 3.0 y el trabajo en notebooks dentro de la plataforma de Analítica Unificada Databricks.

Asimismo, revisaremos en conjunto una introducción referente a las principales nociones del procesamiento de datos, los problemas que se resuelven, herramientas que se utilizan y los primeros pasos con el lenguaje de programación Python con PySpark y SparkSQL para ingeniería de datos.

Alrededor de eso, aprenderás a usar distintos tipos de datos estructurados y no estructurados a través de procesos ETL (Extracción, Transformación y Carga) manejando Apache Spark y distintas técnicas para tratar datos masivos provenientes de fuentes SQL, NoSQL y Data Lakes.

En este curso tendrás un entendimiento suficiente para trabajar en proyectos de Ingeniería de Datos, aprenderás a desarrollar tus habilidades bajo la metodología Learning-by-doing, la misma que propone un aprendizaje dinámico e interactivo.

Los contenidos de este curso los trabajaremos con la guía y ayuda del instructor: Diego Montúfar .

Indicaciones iniciales

La Carrera Ingeniería de Datos con Spark se encuentra diseñada para desarrollar su contenido en modalidad sincrónica con clases en vivo (Learning-by-doing). Dentro de cada lección, encontrarás detallado las sesiones que se han preparado para el desarrollo de sus contenidos.

• Al ser un curso práctico con clases sincrónicas, las sesiones en vivo se las impartirá a través de la plataforma Zoom.

– A partir del miércoles 31 de marzo hasta el jueves 15 de abril en horario de 18h30 a 20h30, y viernes 16 de abril hasta el martes 20 de abril en horario de 07h00 a 09h00 (GMT-5), nos conectaremos al aula virtual de Zoom haciendo clic en el siguiente botón:

• En la sección Materiales de cada sesión, se encontrarán los medios y/o recursos para trabajar en el desarrollo de los contenidos. Estos medios pueden incluir: material para el desarrollo de ejercicios, archivos PDF, videos, lecturas, entre otros.

• Además, dentro de cada sesión se podrá visualizar las grabaciones de las clases en vivo. Estos videos estarán disponibles en la plataforma una vez finalice la clase del día. Podrás acceder a ellos en el momento que desees.

Recuerda que cualquier duda referente al curso, la podrás realizar a través de nuestro canal de Slack. En donde también publicaremos comunicados importantes, y podrás interactuar con el grupo de trabajo y los instructores durante todo el curso.

NOTA: El acceso al contenido de este curso en la plataforma databits, se encontrará habilitado durante 1 año.

¡Empecemos!

A continuación, da clic en la primera lección Herramientas para Ingeniería de Datos para comenzar con el curso.