Databricks Quickstart

$289.00

 

Horarios: Clases sincrónicas lunes, miércoles y viernes en el horario de 19h30 a 21h30 (GTM-5: ECU, CO, PE) y 18h30 a 20h30 MX.

Duración: 10 horas sincrónicas.

¡Inscripciones abiertas!

Resumen

El curso introduce la herramienta cloud Databricks QuickStart, los estudiantes aprenderán las funcionalidades principales del Workspace Databricks, incluyendo el almacenamiento de datos, aprovisionamiento de clústers, seguridades, jobs, monitoreo, entre otros.

Además, revisaran la librería Koalas, misma que permite utilizar la API de Pandas para ejecutar pipelines de datos en modo distribuido sobre clústers de Spark con Python puro. Finalmente, conocerán cómo construir pipelines de datos en tiempo real con Spark Streaming y Kafka.

Beneficios
  • Metodología innovadora de enseñanza con enfoque práctico y dinámico (Learning by doing).

  • Recibe una certificación open badge validada mediante tecnología blockchain.

  • Revisa el contenido de las sesiones al acceder a las grabaciones y materiales.

  • Interactúa de forma dinámica con los instructores y otros estudiantes, realizando consultas a través de un canal de comunicación privado.

  • Forma parte de nuestra comunidad de profesionales en Datos que te ayudarán en tu camino de aprendizaje.
  • Emplea herramientas en la nube sin la necesidad de instalar software en tu ordenador.

Perfil de Salida
  • Disponer de una visión completa de los componentes y funcionalidades de la plataforma Databricks.

  • Comprender la importancia del procesamiento distribuido en la nube y su uso en el mundo de los datos.

  • Escribir código empleado notebooks de trabajo.

Lecciones

Conceptos y fundamentos

  • Notebooks
  • ¿Como funciona Spark?
  • PySpark primeros pasos
  • SparkSQL primeros pasos
  • Delta Lake
  • Spark Streaming
  • MLlib y MLFlow

Instructor

Ronald Gualán Saavedra

imagen

  • Científico de datos ecuatoriano con más de 10 años de experiencia en ingeniería de datos, inteligencia de negocios y ciencias de la computación.
  • Graduado de Ingeniero de Sistemas por la Universidad de Cuenca (EC), y de MSc. en Ciencia de Datos por la Universidad de Southampton (UK).
  • Con amplia experiencia en proyectos de investigación multidisciplinarios en las áreas de: integración de datos, análisis de datos, Linked Data, ciencia de datos, estadística aplicada, machine learning y computación de alto rendimiento.

Requerimientos técnicos

El participante deberá contar con:

  • Un navegador Chrome o Firefox
  • Acceso a internet

Requisitos de hardware y software:

  • Un equipo con al menos: 4GB de RAM y 2 CPUs
  • Espacio libre en disco de al menos: 20GB
  • Sistema operativo Windows, MacOS o Linux

Detalles Importantes

Modalidad: Masterclass online en vivo.

Dirigido a: Profesionales con formación en carreras: Informática, Inteligencia de Negocios, Ingenierías, Análisis de datos y áreas afines.

Preguntas frecuentes

Si tienes dudas, siempre puedes revisar nuestra sección de preguntas frecuentes.

Valoraciones

No hay valoraciones aún.

Solo los usuarios registrados que hayan comprado este producto pueden hacer una valoración.

También te recomendamos…