fbpx

Estadística para Ciencia de Datos

$45.99 Sin IVA

*Precio en dólares

Fecha: 16 y 17 de septiembre del 2020.
Horario: 18h30 a 20h30 GTM-5: (GTM-5: Bogotá, Lima, Quito).
Duración: 4 horas.

Resumen

El curso presenta las principales medidas de estadística descriptiva (tendencia central, dispersión, posición y forma) con el fin de interpretar el comportamiento de variables de tipo numérico. Se utilizan gráficos estadísticos (histogramas, boxplots y de densidad) que permiten asociar visualizaciones y comportamientos de variables.

Finalmente, se introduce a la teoría de probabilidad y las principales distribuciones discretas y continuas por medio de ejemplos y simulaciones en Python.

Metodología

Aplicamos la metodología learning by doing utilizando notebooks y herramientas en la nube para manejo de grandes volúmenes de datos.

¿Por qué aprender Estadística Descriptiva?

Las técnicas de estadística descriptiva son clave en el proceso de análisis exploratorio previo al entrenamiento de algoritmos de Machine Learning ya que, permiten identificar comportamientos atípicos e inconsistencias en los datos.

De forma complementaria, la teoría de probabilidad permite comprender los fundamentos teóricos detrás de los algoritmos de aprendizaje automático por medio de hipótesis sobre la distribución de una variable objetivo.

Objetivos de aprendizaje
  1. Calcular e interpretar las principales medidas de estadística descriptiva.
  2. Relacionar las principales medidas descriptivas con características visuales de la distribución de probabilidad.
  3. Diferenciar y comprender el uso de las distribuciones de probabilidad discretas y continuas.
  4. Emplear la probabilidad condicional para la formulación de modelos de aprendizaje automático.

Lecciones

  • Medidas de Tendencia Central
  • Medidas de Dispersión
  • Medidas de Posición
  • Medidas de Forma
  • Teoría de probabilidad: distribuciones de probabilidad, esperanza matemática y varianza

Instructor

MSc. Eduardo Marín Nicolalde

Director Académico en handytec Academy y Científico de Datos en handytec. Es Máster en Estadística Aplicada con mención en Econometría y Data Mining por la Universidad Católica de Lovaina en Bélgica. Especialista en Machine Learning y Redes Neuronales Profundas, ha trabajado como docente universitario y consultor estadístico a nivel nacional e internacional. Su experiencia actual se basa en la implementación de proyectos de Inteligencia Artificial y Machine Learning y en la creación de programas académicos de alta calidad en Ciencia de Datos.

Detalles importantes

  • Herramienta: Python en Databricks. No requieres instalar ningún software en tu computadora
  • Prerrequisitos: Manejo de Python nivel introductorio (Pandas y NumPy)
  • Accede a los videos de las clases grabadas

También te recomendamos…

Ir arriba