fbpx
¡Oferta!

Machine Learning con Python – Aprendizaje supervisado

$82.99 $72.99 Sin IVA

*Precio en dólares

Fecha: Del 28 de septiembre al 01 de octubre del 2020.
Horario: Lunes a jueves – 18h30 a 20h30 (GTM-5: Bogotá, Lima, Quito).
Duración: 8 horas.

Resumen

El curso presenta las familias más complejas de algoritmos de regresión y clasificación para Machine Learning supervisado. Partiremos del análisis de un algoritmo sencillo (KNN) para ilustrar las diferentes formas de particionar el espacio de representación de las variables predictoras (features).

De forma simultánea, se abordará el ajuste de hiperparámetros de cada familia de algoritmos con recomendaciones acerca del espacio de búsqueda óptima con el fin de seleccionar un modelo campeón para un conjunto de datos en particular.

Metodología

Aplicamos la metodología learning by doing utilizando notebooks y herramientas en la nube para manejo de grandes volúmenes de datos.

¿Por qué aprender Machine Learning?

Dominar el funcionamiento y aplicación de las principales familias de algoritmos de aprendizaje supervisado es fundamental para seleccionar el mejor modelo (champion model) ante una tarea específica de aprendizaje.

La partición de los datos (train, test y validation sets), las métricas de evaluación para clasificación y regresión, las simulaciones de validación cruzada y la selección de hiperparámetros óptimos son cruciales para resolver cualquier problema de aprendizaje automático de forma eficiente.

Objetivos de aprendizaje
  1. Sintetizar el funcionamiento de las familias de algoritmos SVM y Árboles de Decisión para tareas de clasificación y regresión.
  2. Comprender las distintas formas de particionamiento de tablas de datos para tareas de regresión y clasificación en función del número de datos disponibles.
  3. Utilizar de forma adecuada las distintas métricas de evaluación de algoritmos de clasificación y regresión.
  4. Utilizar espacios de búsqueda lineales o exponenciales para localizar los hiperparámetros óptimos de un algoritmo evitando el sobreajuste (overfitting).

Lecciones

  • Métricas de evaluación
  • Espacios de búsqueda de hiperparámetros
  • K-Nearest Neighbours
  • Support Vector Machines
  • Árboles de Decisión + RandomForest
  • XGBoost

Instructor

MSc. Eduardo Marín Nicolalde

Director Académico en handytec Academy y Científico de Datos en handytec. Es Máster en Estadística Aplicada con mención en Econometría y Data Mining por la Universidad Católica de Lovaina en Bélgica. Especialista en Machine Learning y Redes Neuronales Profundas, ha trabajado como docente universitario y consultor estadístico a nivel nacional e internacional. Su experiencia actual se basa en la implementación de proyectos de Inteligencia Artificial y Machine Learning y en la creación de programas académicos de alta calidad en Ciencia de Datos.

Detalles importantes

  • Herramienta: Python en Databricks. No necesitas instalar ningún software en tu computadora
  • Nivel: Avanzado
  • Prerrequisitos:
    • Conocimientos básicos en python y estadística para ciencia de datos
    • Conocimiento básico en el entrenamiento de algoritmos con scikit-learn y cross-validation
  • Accede a los videos de las clases grabadas

También te recomendamos…

Ir arriba