Programas Vigentes de Materias de UBA-FCE
527 -
Contenidos Mínimos de la materia:
Motivación, Objetivos y Dinámica del curso. Introducción: Definiciones de Data mining, big data. Debate del Rol de Big Data. Aprendizaje supervisado y no supervisado. Análisis descriptivo: Visualización de datos. Histogramas, Kernels y distribuciones. Aplicaciones. Métodos No Supervisados: Componentes principales y la Maldición de la Dimensionalidad. Clusters. Regresión. Modelos lineales, linealizables y no lineales. Clasificación: Clasificador de Bayes. Regresión logística. Vecinos cercanos. Análisis discriminante. Aplicaciones. Análisis ROC. Comparacion de metodos y regression de Poisson. Métodos de Remuestreo. Problemas de Overfiting. Cross-validation. Bootstrap. Regularización y elección de modelos: Lasso, ridge. Elastic net. Comparación de métodos. Regularizacion e Inferencia Causal. Aplicaciones. Lasso, Ridge. Elastic net. Comparación de métodos. Modelos lineales que reducen la dimensionalidad: Regresion de Componentes principales (PCR) y Regresion parcial local (PLS). Modelos no lineales: Polinomios, Splines, Regresión Local por KNN & Kernels. CART: árboles de regresión y clasificación. Metodos de Ensamble I: Bagging, boosting. Random Forest. Casual Random Forest. Aplicaciones. Introducción a Economía de la Privacidad & Datos censurados. Análisis de Supervivencia: Funcion de supervivencia y riesgo. Metodo de proporcional de Cox.