Big Data

Luis Argerich

¡Quiero saber más!

Big Data

Este curso tiene como objetivo presentar los problemas relacionados al procesamiento de datos masivos (Big Data) y la forma de resolver estos problemas usando Apache Spark. Spark es una plataforma para procesamiento de datos distribuidos que ha tomado un gran impulso en los últimos años desplazando las arquitecturas anteriores basadas en Hadoop.

El curso explica la necesidad de procesar los datos en un ambiente distribuido, el diseño de algoritmos que permitan procesamiento distribuido paralelizable y el uso de Apache Spark para implementar estos algoritmos. Consistirá de cuatro laboratorios donde se resolverán problemas reales.

Requisito: conocimientos mínimos de programación en cualquier lenguaje.

Luis Argerich

Profesor de la materia Organización de Datos de la Facultad de Ingeniería en la Universidad de Buenos Aires.

Con 20 años de experiencia como docente y una especialización en Data Mining en la Universidad de Illinois, es autor de varias obras en las áreas de Data Science y Programación. Es fundador y programador de varios proyectos open-source, entre ellos Tikiwiki y co-autor de algunos algoritmos para análisis de Redes Sociales y Procesamiento de Textos.

A su vez, es consultor en las áreas de Data Science y Machine Learning y tutor de trabajos finales de las carreras de Ingeniería Informática y Licenciatura en Análisis de Sistemas de la Facultad de Ingeniería.

Horarios

El curso se realizará en las oficinas de Mulesoft (Av. Corrientes 316 Planta Baja, Buenos Aires) y comenzará con una charla introductoria que se realizará en dos horarios. El martes 5 de Julio por la tarde (19 a 21hs) y el miércoles 6 de Julio por la mañana (9 a 11hs). Luego, el curso en sí se realizará durante las cuatro semanas consecutivas (12/7, 19/7, 26/7 y 2/8) los martes de 19 a 21hs.

Material

Otros recursos

¡Contactanos!

Ante cualquier duda que tengas contáctanos a través de los siguientes medios: