SADIO – Curso virtual “Introduccion a la Ciencia de Datos”

                                    “en la senda de Sadosky”

Estimados,

Les acercamos información sobre el curso “Introducción a la Ciencia de Datos” que se dictará virtualmente en el campus de SADIO.
 
Esperamos que sea de su interés y agradecemos la difusión que pueda darle. 
 
Saludos cordiales.
 
¡Seguinos en nuestras redes sociales para enterarte de más novedades! 
      

Curso virtual “Introducción a la Ciencia de Datos”
 
Docentes: Eduardo Poggi y Vanina Beraudo
 
Fecha de Inicio: 28 de Septiembre de 2020
 
Duración: 8 semanas
 
Descripción: Para la toma de decisiones en cualquier organización se cuenta con infinidad de datos de todo tipo, muchos recopilados por los propios sistemas de información, pero muchos más obtenidos de una variedad de fuentes: datos publicados por otras organizaciones públicas y privadas, redes sociales, sensores, fuentes bibliográficas, medios, imágenes, videos; que pueden ser usados conjuntamente para disminuir la incertidumbre de los tomadores de decisiones. La persistencia, limpieza y procesamiento de estos datos requiere de prácticas y algoritmos diferentes a los de la informática tradicional.
 
Este curso inicial pretende brindar los fundamentos del Ciencia de Datos, incluyendo el esclarecimiento de términos como Analítica de datos, Minería de datos, Aprendizaje Automático y Big Data.
 
Destinatarios: Profesionales con interés y/o necesidades de conocer las prácticas actuales para la gestión no tradicional de datos.  El curso puede ser de interés para una variedad de profesiones: informáticos, ingenieros, economistas, estadísticos, actuarios, matemáticos y toda otra profesión que requiera de manejo de datos como sociólogos o médicos sanitaristas, por ejemplo.
 
Objetivo: Que los alumnos logren apropiar los conceptos fundamentales, el vocabulario básico, el marco metodológico y la aplicación de algunas herramientas para la gestión no tradicional de datos para la toma de decisiones.
 
Requisitos: Manejo de planillas de cálculo, facilidad para navegar por Internet, lectura de textos técnicos en inglés.
 
Estructura: El curso está dividido en dos módulos de 4 clases cada uno de 3hs virtuales-sincrónicas. Cada clase estará acompañada por lecturas o ejercicios que los participantes deberán realizar con anterioridad. También se aportará bibliografía complementaria para quien quiera profundizar. Las clases sincrónicas están previstas para los días lunes de 17 a 20 hs. y serán grabadas. Quedarán a disposición de la consulta de los participantes en las respectivas unidades del curso.
 
MÓDULO 1
Unidad 1: Datos 2020 / IA / AA
  • El concepto de datos hacia en el 2020. Breve historia de los sistemas de información. Producción sistemática de datos digitales. Conceptos de minería de datos, Big Data y Analítica. Ejercicio de inducción.
  • La disponibilidad de datos y ejemplos de aplicaciones en negocios. Datos como materia prima. Ejemplos de Inteligencia Artificial. El Aprendizaje Automático, la estadística y la persistencia de datos como pilares del análisis de datos.  Marco metodológico.
Unidad 2: Introducción al Aprendizaje Automático
  • El Aprendizaje Automático como disciplina central del procesamiento aproximado de datos. La inducción como método válido de inferencia.
  • Inducción de árboles de decisión a partir de ejemplos. Práctica para la inducción de árboles de decisión. Concepto de sobreajuste y poda.
Unidad 3: Introducción a los modelos probabilísticos y basados en semejanza
  • Aspectos teóricos de los modelos de predicción basados en inferencia probabilística.
  • Práctica para la inducción de árboles de decisión.
  • Modelos de predicción basados en distancias. Caso de aplicación. Problemas de implementación de métodos inductivos.
Unidad 4: Ensamble de modelos predictivos
  • Métodos de ensamble de modelos. Caso práctico utilizando los métodos vistos.
  • Técnicas de Validación de modelos.
  • Desarrollo de un modelo de predicción, incorporando los conceptos y las prácticas estudiadas en el módulo.
MÓDULO 2
Unidad 5: Aprendizaje no supervisado
  • Métodos de clustering. Ejemplos de aplicación. Medidas de calidad.
  • Conceptos básicos de Minería de Textos. Ejemplo de análisis de sentimientos a partir de textos.
Unidad 6: Marco metodológico
  • Técnicas y herramientas para la preparación y validación de datos. Métricas de calidad de datos. Tratamiento de valores numéricos y faltantes. Datos derivados.
  • Métricas de validación. Preguntas y respuestas de negocio.
  • Ejemplos de meta algoritmos. Fuerza bruta vs modelado artesanal. Random-Forest. 
Unidades 7: Desarrollo de caso avanzado
  • Desarrollo de diversos modelos de predicción de mediana complejidad, incorporando los conceptos y las prácticas estudiadas en el curso.
Unidad 8: Analítica de datos en las organizaciones
  • Prácticas organizacionales para la apropiación de la Ciencia de Datos. La puesta en producción de modelos predictivos. Aspectos éticos y legales.
Evaluación y aprobación: La evaluación de los participantes consistirá en la participación de los casos guiados que se desarrollan en cada módulo.
 
Aranceles
Inscripción temprana (hasta el 21/09/2020): $12.600
Inscripción tardía (desde el 22/09/2020): $14.000
Descuento para socios de SADIO 50%
 

Medios de pago disponibles: transferencia bancaria (solo residentes en Argentina) y tarjeta de crédito/débito (Visa, Master o Cabal). Consultar en informacion@sadio.org.ar 

 
Formulario de inscripción: https://tinyurl.com/yyoojrvz
 
Docentes
Eduardo Poggi: Cuenta con 40 años de experiencia profesional en proyectos de Tecnología de la Información fundamentalmente orientada al sector público latinoamericano. En la última década se orientó a la gestión de datos públicos: Datos Abiertos, Interoperabilidad y Ciencia de datos. Acredita unos 25 años de docencia de grado y posgrado en: Aprendizaje Automático, Minería de Datos y gestión de TI Pública en general. Es licenciado en Ciencias de la Computación por la UBA (FCEN), magister en Administración y Políticas Públicas y posee una especialización en Negocios y Tecnología por la Universidad de San Andrés; ambas de Argentina. Actualmente se desempeña como asesor en la Dirección de Analítica de Datos de la AFIP de Argentina, docente de posgrado y consultor internacional.
 
Vanina Beraudo: Magister en Explotación de Datos y Descubrimiento del Conocimiento UBA – FCEN. Licenciada en Sistemas de Información por U.N.Luján. Integra el equipo de Analítica de Datos de AFIP. También se ha desempeñado como especialista en Minería de Datos en la Subdirección Gral. de Sistemas y Telecomunicaciones de la misma institución. Ha realizado diversas presentaciones sobre aspectos de Minería de Datos en el ámbito fiscal, así como participa como  docente del curso de Minería de Datos para el personal de AFIP.
 

Both comments and pings are currently closed.

Comments are closed.

Design by 2b Consult