Curso de Introducción al Lenguaje y Ambiente de Análisis de Datos R
Fecha y hora:
Lunes y miércoles de 18.30 a 20.30 hs.
Miércoles 9 de Marzo
Lunes 14 de Marzo – Miércoles 16 de Marzo
Lunes 21 de Marzo – Miércoles 23 de Marzo
Lunes 28 de Marzo – Miércoles 30 de Marzo
Arancel (en pesos argentinos)
Inscripción temprana (hasta el 26/02/2016) $1840
Inscripción tardía (desde el 27/02/2016) $2070
Descuento para socios de SADIO 50%
La vacante se reserva con el pago del arancel y los cupos son limitados.
Para inscribirse o recibir más información, comunicarse a informacion@sadio.org.ar o al (011) 4371-5755.
(Consulte por descuentos para grupos)
Duración: 7 clases
Modalidad
Las clases serán teórico – prácticas. Se invitará a los alumnos a traer sus computadoras portátiles. Se recomienda los participantes que instalen previamente R (http://www.r-project.org/) y RStudio (http://www.rstudio.com/) en las notebooks que vayan a utilizar en el curso
Carga Horaria
14 horas, distribuidas en 7 clases de 2 horas.
Fundamentos
R comenzó como un software para análisis gráfico y estadístico de datos, con los años se fue extendiendo a otras áreas y hoy en día es la herramienta de elección de estadísticos y también para científicos de datos, analistas financieros, bioinformáticos, etc.
Esta popularidad se origina en que desde su origen se lo concibió como una plataforma gratuita de código abierto, a la que numerosos grupos aportaron bibliotecas para realizar diferentes tipos de tareas, que incluyen, por ejemplo, el análisis de textos, de imágenes, la interacción con bases de datos o herramientas para paralelismo.
Esta gran versatilidad requiere un uso intensivo de la línea de comandos en la interfaz de usuario, por la cual muchos potenciales usuarios evitan aprender R, ya que en una primera aproximación lo encuentran difícil de usar.
Objetivo
Facilitar a los alumnos los primeros pasos en R. Brindarles entrenamiento en las tareas básicas de lectura, escritura y manipulación de datos, análisis exploratorio de datos y estadístico básico. El curso incluye un tutorial para aprender a instalar R y RStudio.
Temario y Contenidos
Las diferentes unidades del programa del curso contarán con material e instrucciones en un sitio web preparado por el docente responsable del curso. A continuación se detalla el programa del curso:
1. Instalación de R y RStudio
2. Tipos de datos básicos en R: numéricos, carácter, lógicos y factores (Módulo 1)
3. Sintáxis: asignaciones, expresiones (módulo 1)
4. Estructuras de datos básicas en R: “data frames”. Filtrado, selección y ordenado de data frames (módulo 2)
5. Análisis exploratorio de datos. Estadística descriptiva: estadísticos básicos. Construcción de tablas y resúmenes de datos (módulo 3, módulo 4)
6. Uso de bibliotecas en R (instalación, carga, actualización)
7. Lectura de datos desde archivos y url (módulo 1, módulo 5)
8. Introducción al modelado estadístico: regresión lineal básica.
Conocimientos previos
Los interesados no requieren conocimientos previos de R. Es recomendable contar con un conocimiento inicial de estadística, aunque en el curso se hará un repaso de estos temas.
Destinatarios
El curso está dirigido a quienes requieran utilizar R para el análisis de datos y que no cuentan con experiencia previa. El curso estará orientado al uso de R para resolver problemas básicos de preparación de datos, análisis exploratorio y pruebas de hipótesis estadísticas.
Instructor
Marcelo A. Soria: Profesor de la maestría de minería de datos y descubrimiento del conocimiento de la Universidad de Buenos Aires (UBA) y profesor de la Facultad de Agronomía (UBA). Realiza tareas de investigación en bioinformática y ciencia de datos en biología, ha publicado más de treinta trabajos de investigación en revistas internacionales. Ha dictado cursos y conferencias sobre ciencia de datos, bioinformática y R en instituciones públicas y privadas del país y del exterior.