El Programa de Doctorado en Ciencias Agrarias y Ambientales de la UCLM organiza el curso de estadística “Programación para análisis de datos con R” impartido por el Data Science Laboratory (DSLAB; http://www.datasciencelab.es), el cual está integrado en el Centro de Investigación para las Tecnologías Inteligentes de la Información y sus Aplicaciones de la Universidad Rey Juan Carlos y en el que participa nuestro compañero, el Profesor Emilio Cano (UCLM).

En este curso se cubren aspectos relacionados con el aprendizaje de la programación necesaria para el tratamiento y análisis de datos, yendo más allá del análisis de variables y ajuste de modelos simples. Se cubren aspectos generales de programación (control del flujo (condiciones, bucles, etc.)) y creación de funciones personalizadas. También aspectos específicos de R (como el alcance de Environments) y aspectos de productividad como el uso de github.

Su impartición, práctica y aplicada, permitirá a los futuros doctores manejar su flujo de datos y análisis de manera avanzada.Partiendo de los elementos básicos del lenguaje, algunos de los cuales forman parte del uso de R (sin programación propiamente dicha), se avanza progresivamente en uso de programación convencional, específicos en R, y finalmente la llamada a R desde el sistema u otros programas.

–    Elementos básicos del lenguaje R
–    Definición y uso de funciones
–    Control del flujo: condiciones y bucles
–    Funciones vectorizadas (bucles sin bucles)
–    Manipulación de datos con dplyr
–    Herramientas de colaboración y gestión de versiones: github
–    Depuración de errores
–    Ejecución de programas fuera de R

Se ha diseñado como curso base para cualquier línea de investigación, por lo que está abierto a estudiantes de cualquier Programa de la Escuela Internacional de Doctorado de la Universidad de Castilla-La Mancha, por lo que será útil para vuestra formación ya que los objetivos son:

  • Aprender técnicas avanzadas de preparación de datos y flujo de trabajos de análisis
  • Aprender a personalizar el software mediante la creación de funciones útiles en el dominio de aplicación
  • Utilizar las herramientas más avanzadas de colaboración, control de versiones, depuración y manipulación de datos

El curso sería gratuito para quienes os habéis matriculado y pagado las tasas del curso 2019/2020.

La duración total del curso es d: 12 h, repartidas en 3 sesiones más una breve sesión introductoria.

  • Sesión 0 : 1 julio –> 18:00 h: pruebas de conexión y resolución de dudas técnicas.
  • Sesión 1 : 6 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Elementos del lenguaje
  • Sesión 2 : 7 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Funciones vectorizadas y manipulación de datos
  • Sesión 3 : 8 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Proyecto de principio a fin, control de versiones, depuración y ejecución externa

INSCRIPCION: enviar email a daniel.moya@uclm.es con:

NOMBRE Y APELLIDOS
dirección EMAIL oficial (UCLM)
Centro de trabajo habitual

El aforo máximo es de 25 alumnos y se os matriculara por orden de inscripción.

Esta actividad está financiada por el Vicerrectorado de Investigación y Política Científica  en su convocatoria de ayudas para la realización de actividades formativas en el ámbito de los programas de doctorado de la UCLM 2020.