El Programa de Doctorado en Ciencias Agrarias y Ambientales de la UCLM organiza el curso de estadística « Programación para análisis de datos con R » impartido por el Data Science Laboratory (DSLAB; http://www.datasciencelab.es), el cual está integrado en el Centro de Investigación para las Tecnologías Inteligentes de la Información y sus Aplicaciones de la Universidad Rey Juan Carlos y en el que participa nuestro compañero, el Profesor Emilio Cano (UCLM).
En este curso se cubren aspectos relacionados con el aprendizaje de la programación necesaria para el tratamiento y análisis de datos, yendo más allá del análisis de variables y ajuste de modelos simples. Se cubren aspectos generales de programación (control del flujo (condiciones, bucles, etc.)) y creación de funciones personalizadas. También aspectos específicos de R (como el alcance de Environments) y aspectos de productividad como el uso de github.
Su impartición, práctica y aplicada, permitirá a los futuros doctores manejar su flujo de datos y análisis de manera avanzada.Partiendo de los elementos básicos del lenguaje, algunos de los cuales forman parte del uso de R (sin programación propiamente dicha), se avanza progresivamente en uso de programación convencional, específicos en R, y finalmente la llamada a R desde el sistema u otros programas.
– Elementos básicos del lenguaje R
– Definición y uso de funciones
– Control del flujo: condiciones y bucles
– Funciones vectorizadas (bucles sin bucles)
– Manipulación de datos con dplyr
– Herramientas de colaboración y gestión de versiones: github
– Depuración de errores
– Ejecución de programas fuera de R
Se ha diseñado como curso base para cualquier línea de investigación, por lo que está abierto a estudiantes de cualquier Programa de la Escuela Internacional de Doctorado de la Universidad de Castilla-La Mancha, por lo que será útil para vuestra formación ya que los objetivos son:
- Aprender técnicas avanzadas de preparación de datos y flujo de trabajos de análisis
- Aprender a personalizar el software mediante la creación de funciones útiles en el dominio de aplicación
- Utilizar las herramientas más avanzadas de colaboración, control de versiones, depuración y manipulación de datos
El curso sería gratuito para quienes os habéis matriculado y pagado las tasas del curso 2019/2020.
La duración total del curso es d: 12 h, repartidas en 3 sesiones más una breve sesión introductoria.
- Sesión 0 : 1 julio –> 18:00 h: pruebas de conexión y resolución de dudas técnicas.
- Sesión 1 : 6 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Elementos del lenguaje
- Sesión 2 : 7 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Funciones vectorizadas y manipulación de datos
- Sesión 3 : 8 julio –> 12:00 a 14:10 y 18:00-20:10 h (con 10 min de descanso): Proyecto de principio a fin, control de versiones, depuración y ejecución externa
INSCRIPCION: enviar email a daniel.moya@uclm.es con:
NOMBRE Y APELLIDOS
dirección EMAIL oficial (UCLM)
Centro de trabajo habitual
El aforo máximo es de 25 alumnos y se os matriculara por orden de inscripción.
Esta actividad está financiada por el Vicerrectorado de Investigación y Política Científica en su convocatoria de ayudas para la realización de actividades formativas en el ámbito de los programas de doctorado de la UCLM 2020.