El Programa de Doctorado en Ciencias Agrarias y Ambientales organiza el curso “Programación para análisis de datos con R (2ª edición)”, abierto a todos los estudiantes matriculados en programas de doctorado de la UCLM. Esta actividad está financiada en la convocatoria de ayudas del Vicerrectorado de Política Científica a los programas de doctorado de la UCLM para la organización de actividades formativas complementarias.

DESCRIPCIÓN

Generalmente, el uso del software R para análisis de datos conlleva un uso de este software de manera más compleja. Además de ser un software estadístico, se trata de un lenguaje de programación permite realizar tareas tan complejas como se requiera. En este curso se cubren aspectos relacionados con el aprendizaje de la programación necesaria para el tratamiento y análisis de datos, yendo más allá del análisis de variables y ajuste de modelos simples. Se cubren aspectos generales de programación (control del flujo (condiciones, bucles, etc.)) y creación de funciones personalizadas. También aspectos específicos de R (como el alcance de Environments) y aspectos de productividad como el uso de github. Su impartición, práctica y aplicada, permitirá a los futuros doctores manejar su flujo de datos y análisis de manera avanzada.

Se asume que los asistentes tienen formación previa en estadística y del uso del software estadístico R y del interfaz R Studio. No son necesarios conocimientos previos de programación.

CONTENIDO

Partiendo de los elementos básicos del lenguaje, algunos de los cuales forman parte del uso de R (sin programación propiamente dicha), se avanza progresivamente en uso de programación convencional, específicos en R, y finalmente la llamada a R desde el sistema u otros programas. Se ha diseñado como curso base para cualquier línea de investigación, por lo que está abierto a estudiantes de cualquier Programa de la Escuela Internacional de Doctorado de la Universidad de Castilla-La Mancha, por lo que será útil para su formación ya que los objetivos son:

  • Elementos básicos del lenguaje R
  • Definición y uso de funciones
  • Control del flujo: condiciones y bucles
  • Funciones vectorizadas (bucles sin bucles)
  • Manipulación de datos con dplyr
  • Herramientas de colaboración y gestión de versiones: github
  • Depuración de errores
  • Ejecución de programas fuera de R

PROFESORADO

El curso se impartirá por el profesor Dr. Felipe Ortega, del Data Science Laboratory (DSLAB) (http://www.datasciencelab.es) que está integrado en el Centro de Investigación para las Tecnologías Inteligentes de la Información y sus Aplicaciones de la Universidad Rey Juan Carlos. EL DSLAB realiza actividades de investigación y transferencia, incluyendo cursos en empresas e instituciones públicas sobre herramientas estadísticas y computacionales avanzadas.

PROGRAMACIÓN

Duración total del curso: 12 h, repartidas en 3 sesiones más una breve sesión introductoria:

  • Sesión introductoria – 14/06/2021 – 10:00-11:00: Configuración, material previo, resolución de dudas
  • Jornada 1 – 16/06/2021 – 12:00-14:00 h y 18:00 a 20:00: Elementos del lenguaje
  • Jornada 2 – 17/06/2021 – 12:00-14:00 h y 18:00 a 20:00: Funciones vectorizadas y manipulación de datos
  • Jornada 3 – 18/06/2021 – 12:00-14:00 h y 18:00 a 20:00): Proyecto de principio a fin, control de versiones, depuración y ejecución externa
  • Jornada final práctica – 21/06/2021 – 18:00 a 20:00: Trabajo síncrono de los asistentes sobre un problema propuesto o sus propios datos

PLAZAS

Hasta un máximo de 25 alumnos

INSCRIPCION (por orden de recepción):

Correo electrónico a daniel.moya@uclm.es, con los siguientes datos:

  • NOMBRE Y APELLIDOS
  • Dirección EMAIL oficial (UCLM) y Centro de trabajo habitual