¿Qué es R-Stars?
Trabajo usualmente con el software / lenguaje estadístico R. R es un recurso de acceso libre. A continuación tenéis recursos que he ido encontrando para comenzar y profundizar en el manejo de este interesante, completo y gratuito entorno de análisis.

A partir de la impartición de asignaturas durante un dilatado período de tiempo, he ido creando y perfeccionando diverso material, sobre todo práctico, en modo de supuestos y ejemplos de análisis, para facilitar el aprendizaje de las técnicas de análisis de datos más habituales.
Siempre he tenido la idea de facilitar el acceso a este material de modo libre y gratuito, por vocación y por convicción.
El problema habitual a la hora de llevar a cabo esto son los datos. En mis clases suelo utilizar datos de empresas reales, extraídos de bases de datos de acceso restringido. Esto hace que no pueda hacer públicas las prácticas junto con estos datos, más allá de mi clase y mis alumnas/os.
Por otro lado, durante el curso 24/25 tuve la idea de revisar sustancialmente las prácticas que había preparado, y utilizar en este afán las facilidades que proporciona la Inteligencia Artificial. Testear modos en los que este recurso puede ayudar en la tarea tanto docente como profesional.
He de reconocer que el resultado ha sido francamente satisfactorio. He podido crear código nuevo, aplicar nuevas técnicas, y mejorar el que tenía con una velocidad que aún me deja perplejo. Eso sí, con un concienzudo trabajo en equipo (a veces incluso desesperante) con la Inteligencia Artificial. Y es que, hay que explicarle muy bien lo que quieres hacer, probar sus propuestas y establecer un diálogo continuo. Si algo he aprendido es que la IA es una ayudante o colaboradora muy eficiente; pero sin nuestra supervisión, al menos hasta el momento, no logra plasmar al 100% las estrategias de análisis que tenemos en mente.
Esto me llevó a intentar dar un paso más: generar mis propios datos para analizarlos a partir del código de las prácticas, de modo que se superara la limitación del uso de datos «calientes». Había que lograr datos abundantes, y realistas: razonablemente parecidos a los datos que pueden darse en cualquier sector económico. Datos que respetasen la coherencia entre variables, y que a su vez no resultaran demasiado «deterministas».
De este experimento nació R-Stars.
Rstars, en lo sustancial, tiene un núcleo basado en unas 30 variables cuyos valores se han obtenido para un total de 300 empresas «ficticias». Los datos han sido generados por la Inteligencia Artificial, intentando mantener un equilibrio entre la coherencia económica y contable, y la aleatoriedad que permite ir más allá de resultados demasiado artificiosos.
Entorno a esta base de datos, surge un ejercicio de creatividad (y cierto «frikismo») para dotar de contexto a los datos. Algo que sonara «divertido».
Y así, ocurrió que la base de datos rinde un homenaje a la filmografía de la Ciencia Ficción, estando definida para el caso de 300 empresas de transporte de mercancias… interestelar. Empresas con nombres simbólicos en este tipo de cine, y que ejercen su actividad comercial en torno a 30 planetas que, de igual modo, no son desconocidos para los amantes de este género cinematográfico.
Instalación de R y de la interfaz R-Studio.
R es un software con licencia de libre uso, y se puede descargar en el sitio oficial, R-Project. Pulsa aquí y descárgate la última versión estable.
Una vez instalado R, conviene instalar R-Studio. R-Studio es una interfaz que permite trabajar con R de un modo más cómodo que utilizando la propia interfaz básica de R. Hay que instalarla a continuación de R. Accede a la última versión pulsando aquí. Conviene instalar primero R, y luego R-Studio. Primeros pasos con R y R-Studio.
O’Reilly es una editorial que publica libros geniales sobre lenguajes de programación y muchos temas más. Tenemos la suerte de que esta editorial nos permite acceder libremente a algunos de los libros. Entre ellos destaca un clásico fundamental: R for Data Science. Dicho y hecho, pulsa en el enlace y te llevará al libro. Sin piratería de por medio.Modelos econométricos y otras técnicas de análisis multivariante con R.
Algunas de las técnicas estadísticas aplicadas al análisis económico integran lo que conocemos habitualmente como Econometría. Hay una gran variedad de modelos econométricos más o menos refinados, parrtiendo del modelo general. Por otro lado, existen otras técnicas de análisis muy útiles en su aplicación al análisis económico que no pertenecen al cuerpo de los modelos econométricos en sentido estricto, como son los métodos de agrupación de información (componentes principales, análisis factorial, cluster) o de clasificación (análisis discriminante, árboles de decisión, etc.). Algunos de estos métodos de análisis incluyen elementos de aprendizaje automático, es decir, lo que conocemos como Machine Learning. Muchas de estas técnicas se pueden implementar en R. Un buen texto para sumergirse en estas técnicas es el libro de Francisco Parra Estadística y Machine Learning con R, que puede ser consultado de modo gratuito pinchando en el enlace anterior.