Mito: Jugar la Champions perjudica a algunos equipos para la Liga. FALSO!!

Autores: Julio del Corral y Carlos Gómez-González

En Enero uno de los mejores periodistas deportivos de España, Javier Ares, lanzaba un tuit que decía: ¿Será casualidad que Chelsea y Liverpool, los dos primeros de la Premier, no estén jugando competición europea? La idea que hay detrás de esta pregunta es razonable, los equipos que no juegan competición europea pueden centrarse en la liga doméstica y así pueden obtener mejores resultados. Otro ejemplo bien recordado es el del Celta de Vigo en la temporada 2003/2004 que descendió a Segunda División en una temporada que disputó la Champions League. En este artículo se muestra que a pesar de que se pueden encontrar ejemplos en esta dirección, la estadística indica, que entre las temporadas 2005-2006 y 2015-2016, la dirección es la opuesta: los equipos que juegan Champions tienen un mejor rendimiento en la liga, si bien cuando se usan modelos avanzados de estadística la mejora es marginal.

La base de datos se compone de las ligas belga, alemana, inglesa, francesa, griega, italiana, holandesa, portuguesa, escocesa, española y turca. Las temporadas analizadas van desde la 2005-2006 hasta la 2015-2016.

Para tener una medida de la actuación en la liga se usa la medida de eficiencia desarrollada en el artículo publicado en Journal of Sport Economics del Corral, Gallardo y Maroto (2017) y que puede descargarse en este enlace. Esta medida se construye como uno menos la probabilidad de obtener más puntos que los realmente obtenidos, según las casas de apuestas. Así, los equipos que tienen un rendimiento muy superior al esperado como el Leicester en la temporada 2015-2016 tienen un valor muy próximo a uno, el del Leicester en esa temporada fue 0,9998, mientras que los equipos que tienen un rendimiento muy inferior al esperado como el Chelsea de Mourinho en la temporada 2015-2016 tienen un valor muy próximo a cero, en ese caso fue 0,02.[1]

Una primera aproximación es comparar la eficiencia de los equipos que juegan competición europea (cualquiera) o Champions (la fase de grupos) con los que no la juegan.

Observaciones Eficiencia
Juega c. europea 1.385 0,50
No juega c. europea 717 0,58
Juega Champions 1.843 0,51
No juega Champions 259 0,63
Total 2.102 0,52

 

Es importante destacar que las diferencias son significativas estadísticamente en ambos casos. Estas diferencias pueden verse gráficamente en estos gráficos de cajas, donde la línea del medio representa la mediana y la caja representa los cuartiles inferiores y superiores.

Un análisis complementario es ver el número de observaciones que están por encima y por debajo de la media (0,52). De los equipos que jugaron Champions 167 obtuvieron una eficiencia mayor que la media mientras que fueron 92 los que obtuvieron una media inferior. Sin embargo, de los equipos que no jugaron Champions 906 obtuvieron una eficiencia por encima de la media mientras que 937 la obtuvieron inferior.

Así, en un primer análisis se ve como jugar competiciones europeas no sólo no es perjudicial para el rendimiento en liga, sino que es muy beneficioso.

Sin embargo, para conocer el efecto real de la participación en Champions para los equipos una forma más adecuada es utilizar las que se llaman técnicas de evaluación del impacto de políticas. En concreto, para cada participante en Champions puede buscarse al individuo más parecido que no participa, que sería el equipo de su misma liga con la calidad de equipo medida como valor en Transfermarkt más parecida. Así, puede verse el efecto de participar en Champions. Como algunos equipos no van a tener un buen contrafactual como por ejemplo el Real Madrid para la temporada 2015-2016 en la diferencia de calidad entre el Real Madrid y el mejor equipo que no juega Champions es tan grande que no sería un buen contrafactual. Una forma de evitar este problema es ir quitando observaciones de los equipos que participan muchas veces en Champions (ECL). Los resultados son los siguientes:

Observaciones Ef. eq. Champions Ef. Eq. no ECL
Toda la muestra 259 0,63 0,60
Quitar eq. 11 ECL 215 0,63 0,60
Quitar eq. >9 ECL 195 0,63 0,60
Quitar eq. >8 ECL 177 0,61 0,59
Quitar eq. >7 ECL 153 0,60 0,60

De hecho cuando se implementa la metodología del vecino más parecido el efecto de la política (participar) en Champions es 0,003. Así el participar en Champions no tiene efecto ni positivo ni negativo sobre la eficiencia en la liga.

Resumiendo, hay una creencia que participar en competiciones europeas perjudica al rendimiento de los equipos en las ligas nacionales. Sin embargo, la evidencia empírica sugiere que de haber efecto éste es positivo, es decir que participar en competiciones europeas no sólo no perjudica sino que beneficia al rendimiento en liga. Así, los aficionados al Sevilla si se clasifica para la Champions pueden estar tranquilos, su rendimiento en liga no va a ser peor por el mero hecho de jugar Champions.

[1] En estos enlaces puede verse aplicada y explicada dicha metodología para el fútbol español: enlace1, enlace2, enlace3 y en estos otros para la liga ACB: enlace4, enlace5.

¿Fue tan mala la actuación española en los Mundiales de atletismo de Londres 2017?

Hace unos días se publicaba un artículo de mi cosecha (junto con Carlos Gómez-González y José Manuel Santos-Sánchez) titulado “A country-level efficiency analysis of the 2016 Summer Olympic Games in Rio: A complete picture”, aquí el enlace a la revista y aquí el enlace a una versión completa de acceso no restringido. Las tres contribuciones principales de dicho artículo son considerar el número de deportistas en los JJ.OO. como uno de los outputs para calcular la eficiencia de los países, una metodología para calcular la ineficiencia de los países que no obtienen ninguna medalla así como resaltar la importancia de estimar las funciones entre similares (e.g., países del mismo continente). España, en los Mundiales de Londres 2017, no ha conseguido ningún metal por primera vez en la historia de los Mundiales de Atletismo. Desde luego es un retroceso, pero a continuación voy a presentar los resultados replicando la metodología de dicho artículo.

Una de los argumentos que se ha usado en contra de la Federación Española, es que si el atleta cumplía los (duros)requisitos impuestos por la IAAF y el atleta demostraba encontrarse en forma el atleta sería seleccionado. Así, para quitar el sesgo de selección de atletas por parte de los países, también incluyo en el análisis un cuarto output: atletas con mínima y potencialmente participantes.[1]

En competiciones como los Juegos Olímpicos o Mundiales de atletismo es habitual usar como input (o predictor en función del objetivo) el PIB de los países. A continuación se muestran las correlaciones entre las medallas de los países en los Mundiales de Atletismo 2017, la puntuación obtenida según la IAAF (8 puntos por victoria, 7 punto segundo puesto, …, 1 punto octavo puesto), los atletas  y el PIB de los países.

Medallas Puntos Participantes Atletas con mínima
Medallas
Puntos 0.94
Participantes 0.60 0.76
Atletas con mínima 0.77 0.85 0.95
PIB 0.22 0.32 0.63 0.70

 

Como puede verse la correlación entre las medallas y el PIB es positiva pero no muy alta, relativamente normal pues el atletismo es dominado en varias disciplinas por países de renta baja como Jamaica, Kenia, Etiopía. Sin embargo, la correlación entre el número de participantes y el PIB es mucho más alta, y aún mayor respecto a los atletas con mínima. Los países que tengan una cantidad superior de medallas o participantes a los esperados dado su PIB serán considerados como más eficientes mientras que los países que tengan menos medallas de las esperadas. El nivel de eficiencia se encuentra entre 0 y 1, así cuanto más cerca a uno más eficiente. Más detalles técnicos sobre el cómputo de la eficiencia pueden verse en el citado artículo.

Antes de analizar los resultados de las funciones de producción que se estiman usando los datos de los países europeos, se muestra el gráfico que relaciona atletas con mínima para Londres 2017 y el PIB. Como puede verse España es uno de los países que más atletas con mínima tiene. En concreto se sitúa en sexto lugar detrás de Estados Unidos, Reino Unido, Alemania, Francia y Polonia. Si bien la distancia con Francia es nimia. Así España parece que tiene un sistema atlético capaz de generar muchos atletas con mínima. Buena señal.

A continuación se presentan los gráficos que relacionan los cuatro outputs: medallas, puntuación IAAF, número de participantes, y atletas con mínima con el PIB para los países europeos mostrando la función de producción que indica la máxima cantidad de output que se puede producir dado el PIB. Como la frontera es estocástica es posible que algún país se sitúe por encima de la frontera.

El país más eficiente en cuanto al número de medallas es Polonia con una diferencia bastante notable respecto al siguiente país que sería la República Checa. Para ver cual es la probabilidad que dado el PIB España no saque medalla, esta probabilidad puede interpretarse como eficiencia de los países con cero medallas. Esta cifra es de 0,13, lo cual sugiere que España debería sacar al menos una medalla y que desde luego hay que intentar salir de este bache en medallas.

Como se ha podido ver antes la correlación entre el número de medallas y la puntuación IAAF es muy alta. La ventaja es que hay muchos más países con puntuación que con medallas así se pueden ver todos juntos. España nuevamente resulta muy ineficiente, con una eficiencia de 0,22. Al igual que en medallas España debería ver como mejorar en el número de atletas que se sitúen entre los 8 mejores de un mundial.

Sin embargo, España tanto en atletas en Londres como en atletas con mínima para Londres se sitúa como segundo país más eficiente dentro de los 15 países con mayor renta europeos sólo por detrás de Polonia. En este sentido, puede verse como un éxito. Para poder tener muchos atletas con medallas en eventos futuros es importante tener muchos atletas del nivel suficiente como para clasificarse para un mundial.

 

País y1 y2 y3 y4 Ef. y1

(probit)

Ef. y1

(SF)

Ef. y2 Ef. y3 Ef. y4
Alemania 5 78 76 76 0.72 0.59 0.65 0.69
Reino Unido 6 105 92 77 0.76 0.70 0.69 0.71
Francia 5 68 55 51 0.73 0.59 0.63 0.64
Italia 1 9 37 32 0.37 0.12 0.59 0.55
España 0 14 59 49 0.13 0.22 0.70 0.71
Países Bajos 4 40 28 30 0.75 0.62 0.63 0.65
Turquía 2 21 27 24 0.61 0.40 0.63 0.60
Suiza 0 9 19 18 0.40 0.19 0.58 0.53
Suecia 1 8 32 26 0.46 0.20 0.69 0.67
Polonia 8 86 51 52 0.85 0.83 0.75 0.79
Bélgica 1 13 18 14 0.47 0.32 0.61 0.51
Noruega 2 14 13 16 0.65 0.37 0.57 0.57
Austria 0 3 5 5 0.60 0.09 0.38 0.28
Dinamarca 0 0 4 4 0.65 0.37 0.26
Irlanda 0 1 12 12 0.68 0.04 0.60 0.56
Finlandia 0 4 12 10 0.69 0.15 0.61 0.51
Portugal 2 17 21 24 0.69 0.55 0.71 0.74
Grecia 1 11 20 16 0.53 0.40 0.70 0.66
República Checa 3 37 27 24 0.77 0.78 0.74 0.75
Rumanía 0 0 15 10 0.72 0.67 0.55
Hungría 2 16 16 15 0.72 0.62 0.71 0.70
Ucrania 1 15 48 42 0.58 0.64 0.83 0.85
Eslovaquía 0 0 5 3 0.77 0.56 0.32
Luxemburgo 0 0 1 0 0.78 0.30
Bielorrusia 0 8 16 23 0.78 0.52 0.77 0.82
Azerbayán 0 8 4 4 0.78 0.52 0.57 0.46
Bulgaria 0 2 8 8 0.79 0.16 0.69 0.66
Croacia 2 19 9 7 0.76 0.78 0.71 0.63
Eslovenia 0 0 7 6 0.79 0.68 0.60
Lituania 1 10 15 14 0.64 0.64 0.78 0.78
Serbia 0 5 8 8 0.79 0.42 0.72 0.69
Letonia 0 0 12 8 0.80 0.78 0.72
Estonia 0 5 14 5 0.80 0.51 0.80 0.64
Chipre 0 0 5 4 0.80 0.70 0.60
Islanda 0 0 3 3 0.80 0.64 0.54
Bosnia-Herzegovina 0 0 3 4 0.80 0.65 0.62
Georgia 0 0 1 1 0.80 0.46 0.28
Albania 0 0 1 1 0.80 0.48 0.30
Armenia 0 0 1 0 0.80 0.49
Macedonia 0 0 1 0 0.80 0.50
Moldavia 0 1 5 5 0.81 0.22 0.78 0.76
Kosovo 0 0 1 0 0.81 0.55
Monaco 0 0 1 0 0.81 0.56
Montenegro 0 0 1 0 0.81 0.60
Andorra 0 0 1 0 0.81 0.62
San Marino  0  0  0 0 0.81  —  —  —

y1-medallas, y2-puntuación IAFF, y3-atletas participantes en Londres 2017, y4-atletas con mínima para Londres 2017

 

En resumen, la actuación de España en cuanto a número de medallas y puntuación IAAF fue mala siendo uno de los países más ineficientes, sin embargo en cuanto a participación tanto en participación efectiva como en atletas con mínima España es uno de los países más eficientes. Yo, que modestamente creo que algo de deporte sé, un buen sistema organizativo genera una gran cantidad de buenos atletas, que esos buenos atletas se conviertan en atletas excelentes (posibles ganadores de medalla) depende de muchos factores donde la suerte, en forma de atletas

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[1] Para obtener el número de atletas con mínima se ha consultado el ranking de la IAAF 2017. Si un país tenía más de tres atletas con mínima se consideraban sólo 3. Además, no se incluyen los relevos. Así puede haber pequeñas diferencias entre las cifras de atletas con mínima y la cifra de atletas potencialmente participantes.

Detrás de la mala prensa de la universidad española se esconde un buen sistema universitario: Ranking de Shangái 2017

Hoy se ha publicado los resultados de uno de los rankings globales de universidades más influyentes, el ARWU (Academic Ranking of World University) más conocido como ranking de Shanghái. Este es el enlace: www.shanghairanking.com/ARWU2017.html.

Como es habitual la prensa del día está llena de titulares negativos hacia el sistema universitario español. Y no les falta razón, el sistema universitario español no es capaz de tener universidades entre las mejores de las mejores. No hay ninguna universidad española entre las 50 primeras, ni entre las 100, hay que llegar al rango 201-300 para encontrar a las primeras universidades españolas: la Universidad de Barcelona, que según mis cálculos a partir de la información que proporciona el ranking, estaría en la posición 201, la Pompeu Fabra en la 262 mientras que la Universidad de Granada se situaría en la posición 252.

Sin embargo, con un análisis más completo se ve que el sistema universitario español a pesar de no ser capaz de generar universidades excelentes sí es capaz de generar un buen número de universidades muy buenas (top-500) y universidades buenas (top-800) es más es uno de los pocos países eficientes en el número de universidades Top-800.

La correlación que hay entre el PIB de los países y el número de universidades entre las 800 primeras según el ranking de Shanghái es 0,89 y de 0,84 entre el PIB y el número de universidades.[1] Es decir, el número de universidades entre las mejores del mundo está muy correlacionado con el PIB. La pregunta que surge, es ¿cómo se sitúa España en número de universidades dado el PIB?

 

Es habitual que para responder a esta pregunta se calcule lo que se conoce producto medio, que consiste en dividir el output, número de universidades en Top-500 o Top-800, entre el input, el PIB. Sin embargo, esto sólo sería adecuado si la función de producción presentase lo que los economistas conocemos como rendimientos constantes a escala, en caso contrario como ocurre en este caso se pueden obtener resultados incorrectos, como que Estados Unidos es uno de los peores países. Una forma más adecuada es calcular la eficiencia de los países a través de una función frontera como por ejemplo a través del Análisis Envolvente de Datos.

España cuenta con 26 universidades (todas públicas) en el Top-800 y 11 en el Top-500. Un primer indicio positivo del sistema universitario español es que los Países Bajos es el único país que con un menor PIB supera a España en el número de universidades Top-500. Un segundo es que España se sitúa en novena posición en cuanto a número de universidades en Top-800, teniendo una cifra similar a países como Francia, Cánada, Corea del Sur y Australia, todos ellos países con renta superior a la española.

A continuación puede verse la tabla con estos datos así como los niveles de eficiencia de los países en un modelo DEA de rendimientos variables orientado al output usando como input el PIB del país y como outputs el número de universidades en Top-500 y en Top-800. Así mismo pueden verse los gráficos que relacionan estas variables teniendo color rojo los países que delimitan la frontera según el modelo DEA. En el modelo Top-800 España es uno de los seis países eficientes junto con Islandia, Nueva Zelanda, España, Italia, Reino Unido y Estados Unidos. Sin embargo, España presenta un índice de eficiencia medio en el modelo Top-500.

Nota: Estados Unidos se ha eliminado del gráfico para que sea más claro.

Nota: Estados Unidos se ha eliminado del gráfico para que sea más claro.

 

País PIB (millones $) Nº univ.

Top 800

Nº univ.

Top 500

Eficiencia

Top 800

Eficiencia

Top-500

EE.UU. 17,947,000 190 135 1.00 1.00
China 10,866,400 91 45 0.73 0.50
Japón 4,123,260 36 17 0.58 0.37
Alemania 3,355,770 46 37 0.84 0.90
Reino Unido 2,848,760 50 38 1.00 1.00
Francia 2,421,680 30 20 0.67 0.59
India 2,073,540 7 1 0.17 0.03
Italia 1,814,760 37 16 1.00 0.58
Brasil 1,774,720 13 6 0.36 0.22
Cánada 1,550,540 26 19 0.81 0.76
Corea Sur 1,377,870 28 12 0.96 0.51
Australia 1,339,540 27 23 0.95 1.00
Rusia 1,326,020 4 3 0.14 0.13
España 1,199,060 26 11 1.00 0.52
China Taipei 1,156,440 13 7 0.52 0.34
Méjico 1,144,330 2 1 0.08 0.05
Países Bajos 752,547 13 12 0.73 0.82
Turquía 718,221 7 1 0.41 0.07
Suiza 664,738 10 8 0.62 0.60
Arabia Saudí 646,002 4 4 0.25 0.30
Argentina 548,055 3 1 0.22 0.08
Suecia 492,618 11 11 0.85 1.00
Polonia 474,783 6 2 0.48 0.19
Bélgica 454,039 7 7 0.57 0.69
Irán 425,326 8 2 0.69 0.21
Tailandia 395,282 3 1 0.27 0.11
Noruega 388,315 4 3 0.36 0.34
Austria 374,056 8 4 0.75 0.47
Egipto 330,779 3 1 0.30 0.13
Sudáfrica 312,798 8 5 0.84 0.68
Hong Kong 309,929 6 5 0.63 0.69
Malasia 296,218 5 2 0.54 0.29
Israel 296,075 7 6 0.76 0.86
Dinamarca 295,164 6 5 0.65 0.72
Singapur 292,739 2 2 0.22 0.29
Chile 240,216 4 2 0.49 0.34
Irlanda 238,020 5 3 0.61 0.52
Finlandia 229,810 7 5 0.87 0.89
Portugal 198,931 6 5 0.80 1.00
Grecia 195,212 3 3 0.41 0.61
Rep. Checa 181,811 4 1 0.56 0.22
Nueva Zelanda 173,754 7 4 1.00 0.90
Eslovenia 42,747 1 1 0.50 0.64
Serbia 36,513 1 1 0.57 0.70
Estonia 22,692 1 1 0.81 0.88
Islandia 16,599 1 1 1.00 1.00

 

En resumen, España no tiene universidades excelentes por lo que debe mejorar en este aspecto. Sin embargo, España cuenta con un número adecuado de universidades en el Top-800 si bien es mejorable en el Top-500. Así, si España quiere que sus universidades pasen de ser buenas a excelentes en los rankings internacionales la primera medida a adoptar es apostar por la universidad y la investigación y esto implica entre otras muchas cosas más recursos. Si las universidades españolas con recursos comparables a las que aparecen en los primeros puestos España no consigue colocar a ninguna entre los primeros puestos entonces dígase y bien alto: LA UNIVERSIDAD ESPAÑOLA ES UN DESASTRE, hasta entonces, si bien mejorable, la universidad española desde luego no es ningún desastre pues consigue que la mayoría de sus universidades públicas sean reconocidas en los principales rankings internacionales de universidades.

[1] Se quita Estados Unidos y China pues con su inclusión aumenta la correlación de forma algo ficticia.

Análisis del entrenador del año 2017 en la ACB

Autores: Andrés Maroto (@jazzandmar) y Julio del Corral (@jdelcorraltm)

Ahora que los equipos de la Liga Endesa están preparando sus plantillas de cara a la próxima temporada es buen momento para analizar los resultados de la temporada finalizada. Y como siempre desde este blog nos gusta hacerlo desde el punto de vista de la eficiencia de los entrenadores. Este año el galardón para el mejor entrenador de la ACB ha recaído en Txus Vidorreta, entrenador del Iberostar Tenerife, que ha llevado a los insulares a la fase final de la Copa del Rey y de los Play-Off de la Liga, consiguiendo el récord de victorias de la franquicia (22), así como a conquistar su primer título europeo tras vencer en la FIBA Champions League.

Al contrario que en años anteriores, en esta edición el premio se votaba entre los propios entrenadores de la Liga Endesa así como los miembros de la AEEB (Asociación Española de Entrenadores de Baloncesto) y, seguramente por esta razón, esta vez el galardón no ha recaído en el entrenador del equipo que ha logrado la primera plaza en liga regular (Pablo Laso) como ocurría en años anteriores. Por nuestra parte, en este blog siempre hemos creído que el premio debería llevárselo el entrenador que más rendimiento haya sacado a su plantilla y por eso llevamos tiempo haciendo análisis de la eficiencia de los mismos. ¿Qué tiene más mérito como entrenador? ¿Ganar 25 partidos de 32 con el Real Madrid o 22 con el Tenerife?

La cuestión seguro que no es fácil de responder y muchos usaran su percepción para decantarse por una u otra opción. Sin embargo, pueden usarse medios objetivos para responder a esta pregunta, así como para establecer un ranking de los entrenadores en una temporada. Una opción para ello es comparar los resultados obtenidos y los resultados esperados para un equipo a partir de las cuotas de apuestas deportivas. A partir de las cuotas de apuestas para un determinado partido se puede obtener la probabilidad de que suceda cualquiera de los dos resultados posibles (i.e., victoria del equipo local o victoria del equipo visitante) y a partir de las cuotas de todos los partidos de una temporada se puede calcular la probabilidad de obtener cada uno de los posibles número de victorias. Este método científico está validado dentro de la comunidad especializada y los resultados para temporadas anteriores pueden verse en un artículo que se publicó en el Journal of Sport Economics.

Para obtener una medida objetiva de la actuación de los entrenadores puede calcularse la probabilidad de haber obtenido más victorias que las realmente obtenidas. Entonces para calcular una medida objetiva del rendimiento del equipo lo único que hay que hacer es calcular el inverso de esa probabilidad para dar el rendimiento o eficiencia final en una escala entre 0 y 1. La siguiente tabla muestra el rendimiento de los entrenadores con la metodología descrita anteriormente para la presente campaña 2016/17 y que demuestra que, efectivamente, el entrenador que más rendimiento ha sacado a su equipo ha sido Txus Vidorreta (con una eficiencia técnica del 98%, la más alta de las últimas temporadas). El siguiente en el ranking sería Joan Plaza (con un 87% de eficiencia en el Unicaja Málaga) y completaría el podio de la fase regular Joan Peñarroya (77%) que ha llevado al Morabanc Andorra a la fase final de la Copa del Rey y a los Play-Off de la ACB.

*Sustituido por A. Martínez en la jornada 29

**Sustituido por L. Guil en la jornada 24

En la tabla anterior también se puede observar como Pedro Martínez, que finalmente consiguió ganar la liga ACB contra todo pronóstico al vencer al Real Madrid en la final, ocupa la quinta posición con una eficiencia del 72% (que no tiene en cuenta los resultados del play-off), justo por detrás de Sito Alonso que después de llevar al Baskonia a la 2ª posición de la fase regular y los cuartos de final de la Euroliga ha cambiado Vitoria por Barcelona este verano. Conviene resaltar que este tipo de indicador de la eficiencia no sólo coincide en la parte alta con el mejor entrenador de la temporada, sino que también lo hace en los puestos más bajos ya que los 3 entrenadores con peor rendimiento han sido los de los 3 equipos con menos de 10 victorias en la última temporada. Dos de ellos, además, fueron los únicos sustituidos a mitad de temporada (Tabak en el Real Betis y Casadevall en el Zaragoza).

Para los interesados pueden leer los análisis de eficiencia de los entrenadores de la Liga Endesa para la temporada anterior o para el período 2007-2014, así como uno similar para el caso de la NBA, en http://blog.uclm.es/juliocorral/blog/

 

 

Análisis alternativo de La Liga 2016-2017. ¡Ánimo pues, Alavés!

Julio del Corral y Carlos Gómez-González 

Con el final del campeonato nacional de liga en primera división se ha abierto la caja de Pandora y un sinfín de rumores con respecto al futuro de muchos jugadores colapsan las líneas editoriales.

Los directores deportivos son los encargados ahora de tomar decisiones sobre los objetivos de los equipos para la próxima temporada. Para ello, se requiere un análisis exhaustivo del rendimiento de los equipos y la actuación de entrenadores y jugadores. En este caso, ¿son los puntos una variable totalmente fiable para analizar el rendimiento?

Desde la Universidad de Castilla-La Mancha pensamos que es interesante utilizar otras medidas que nos den pistas sobre el rendimiento de los equipos en base a su potencial. Para ello, como venimos haciendo desde hace ya algunas temporadas, hemos llevado a cabo un análisis alternativo que utiliza las cuotas de apuestas para extraer probabilidades de victoria y ofrecer una imagen completa de La Liga 2016-2017.

Las cuotas de apuestas, que llevan información implícita sobre el potencial de los equipos y las expectativas sobre el rendimiento, son convertidas a probabilidades de victoria. Este primer paso permite obtener los puntos esperados de los equipos y calcular la eficiencia de los mismos como: 1 – la probabilidad de haber obtenido más puntos que los realmente obtenidos. Para obtener información detallada sobre esta metodología consulta este artículo en el Journal of Sports Economics.

La tabla que se muestra a continuación contiene tres clasificaciones alternativas para la temporada 2016-2017 en La Liga:

 

La Liga esperada

¡Qué sorpresa…! Ahí están, un año más, el Barcelona y el Real Madrid acaparando todas las expectativas de ganar el título liguero. A base de méritos propios el Atlético de Madrid ha conseguido consolidarse como el tercero en discordia, seguido por un Sevilla algo alejado. El Athletic de Bilbao y el Villareal aspirarían a competir en la Europa League, mientras que Sporting, Granada y Osasuna estarían peleando por esquivar el infierno de 2ª división con Alavés, Leganés y Betis.

La Liga actual

La temporada 2016-2017 en La Liga nos ha dejado estos resultados. El Real Madrid ganó el título en la última jornada con un Barcelona que no dejó de apretar el acelerador hasta el final. El Atlético y el Sevilla cierran los puestos que dan acceso a la Champions League 2017-2018. Por abajo no ha habido sorpresas esta vez. Sporting, Granada y Osasuna dijeron adiós a su andadura en la máxima categoría, quizá incluso mucho antes de lo esperado. Sólo el Sporting remó hasta el final contra un Leganés que mantuvo el pulso y repetirá al año que viene en 1ª división.

La Liga eficiencia

En el análisis de la primera vuelta, el Sevilla se consagró como campeón de invierno y se anticipó el buen papel de algunos equipos: “La liga de los equipos extraordinarios la completan en esta primera vuelta Real Sociedad, Alavés y Eibar ¡No se puede dar más con menos! ¡Enhorabuena!”.

Ahora, al final de temporada, la eficiencia se rinde a los pies del Alavés. El equipo blanquiazul que no ha podido conquistar la Copa del Rey ante el Barcelona en el Calderón, brilla con luz propia en esta clasificación. El mercado de apuestas lo esperaba allí, en el hoyo, peleando por salvar la categoría hasta el último momento con los de abajo. Sin embargo, en una temporada soberbia el Alavés ha terminado siendo el campeón de la liga eficiencia con 55 puntos (9ª posición) y 0.98 de coeficiente eficiencia. ¡Ánimo pues!

En esta liga destacan por abajo Granada y Osasuna. Ambos equipos, más algún otro como el Deportivo, y han obtenido muchos menos puntos de los que ya se les anticipaban. Es por ello que la lucha por evitar el descenso ha resultado ser un tanto descafeinada al final de temporada.

La liga de la eficiencia premia también el rendimiento de la Real Sociedad, Espanyol y Villareal con coeficientes por encima del 0,90 y puestos de acceso a Champions League ¡Trabajo más que bien hecho!

Por último, la tabla muestra como el Real Madrid tiene un valor de eficiencia mucho más alto que el Barcelona. Así, el Real Madrid necesitó hacer una buena campaña para ganar la Liga y que el Barcelona no la hiciese. Si se indaga más en los datos, se ve como la probabilidad de victoria promedio del Barcelona en casa fue 0,82 mientras que la del Real Madrid fue 0,80, fuera de casa las diferencias son mayores pues la probabilidad promedio de victoria del Barcelona fue de 0,69 mientras que la del Real Madrid de 0,64.  Si uno lee la prensa estos día da la sensación que el Barcelona debe hacer una revolución para volver a ser un equipo ganador mientras que el Real Madrid lo único que debe hacer es mantenerse igual, los datos no muestran lo mismo pues dicen que el Barcelona es mejor equipo que el Real Madrid y que éste último ha ganado la Liga gracias a hacer una buena temporada mientras que su gran rival la ha hecho regular.

¡La Liga que se esperaba, la que realmente es y la de la eficiencia!

El Sevilla es campeón de invierno en la Liga de la eficiencia. Atlético de Madrid y Valencia a la cola…

Autores: Julio del Corral y Carlos Gómez-González

En cualquier ámbito las personas tendemos a generar unas expectativas sobre acontecimiento futuros en base a percepciones o experiencias previas. El fútbol es un claro ejemplo. Antes de un partido somos capaces de intuir quién puede ser el vencedor. Del mismo modo, a largo plazo podemos intuir cuáles van a ser los equipos que luchen por el título a final de temporada.
Estas intuiciones vienen dadas por el potencial de los equipos. En La Liga, no todos los equipos compiten en igualdad de condiciones, dado que los presupuestos y el talento del que disponen son muy diferentes. Por tanto, ¿son los puntos la forma más objetiva de medir su rendimiento? ¿Existen otras formas?
Quizá no. Y sí, sí existen alternativas. Vamos a analizar el rendimiento de los equipos en la Liga con un enfoque diferente:
Las cuotas de apuestas deportivas, además de mantener a unos cuantos entretenidos los fines de semana, son una fuente de información extraordinaria. Las cuotas reflejan el potencial de los equipos y, por tanto, lo que se puede esperar de ellos. Para utilizarlas en nuestro análisis es necesario extraer las probabilidades de victoria de los equipos, reajustando el margen superfluo que las casas de apuestas imponen.

Así, una vez tenemos todas las probabilidades de victoria para los partidos de un equipo, es posible generar una función de densidad con las puntuaciones esperadas. Véase un ejemplo del Sevilla en esta primera vuelta:

Con toda la información de los puntos esperados, podemos calcular la eficiencia de los equipos en base a lo que se esperaba de ellos en las apuestas deportivas como uno menos la probabilidad de haber obtenido más puntos que los realmente obtenidos. Información más detallada sobre esta metodología puede ser encontrada en este artículo del Journal of Sports Economics.

La Tabla 1 muestra tres clasificaciones diferentes para la primera vuelta de La Liga en esta temporada 2016-2017:
La Liga que se esperaba
No es sorprende que los aficionados situaran al Barcelona y Real Madrid peleando por la 1ª posición. El Atlético cerraría el podio, por delante de un retrasado Sevilla en 4ª posición. Athletic y Valencia estaban llamados a ocupar puestos de Europa League, mientras que a Granada, Sporting y Osasuna se les esperaba luchando por mantener la categoría.
La Liga que realmente es
Los resultados actuales han llevado al Madrid a ocupar la 1ª posición, haciendo lo que se esperaba de ellos. Un poco por detrás de sus expectativas andan Barcelona y Atlético, mientras que la Real Sociedad y el Sevilla están mejorando cumpliendo con creces. Muy notorio es el caso del Valencia, cuyos números están lejos de la puntuación que se esperaba de ellos al principio de temporada.
La liga de la eficiencia
En nuestra particular liga de la eficiencia, el Sevilla de Sampaoli está cuajando una temporada espectacular y cierra la primera vuelta bordando el coeficiente de eficiencia. Además, la última joya de Monchi, el montenegrino Stefan Jovetic, no ha podido aterrizar con mejor pie. ¡Suenan tambores de guerra en Nervión!
La liga de los equipos extraordinarios la completan en esta primera vuelta Real Sociedad, Alavés y Eibar ¡No se puede dar más con menos! ¡Enhorabuena!
Mientras que el Real Madrid está en los números esperados, el Barcelona cae hasta la posición 15ª. Unos pocos puntos de diferencia significan una gran caída en la eficiencia a estos niveles. ¡La vida en la cumbre es así de dura!
La lista la cierran por la cola el Atlético de Madrid, Valencia y Granada.
La eficiencia del Atlético de Madrides una de las grandes desconocidas de nuestra peculiar clasificación en esta primera vuelta. El Atlético emergente que sorprendió a medio mundo acariciando lo intocable, hoy tiene reservado el papel de actor principal. Los fans esperaban más del Atlético, pero Simeone ha declarado que les gusta verse exigidos. ¡Le esperamos a final de temporada en nuestro ranking!
Por último, es muy destacable el mal momento que está atravesando el Valencia. Los aficionados que esperaban verlo luchando por puestos europeos hoy lo ven relegado a la posición 18ª de la liga de la eficiencia. En cualquier caso, súper Voro parece haber vuelto al rescate. Estaremos atentos a esta evolución.
¡Veremos que nos depara la 2ª vuelta!

Rendimiento de los equipos en Liga 123 en la primera vuelta 2016-2017

Este fin de semana ha concluido la primera vuelta en la Liga 123, popularmente conocida como Segunda División, y es un buen momento para analizar el rendimiento de los equipos hasta este momento. Se puede analizar el rendimiento de los equipos de forma objetiva usando una medida que muestre lo bien o lo mal que lo están haciendo los equipos dado su potencial. Lo que se espera de un equipo de fútbol puede obtenerse a través de las cuotas de las casas de apuestas deportivas. Las cuotas reflejan el inverso de las probabilidades establecidas por la casa de apuestas ajustadas ligeramente para que la casa tenga un pequeño margen (este suele rondar el 7%). Varios trabajos han obtenido que las probabilidades calculadas a partir de las cuotas de las casas de apuestas son eficientes en el sentido que reflejan bien las probabilidades de los resultados. La probabilidad de obtener una determinada cantidad de puntos para cada equipo puede calcularse a partir de las probabilidades asociadas a las cuotas de los partidos de ese equipo, esto estadísticamente hablando es la función de densidad de los puntos conseguidos por un equipo.
Una vez calculada estas funciones se puede calcular la probabilidad de que el número de puntos obtenido por un equipo hubiese sido igual o inferior que el número de puntos obtenidos. Para ello lo único que hay que hacer es sumar la probabilidad de haber obtenido desde cero puntos hasta los puntos obtenidos. Este valor lo etiqueto como eficiencia, pues es una medida de lo bien (valores próximos a 1) o mal (valores próximos a 0) que lo han hecho los equipos.
Adicionalmente, agregando la multiplicación cada posible puntuación por su probabilidad se obtiene la puntuación esperada para cada equipo, y de esta forma se puede obtener otra medida del rendimiento de los equipos esta vez medido en puntos sin dar una nota entre 0 y 1. Los equipos que tengan una diferencia positiva es que han tenido un rendimiento por encima del esperado mientras que los equipos que tengan una diferencia negativa es que han tenido un mal rendimiento.
La siguiente tabla muestra la eficiencia de cada uno de los equipos en la Liga 123 en la primera vuelta de la temporada 2016/2017.
Eficiencia de los equipos en la primera vuelta liga Adelante 2016-2017
Equipo
Eficiencia
Puntos
Puntos esperados
Puntos-Puntos esperados
Levante
0,99
46
33,2
12,8
Girona
0,88
39
32,7
6,3
Sevilla Atlético
0,88
31
25,0
6,0
Cádiz
0,87
33
27,0
6,0
Getafe
0,76
35
31,4
3,6
Lugo
0,76
31
27,5
3,5
Reus Deportiu
0,75
30
26,6
3,4
Valladolid
0,61
31
29,9
1,1
Huesca
0,61
28
27,0
1,0
Tenerife
0,61
30
29,0
1,0
Oviedo
0,56
29
28,7
0,3
Elche
0,50
26
26,6
-0,6
Numancia
0,48
27
27,9
-0,9
Zaragoza
0,39
27
29,1
-2,1
Córdoba
0,38
26
28,4
-2,4
Mirandés
0,28
22
26,0
-4,0
Alcorcón
0,22
23
28,0
-5,0
Almería
0,17
21
27,1
-6,1
Mallorca
0,15
23
29,5
-6,5
UCAM Murcia
0,13
20
26,9
-6,9
Gimnàstic
0,09
18
25,9
-7,9
Rayo Vallecano
0,08
24
32,6
-8,6
Notas: elaborada usando la media de las cuotas de 4 casas de apuestas.
Los equipos están ordenados en orden decreciente de la eficiencia.
Un resultado curioso es que el que el primer y último equipo en eficiencia son los dos equipos que se espera consigan más puntos. Sin embargo, el Levante consigue una primera vuelta casi perfecta con una eficiencia de 0,99, mientras que el Rayo Vallecano apenas consigue una eficiencia de 0,08. Otros tres equipos que han hecho una primera vuelta muy meritoria son el Girona, el Sevilla Atlético y el Cádiz. Por su parte el Oviedo obtiene una puntuación muy cerca de la puntuación esperada.  
Otro hecho a destacar es la igualdad que se ve en esta liga que se manifiesta en que la puntuación esperada de los equipos apenas varía desde los 25 puntos esperados del Sevilla Atlético a los 33,2 puntos del Levante.

Julio del Corral Cuervo es profesor de Economía en la Universidad de Castilla-La Mancha.

Los horarios poco habituales en La Liga reducen la asistencia en más de un 5%

Autores: Laura Bermejo Camacho, Julio del Corral y Carlos Gómez-González

Arrancaban los platos fuertes del campeonato nacional de liga correspondientes a la quinta jornada; y lo hacían un día laborable (miércoles) en horario inusual. El Real Madrid recibió al Villareal en el Santiago Bernabéu a las 20:00 h ante 67.328 espectadores, una entrada muy por debajo de la media que habitualmente registra el equipo blanco. El partido tenía el atractivo añadido para el Real Madrid de superar el récord de 16 victorias consecutivas del FC Barcelona de Pep Guardiola. Por otro lado, el Camp Nou albergó el encuentro entre el FC Barcelona y el Atlético de Madrid dos horas más tarde, a las 22:00 h. Empezaba el encuentro marcado por la noticia del acuerdo entre el FC Barcelona y Transportes Metropolitanos de Barcelona (TMB) para ampliar el horario del metro de la ciudad hasta la 1 de la madrugada; con el fin de proporcionar una alternativa “sostenible” y “segura” a los asistentes al estadio. El Camp Nou registró finalmente una buena entrada pero lejos del lleno (89.421 espectadores) para ver el choque de dos llamados a alzarse con el título liguero esta temporada.
En cualquier caso, se puede afirmar que el domingo ha dejado de ser el día del fútbol en nuestro país. Poco a poco nos hemos acostumbrado a ver a nuestros equipos jugar los sábados (más tarde o más temprano), los viernes e incluso los lunes. Además, las jornadas entre semana aprietan aún más si cabe un calendario a rebosar. Se quejaba Luis Enrique al finalizar el partido de lo difícil que va a ser cuidar de sus estrellas, en referencia a Leo Messi, con este calendario. Sin embargo, al aficionado nunca se le ha llegado a explicar de forma clara la motivación de estos horarios tan poco usuales. Con más o menos certeza, se intuye que los derechos televisivos han tenido algo que ver.
El año pasado, La Liga de Fútbol Profesional Española (La Liga) hizo públicos los términos del contrato que regulaba la venta de derechos televisivos. Hoy sabemos que La Liga es la única competición europea que ingresa más dinero por derechos televisivos en el extranjero que en el territorio nacional. La inversión procedente únicamente de América y Asia/Oceanía, con compañías como ESPN, beIN SPORTS y PPTV, alcanzó los 206 y 178 millones de euros respectivamente el curso pasado. En consecuencia, los equipos de la Primera y Segunda División están percibiendo unos ingresos mucho mayores. Pero, ¿qué pasa con la asistencia a los estadios? ¿Cómo se comportan los aficionados ante este baile de horarios?
Un grupo de investigadores de la Universidad de Castilla-La Manchaha realizado un estudio para averiguar cómo afectan los horarios de los partidos al número de asistentes en los estadios de la liga española desde la temporada 2008-2009hasta la 2014-2015. Para ello se dividieron los horarios de acuerdo al número total de partidos en usual (más de 200 partidos), poco usual (entre 50 y 200 partidos) e inusual (menos de 50 partidos)[1]; así como en fin de semana y entre semana. Los horarios representan, por tanto, la principal variable independiente del estudio. La asistencia a los estadios, definida como el número de espectadores en relación a la capacidad máxima del estadio o porcentaje de ocupación (share), conforma la variable dependiente. Los números de asistencia para cada partido se obtuvieron de la página web www.worldfootball.net[2].
Este estudio, perteneciente al Trabajo Fin de Grado de la estudiante Laura Bermejo, arroja algunos resultados interesantes. La relación entre los números de asistencia media a los estadios y los horarios, sin tener en cuenta ningún otro factor, es la siguiente: horario usual (29.533 espectadores), horario poco usual (24.626espectadores) y horario inusual (25.689 espectadores). La Figura 1 muestra de forma gráfica estos resultados. Así, se observa que los partidos jugados en horario inusual registran un mayor número de asistentes que aquellos disputados en horario poco usual, en contra de lo que cabía esperar. Finalmente, los encuentros en horario usual presentan la media más alta de espectadores.



Figura 1. Media de asistencia según el tipo de horario (Temporadas 2008-09
a 2014/15)
No obstante, para comprobar que no existiesen factores que pudieran interferir en esta relación y completar el análisis, se utilizó un modelo de regresión lineal[3].
El análisis incluyó, además de los números de asistencia (share), el día de partido (fin de semana o entre semana) y los diferentes horarios(horario usual, poco usual e inusual), otras variables de control típicas de un análisis de demanda. La variable probabilidad de victoria del equipo local, construida a partir de cuotas de apuestas deportivas, controla el efecto que pueda tener sobre la asistencia la superioridad del equipo que juega en casa. Se espera que la asistencia a los estadios sea mayor cuando el equipo de casa tenga más probabilidades de ganar el partido. Además, para controlar la influencia que puedan generar en el análisis las diferencias existentes entre los diferentes equipos de La Liga, se incluyeron los efectos fijos del equipo local y los efectos fijos del equipo visitante. El análisis incorporó, también, la variable mes de partido para identificar la época del año en la que se disputan los encuentros. En este caso, se prevé una mayor asistencia durante el primer mes de competición (debido a la novedad de la temporada que comienza) y el último (debido a la incertidumbre por conocer el desenlace de la misma). Finalmente, se crearon hasta 6 modelos diferentes que permitiesen incorporar las variables de control de forma gradual a la regresión, con el fin de identificar su influencia en los números de asistencia.

Tabla 1. Resultados del análisis de regresión con variable dependienteshare de asistencia
Variables
Modelo 1
Modelo 2
Modelo 3
Modelo 4
Modelo 5
Modelo 6
Coeficiente
Coeficiente
Coeficiente
Coeficiente
Coeficiente
Coeficiente
Día de Partido
Fin de semana
0,026 ***
0,030 ***
0,037 ***
Tipo de Horario
Horario Poco Usual
-0,012 *
-0,021 ***
-0,014 **
-0,025 ***
-0,026 ***
-0,039 ***
Horario Inusual
-0,030 ***
-0,054 ***
-0,032 ***
-0,059 ***
-0,034 **
-0,067 ***
Probabilidad Victoria Equipo Local
Efecto Fijo
Equipo
Local
No
No
Efecto Fijo Equipo Visitante
No
No
No
No
Mes de Partido

<!–[if gte msEquation 12]>R2<![endif]–>

0,975
0,975
0,972
0,972
0,954
0,954

<!–[if gte msEquation 12]>R2Adj<![endif]–>

0,974
0,974
0,972
0,972
0,954
0,954
N
2.660
2.660
2.660
2.660
2.660
2.660
Nota: * p<0,10; ** p<0,05; *** p<0,01

La Tabla 1 muestra los resultados del análisis de regresión.[4] Uno de los resultados principales del estudio es que los partidos en fin de semana tienen una asistencia media significativamente mayor que entre semana (p<0,01). En cifras, esta diferencia, que supone un 2,6% del total de la media de asistencia, superaría los 1.200 espectadores. Además, los resultados muestran claramente cómo los partidos que se disputan en horario poco usual e inusual presentan una afluencia de espectadores significativamente menor que aquellos jugados en horario usual (p<0,01). Este desequilibrio refleja una pérdida de espectadores del 2,1% de media en los partidos disputados en horario poco usual y del 5,4% en horario inusual. Nótese la disminución gradual de los números de asistencia conforme a lo inusual de los horarios cuando se incluyen todas las variables de control en el análisis. Los resultados del resto de variables, que no comentaremos en profundidad, se corresponden con las hipótesis previstas.
Estos resultados son importantes por dos motivos. Primero, aunque los equipos aumenten sus ingresos televisivos, la taquilla en día de partido, que supone una media del 30% de los ingresos totales de los mismos, podría verse alterada por estos nuevos horarios. Segundo, la satisfacción de los aficionados, que tienden a asistir más a los partidos en horarios usuales los fines de semana, podría verse deteriorada.
Si el objetivo de los nuevos horarios es atraer más inversión procedente de televisiones extranjeras; y que La Liga (540 millones de euros) alcance a la Premier League (1,5 billones de euros) en ingresos para los equipos, se antoja complicado, al menos de momento.
¿Estamos dispuestos a vender nuestros horarios a cualquier precio? Y si este fuera el caso, ¿dónde establecemos el límite?
Equipo investigador conformado por:
Profesor Julio del Corral Cuervo
Estudiante de Doctorado Carlos Gómez González
Estudiante de Grado Laura Bermejo Camacho y en búsqueda activa de empleo

[1] Los horarios inusuales serían: Domingo: 22h., 23h., Lunes: 17 h., 19 h., 20 h., 22 h., 23 h., Martes: 12 h., 18 h., 20 h., 21 h., 22 h., Miércoles: 18 h., 19 h., 21 h., 22 h., Jueves: 20 h., 21 h., 22 h., Viernes: 20 h., 22 h., 23 h., Sábado: 17 h., 19 h., 23 h. Los horarios poco usuales serían Lunes 21 h., Miércoles 20 h., Viernes 21 h., Sábado: 16 h., 21 h., Domingo: 12 h., 16 h., 18 h., 20 h.
[2] La no disponibilidad de los datos de asistencia a nivel de partido de forma telemática en la web oficial de La Liga y la posterior confirmación vía telefónica propició el uso de esta página web alternativa por parte del equipo investigador.
[3] El equipo investigador está dispuesto a replicar el estudio con los datos oficiales de asistencia de La Liga si pudieran ser rastreados.
[4] En el Trabajo Fin de Grado de Laura Bermejo que puede descargarse aquí hay otro conjunto de estimaciones donde la variable dependiente es el número de espectadores.

Relación entre eficiencia en universidades de los países y eficiencia en los JJOO

En junio 2016 fue presentado, bajo mi punto de vista, el mejor Trabajo Fin de Grado que he dirigido hasta este momento. La alumna se llama María Moraga (aquíun enlace al trabajo). El tema del trabajo era analizar la eficiencia de los países en tener universidades de élite según el ranking THE, que es uno de los más prestigiosos y que en su edición de 2015 incluía a 800 universidades, y por otro lado analizar la eficiencia de los países en el desempeño olímpico, analizando los Juegos de Londres 2012. Como este verano se han desarrollado los Juegos Olímpicos de Río esos cálculos han quedado obsoletos. Sin embargo, con motivo de un congreso de Economía del Deporte he actualizado los cálculos de la eficiencia de los países en los Juegos Olímpicos calculando la eficiencia tanto en participantes como en número de medallas (aquíenlace al artículo del blog y aquíenlace a las transparencias usadas en el congreso).

Una pregunta que me he hecho estos días es ver si hay alguna relación entre ambas eficiencias. La forma más fácil es hacerlo a través de los siguientes gráficos:
Nota: las barras indican la media en la muestra

Nota: las barras indican la media en la muestra
Como puede verse no se aprecia ninguna relación entre ambas eficiencias, de hecho las correlaciones son de 0,16 entre eficiencia en número de medallas y eficiencia en el número de universidades y de 0,04 entre la eficiencia en el número de participantes en Río y el número de universidades. Esta relación es muy baja, y por tanto se puede concluir que no hay relación entre ser un país eficiente en el éxito de las universidades y en el éxito de los deportistas.
Al ver la situación de España en ambos gráficos aparecen las buenas noticias, pues se sitúa en el cuadrante de eficiencia alta. De hecho la eficiencia de España es mucho más alta en universidades que en el deporte donde en niveles de participación si obtiene niveles muy altos pero en el número de medallas se sitúa sólo un poco por encima de la media. 

Análisis de la “eficiencia” de los países en los JJ OO de Río: ¿Qué tal bien lo ha hecho España?

Después de cada uno de los JJ OO los periódicos de todo el mundo se llenan de análisis del “éxito” de su país en dichos JJ OO. Muchos de estos análisis se basan en exclusiva en el análisis del medallero, que siendo un elemento muy importante no es lo único que habría que mirarse. Por ejemplo, Jamaica ocupó la posición 16 del medallero de los Juegos Olímpicos de Río, siendo claramente un éxito para dicho país. En cambio China con su tercer puesto no ha tenido una actuación brillante. ¿Por qué esta diferencia? La idea es bien sencilla, Jamaica ha tenido muchas más medallas de las esperables para un país de su población y PIB. En cambio China no tanto.
Por ello, para medir el éxito o fracaso de un país en los JJ OO no sólo hay que fijarse en su posición en el medallero. Una primera aproximación sería calcular la ratio entre medallas y población o PIB, es lo que los economistas llamamos productos medios. Sin embargo, si la tecnología no tiene rendimientos constantes a escala un país que esté produciendo de forma eficiente, es decir lo máximo que podría producir dados sus inputs, podría tener un menor valor del producto medio. (Una explicación más detallada puede encontrarse en la página 33  de este, magnífico, Trabajo Fin de Grado que dirigí recientemente)
Así, hay bastante literatura que ha analizado de una u otra manera la eficiencia de los países en los JJ OO. En la página 21 del citado Trabajo Fin de Grado hay una breve revisión de esta literatura. Todos los trabajos utilizan como output alguna medida de éxito deportivo asociado a las medallas olímpicas o los diplomas olímpicos. Para producir deportistas de éxito es necesario contar con población que se dedique a la práctica deportiva, en este caso usar la población de un país como aproximación parece bastante razonable. Además es necesario gastar en deporte, en gastos como instalaciones deportivas, material deportivo, entrenadores, competiciones de los deportistas, sustento económico deportistas si fuese necesario. Sin embargo,  ninguna base de datos fiable ofrece alguna variable que recoja este tipo de gasto para un número amplio de países. La solución adoptada en la literatura es usar el PIB como aproximación al gasto en deporte. Pero, en este caso las diferencias entre países son más acusadas pues asumir una relación directa entre el PIB y el gasto en deporte sería lo mismo que asumir que la relación entre el número de vacas de una explotación y la cuenta corriente de su dueño. Así, al no disponer de los inputs para producir éxitos deportivos la eficiencia debería etiquetarse como “eficiencia”. Otros trabajos han incorporado otras variables para aproximar el gasto en deporte como por ejemplo con el gasto en recreación y cultura.
Hasta ahora todos los trabajos han analizado el éxito en los JJ OO usando medallas o diplomas, sin embargo el primer éxito para un deportista es la clasificación para los JJ OO. Así, como outputs en este breve artículo van a ser considerados tanto el número de participantes en los JJ OO de Rio 2016 como el número total de medallas, dejando otros posibles outputs como la suma número de diplomas olímpicos (posiciones 4-8) y medallas (posiciones 1-3), o una puntuación ponderando las medallas, dado que al usar como output el número de medallas se asume que un oro y un bronce tienen el mismo valor para trabajos posteriores. Así mismo, como “input” va a usarse sólo el PIB, pues su poder explicativo es muy superior al de la población, incluso en algunos modelos la población no es significativa estadísticamente.
El siguiente gráfico muestra la relación entre el número de participantes y el PIB de cada país. En este caso se han excluido China y Estados Unidos por ser claramente dos valores atípicos o outliers.

 El primer resultado es que el PIB explica en gran medida el número de participantes pues el R2 es superior al 70%. La curva verde es la regresión cuadrática entre el número de participantes y el PIB. Para tener una primera aproximación a qué países lo hacen por encima de lo esperado bastaría con mirar si un país se sitúa por encima o por debajo de la línea verde. En el caso de España se sitúa claramente por encima. Los países que más destacan son Brasil que como país organizador tiene asegurada una amplia participación independientemente del nivel de sus deportistas y Australia. El caso es Australia es diferente al de Brasil, el COI tiene un método de clasificación de deportistas por continentes en el que debe de haber ciertos deportistas de cada continente. Australia en la mayoría de deportes a nivel de Oceanía sólo cuenta con Nueva Zelanda como rival destacable. Así para evitar este tipo de sesgos a continuación se reproduce el mismo gráfico pero para los países europeos.

En este caso el R2 es aún mayor siendo cercano al 85%. España sigue situándose por encima de la recta de regresión. Para obtener una medida más precisa de la “eficiencia” de los países se estimó una frontera estocástica que permite obtener como “eficiencia” la ratio entre el valor del output y el valor máximo que se podría producir dada la cantidad de PIB de cada país. Esta línea es la naranja. Se divide a los países europeos en tres terciles en función de su valor de eficiencia y España aparece en el grupo más eficiente en términos de participación.
En el caso del número de medallas los países que se sitúan muy encima de lo esperable son Reino Unido y Rusia. España en cambio se sitúa justo en la recta de regresión.
Replicando el gráfico pero para los países europeos puede verse que España se sitúa por debajo de la recta de regresión, situándose en este caso en el grupo de eficiencia media dentro de los países europeos.
Por último a continuación se analiza la relación entre las eficiencias en participación y en medallas calculadas usando los países europeos. Aquellos países como Reino Unido, Azerbayán y Rusia situados muy por encima de la recta de regresión son países que han tenido un mejor rendimiento en medallas que en participantes. En cambio los países situados muy debajo de la recta de regresión son países que han tenido un mejor rendimiento en la participación que en medallas como por ejemplo Portugal, Estonia o Irlanda. España se sitúa en el grupo de países que tienen una mayor eficiencia en la participación que en medallas. 
Por tanto el reto para Tokio 2020 debería ser trasladar la buena participación de Río 2016 en más medallas para Tokio 2020. 
PD: Para los más curiosos en este enlacepuede descargarse el Excel con los datos usados y con las eficiencias calculadas.