{"id":964,"date":"2026-03-11T18:16:20","date_gmt":"2026-03-11T16:16:20","guid":{"rendered":"https:\/\/blog.uclm.es\/miguelangeltarancon\/?p=964"},"modified":"2026-03-12T17:08:23","modified_gmt":"2026-03-12T15:08:23","slug":"prueba-1","status":"publish","type":"post","link":"https:\/\/blog.uclm.es\/miguelangeltarancon\/2026\/03\/11\/prueba-1\/","title":{"rendered":"La multicolinealidad en el modelo de regresi\u00f3n: una oficina en caos\u2026 que a veces funciona."},"content":{"rendered":"\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"572\" src=\"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-1024x572.jpg\" alt=\"\" class=\"wp-image-987\" srcset=\"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-1024x572.jpg 1024w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-300x167.jpg 300w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-768x429.jpg 768w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-1536x857.jpg 1536w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/Oficina-2048x1143.jpg 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><strong>The office.<\/strong><\/p>\n\n\n\n<p>\ud83e\udd28 La <strong>multicolinealidad<\/strong> en el modelo de regresi\u00f3n m\u00faltiple, \u00bfes un problema grave?<br><br>Depende.<br><\/p>\n\n\n\n<p>Imagina una oficina. En ella trabajan varios empleados \u2014los llamaremos regresores\u2014 cuya misi\u00f3n conjunta es producir una previsi\u00f3n de la actividad de la empresa (la variable dependiente y). Ahora imagina tres situaciones posibles:<\/p>\n\n\n\n<p><strong>\u2022 Escenario 1 \u2014<\/strong> La oficina bien organizada: cada empleado tiene un rol perfectamente definido, no se pisa con nadie, y es bueno en lo suyo. El trabajo sale adelante con eficiencia y eficacia. Esto es lo que los econometristas llamamos un modelo bien especificado, sin multicolinealidad.<\/p>\n\n\n\n<p><br><strong>\u2022 Escenario 2 \u2014<\/strong> La oficina ca\u00f3tica: los empleados son competentes, pero nadie ha definido bien qui\u00e9n hace qu\u00e9. Se solapan continuamente, repiten tareas, se estorban. Y, sin embargo, el trabajo sale adelante, aunque sea de manera algo desordenada. Este es el escenario de la multicolinealidad: los regresores se duplican mutuamente la informaci\u00f3n, pero el modelo puede seguir siendo \u00fatil para predecir.<\/p>\n\n\n\n<p><br><strong>\u2022 Escenario 3 \u2014 <\/strong>La oficina con personal inadecuado: las funciones est\u00e1n bien repartidas y no hay conflictos entre empleados. El problema es que ninguno de ellos es muy bueno en lo suyo. El trabajo no sale adelante. Es el caso de los regresores d\u00e9biles: variables que, aunque independientes entre s\u00ed, simplemente no explican la variable dependiente.<\/p>\n\n\n\n<p><strong>El experimento: tres mundos paralelos con el mismo n\u00famero de regresores.<\/strong><\/p>\n\n\n\n<p>Para poner a prueba estas tres situaciones de forma controlada, hemos simulado datos bajo cada escenario y estimado un modelo de regresi\u00f3n lineal con dos variables explicativas. La muestra de estimaci\u00f3n tiene 30 observaciones; las 5 restantes se reservan para validaci\u00f3n (predecimos esos 5 valores y medimos el error).<\/p>\n\n\n\n<p><br><em>Escenario 1: el ideal (x1 y x2 independientes y potentes)<br><\/em>x1 y x2 se generan como variables aleatorias independientes (correlaci\u00f3n \u2248 0) y sus coeficientes verdaderos son grandes. El ruido es moderado. El resultado esperado: R\u00b2 alto, coeficientes significativos, buena predicci\u00f3n. La oficina de ensue\u00f1o.<\/p>\n\n\n\n<p><br><em>Escenario 2: multicolinealidad (x3 y x4 casi colineales)<\/em><br>x4 se construye directamente como una transformaci\u00f3n lineal de x3 m\u00e1s un peque\u00f1o ruido (x4 \u2248 0.95\u00b7x3). La correlaci\u00f3n entre ambas ronda 0.96, un nivel de multicolinealidad severa. Sin embargo, el modelo verdadero que genera y utiliza ambas variables con coeficientes sustanciales. \u00bfLograr\u00e1 el modelo predecir bien a pesar del caos interno?<\/p>\n\n\n\n<p><em><br>Escenario 3: regresores d\u00e9biles (x5 y x6 irrelevantes)<\/em><br>x5 y x6 son independientes entre s\u00ed (correlaci\u00f3n \u2248 0), pero sus coeficientes verdaderos son muy peque\u00f1os y el ruido es enorme. La se\u00f1al es casi inexistente. Aqu\u00ed la oficina est\u00e1 bien organizada, pero los empleados son, lament\u00e9moslo sin rodeos, bastante in\u00fatiles para el trabajo que se les encomienda.<\/p>\n\n\n\n<p><strong>Los resultados: cuando los n\u00fameros confirman la met\u00e1fora.<\/strong><\/p>\n\n\n\n<p>La tabla siguiente recoge, de un vistazo, todo lo que necesitamos saber sobre los tres escenarios:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"815\" src=\"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/imagen-5-1024x815.png\" alt=\"\" class=\"wp-image-1015\" srcset=\"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/imagen-5-1024x815.png 1024w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/imagen-5-300x239.png 300w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/imagen-5-768x611.png 768w, https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-content\/uploads\/sites\/67\/2026\/03\/imagen-5.png 1434w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p>Leamos los resultados con calma, escenario por escenario.<\/p>\n\n\n\n<p><br><em><strong>Escenario 1:<\/strong> todo lo que uno esperar\u00eda de un modelo bien especificado.<\/em><br>El R\u00b2 es de 0.905, y el R\u00b2 ajustado de 0.898. Ambas variables x1 y x2 son altamente significativas (p &lt; 0.001 en los dos casos). La correlaci\u00f3n entre regresores es de \u22120.24, es decir, pr\u00e1cticamente nula. Y el MAE de validaci\u00f3n es de 1.65: el modelo predice con una precisi\u00f3n envidiable. Esto es lo que deber\u00eda ser la norma, aunque en la pr\u00e1ctica econ\u00f3mica real raramente lo es.<\/p>\n\n\n\n<p><br><strong>En la oficina del Escenario 1, cada empleado sabe exactamente cu\u00e1nto ha contribuido al resultado del d\u00eda y puede demostrar su aportaci\u00f3n con un p-valor que lo respalda. Vida sencilla y reconfortante.<\/strong><\/p>\n\n\n\n<p><br><em><strong>Escenario 2:<\/strong> el caos que funciona\u2026 a medias<\/em><br>Aqu\u00ed empieza lo interesante. El R\u00b2 es incluso mayor que en el Escenario 1: 0.954. El modelo explica casi el 95% de la variabilidad de y. Hasta aqu\u00ed, buenas noticias.<\/p>\n\n\n\n<p>Pero fij\u00e9monos en los coeficientes individuales: el de x3 tiene un p-valor de 0.114, claramente por encima del umbral del 5%. En una lectura apresurada, podr\u00edamos concluir que x3 no es relevante. \u00a1Grave error de interpretaci\u00f3n!<\/p>\n\n\n\n<p><br>Lo que ocurre es que x3 y x4 est\u00e1n tan correlacionadas (r = 0.96) que el modelo no puede repartir el m\u00e9rito entre ellas. Sabe que algo est\u00e1 explicando la variabilidad de y, pero no consigue distinguir a qui\u00e9n atribuirlo. Es como si dos empleados hicieran exactamente el mismo trabajo: el jefe sabe que la tarea est\u00e1 hecha, pero no sabe a cu\u00e1l de los dos felicitar. Sin embargo, la capacidad predictiva se mantiene razonablemente buena: el MAE de validaci\u00f3n es de 2.63, algo mayor que en el Escenario 1, pero perfectamente aceptable.<\/p>\n\n\n\n<p><strong>La oficina ca\u00f3tica produce, aunque sea desordenadamente. Esto confirma el argumento del post introductorio: la multicolinealidad no es necesariamente un problema grave si el objetivo del modelo es predecir.<\/strong><\/p>\n\n\n\n<p>El diagn\u00f3stico preciso: la multicolinealidad infla los errores est\u00e1ndar de los coeficientes, haciendo que parezcan no significativos individualmente. Pero no deteriora (o lo hace poco) la capacidad explicativa y predictiva del conjunto. Es un <strong>problema de identificaci\u00f3n, no de ajuste.<\/strong><\/p>\n\n\n\n<p><em><strong>Escenario 3: <\/strong>la oficina competente\u2026 en el papeleo<\/em><br>El Escenario 3 es el m\u00e1s desolador. La correlaci\u00f3n entre x5 y x6 es pr\u00e1cticamente cero (0.002): <strong>no hay multicolinealidad<\/strong>. Todo parece en orden. Pero el R\u00b2 es de 0.023. No es una errata: el modelo explica el 2,3% de la variabilidad de y. Los coeficientes de ambas variables tienen p-valores de 0.65 y 0.52, respectivamente. No son significativos ni de lejos. Y el MAE de validaci\u00f3n es de 6.50, cuatro veces mayor que en el Escenario 1.<\/p>\n\n\n\n<p><br>Aqu\u00ed no hay multicolinealidad que diagnosticar ni corregir. El problema es m\u00e1s fundamental: las variables x5 y x6 sencillamente no tienen poder explicativo sobre y. Aunque est\u00e9n perfectamente diferenciadas en sus roles, si ninguna de las dos tiene informaci\u00f3n \u00fatil, el modelo fracasa tanto en la estimaci\u00f3n como en la predicci\u00f3n. Es la<strong> omisi\u00f3n de variables relevantes<\/strong> por otra v\u00eda: en lugar de haber excluido variables importantes, hemos incluido variables irrelevantes.<\/p>\n\n\n\n<p><strong>Lecciones para estudiantes (y para econometristas con el caf\u00e9 fr\u00edo).<\/strong><\/p>\n\n\n\n<p><strong>Lecci\u00f3n 1:<\/strong> no confundir la falta de significaci\u00f3n individual con la irrelevancia.<br>La lecci\u00f3n m\u00e1s importante del Escenario 2 es que un coeficiente no significativo no implica autom\u00e1ticamente que la variable sea irrelevante. <strong>Si hay multicolinealidad, la falta de significaci\u00f3n puede ser un s\u00edntoma del solapamiento, no de la ausencia de efecto real.<\/strong> Antes de eliminar una variable por su p-valor, comprueba si est\u00e1 altamente correlacionada con otra del modelo.<\/p>\n\n\n\n<p><br><strong>Lecci\u00f3n 2:<\/strong> el test F y el R\u00b2 miran al equipo, no al jugador.<br>El contraste de significaci\u00f3n conjunta (test F del modelo) y el R\u00b2 eval\u00faan si el conjunto de regresores explica y. Si este contraste es significativo con un R\u00b2 alto, el modelo es \u00fatil globalmente, aunque alg\u00fan coeficiente individual no lo sea. En el Escenario 2, el test F ser\u00eda altamente significativo. En el Escenario 3, no.<\/p>\n\n\n\n<p><br><strong>Lecci\u00f3n 3:<\/strong> el VIF como term\u00f3metro de la multicolinealidad.<br>Una herramienta est\u00e1ndar para diagnosticar multicolinealidad es el <strong><em>Factor de Inflaci\u00f3n de la Varianza<\/em> (VIF)<\/strong>. Un VIF &gt; 5 empieza a ser preocupante; por encima de 10 es severo. En el Escenario 2, el VIF de x3 y x4 ser\u00eda muy elevado (probablemente &gt; 50), confirmando lo que ya vemos en la correlaci\u00f3n. En los Escenarios 1 y 3, el VIF ser\u00eda cercano a 1, pues las variables son casi ortogonales.<\/p>\n\n\n\n<p><br><strong>Lecci\u00f3n 4: <\/strong>el impacto de la multicolinealidad depende del objetivo.<br>Esta es quiz\u00e1 la lecci\u00f3n m\u00e1s pr\u00e1ctica de todas, y la que resume la met\u00e1fora de la oficina:<\/p>\n\n\n\n<p><strong>Si el objetivo es predecir:<\/strong> la multicolinealidad es molesta pero generalmente tolerable. Los coeficientes individuales son inestables (cambian mucho de una muestra a otra), pero <strong>la predicci\u00f3n conjunta puede ser buena.<\/strong> La oficina ca\u00f3tica entrega el pedido.<\/p>\n\n\n\n<p><strong>Si el objetivo es el an\u00e1lisis estructural<\/strong> (entender qu\u00e9 variable causa qu\u00e9): la multicolinealidad <strong>es un problema serio.<\/strong> No podemos identificar el efecto marginal de cada regresor porque el modelo no puede separar sus contribuciones. La oficina ca\u00f3tica no puede responder qui\u00e9n hizo el trabajo.<\/p>\n\n\n\n<p><strong>Lecci\u00f3n 5:<\/strong> lo peor no siempre es lo que m\u00e1s llama la atenci\u00f3n.<br>Los estudiantes suelen temer la multicolinealidad como si fuera la plaga econom\u00e9trica definitiva. Pero, como hemos visto, el <em>Escenario 3 <\/em>\u2014sin multicolinealidad alguna\u2014 produce resultados mucho peores tanto en estimaci\u00f3n como en predicci\u00f3n. La <strong>omisi\u00f3n de variables relevantes,<\/strong> o la inclusi\u00f3n de variables irrelevantes, es generalmente m\u00e1s da\u00f1ina que la correlaci\u00f3n entre regresores. La multicolinealidad es, en muchos casos, un <strong>problema de precisi\u00f3n<\/strong>; la mala especificaci\u00f3n es un <strong>problema de validez.<\/strong><\/p>\n\n\n\n<p><strong>Conclusi\u00f3n: el caos que predice y la calma que no sirve.<\/strong><\/p>\n\n\n\n<p>La multicolinealidad no es el villano que muchos textos pintan. Es, m\u00e1s bien, un <strong>complicador<\/strong> que exige precisi\u00f3n en el diagn\u00f3stico y claridad sobre el objetivo del an\u00e1lisis.<\/p>\n\n\n\n<p>Un modelo con multicolinealidad puede ser perfectamente v\u00e1lido para predecir; fallar\u00e1 si se intenta usar para cuantificar efectos causales individuales.<br>En cambio, un modelo con variables irrelevantes \u2014aunque est\u00e9n perfectamente desacopladas entre s\u00ed\u2014 <strong>es in\u00fatil tanto para predecir como para entender.<\/strong> La correlaci\u00f3n entre regresores es un problema de <strong>c\u00f3mo repartimos el m\u00e9rito<\/strong>; la falta de relevancia es un problema de <strong>si hay m\u00e9rito que repartir.<\/strong><\/p>\n\n\n\n<p>La pr\u00f3xima vez que un R\u00b2 bajo te deje helado, no busques la multicolinealidad: busca mejores variables. Y la pr\u00f3xima vez que encuentres coeficientes no significativos con un R\u00b2 alto, antes de eliminar variables, calcula el VIF. Puede que tus regresores se est\u00e9n pisando los pies\u2026 pero est\u00e9n sacando el trabajo adelante.<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>The office. \ud83e\udd28 La multicolinealidad en el modelo de regresi\u00f3n m\u00faltiple, \u00bfes un problema grave? Depende. Imagina una oficina. En ella trabajan varios empleados \u2014los llamaremos regresores\u2014 cuya misi\u00f3n conjunta es producir una previsi\u00f3n de la actividad de la empresa (la variable dependiente y). Ahora imagina tres situaciones posibles: \u2022 Escenario 1 \u2014 La oficina [&hellip;]<\/p>\n","protected":false},"author":78,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[23],"tags":[],"class_list":["post-964","post","type-post","status-publish","format-standard","hentry","category-error-estandar"],"_links":{"self":[{"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/posts\/964","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/users\/78"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/comments?post=964"}],"version-history":[{"count":7,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/posts\/964\/revisions"}],"predecessor-version":[{"id":1016,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/posts\/964\/revisions\/1016"}],"wp:attachment":[{"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/media?parent=964"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/categories?post=964"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.uclm.es\/miguelangeltarancon\/wp-json\/wp\/v2\/tags?post=964"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}