{"id":17,"date":"2016-05-13T14:49:03","date_gmt":"2016-05-13T13:49:03","guid":{"rendered":"http:\/\/blog.uclm.es\/gonzalorprieto\/?p=17"},"modified":"2016-05-13T14:49:03","modified_gmt":"2016-05-13T13:49:03","slug":"suavizado-de-datos-no-correlativos","status":"publish","type":"post","link":"https:\/\/blog.uclm.es\/gonzalorprieto\/2016\/05\/13\/suavizado-de-datos-no-correlativos\/","title":{"rendered":"Suavizado de datos no correlativos"},"content":{"rendered":"<p>El suavizado de datos experimentales no correlativos es algo bastante dif\u00edcil. Como siempre que se habla de algo dif\u00edcil,va a ser mejor empezar por definirlo.\u00abDatos experimentales no correlativos\u00bb son series de datos, desde posiciones hasta voltajes, recogidos a lo largo de una dimensi\u00f3n sin que haya una separaci\u00f3n contante entre ellos(1). En otras palabras, un conjunto de datos disperso. Con frecuencia, para poder entender algo de los datos y extraer conclusiones hay que representarlos en una gr\u00e1fica o quiz\u00e1s derivarlos, integrarlos, etc. La representaci\u00f3n gr\u00e1fica en s\u00ed no presenta dificultad demasiada dificultad. Pero, \u00bfqu\u00e9 pasa si la dispersi\u00f3n en los datos y los \u00abhuecos\u00bb en los datos es demasiado grande para poder obtener una visi\u00f3n de conjunto? Pues que resulta muy conveniente realizar un suavizado de los datos para tener una curva de referencia en la que poder fijarse, y que luego se pueda derivar, integrar o realizarle cualquier \u00abperrada\u00bb num\u00e9rica.<\/p>\n<p>Para ello, esta curva debe cumplir estos criterios:<\/p>\n<ol>\n<li> Ser equiespaciada<\/li>\n<li> Estar lo m\u00e1s cerca posible de los datos experimentales, pero suavizando las oscilaciones que se deban a errores experimentales.<\/li>\n<\/ol>\n<p> Si los datos son equiespaciados, podemos usar m\u00e9todos basados en transformadas de Fourier y filtrados posteriores o similares, sobre todo si sabemos que los datos son peri\u00f3dicos. En este caso, se trata de filtrar el ruido de una se\u00f1al y es un problema tambi\u00e9n muy interesante, pero no lo trato aqu\u00ed. En el caso que nos ocupa, deben emplearse otras t\u00e9cnicas num\u00e9ricas. Una peque\u00f1a muestra de ellas es:<\/p>\n<dl>\n<dt>Aproximaci\u00f3n polin\u00f3mica de orden n a los datos.<\/dt>\n<dd> De manera muy simple, consiste en emplear los puntos experimentales como las posibles soluciones de un polinomio de orden <b>n<\/b>, siendo n un n\u00famero entero.<\/dd>\n<dt>Spline de los datos.<\/dt>\n<dd> En lugar de tener un s\u00f3lo polinomio, se aproximan regiones de los datos por polinomios de orden fijo, generalmente 2 o 3.(2)<\/dd>\n<dt> Suavizado de los datos al resolver una ecuaci\u00f3n lineal.<\/dt>\n<dd> Se considera a los datos la soluci\u00f3n de una ecuaci\u00f3n lineal que adem\u00e1s introduce una \u00abrugosidad\u00bb de los datos experimentales. Esto es, cuanto se separan los valores aproximados de los experimentales.<\/dd>\n<\/dl>\n<p> Cada m\u00e9todo tiene ventajas e inconvenientes, pero de manera muy somera, tanto la aproximaci\u00f3n a un s\u00f3lo polinomio como a las curvas spline poseen varios problemas comunes:<\/p>\n<ol>\n<li> Cuando hay pocos datos experimentales y se trata de aproximar un polinomio de orden alto, cualquier cosa se puede aproximar. Pensemos que tengo 10 datos experimentales y lo aproximo por un polinomio de orden 6. Al estar tan cerca el n\u00famero de datos experimentales al orden del polinomio, casi cualquier conjunto de valores ser\u00e1n capaces de hacer la aproximaci\u00f3n.<\/li>\n<li> Introduce oscilaciones que no tienen porqu\u00e9 tener sentido. Los polinomios tiene cambios de tendencia que se corresponden con acercamientos a m\u00e1ximos y m\u00ednimos locales. Y son m\u00e1s cuanto m\u00e1s alto es el orden del polinomio, porque depende de los ceros, que es igual al orden del polinomio.<\/li>\n<li> Con frecuencia, los par\u00e1metros que se emplean para decidir si una aproximaci\u00f3n se ajusta m\u00e1s o menos al conjunto de datos son muy parecidos entre diversas aproximaciones de muy distinto orden, lo que dificulta mucho el escoger un polinomio u otro. De hecho, en las aproximaciones Spline, para evitar este problema se emplean siempre polinomios de orden fijo.<\/li>\n<\/ol>\n<p> As\u00ed, cuando no hay un modelo matem\u00e1tico claro que nos permita decir que los datos se ajustan a una funci\u00f3n u otra, el mejor m\u00e9todo para obtener un conjunto equiespaciado de datos del conjunto original es el tercer m\u00e9todo. Este sistema est\u00e1 implementado en la funci\u00f3n \u00abregdatasmooth.m\u00bb del paquete de Octave <a href=\"http:\/\/octave.sourceforge.net\/data-smoothing\/\">\u00abdata-smoothing-1.3.0\u00bb<\/a>  y funciona muy bien si se tiene cuidado al escoger los par\u00e1metros del ajuste. La justificaci\u00f3n te\u00f3rica se encuentra publicada en: <a href=\"http:\/\/pubs.acs.org\/doi\/abs\/10.1021\/ac034173t\">\u00abA perfect smoother.\u00bb Anal. Chem., 2003, 75 (14), pp 3631\u20133636<\/a>\n<\/p>\n<p>\n(1) Pensar en una serie de posiciones de algo tomada a intervalos irregulares.<br \/>\n(2) <a href=\"http:\/\/www.doc.ic.ac.uk\/~dfg\/AndysSplineTutorial\/index.html\">Muy buen tutorial sobre splines. Ingl\u00e9s<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>El suavizado de datos experimentales no correlativos es algo bastante dif\u00edcil. Como siempre que se habla de algo dif\u00edcil,va a ser mejor empezar por definirlo.\u00abDatos experimentales no correlativos\u00bb son series de datos, desde posiciones hasta voltajes, recogidos a lo largo de una dimensi\u00f3n sin que haya una separaci\u00f3n contante entre ellos(1). En otras palabras, un &hellip; <a href=\"https:\/\/blog.uclm.es\/gonzalorprieto\/2016\/05\/13\/suavizado-de-datos-no-correlativos\/\" class=\"more-link\">Continuar leyendo<span class=\"screen-reader-text\"> \u00abSuavizado de datos no correlativos\u00bb<\/span><\/a><\/p>\n","protected":false},"author":378,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-17","post","type-post","status-publish","format-standard","hentry","category-calculo-numerico"],"_links":{"self":[{"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/posts\/17","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/users\/378"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/comments?post=17"}],"version-history":[{"count":0,"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/posts\/17\/revisions"}],"wp:attachment":[{"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/media?parent=17"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/categories?post=17"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.uclm.es\/gonzalorprieto\/wp-json\/wp\/v2\/tags?post=17"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}