Estás aquiBitácoras / blog de maria / Cotilleo y compresión de datos. De cómo un algoritmo cambia la vida
Cotilleo y compresión de datos. De cómo un algoritmo cambia la vida
Esta entrada la vamos a dedicar al cotilleo. Y cito a Margarito, un genial monstruo de un cómic para niños: “Eso siempre gusta” (Joann Sfar, Vampir). Porque será un cotilleo sin remordimiento, y con algo serio también. Escenario: el cóctel de la entrega de los premios de la Fundación BBVA Fronteras del Conocimiento, en Madrid, el pasado 18 de junio. Protagonistas: unos 300 invitados, gran parte de ellos de la élite de la comunidad científica española. Neurocientíficos, oceanógrafos, especialistas en evolución, genetistas, físicos, la ministra de Ciencia e Innovación Cristina Garmendia, su secretario de Estado Carlos Martínez, el presidente del CSIC, Rafael Rodrigo, y dos matemáticos: Olga Gil, presidenta de la Real Sociedad Matemática Española, y Manuel de León, director del ICMAT y único español en la Ejecutiva de la Unión Matemática Internacional. Entre los canapés vuelan ideas cruzadas, embriones de proyectos, planes para colaboraciones futuras. Y he aquí que, ¿de qué hablan los matemáticos? ¡De matemáticas, por supuesto!
Pero su reflexión, origen de esta entrada, es bonita: “Es que en todos los premiados, en todos, hay una conexión con las matemáticas”, dice Gil con énfasis. Tiene razón. Los premios, de los que se celebraba este año su primera edición, son de los más generosos del planeta y desde luego de España -3,2 millones de euros distribuidos en ocho categorías-. Y nacen, insiste la FBBVA, con voluntad de situarse entre los más prestigiosos. Como prueba, los currículos de los jurados seleccionados internacionalmente con la ayuda del CSIC. Pero estábamos en los premiados. En esta edición inaugural han sido 10: Wallace S. Broecker, en Cambio Climático; Peter Zoller e Ignacio Cirac, en Ciencias Básicas; Joan Massagué, en Biomedicina; Thomas E. Lovejoy y William F. Laurance, en Ecología y Biología de la Conservación; Jacob Ziv, en Tecnologías de la Información y la Comunicación; Jean Tirole, en Economía, Finanzas y Gestión de Empresas; Steven Holl, en Artes; y el Laboratorio de Acción contra la Pobreza Abdul Latif Jameel (MIT), en Cooperación al Desarrollo.
Efectivamente las matemáticas son esenciales para todos ellos: sin los modelos de clima –que Broecker, por cierto, encuentra aún demasiado imperfectos para ser considerados fiables- es imposible predecir el impacto del calentamiento global; sin programas, Massagué no podría bucear en el genoma de las células cancerosas; sin las simulaciones, Laurance lo tendría mucho más difícil a la hora de advertir que a la Amazonia le queda apenas una década, si se sigue al actual ritmo de deforestación. El economista Tirole, por su parte, basa la mayor parte de su trabajo en aplicar a la economía la teoría de juegos, como una herramienta que hace explícito qué gana y qué pierde cada actor económico con sus decisiones.
Una solución sin problema
Aunque quizás la relación más profunda con las matemáticas sea la del israelí Jacob Ziv, Doctor en Ingeniería Eléctrica por el Instituto de Tecnología de Massachussets, de 77 años, y a quien se debe el desarrollo junto con Abraham Lempel del algoritmo LZ77, clave para la compresión de archivos. Tan clave, que sin el trabajo de Ziv no existirían los formatos mp3, pdf o los ‘Zip’ (la Z de ‘zip’ corresponde a su apellido: Ziv Compression Packaging). «Muchos aparatos dependen de la compresión de información para un almacenamiento más eficiente», explicó durante sus intervenciones en la FBBVA. «Tengo la gran suerte de trabajar en un campo que ha permitido abrir las puertas a las modernas tecnologías de la comunicación», afirma rotundo.
Sin embargo, Ziv partió en los años setenta de problemas teóricos. ¿Qué mínima cantidad de datos puede usarse sin perder información? ¿Existe un límite fundamental? Para las aplicaciones y el interés de las empresas aún faltaban años: “Aún no había aplicaciones que hicieran necesaria la compresión de archivos”. “Al principio era, y sigue siendo, una teoría matemática de la comunicación, iniciada por Claude Shannon en 1948 [matemático]. Sólo con el desarrollo de los ordenadores se vio que estas teorías tendrían aplicaciones, por ejemplo para la transmisión de información a través de canales ruidosos y para almacenar más información”.
Ziv cuenta que enseguida “quedó bastante claro” que era posible comprimir los datos si se caracterizaban, si se tenía “un conocimiento estadístico total de los datos”. El resultado de sus primeros trabajos estableció que sí existía un límite fundamental para la compresión, pero sólo cuando no hay un conocimiento previo ‘inserto’ en quienes intercambian la información. Ziv explica este concepto con un ejemplo: si él escribe en un foro de seguidores del Real Madrid las siglas RJRM “muchos entenderán que digo Ronaldo Joints Real Madrid [Ronaldo se une al Real Madrid]”, pero la táctica no vale para quien no esté en el ajo.
¿Comprime mejor la naturaleza, o el hombre?
Ziv y Lempel trataron de interesar a una compañía por su trabajo, pero la cosa quedó en nada. La comunidad científica, en cambio, sí lo consideró relevante. Y con razón. Con el ‘boom’ de las ‘punto com’ quedó claro su valor. Ziv, no obstante, nunca ha cobrado nada parecido a derechos de autor por su trabajo –lo cual dice no preocuparle: “Me siento bastante recompensado”-.
Su objetivo ahora es aplicar su trabajo a otras áreas. Un campo obvio, para Ziv, es la biomedicina, y en concreto la biología de síntesis. “Hay un hueco entre las herramientas de la teoría de la información y la biología estructural, que estamos tapando poco a poco”, afirma.
Esta conexión entre campos sugiere más preguntas: ¿Quién comprime mejor la información, la naturaleza o los humanos (artificialmente)? La naturaleza, por supuesto. Pero hay una curiosa similitud, según Ziv, en los métodos natural y artificial de mejorar la eficacia en el tratamiento de los datos: ambos se basan, de nuevo, en el conocimiento ‘pre-instalado’ en los usuarios de esa información. “Los niños aprenden a hablar porque el cerebro ya viene ‘de serie’ con una serie de conocimientos para distinguir las estructuras linguísticas, las acciones, los nombres... Es algo que ya dijo Noam Chomsky”.
Ziv, por supuesto, se declara un gran admirador y usuario de las nuevas tecnologías. Adora su i-pod de segunda generación y subraya que hace ya años que no baja a consultar la biblioteca de debajo de su despacho, en el prestigioso instituto Technion (Instituto de Tecnología de Israel) porque con internet no le hace falta. Repite una y otra vez que “es imposible predecir el futuro”, y que por tanto lo más sabio que se puede hacer, especialmente en tiempos de crisis es fomentar la ciencia básica: “Es una inversión para el futuro”.



Si la naturaleza comprime mejor, desarrollar un compresor mediante un simulador evolutivo podria ser una buena idea.
Saludos
en efecto, piense en la cantidad de información almacenada en el DNA sobre la síntesis
de proteína, es decir sobre quien es quien. y a escala molecular...
Enviar un comentario nuevo