Una ciencia más eficiente basada en la publicación de ideas

El actual sistema de publicación científica (y, en esencia, el motor último de la investigación) valora únicamente los resultados positivos. Esto arroja a la basura un montón de conocimiento valioso que también produce la ciencia: el inmenso mundo de las hipótesis nulas y los experimentos fallidos. El problema no es sólo la pérdida de información sino que, además, la asimetría en la valoración introduce un sesgo sobre las propias publicaciones científicas: el efecto de presionar a los investigadores para que sus resultados sean siempre positivos es que, muchas veces, esos resultados son muy difíciles de replicar después. Y no se trata de una falta de honestidad por parte de los investigadores; se trata de un sesgo y como tal, opera a nivel sistémico. Todas las publicaciones tenderán a ser un poco más positivas que la realidad, sencillamente, porque lo negativo es sistemáticamente rechazado.

En esta magnífica charla TEDx, Lucas Sánchez plantea una posible alternativa a todo esto. Una ciencia más eficiente basada en la publicación de ideas en lugar de resultados, de procesos en lugar de desenlaces que, además, facilitaría la comunicación de la ciencia a la sociedad. No os la perdáis.

Cuando la música era ciencia. Pamplonetario de Navarra

El pasado 14 de octubre impartí una charla en el Pamplonetario de Navarra, dentro del ciclo «Ciencia, Arte y Tecnología» organizado por la UPNA con el apoyo de la FECYT.

En ella abordo las cuestiones que ya vienen siendo habituales por esta casa: cuáles son las bases (físicas y fisiológicas) de la consonancia y la disonancia, cómo sirven de fundamento a nuestro sistema musical y otros a lo largo del mundo, para qué sirven las escalas…

¿La peor gráfica de la historia?

Se puede hacer peor, pero es francamente complicado. Me refiero a esta:

temperatura-piratas

La competencia es feroz, por lo que no me atreveré a responder afirmativamente al título de esta entrada, pero sin duda es una de las peores que he visto. No obstante, lo que más me duele de esta gráfica es que haya salido en uno de los pocos programas que hay en la televisión pública que tratan de popularizar la ciencia. Me estoy refiriendo a Órbita Laika – La nueva generación, y la gráfica vino de la mano del compañero @SantiGarciaCC para ilustrar el concepto de que correlación no implica causalidad:

El objetivo es loable, pero el fin no justifica los medios. En su (pequeña) defensa, hay que decir que no son los autores de la gráfica. De hecho, esta gráfica se repite una y otra vez en Internet, a modo de meme, cada vez que un artículo habla de correlación y causalidad. Se ha representado hasta la extenuación (incluso bien). Esta misma versión apareció en JotDown, y una extensa labor de investigación por mi parte —consistente en una búsqueda de diez segundos en Google— me ha permitido determinar que el atentado, al gusto en general y a la representación de datos en particular, se produjo originariamente aquí.

¿Estoy dramatizando? En absoluto, y lo voy a demostrar con un análisis de la misma. Lo más rápido es empezar por los elementos que son correctos, a saber:

  • El eje vertical. Un eje debidamente etiquetado representando una variable continua con límites razonables.

Y ya. Hemos terminado. O mejor seguimos con lo que está mal, que —dejando de lado aspectos visuales como el horrible degradado de fondo— es todo lo demás:

  • Atención a la etiqueta del eje horizontal. Dice «Número de piratas (aproximado)«. 35000… 5000… 400 y de repente… ¡17! Ya de 5000 a 400 el error en la aproximación ha caído un orden de magnitud, pero seguidamente especificar 17 se corresponde con otros dos órdenes de magnitud… Simplemente absurdo.
  • El eje horizontal contiene una variable discreta (número de piratas), pero se representa como variable categórica. No se explica de otra manera la equidistancia entre cada valor y el hecho de que a veces suba (35000 a 45000) y a veces baje (el resto de casos).
  • Para representar una variable categórica, se utilizan puntos unidos con líneas. Esto no se debe hacer jamás, puesto que la línea representa evolución y no puede haber ninguna evolución entre categorías. Pensemos, por ejemplo, en el número de empleados en cada departamento de una empresa. ¿Unimos 25 del departamento de ventas con 15 del departamento de sistemas?
  • Lo anterior sucede porque de facto sí existe un pseudoeje horizontal continuo, que es sobre el que se produce el ordenamiento de los puntos, y es el tiempo. Pero, de nuevo, los intervalos numéricos y el espaciado no se corresponden, y los años aparecen absurdamente etiquetados sobre los puntos en lugar de bajo el eje horizontal, que es su sitio.
  • Por tanto, el título es incorrecto. Reza «Temperatura global vs. Nº de piratas», cuando lo que en realidad se representa es «Temperatura global vs. tiempo«. Aunque, como decíamos, el espaciado no es proporcional a la diferencia de años, por lo que la evolución mostrada no es fiel.

En definitiva, el número de piratas es un pegote, y cualquier relación que quiera verse en esa línea es pura fantasía. Esta gráfica es totalmente equivalente a poner una línea recta y datos cualesquiera inventados, y su perpetuación no le hace ningún bien a la divulgación científica.

¿Podrías distinguir entre Bach y un ordenador?

Dale al play:

Está canción no tiene autor. Ha sido «compuesta» por una inteligencia artificial. La robótica madre de la criatura se llama FlowMachines y ha sido creada por un grupo de científicos europeos liderado por François Pachet. Es un sistema capaz de identificar y aprender distintos estilos musicales a partir de una base de datos de canciones. Según se puede leer en su página web:

Style is what makes an author (composer, writer, painter, etc.) recognizable, “different”. […] Studying how these people [Picasso, Mozart, Shakespeare…] came to invent their style suggests that this is basically a process of manipulating the styles of other creators to create new objects until something interesting emerges […] The Flow Machines project takes a computer science perspective on style: how can a machine understand style and turn it into a computational object?

Bajo esta perspectiva, FlowMachines se empapa del estilo de un autor dado y, con el aprendizaje resultante, es capaz de componer nuevas canciones, inéditas, en ese determinado estilo. Recuerda poderosamente al caso de EMI, la inteligencia artificial que auxilió a su creador, el compositor David Cope, en un momento de bloqueo creativo.

Daddy’s Car, concretamente y como quizás hayas podido adivinar, se basa en el estilo de Los Beatles y, ciertamente, el tema recuerda bastante a su música. Probablemente, no sea su mejor canción pero igual hubiese podido colar sin dar mucho el cante en alguno de sus álbumes. Las letras y la producción de la canción, eso sí, aún siguen llevando la firma de un humano: el compositor francés, Benoît Carré.

Los investigadores llevan un tiempo trabajando también en un algoritmo capaz de generar corales al estilo de Bach y, para evaluar el resultado de su trabajo, solicitan la ayuda de los internautas: ¿cómo de bachianas son las composiciones de FlowMachines?, ¿serías capaz de distinguir entre Bach y una inteligencia artifical? El test solo requiere unos pocos minutos, pero ¡lo advierto! no resulta precisamente evidente. Eso sí, si te picas, siempre puedes repetir para mejorar tu puntuación ;)

bachorpc

 

Afinadores de estrellas

Esta es la charla que impartí el pasado viernes, 30 de Septiembre, en la tercera edición de Passion for Knowledge. Como en la anterior edición, Naukas llevó al escenario del Teatro Victoria Eugenia de San Sebastián, charlas de 10 minutos que pretenden acercar la ciencia al público de forma más amena. Podéis encontrar el resto de charlas aquí.