A más datos, mejor servicio público

La digitalización es un aspecto imparable de nuestras sociedades modernas. Cada vez más datos personales acaban en manos de grandes empresas tecnológicas que, en contraprestación, nos ofrecen cada vez nuevos y mejores servicios. Esto, no obstante, conlleva unos riesgos para la privacidad y una preocupación creciente de la ciudadanía, que ya ha visto saltar a los medios diversos escándalos por una gestión poco ética, o directamente ilegal, de esos datos. Leyes como la nueva GDPR europea responden a esa preocupación, y tratan de asegurar que la explotación de nuestros datos se realice con las máximas garantías, aunque todavía queda mucho por hacer.

Sigue leyendo A más datos, mejor servicio público, mi última colaboración en el Cuaderno de Cultura Científica, que complementa este otro, publicado hace unos días, acerca de la polémica suscitada la semana pasada por determinados titulares en prensa.

Cómo evitar que El País sepa tu voto y dónde veraneas

Una pieza informativa aspira a describir unos hechos, que tienen unas implicaciones. Un titular, por su parte, apenas da para una pincelada: es una elección muy particular que resalta una parte muy concreta de los hechos. Es por ello que no hay titular inocente. El titular no es un mero fragmento de información: es un enfoque.

Hoy en día, las noticias digitales se leen poco y se comparten rápido. En el mejor de los casos, el titular condiciona completamente la interpretación de una lectura en diagonal. En el peor de los casos, es lo único que se lee. Y suma y sigue. Like. Retweet. Compartir en Facebook. Por lo tanto, el enfoque es fundamental.

Pero hay un problema: un titular condiciona también cuánta gente hace click y llega a tu medio. La mayoría de las noticias no son realmente tan interesantes y la competencia por la atención es alta. Los medios lo saben, y su incentivo está en retorcer ese enfoque, lo que a veces puede tener consecuencias desastrosas.

Un caso paradigmático de esto se está dando esta semana. El pasado miércoles, en una noticia que no voy a enlazar directamente, El País Economía titulaba así:

El INE seguirá la pista de los móviles de toda España durante ocho días

La polémica estaba servida. Expertos opinadores de toda índole se lanzaban a afirmar desde que era ilegal hasta que no servía para nada. Ardían las redes. El Estado nos vigila. ¿Y adivinan qué? Exacto: el INE no seguirá la pista de los móviles de toda España. No obstante, toda la información que explica qué es exactamente lo que va a hacer el INE —que es algo completamente legal, ético y razonable, con datos anónimos— estaba en el cuerpo de la noticia, pero nadie lo leyó o quiso leerlo. De hecho, puse un hilo en Twitter explicando la noticia apoyado en capturas de la misma:

Ofrezco un par de titulares alternativos a partir de información incluida en el propio artículo:

Un estudio pionero tratará de mejorar cómo se hace la estadística pública

El INE buscará abaratar costes y mejorar la precisión de cara al Censo 2021

Desafortunadamente, ni el redactor ni el editor apostaron por este enfoque. En su lugar, escogieron uno que, como mínimo, resulta engañoso, y literalmente, es mentira.

Otros fueron más lejos todavía, como Público:

El INE quiere rastrear la posición de nuestros móviles pese a que lo impide la ley

Que ya no es que el titular se pase de rosca, es que el cuerpo de la noticia es pura bazofia digna de The Sun.

Unas horas más tarde, Verne, de El País, insistía en el enfoque:

Cómo evitar que los datos de tu teléfono móvil formen parte del estudio del INE

Tristemente, otros medios, como Maldita (periodismo para que no te la cuelen), se apuntaban al mismo carro. Eso sí: ni rastro de explicar que el resultado de un estudio así es un bien público y por qué nos interesa a todos que salga bien. Y ayer, El País Economía volvía a la carga:

No solo el INE rastrea los móviles: Fomento ya pagó a Orange por los datos de 16 millones de teléfonos

¿Adivinan qué, otra vez? Efectivamente: Fomento no pagó por datos privados, sino por un estudio de esos datos para obtener información agregada y anónima de movilidad que, de otra manera, se habría obtenido por un procedimiento de un orden de magnitud más caro. Detalles, detalles…

Lo paradójico de todo esto es que El País es un abanderado del llamado periodismo de datos (lo que me parece muy bien; ¡a favor!). Fueron los primeros en hacer el mapa interactivo del voto en las últimas elecciones, que luego otros medios copiaron. Y en verano, leíamos un reportaje interesantísimo donde utilizaban datos de telefonía de Orange (¿suena familiar?) titulado De dónde son los españoles que veranean en Benidorm (y en otros 55 destinos).

Por aquel entonces ya hubo quien se quejó —porque es cierto que hay un debate abierto en torno a la privacidad, un asunto delicado—, y el tema acabó en el Defensor del Lector, que no dudó en defender la labor de sus periodistas de datos en A más datos, más periodismo. Sí, señor. Solo me pregunto qué les parecería si otro medio decidiera hoy titular:

No solo el INE y Fomento rastrean los móviles: El País ya siguió los datos de millones de teléfonos

Cómo evitar que El País sepa tu voto y dónde veraneas

#Naukas19: Aprendiendo de las máquinas

Dejo por aquí un enlace al vídeo, que como cada año EiTB pone a disposición en su plataforma Kosmos, de mi participación en Naukas Bilbao 2019 del pasado 20-21 de septiembre en el Palacio Euskalduna. En la línea de mi artículo Aprendiendo de las máquinas, hago un poquito más de hincapié en cómo la metáfora de la «inteligencia artificial» se nos ha ido de las manos en la cultura popular; en qué es la inteligencia artificial y, sobre todo, en qué no es.

simmer 4.3.0 + JSS publication

The 4.3.0 release of simmer, the Discrete-Event Simulator for R, is on CRAN. Along with this update, we are very glad to announce that our homonymous paper finally appeared in the Journal of Statistical Software. Please, use the following reference for citations (see citation("simmer")):

  • Ucar I, Smeets B, Azcorra A (2019). “simmer: Discrete-Event Simulation for R.” Journal of Statistical Software90(2), 1-30. doi: 10.18637/jss.v090.i02 (URL: https://doi.org/10.18637/jss.v090.i02).

It took quite a lot of work and time, but we are very proud of the final result. We would like to thank the editorial team for their hard work, with special thanks to the anonymous referee for their thorough reviews and valuable comments, and Norman Matloff for his advice and support. Last but not least, we are very grateful for all the discussion and fruitful ideas that our growing community provides via the simmer-devel mailing list and GitHub.

The new release bring us the ability to keep seized resources after reneging, as well as to define a range of arrival priorities that are allowed to access a resource’s queue if there is no room in the server. We moved a lot of activity usage examples that were scattered in a far too long vignette to the appropriate help pages, and of course there is the usual share of bug fixes. See below for a complete list of changes.

Special thanks to Tom Lawton for his contributions to this release, and to Benjamin Sawicki for his generous donation.

New features

  • Add ability to keep_seized resources after reneging (#204 addressing #200).
  • Add ability to define a range of arrival priorities that are allowed to access a resource’s queue if there is no room in the server (#205 addressing #202).

Minor changes and fixes:

  • Drop R6 as a dependency (#193 addressing #190).
  • Small fix in from and from_to + documentation update (75a9569).
  • Move activity usage examples to help pages (#194).
  • Fix shortest-queue selection policies (#196).
  • Fix batch triggering (#203).
  • Update JSS paper, CITATION, references and DOI.

Los orígenes de la visualización de datos

Hoy en día, vivimos inmersos en gráficas, mapas e infografías de toda índole. En la era de la información, la visualización de datos se percibe como un lenguaje familiar que, además, gracias a las computadoras, resulta muy accesible. Pero no siempre fue ni tan obvio ni tan sencillo, sino que se lo debemos a unos pocos pioneros que, a base de papel y tinta, tuvieron la visión y la destreza de combinar arte y estadística para revolucionar nuestra manera de estudiar los datos.

Sigue leyendo Los orígenes de la visualización de datos, mi última colaboración en el Cuaderno de Cultura Científica.