cran2copr: RPM repos with 15k binary R packages

Bringing R packages to Fedora (in fact, to any distro) is an Herculean task, especially considering the rate at which CRAN grows nowadays. So I am happy to announce the cran2copr project, which is an attempt to maintain binary RPM repos for most of CRAN (~15k packages as of Feb. 2020) in an automated way using Fedora Copr.

Are you a Fedora user? Enable the CRAN Copr repo for your system:

$ sudo dnf copr enable iucar/cran

and you are ready to go. Packages are prefixed with R-CRAN-, e.g.:

$ sudo dnf install R-CRAN-rstanarm

Currently, only x86_64 chroots for supported (non-EOL) versions of Fedora, including rawhide, are enabled. If you are interested in other chroots (from the supported architectures and distros), please open an issue on GitHub expressing so, but it is unlikely that it will be enabled in the short to medium term due to current storage limitations in the Copr infrastructure.

These repos are automatically synchronized with CRAN every day at 00:00 UTC through a GitHub Action that removes archived packages and builds the most recent updates. If you find any issue with any of the supported packages (see details and limitations below), please open an issue on GitHub.

Acknowledgements

Thanks to the authors of cran2deb for the inspiration. Thanks to RedHat and, particularly, the Copr team for developing this tool and maintaining the Fedora Copr service for the Fedora community. And thanks to AWS too, because they provide a CDN for free.

simmer 4.4.0 on CRAN

The 4.4.0 release of simmer, the Discrete-Event Simulator for R, is on CRAN. This update stabilises a new pace of a couple of new releases per year, which is more appropriate given the maturity that the project has reached.

This release brings us a dozen bug fixes and improvements, including the unification of the leave/renege API, further enhancements of convenience function to set up generators, and performance improvements for the simulation environment definition thanks to the vectorisation of add_resource and add_generator. See below for a complete list of changes.

New features

  • Add out and keep_seized parameters to leave() with the same behaviour as in renege_in() and renege_if(). Code and documentation of these functions are now integrated under help(renege) (#208, #217).
  • Convenience functions fromto and from_to accept dynamic parameters for arguments start_timestop_time and every (#219).
  • Activities to interact with sources have been vectorised to modify multiple sources at once (#222).
  • Several generators or resources with the same parameters can be added with a single call to add_generator() and add_resource() respectively if a vector of names is provided (#221).

Minor changes and fixes:

  • Fix get_mon_*() dispatch for named lists (#210).
  • Get/put the RNG state when random numbers are required in the backend (#218).
  • Fix convenience functions fromto and from_to to preserve the environment of the supplied functions (as part of #219).
  • Documentation improvements (#212, #220).
  • Fix queueing in multiple resources after preemption (#224 addressing #206).

El laberinto del IRPF

Sobre el IRPF existen muchas leyendas urbanas: desde las que dicen que a los catalanes se les va la mitad del sueldo en impuestos, hasta aquello de que supuestamente puedes acabar ganando menos con una subida de sueldo. Todo esto no es cierto, pero el tema tampoco es tan simple como aplicar los tipos por tramos de la famosa tabla y ya está. No en vano, la Agencia Tributaria tiene unos bonitos «manuales prácticos» de nada menos que 1300 páginas. En serio.

El caso es que a @marga_tf y a mí nos han concedido un proyecto de investigación multidisciplinar en la UC3M (más sobre esto, quizás, en otro momento), y el mes que viene toca sacar una oferta de empleo para contratar a un técnico de apoyo para el proyecto. Queremos que tenga un sueldo digno, y por ello andaba yo echando cuentas entre la calculadora de Cinco Días y la de la Agencia Tributaria para verificar el sueldo neto, pero me salían resultados distintos. Total, que una cosa llevó a la otra y… acabé haciéndome mi propia calculadora, cuya salida tiene esta pinta:

Lo hice y lo entendí. Y por si a alguien más le puede servir, he publicado una app donde se puede juguetear con los diferentes parámetros (tramos, cotización, reducción, mínimo…) y las gráficas cambian en consecuencia. Obviamente, cubre el caso más sencillo, pero variando los parámetros probablemente se puedan añadir deducciones y cubrir casos más complejos. El código está en GitHub.

Actualización: He añadido el cálculo del tipo marginal (cuánto pagas por cada euro adicional). Lo que sucede en las rentas bajas es un auténtico disparate. Por ejemplo, al pasar de ganar 17 mil euros brutos anuales a 18 mil, se perciben únicamente unos 400 euros más, lo que supone un 56% de IRPF para esos mil euros de subida. Ya lo denunciaban hace más de un año en Nada es Gratis (me puso sobre la pista @gilbellosta).

A más datos, mejor servicio público

La digitalización es un aspecto imparable de nuestras sociedades modernas. Cada vez más datos personales acaban en manos de grandes empresas tecnológicas que, en contraprestación, nos ofrecen cada vez nuevos y mejores servicios. Esto, no obstante, conlleva unos riesgos para la privacidad y una preocupación creciente de la ciudadanía, que ya ha visto saltar a los medios diversos escándalos por una gestión poco ética, o directamente ilegal, de esos datos. Leyes como la nueva GDPR europea responden a esa preocupación, y tratan de asegurar que la explotación de nuestros datos se realice con las máximas garantías, aunque todavía queda mucho por hacer.

Sigue leyendo A más datos, mejor servicio público, mi última colaboración en el Cuaderno de Cultura Científica, que complementa este otro, publicado hace unos días, acerca de la polémica suscitada la semana pasada por determinados titulares en prensa.

Cómo evitar que El País sepa tu voto y dónde veraneas

Una pieza informativa aspira a describir unos hechos, que tienen unas implicaciones. Un titular, por su parte, apenas da para una pincelada: es una elección muy particular que resalta una parte muy concreta de los hechos. Es por ello que no hay titular inocente. El titular no es un mero fragmento de información: es un enfoque.

Hoy en día, las noticias digitales se leen poco y se comparten rápido. En el mejor de los casos, el titular condiciona completamente la interpretación de una lectura en diagonal. En el peor de los casos, es lo único que se lee. Y suma y sigue. Like. Retweet. Compartir en Facebook. Por lo tanto, el enfoque es fundamental.

Pero hay un problema: un titular condiciona también cuánta gente hace click y llega a tu medio. La mayoría de las noticias no son realmente tan interesantes y la competencia por la atención es alta. Los medios lo saben, y su incentivo está en retorcer ese enfoque, lo que a veces puede tener consecuencias desastrosas.

Un caso paradigmático de esto se está dando esta semana. El pasado miércoles, en una noticia que no voy a enlazar directamente, El País Economía titulaba así:

El INE seguirá la pista de los móviles de toda España durante ocho días

La polémica estaba servida. Expertos opinadores de toda índole se lanzaban a afirmar desde que era ilegal hasta que no servía para nada. Ardían las redes. El Estado nos vigila. ¿Y adivinan qué? Exacto: el INE no seguirá la pista de los móviles de toda España. No obstante, toda la información que explica qué es exactamente lo que va a hacer el INE —que es algo completamente legal, ético y razonable, con datos anónimos— estaba en el cuerpo de la noticia, pero nadie lo leyó o quiso leerlo. De hecho, puse un hilo en Twitter explicando la noticia apoyado en capturas de la misma:

Ofrezco un par de titulares alternativos a partir de información incluida en el propio artículo:

Un estudio pionero tratará de mejorar cómo se hace la estadística pública

El INE buscará abaratar costes y mejorar la precisión de cara al Censo 2021

Desafortunadamente, ni el redactor ni el editor apostaron por este enfoque. En su lugar, escogieron uno que, como mínimo, resulta engañoso, y literalmente, es mentira.

Otros fueron más lejos todavía, como Público:

El INE quiere rastrear la posición de nuestros móviles pese a que lo impide la ley

Que ya no es que el titular se pase de rosca, es que el cuerpo de la noticia es pura bazofia digna de The Sun.

Unas horas más tarde, Verne, de El País, insistía en el enfoque:

Cómo evitar que los datos de tu teléfono móvil formen parte del estudio del INE

Tristemente, otros medios, como Maldita (periodismo para que no te la cuelen), se apuntaban al mismo carro. Eso sí: ni rastro de explicar que el resultado de un estudio así es un bien público y por qué nos interesa a todos que salga bien. Y ayer, El País Economía volvía a la carga:

No solo el INE rastrea los móviles: Fomento ya pagó a Orange por los datos de 16 millones de teléfonos

¿Adivinan qué, otra vez? Efectivamente: Fomento no pagó por datos privados, sino por un estudio de esos datos para obtener información agregada y anónima de movilidad que, de otra manera, se habría obtenido por un procedimiento de un orden de magnitud más caro. Detalles, detalles…

Lo paradójico de todo esto es que El País es un abanderado del llamado periodismo de datos (lo que me parece muy bien; ¡a favor!). Fueron los primeros en hacer el mapa interactivo del voto en las últimas elecciones, que luego otros medios copiaron. Y en verano, leíamos un reportaje interesantísimo donde utilizaban datos de telefonía de Orange (¿suena familiar?) titulado De dónde son los españoles que veranean en Benidorm (y en otros 55 destinos).

Por aquel entonces ya hubo quien se quejó —porque es cierto que hay un debate abierto en torno a la privacidad, un asunto delicado—, y el tema acabó en el Defensor del Lector, que no dudó en defender la labor de sus periodistas de datos en A más datos, más periodismo. Sí, señor. Solo me pregunto qué les parecería si otro medio decidiera hoy titular:

No solo el INE y Fomento rastrean los móviles: El País ya siguió los datos de millones de teléfonos

Cómo evitar que El País sepa tu voto y dónde veraneas